Aussi connue sous sa dénomination anglophone (data quality), la qualité des données fait référence à la conformité des informations collectées avec la réalité qu’elles représentent. Par extension, cette appellation regroupe également les actions déployées par les organisations pour que leurs data soient aussi pertinentes que possible et surtout interprétables.
L’objectif : disposer de données pertinentes au sein des systèmes informatiques afin de mener à bien certains projets ou prendre des décisions stratégiques. Au contraire, des données de mauvaise qualité peuvent avoir des conséquences désastreuses : par exemple, passer à côté de certaines opportunités commerciales, car les coordonnées des prospects n’ont pas été actualisées.
Une importance stratégique
Ce n’est pas un hasard si la qualité des données revêt aujourd’hui une importance capitale pour les organisations. Tout particulièrement, les informations relatives aux clients et prospects sont largement répandues dans le Direct Marketing ou la gestion de la relation client, permettant de mener des actions plus efficaces, de doper les ventes, de personnaliser les offres et services, et de rendre l’entreprise plus proactive dans sa proposition de valeur. Il ne s’agit cependant pas du seul atout des données de qualité !
Elles peuvent, par exemple, être particulièrement utiles dans des secteurs tels que la santé, l'agroalimentaire ou la grande distribution pour assurer la traçabilité des produits, suivre avec précision le parcours de soin et l’historique des patients, etc. Par ailleurs, imposer des règles de qualité des données facilite la migration de celles-ci, en les homogénéisant et en identifiant des erreurs éventuelles en amont. Sans oublier que le temps et les coûts liés au traitement des données peuvent être minimisés, lorsque celles-ci sont de bonne qualité.
Une multitude de critères à prendre en compte
Afin de faire les meilleurs choix, les organisations peuvent mesurer l’aspect qualitatif de leurs données en se basant sur différentes caractéristiques :
- La précision et l’exactitude : les données doivent parfaitement représenter la réalité, ce qui nécessite de les sourcer et de les valider ;
- L’actualisation : il est préférable de vérifier régulièrement que les informations stockées sont toujours d’actualité (les coordonnées notamment) ;
- La complétude : les données collectées doivent être suffisantes pour être analysées et utilisées dans le cadre des opérations prévues (commerciales, par exemple) ;
- L’homogénéité, la cohérence et l’unicité : les données hébergées dans les différents systèmes doivent refléter les mêmes informations et être synchronisées pour éviter les erreurs ou les doublons ;
- La validité : attention à ce que les données respectent les normes et la réglementation en vigueur, notamment le Règlement général sur la protection des données (RGPD) ;
- L’opportunité : il ne s’agit pas de collecter des données à tout-va, mais de récupérer des informations essentielles à la prise de décision.
Au-delà de ces critères, les données de qualité doivent également répondre à un processus de récupération visant justement à éviter les informations dupliquées ou erronées. Encore trop souvent, les organisations remontent des erreurs pouvant être techniques, humaines ou organisationnelles : mauvaise saisie des données, multi-versionning, problèmes de compatibilité lors des exports, mauvais encodage en phase de maintenance, etc.
Bien gérer la qualité des données
Toutes ces difficultés peuvent néanmoins être évitées grâce aux solutions de MDM (Master Data Management), qui s’appuie sur plusieurs étapes successives :
- La précision et l’exactitude : les données doivent parfaitement représenter la réalité, ce qui nécessite de les sourcer et de les valider ;
- L’actualisation : il est préférable de vérifier régulièrement que les informations stockées sont toujours d’actualité (les coordonnées notamment) ;
- La complétude : les données collectées doivent être suffisantes pour être analysées et utilisées dans le cadre des opérations prévues (commerciales, par exemple) ;
- L’homogénéité, la cohérence et l’unicité : les données hébergées dans les différents sys tèmes doivent refléter les mêmes informations et être synchronisées pour éviter les erreurs ou les doublons ;
- La validité : attention à ce que les données respectent les normes et la réglementation en vigueur, notamment le Règlement général sur la protection des données (RGPD) ;
- L’enrichissement des données (complétude, correction et validation) ;
- L’analyse de la qualité des données (phase de reporting).
Cette méthodologie n’est cependant pas figée dans le marbre, et de nombreuses organisations préfèrent s’appuyer sur des démarches conçues en interne.
Vers une gouvernance des données plus globale
Quels que soient les moyens mis en place pour s’assurer de la qualité des données, cette opération doit s’inscrire plus globalement dans une stratégie de gouvernance des données. Déployée à l’échelle de l’organisation toute entière, la data gouvernance intègre à la fois la qualité, mais également la sécurité des données pour assurer leur déploiement à tous les niveaux de l’organisation.
De fait, ses applications concrètes au service des différents métiers sont multiples. Grâce aux données, les managers peuvent facilement évaluer l’impact des opérations menées ou les opportunités du marché, les rapports émanant du service finances se font plus précis, et les experts du marketing sont mieux informés des comportements des clients. La data gouvernance présente de nombreux avantages : vision globale sur les données recueillies, mise à disposition de ces dernières aux différents services de l’organisation, cohérence des informations, facilité de localisation, conformité vis-à-vis des réglementations en vigueur (RGPD notamment), etc
Une gouvernance qui ne s’improvise pas
Pour profiter des nombreux bénéfices qu’offre la data gouvernance, sa mise en œuvre ne doit rien laisser au hasard. Tout comme la gestion de la qualité des données, elle s’appuie sur plusieurs étapes :
- Définition de la stratégie avec rédaction d’une charte de gouvernance des données précisant les objectifs de cette démarche ;
- Choix du modèle de fonctionnement de gouvernance des données ;
- Identification des responsables de la stratégie (y compris au plus haut niveau de l’organisation) ;
- Mise en place d’une cellule dédiée, le data gouvernance office, chargé de faire le lien entre les différents services de l’organisation afin que les données circulent au mieux.
Et si, à première vue, la gouvernance des données tend à mettre l’humain de côté, son succès dépend en réalité d’une forte implication de toutes les parties prenantes au sein de l’organisation. Il est important de bien choisir les acteurs en charge de sa mise en œuvre (cadres commerciaux, RH, DSI, représentants des différents métiers) et de s’entourer de professionnels de la donnée afin que la stratégie adoptée soit efficace.