Le data quality management, ou gestion de la qualité des données en français, est une discipline qui vise à s’assurer que les données exploitées au sein d’une entreprise sont fiables, précises et complètes.
Le data quality management intègre des chantiers d’analyse, de surveillance et de correction des données, ainsi que la mise en place de processus et de standards pour améliorer la qualité des données progressivement dans le temps.
Le but est de s’assurer que les données sont utilisables pour prendre des décisions d’affaires éclairées et de réduire les risques liés à l’utilisation de données erronées ou incomplètes.
Quels sont les problèmes de qualité de données ?
La data quality est citée comme un des freins majeurs au bon déploiement des cas d’usage data. La mise en qualité des données est un chantier de Data Management, qui implique une gouvernance des données et une acculturation forte.
Les problèmes de data quality trouve leurs sources dans le manque de bonnes pratiques et de processus lors de la phase de saisie ou d’enregistrement d’une donnée par les utilisateurs finaux.
Elles altèrent la performance de la stratégie data à plusieurs niveaux :
- Les données manquantes : Les données qui ne sont pas remplies ou qui ont été oubliées lors de la saisie peuvent entraîner des incohérences et des erreurs dans les analyses et les décisions.
- Les données incomplètes : Les données qui ne contiennent pas toutes les informations nécessaires pour une bonne exploitation peuvent être inutiles ou trompeuses.
- Les données erronées : Les données qui contiennent des erreurs de saisie, des erreurs de calcul ou des informations incorrectes peuvent entraîner des décisions erronées.
- Les doublons de données : Les données qui sont enregistrées plusieurs fois dans différents systèmes ou bases de données peuvent entraîner des incohérences.
- Les données non conformes : Les données qui ne respectent pas les normes ou les règles de l’entreprise peuvent causer des problèmes lors de l’intégration ou de l’analyse des données.
- Les données non sécurisées : Les données qui ne sont pas protégées contre les accès non autorisés, la modification ou la suppression peuvent causer des dommages importants à l’entreprise.
- Les données non pertinentes : Les données qui ne sont pas liées aux objectifs de l’entreprise doivent être filtrées pour éviter de créer des confusions par les analystes.
Panorama des outils de Data Quality
Beaucoup d’outils de Data Quality Management permettent aux entreprises résoudre leur problématique de qualité des données. Cependant, il faut noter que des méthodologies de mise en qualité des données et une conduite du changement sont à mener en priorité pour s’assurer d’installer des pratiques de qualité pérennes.
Les outils de Data Quality Management peuvent aider à démocratiser les usages, et accompagner les directions métiers à gagner en maturité en matière de gestion des données. Voici quelques outils intéressants à envisager :
- Les outils de nettoyage de données : Ces outils automatisent la détection et la correction des données manquantes, incomplètes, erronées et redondantes.
- Les outils de validation de données : Ces outils vérifient que les données respectent les normes et les règles de l’entreprise avant qu’elles ne soient enregistrées ou utilisées.
- Les outils de gestion de la qualité des données : Ces outils permettent de surveiller et de gérer la qualité des données à travers l’ensemble de l’entreprise, y compris la création de rapports et de tableaux de bord.
- Les outils de MDM : Ces outils permettent de gérer les données clés de l’entreprise, telles que les données clients, les données produits et les données de référence, pour assurer l’intégrité et l’uniformité des données à travers l’entreprise.
- Les outils de gestion de la sécurité des données : Ces outils protègent les données contre les accès non autorisés, la modification ou la suppression.
- Les outils de Data Governance : Ces outils permettent de définir les rôles et les responsabilités des différents acteurs de l’entreprise en matière de gestion de la qualité des données, de définir les normes et les règles et de mettre en place des processus pour assurer la qualité des données.
Data Quality Manager : rôles et missions dans l’organisation
Beaucoup de nouvelles fonctions apparaissent au sein d’un Data Office depuis quelques années. Outre les Chief Data Officers, on observe l’émergence de fonction dédiée à un domaine du Data Management, le Data Quality Manager en fait partie.
Un Data Quality Manager est une personne en charge de la gestion de la qualité des données dans l’organisation. Il est chargé de s’assurer que les données utilisées par l’entreprise sont fiables, précises et complètes, et qu’elles sont utilisées de manière efficace pour prendre des décisions d’affaires éclairées.
Les missions d’un Data Quality Manager peuvent être les suivantes :
- La mise en place de processus et de politiques de Data Quality Management.
- La surveillance et l’analyse des données pour détecter les problèmes de qualité.
- La mise en place d’outils de Data Quality pour automatiser la détection et la correction des données non conformes.
- La définition et le suivi d’indicateurs pour mesurer et suivre la qualité des données.
- La participation à la mise en place de la gouvernance des données, en définissant les rôles et les responsabilités des différents acteurs de l’entreprise en matière de gestion de la qualité des données.
- L’acculturation et la communication avec les différents départements de l’entreprise pour s’assurer que les processus sont compris et exploités.
Un Data Quality Manager trouve généralement sa place au sein du Data Office, mais peut également travailler au sein de départements métiers tels que le marketing, les finances, les ressources humaines, etc.
Data Quality Analyst : rôles et missions dans l’organisation
Les Data Quality Analysts sont en charge d’analyser et de surveiller la qualité des données dans une entreprise. Le Data Quality Analyst travaille souvent en étroite collaboration avec un Data Quality Manager pour s’assurer opérationnellement que les processus de qualité de données mis en place soient bien respectés, mais également pour effectuer une analyse de données plus en profondeur.
Les missions d’un Data Quality Analyst peuvent être les suivantes :
- L’analyse des données pour détecter les problèmes de qualité, tels que les données manquantes, incomplètes, erronées ou redondantes.
- La création de tests et de validation pour s’assurer que les données respectent les normes et les règles de l’entreprise.
- La mise en place d’outils pour automatiser la détection et la correction des données erronées.
- La participation à l’amélioration continue des processus de gestion de la qualité des données.
- La création de rapports et de tableaux de bord pour suivre la qualité des données.
Un Data Quality Analyst est souvent chargé de l’analyse des données en profondeur et de la mise en place de processus pour améliorer la qualité des données, alors qu’un Data Quality Manager est chargé de la supervision et de la mise en place de politiques globales pour gérer la qualité des données.
Quels sont les indicateurs de Data Quality ?
Il existe de nombreux indicateurs de qualité de données qui peuvent être utilisés pour mesurer la qualité des données dans une entreprise :
- Taux de données manquantes : Le pourcentage de données qui ne sont pas remplies ou qui ont été oubliées lors de la saisie.
- Taux d’erreur : Le pourcentage de données qui contiennent des erreurs de saisie, des erreurs de calcul ou des informations incorrectes.
- Taux de redondance : Le pourcentage de données qui sont enregistrées plusieurs fois dans différents systèmes ou bases de données.
- Taux de conformité : Le pourcentage de données qui respectent les normes et les règles de l’entreprise.
- Taux de sécurité : Le pourcentage de données qui sont protégées contre les accès non autorisés, la modification ou la suppression.
- Taux de pertinence : Le pourcentage de données qui sont liées aux objectifs de l’entreprise.
- Taux de fiabilité : Le pourcentage de données qui sont utilisables pour prendre des décisions d’affaires éclairées.