Pour 95% des entreprises interrogées dans le cadre du baromètre annuel « Les priorités data des décideurs en 2023 », la gestion de la qualité des données est un enjeu primordial pour la réussite de leur stratégie data.
Quels processus de gestion adopter pour une bonne qualité des données ?
Améliorer la qualité des données, un investissement rentable
La data constitue une chaîne de valeur à elle seule. Sur l’ensemble de son cycle de vie et dans tous les aspects de son exploitation, son impact sur l’activité des organisations ne cesse de grandir.
Que ce soit pour la réussite de la stratégie globale, des cas d’usage complexes ou celle des activités opérationnelles récurrentes, la qualité des données est critique par essence. Volet primordial de la gouvernance des données, la gestion de la qualité des données implique un engagement constant, des processus éclairés et une acculturation appropriée.
Comment garantir la qualité des données ?
Le processus de gestion de la qualité des données doit être itératif en s’appuyant sur une mise à niveau de la qualité des données « by design » vers un niveau de qualité standard défini, dans la stratégie data.
Il faut définir des processus de prévention de la non-qualité en amont ainsi que des processus de remédiation des anomalies en aval, sans oublier des contrôles de l’intégrité des données. En somme, cette approche implique davantage de planification dans votre gestion de la qualité des données. Sans cela, la valeur de votre patrimoine de données va diminuer et impactera vos activités opérationnelles.
Notre approche de la gestion de la qualité des données se décline en 6 phases qui, toutes conjointes, permettent d’atteindre le niveau de qualité nécessaire à toute organisation.
Mise en qualité des données : les mesures-clés à ne pas manquer
Les entreprises françaises estiment qu’une proportion non négligeable de leur patrimoine de données n’est pas au niveau de qualité attendu. Conscientes de ces écueils à éviter, la majorité d’entre elles a déjà essayé de mettre en place un processus de gestion des données qui embarquent des bonnes pratiques et des techniques de mesure et de contrôle des données.
DataValue Consulting identifie 8 mesures-clés pour assurer une mise en qualité des données optimale :
- L’amélioration de la qualité des données est avant tout une démarche organisationnelle qui vise à adapter les investissements aux enjeux de qualité.
- C’est également une démarche incrémentale : par sources de données, domaines métiers ou par ensembles de tribus fonctionnelles.
- La mise en place d’une stratégie de qualité de données va mobiliser toute votre organisation, modifier son fonctionnement et ses habitudes de travail. Un volet de conduite du changement sera à prendre en compte et l’empressement n’est pas de mise.
- La démarche cible devrait combiner un contrôle a posteriori avec une démarche de production de qualité au niveau des sources.
- La qualité des données est à définir sur un périmètre ciblé via des « quick wins » dans le cadre d’une vision long terme.
- L’outillage n’est pas une fin en soi : les solutions servent de support à l’évaluation de la qualité, en référentiel de contrôle, mais ce sont les processus mis en place qui pérennisent les travaux.
- La qualité des données est un sujet transverse, des producteurs aux consommateurs via des contrats d’usage.
- Pour garantir la qualité de données dans la durée, il faut construire une trajectoire de transformation où l’on capitalise à chaque étape. La transformation doit être progressive, en s’appuyant sur un modèle industriel reproductible (prototypable, certifiable, généralisable).
Vous l’aurez compris, la qualité des données ne doit pas être une préoccupation des seules équipes data ou IT : elle doit être l’affaire de tous.
La démarche de qualité des données n’est pas qu’un processus ponctuel, c’est elle qui doit se trouver au cœur de tous les processus data de votre organisation. Une approche positive et suffisamment organisée de la qualité de vos données va vous ouvrir les portes de l’optimisation, de l’accélération ou de la meilleure rentabilité de n’importe quel sujet data.