Gouvernance des données : comment maitriser ses données de référence et assurer leur qualité ?

Nov 21, 2022 | Data Gouvernance

Gouvernance des données : une priorité forte mais un sujet difficile à mettre en place

DataValue Consulting a mené une enquête sur les priorités data 2022 en interrogeant des décideurs de grandes entreprises et de grandes administrations. Nous avons ainsi pu identifier les freins principaux qu’ils rencontrent dans leurs projets data. On remarque alors que la gouvernance des données, comme la qualité de donnée, l’organisation ou encore la résistance au changement sont encore problématiques pour de nombreuses organisations.

Les principaux freins à la réussite des projets data

La gouvernance des données, autrement dit, les pratiques et processus qui nous permettent de maitriser le capital data de l’entreprise, repose sur un déploiement à 3 niveaux :

  • L’organisation autour de la gouvernance : la définition des rôles et des responsabilités, la comitologie et les processus.
  • Le data management : les règles, outils et processus liés aux référentiels, la qualité des données, le tagging de données, l’organisation des données et la sécurité.
  • L’acculturation : le programme d’acculturation interne vise à sensibiliser et à former les interlocuteurs internes pour développer le niveau de maitrise et de compréhension des enjeux data.
[Livre Blanc] Gouvernance des données : organisation et stratégie à adopter en 2023

Aujourd’hui, une grande partie des entreprises rencontrent un problème majeur dans les projets de gouvernance : le manque de coordination. Les équipes IT, les départements métiers et les data office construisent leur propre feuille de route ce qui mène à des initiatives isolées. La roadmap data n’est alors pas optimisée, les jalons ne sont pas accordés, les résultats ne sont pas clairement identifiés, et cette situation génère des lenteurs et des freins.

Il est nécessaire d’investir dans la création d’une feuille de route optimale, qui fixe un objectif commun à toute l’entreprise et qui offre de la visibilité à chacun. Ce travail central doit prévoir et ordonnancer tous les chantiers au travers d’un planning général qui est la concrétisation de la stratégie définie.

Quelle démarche pour réussir sa mise sous gouvernance des données ?

Pour construire sa feuille de route, il est important d’identifier le niveau de maturité data de l’entreprise. Ce niveau de maturité peut être évalué à deux niveaux :

  • la maturité culturelle (organisation et acculturation) de l’entreprise,
  • la maturité de son patrimoine data (data management).

Voici un exemple de matrice qui retrace les 5 niveaux de maturité, de l’organisation « anarchique » à la gouvernance des données 2.0.

Matrice de maturité culturelle et patrimoniale

L’audit de maturité permet de mettre en relief la stratégie data en mettant en évidences les écarts entre l’objectif stratégique et l’existant.

data-centry-company

La vision business portée par les dirigeants permettra d’aboutir à la définition de la stratégie data qui elle-même guidera la manière dont sera créée la valeur à partir de la donnée. Plusieurs cas d’usage émaneront, certains seront propres à certaines entités, d’autres transverses à l’entreprise.

Pour mener à bien ces cas d’usage, il faudra alors :

  • Mettre en place une organisation (rôles, responsabilités, processus…),
  • Allouer des ressources (compétences, outils…)
  • S’accorder sur un modèle de delivery (planning, jalons, KPI…)
  • Instaurer un programme d’acculturation (création de groupes, planning de formation et de sensibilisation…).

Alors, les bases du data management et de la gouvernance des données seront posées et se perfectionneront au fur et mesure de la montée en maturité de l’entreprise.

À LIRE AUSSI : Roadmap data : du recueil des besoins métiers au recensement des cas d’usage

Comment appréhender la problématique de qualité des données ?

La qualité de donnée représente un frein pour de nombreuses entreprises. Malgré les initiatives menées, les résultats sont souvent décevants et les actions silotées.

Ce type de situation peut s’expliquer par un manque de synergie entre les périmètres, un manque de gouvernance ou même d’acculturation.

La démarche de mise en qualité de données doit nécessairement traiter quatre piliers :

  1. La stratégie : définition du niveau de qualité et de non-qualité acceptable d’une donnée.
  2. Les processus :
    1. Le curatif : les processus à mettre en place pour traiter les anomalies en aval et contrôler la qualité, la correction en masse les données au niveau des socles de données, etc.
    2. Le préventif : la gouvernance à installer qui ancre les processus du curatif dans l’entreprise, les indicateurs à mettre en place pour suivre leur évolution, etc.
  3. L’organisation humaine :
    1. L’acculturation : amélioration des connaissances data en interne, plan d’acculturation ciblé par type de population, plan de formation et de sensibilisation, etc.
    2. L’organisation : rôles / responsabilités pour mener à bien la stratégie, présence d’un Chief Data Officer, sponsoring du top management, nomination de data steward parmi les équipes métiers, etc.
  4. La supervision : les KPI à mettre en place, mise en place d’un plan d’amélioration continue, etc.

En quoi les données de références constituent-elles un chantier souvent prioritaire ?

Le référentiel de données est le système qui gère les données transverses aux différents services de l’entreprise, cela concerne, par exemple, les données clients, les contrats, les données sur les produits… Le nombre de référentiels varie grandement d’une organisation à une autre, dans une entreprise industrielle de taille moyenne, on retrouve généralement une centaine de référentiels, dans certaines grandes administrations, on peut atteindre entre 600 et 700 référentiels.

Aujourd’hui, toutes les organisations entreprennent des projets de référentiels de données. Ces projets sont essentiels sur le chemin de la gouvernance 2.0 pour assurer la maitrise des données à disposition. La gestion des référentiels se fait alors progressivement via des itérations sur les données de chaque département. Certains référentiels sont plus complexes que d’autres et nécessitent des opérations plus importantes comme le référentiel produit dont la chaine est bien plus diffuse dans l’entreprise qu’un référentiel client.

C’est pour cela qu’il faut accompagner et organiser en amont les projets de référentiels pour assurer la réconciliation des bases et la qualité des données. Le déploiement des référentiels est orchestré par jalon, une fois qu’un domaine est traité, des opérations automatiques sont établies pour assurer la mise à niveau du référentiel.

Pour assurer la qualité des référentiels de données, des rôles doivent être clairement attribués pour nettoyer et traiter les référentiels, assurer leur cohérence globale et leur diffusion au sein de l’entreprise.

Quel est le lien et la causalité entre référentiels et qualité de donnée ?

Dans un cadre de gouvernance des données, les indicateurs de qualité de données instaurés dans l’entreprise vont permettre d’identifier les problématiques de référentiel de données. L’ensemble des critères et des KPI mis en place se retrouvent dans un tableau de bord de qualité qui regroupe 3 grandes familles d’indicateurs : les critères intrinsèques, les critères de services et les critères de sécurité.

KPI pour mesurer la qualité des données

Le suivi de la qualité des référentiels repose essentiellement sur le tableau de bord de qualité de données et sur les indicateurs d’unicité et de cohérence. Il est conseillé d’organiser des corrections mensuelles pour vérifier la qualité des référentiels : les contrats sont-ils tous rattachés à un client ? Les clients ont-ils tous un identifiant différent ? Les clés secondaires en relation avec des référentiels existants sont-elles toutes identifiées ? Tous les travaux entrepris pour améliorer les référentiels de données amélioreront également la qualité générale des données de l’entreprise.

Comment minimiser les freins à la mise en place de ces dispositifs ?

Même en mettant en place des processus et des outils, de nombreuses entreprises rencontrent encore des freins dans la gestion des référentiels et de la qualité des données. Le problème majeur est celui de l’acculturation et de la gestion du changement.

Le manque d’acculturation crée de l’incompréhension et un manque de connaissance sur les données à disposition, leur exploitation, leur partage… Il est crucial d’aborder les questions d’acculturation dès le début, c’est une priorité qui permettra d’identifier les cas d’usage générateurs de valeur et de mener sereinement les projets data qui suivront.

Pour éveiller l’adhésion des collaborateurs dès le début de projet, il est conseillé d’exposer la cartographie des données et des métadonnées pertinentes d’une manière compréhensibles pour accroitre rapidement la conscience data dans l’entreprise. Cette cartographie peut être diffusée dans les communications internes (newsletter, email d’information…) ou lors d’évènements internes (sensibilisation, formation…). Il est également favorable de prioriser les cas d’usages simples et rapides qui corrigent la donnée, les collaborateurs et la qualité de leurs tableaux de bord en seront directement impactés et cela favorisera l’adhésion commune et une envie d’aller plus loin dans les sujets data.

Au-delà du manque d’acculturation, les freins peuvent également venir d’un manque d’outils, ou du mauvais choix d’outils. La gestion de la qualité et des référentiels peut s’appuyer sur les outils de cartographie, de glossaire de données, de traçabilité, de vérification de la conformité… L’objectif est de mettre en place des bonnes pratiques, mais également d’automatiser un certain nombre d’opérations pour faciliter et industrialiser ce travail. Il existe de nombreux types d’outils et le choix de ceux qui seront mis en place doit s’appuyer l’audit du patrimoine data et les problématiques à résoudre.

Livre Blanc

Mise en œuvre d'une stratégie 
de qualité des données 

Livre Blanc

Feuille de route d'une stratégie
de Data Management 

Baromètre annuel de la data

Les priorités des décideurs
data en 2022 

Share This