Qu’est-ce qu’un dictionnaire de données ?

Fév 22, 2023 | Data Management

Définition et utilisation d’un dictionnaire de données

Un dictionnaire de donnée se définit comme un référentiel de métadonnées qui renseigne sur le contexte d’une base de données et qui fournit les informations nécessaires pour pouvoir l’interpréter. Cette documentation facilite la gestion des bases de données et permet aux administrateurs et utilisateurs de comprendre facilement la structure de leurs bases de données.

Le dictionnaire de données décrit les données qui se trouvent dans une base de données en concentrant plusieurs types d’informations :

  • Le nom de la table
  • Le nom des champs
  • La définition des champs
  • Type de données
  • La longueur (nombre de caractères)
  • Les valeurs acceptées
  • Les relations et dépendances
  • L’emplacement du fichier
  • Le responsable du fichier
  • Les règles de calcul
  • Les indicateurs et règles de validation de la qualité des données

Un dictionnaire de donnée peut contenir un grand nombre d’informations et peut varier en fonction des besoins de ses utilisateurs.

[Livre Blanc] Gouvernance des données : organisation et stratégie à adopter en 2023

Quelles sont les différences entre un dictionnaire de données actif et un dictionnaire de donnée passif ?

Il existe deux types de dictionnaires de données, l’un est dit « actif » et l’autre « passif ».

Le dictionnaire de données actif est un référentiel de métadonnées intégré au système de gestion de base de données (SGBD). Le dictionnaire est ainsi automatiquement modifié par le SGBD lorsqu’un changement y intervient. Le dictionnaire de données actif de garder une cohérence entre l’évolution des bases de données.

Le dictionnaire de données passif est un référentiel de métadonnées qui est extérieur au SGBD qui n’est pas géré par le SGBD. Le dictionnaire passif doit être mis à jour manuellement.

Soulignons que chaque type de dictionnaire à des avantages et des inconvénients :

  • Le temps de maintenance : un dictionnaire de donnée actif se met à jour automatiquement alors qu’un dictionnaire passif requiert des modifications manuelles chronophages.
  • Le risque de désynchronisation : le dictionnaire passif devant être maintenu manuellement, présente, en conséquence, un risque plus élevé de désynchronisation entre les métadonnées du dictionnaire avec les bases de données.
  • Centralisation des métadonnées : un dictionnaire actif intégré à un SGBD centralise uniquement les données qui se trouvent dans le même SGBD. S’il existe plusieurs SGBD distincts, seul un dictionnaire de donnée passif pourront centraliser l’ensemble des métadonnées.
  • Les champs du dictionnaire : un dictionnaire intégré à un SGBD ne pourra renseigner que les métadonnées que celui fournit, tandis que le dictionnaire passif n’est pas limité.
  • Les coûts : dû au temps de maintenance qu’il nécessite, le dictionnaire passif représente un plus grand coût qu’un dictionnaire actif.
  • Interface utilisateur : les dictionnaires de données passifs proposent généralement une meilleure interface utilisateur que les dictionnaires actifs qui nécessitent souvent un langage de requête.

Comment créer un dictionnaire de données efficace et complet ?

La création d’un dictionnaire de données est une tache collaborative qui peut impliquer les data owners, les data architectes, les data analystes, la DSI et les directions métiers.

La création d’un dictionnaire de données efficace et complet implique plusieurs étapes importantes :

  1. Identifier les utilisateurs et les objectifs du dictionnaire de données.
  2. Identifier les données à inclure dans le dictionnaire en fonction de leur pertinence et fréquence d’utilisation.
  3. Identifier tous les types de données utilisés dans le système et leurs caractéristiques (par exemple, texte, nombres, dates, etc.).
  4. Déterminer les relations entre les données (par exemple, une table de clients peut être liée à une table de commandes).
  5. Établir des normes pour la dénomination des éléments de données, de manière à assurer une cohérence et une clarté tout au long du système.
  6. Établir des définitions claires pour chaque élément de données, de manière à assurer que tous les utilisateurs comprennent leur signification.
  7. Fournir des exemples d’utilisation de chaque élément de données pour aider les utilisateurs à comprendre comment ils peuvent être utilisés.
  8. Mettre à jour régulièrement le dictionnaire de données pour refléter les modifications apportées au système.
  9. Impliquer les parties prenantes et les utilisateurs du système dans la création et la validation du dictionnaire de données pour s’assurer qu’il est complet et répond à leurs besoins.

Bonnes pratiques en matière de qualité et de gouvernance des données pour votre dictionnaire de données

La gouvernance des données et la qualité de données sont essentielles pour garantir que le dictionnaire de données soit une ressource fiable et utile pour l’entreprise. Voici quelques bonnes pratiques en matière de qualité et de gouvernance des données :

  • Définissez clairement les termes et les définitions utilisés dans le dictionnaire de données pour éviter toute confusion ou interprétation erronée.
  • Maintenez le dictionnaire de données à jour en ajoutant de nouvelles définitions et en supprimant les termes obsolètes.
  • Assurez-vous que le dictionnaire de données est accessible à tous ceux qui en ont besoin, mais protégez les données sensibles.
  • Impliquez les parties prenantes dans la gouvernance et la maintenance du dictionnaire de données afin d’assurer une approche collaborative.
  • Suivez les processus de validation et de contrôle qualité pour garantir la fiabilité et l’exactitude des données.
  • Créez des rapports et des tableaux de bord pour suivre les tendances et la qualité des données.
  • Documentez les changements apportés au dictionnaire de données pour assurer la traçabilité et la transparence.

À LIRE AUSSI : Comment identifier les indicateurs de performance pour son tableau de bord ?

Exemples de dictionnaires de données

Exemple 1 : dictionnaire de données d’une BDD de factures.

Exemple d'un dictionnaire de données ADV

Exemple 2 : dictionnaire de données d’un BDD de talents.

Exemple d'un dictionnaire de données RH

Conclusion

Les dictionnaires de données sont des outils précieux pour les entreprises qui cherchent à organiser, gérer et exploiter leurs données de manière efficace. Ils permettent de standardiser les définitions de données, de faciliter la communication entre les différents services et de garantir que les données sont correctement utilisées et interprétées. De plus, les dictionnaires de données sont des éléments clés pour des projets tels que la mise en place d’entrepôts de données ou la création de rapports automatisés.

Livre Blanc

Mise en œuvre d'une stratégie 
de qualité des données 

Livre Blanc

Feuille de route d'une stratégie
de Data Management 

Baromètre annuel de la data

Les priorités des décideurs
data en 2022 

Share This