Une gouvernance de données efficace peut aider une organisation à maximiser la valeur de ses données, à réduire les risques et à améliorer la prise de décision.
Pour la mise en place d’un plan de gouvernance des données réussi, plusieurs outils sont nécessaires afin permettre aux utilisateurs de se projeter plus facilement dans la démarche de gouvernance des données.
Mise en œuvre d’une gouvernance des données
Le déploiement d’une gouvernance des données se traduit par la mise en œuvre de plusieurs chantiers majeurs :
- Le catalogage des données métier et données applicatives,
- La mise en place de référentiels abritant les données de référence de l’entreprise,
- Le déploiement des rôles et responsabilités autour des données,
- L’accompagnement spécifique des projets à fort impact sur les données.
Le déploiement d’une gouvernance des données se fait en 5 étapes :
- Définir le framework de gouvernance et son modèle de déploiement : La définition du framework de gouvernance cadre les activités et concepts pour une meilleure mise en œuvre de la gouvernance data au sein de l’organisation. Une mise en œuvre réaliste du framework s’entend par étape.
- Mettre en place l’organisation : Une fois le framework défini, sa mise en œuvre passe par une structure organisationnelle en charge de son déploiement et du soutien des projets. Cette organisation s’étoffera à mesure des projets et du déploiement de la gouvernance. Cela se fait en accord avec le cadre de gouvernance global de l’entreprise. Les sponsors exécutifs sont garants de cette organisation.
- Constituer le socle d’infrastructure : Le socle d’infrastructure est l’ensemble des outils et technologies mutualisables dans une démarche data gouvernance. La mise en œuvre du socle se fait en étapes au rythme des projets et de leurs versions.
- Définir les règles et procédures : Les règles et procédures évoquées ici couvrent l’ensemble des règles et bonnes pratiques édictées pour délimiter le cadre ou pour renforcer les leviers. Ceci inclus aussi les éléments documentaires.
- Opérer / Gouverner : La gouvernance s’appuie sur chacun des outils mis en œuvre et intervient à deux niveaux :
- Opérationnel (Projet, suivi d’activité, …)
- Managérial (Pilotage, réalignement stratégique, …).
Les outils à utiliser dans une gouvernance des données
La gouvernance n’a que peu à voir avec l’outillage, il s’agit avant tout de définir des rôles et des responsabilités, des politiques, des procédures, des contrôles, des comités…
Pourtant, quelques dispositifs permettent de faciliter la mise en place et la diffusion d’une gouvernance au sein de l’entreprise.
Le Data Catalog est une solution transverse souvent confié aux équipes en charge de la gouvernance. Il permet de découvrir, explorer, comprendre et savoir exploiter les données à sa disposition.
Le Data Glossary est « l’ouvrage de référence » partagé par les métiers et l’IT contenant l’ensemble des définitions (uniques) des données : description, référence groupe, nomenclatures, processus et sources de référence. Le dictionnaire est alimenté et placé sous la responsabilité du Data Owner et des Data Stewards, avec le soutien du Data Domain Officer.
Il peut être alimenté de deux manières :
- Dans le cadre d’initiatives métier : selon les priorités définies et validées par le Data Office, un Data Domain Officer peut lancer une initiative de documentation de tout ou partie des données de son périmètre.
- Dans le cadre des projets, qui sont une source importante d’alimentation des dictionnaires de données métier.
Le Data Dictionary regroupe les informations des bases de données et des systèmes informatiques. Il regroupe les définitions et les descriptions détaillées des jeux de données (regroupées dans des tableaux) et de leurs valeurs (champs).
Parmi les outils les plus utilisés, on retrouve les catalogues de données, les métadonnées, les outils de sécurité, les outils de qualité de données et les outils d’analyse de données.
Il est important de choisir les outils qui répondent aux besoins spécifiques de l’organisation et de mettre en place une gouvernance de la donnée continue pour assurer un traitement responsable et efficace des données.