Les types d’architecture data
Pour réussir la mise en production des cas d’usage data, définis lors de la phase de cadrage, les entreprises doivent choisir et implémenter une plateforme data basée sur une architecture adaptée à leurs besoins et leurs contraintes.
Plusieurs typologies de plateformes data, guidées par des principes d’architectures différents, existent au sein des SI :
- Le data warehouse: dépôt central de données structurées pour une exploitation en matière de reporting et de prise de décision dans un contexte BI ou EPM.
- Le data lake : dépôt central de données structurées et non structurées exploité par des professionnels des données et des algorithmes pour des analyses approfondies dans un contexte IA / Machine Learning.
- Le data hub: Système de gestion de données structurées de référence qui facilite l’exploitation et le partage de données fiables auprès d’applications et systèmes d’entreprise.
La distinction entre data lake et data hub est peu perceptible dans certaines configurations. Seule l’ambition souhaitée pour la plateforme et les usages particuliers de la data qu’elle implique, éclairent la situation.
L’arbitrage entre data lake et data hub dépend des orientations de l’entreprise et de ses modes de consommation de la donnée : le data lake concentre l’usage de la donnée alors que le data hub se prête mieux à des usages décentralisés de la data.
Pourquoi choisir un hébergement dans le cloud ?
La plupart des entreprises privilégient un hébergement de la plateforme data dans le cloud. De plus en plus, le cloud devient la norme en informatique. Le marché du cloud gagne en intensité année après année : nouveaux produits, feuilles de route éditeurs chargées, fusions/acquisitions, partenariats, etc.
Le choix du cloud entraîne tout de même des arbitrages à réaliser par les directions générales et directions informatiques, notamment en ce qui concerne la localisation, la réglementation (RGPD, Cloud Act), le droit d’audit, la ré-internalisation et la stratégie de sortie des contrats d’externalisation.
Certaines études démontrent qu’une grande partie des entreprises envisagent de fermer leurs centres de données traditionnels d’ici 2025. Cette statistique nous démontre que la construction d’architectures data dans le cloud tend à se généraliser.
On peut le confirmer notamment en étudiant le marché des fournisseurs de plateformes cloud qui est très dynamique et en constante évolution. Il offre une grande variété de solutions et de catalogues de services.
> À LIRE AUSSI : 10 raisons d’une migration cloud dans un projet Big Data
Comment mettre en place une cloud data platform ?
Pour assurer la réussite de l’implémentation d’une cloud data platform, il est important de mener à bien son projet selon 3 prismes : la stratégie, la donnée et l’architecture.
Le choix et la mise en place d’une plateforme data dans le cloud doivent être en phase avec la stratégie data définie au préalable par l’entreprise. Il est important que la plateforme soit conçue de façon à accueillir les cas d’usage générateurs de valeur et qu’elle puisse répondre aux contraintes de conformité et de sécurité.
L’implémentation d’une cloud data platform doit s’accompagner d’une solide gouvernance de la donnée, qui permet d’installer une culture, une organisation, des processus et des règles qui structureront la gestion et l’exploitation de la donnée. Cette gouvernance doit susciter un sentiment de confiance entre producteurs et consommateurs de la donnée (dispositifs de data certification sur les sujets de conformité, de sécurité, de qualité et de traçabilité).
Certaines pratiques et principes architecturaux doivent également être respectés dans la mise en place d’une cloud data platform :
- S’assurer de l’adéquation des outils et des technologies aux besoins et au partage des données,
- Adopter une méthode d’avancement itérative en réalisant un déploiement progressif guidé par la valeur,
- S’assurer d’avoir échangé et partagé avec tous les acteurs pour définir le juste niveau de service,
- Définir une roadmap en tenant compte des impératifs, de la complexité et du cycle de vie des composants SI,
- Mettre en place un socle commun adapté à tous les métiers et tous les usages.
Par Abdelaziz Joudar
Président chez DataValue Consulting
La rédaction vous conseille
> Data warehouse, data lake, data hub : quelles différences ?
> Migrer ses environnements Big Data vers le cloud