Migration Hadoop : que faire de votre Hortonworks ?

Juin 22, 2021 | Archi/Big Data

Même si elles sont jeunes, certaines technologies Big Data sont frappées d’obsolescence. La fin du support des distributions Hadoop Hortonworks en est une parfaite illustration. Cette annonce impose une migration big data pour les utilisateurs, qui peut également se transformer en opportunité.

Les conséquences du rachat d’Hortonworks par Cloudera

Alors que nombre d’entreprises, en particulier parmi les ETI, étudient leur primo-équipement en technologie Big Data, certaines organisations travaillent déjà à moderniser leurs systèmes, souvent sous la contrainte. La principale raison de ce type de migrations provient du rachat d’Hortonworks par Cloudera.

En France, sous l’influence de certains évangélistes data, le discours présentant le Big Data comme un outil permettant de mettre un terme aux coûts de licences des éditeurs jugés disproportionnés, a favorisé le développement d’Hortonworks. Selon les dernières études, moins d’une entreprise française de moins de 1000 personnes sur cinq est équipée de Hadoop.

Cet éditeur de distribution Hadoop mise sur un modèle d’accès libre à la technologie, couplé à des services de support et de maintenance payants.

Si bien qu’Hortonworks s’est adjugé une part de marché comprise entre 60 et 70% parmi les entreprises françaises utilisant Hadoop. Là où Cloudera, qui fait reposer son activité sur un modèle Freemium, est le leader au niveau mondial.

Le choix d’Hortonworks par une large part des entreprises françaises a favorisé la construction de chaînes de valeur basées sur des outils supportés par cet éditeur, en particulier Hive couplé avec Spark.

L’arrêt annoncé du support d’Hortonworks, dont les utilisateurs sont aujourd’hui incités à migrer vers Cloudera, soulève un certain nombre de questions relatives aux montées de versions et à certains outils qui ne seront plus supportés à l’avenir, ce qui va imposer la migration de certains traitements aujourd’hui en production.

Que faire face à l’arrêt annoncé du support d’Hortonworks ? Les entreprises doivent réfléchir à un scénario de sortie. En évaluant les risques et les coûts de chacune des quatre hypothèses suivantes.

Réussir sa migration vers le Big Data

Une obsolescence programmée Hortonworks, quatre possibilités

1. Temporiser avec sa solution Hortonworks

La première option consiste à jouer la montre. Il est possible que l’obsolescence soit un choix raisonnable, en tout cas pour un temps.

Bien que les versions 2 d’Hortonworks ne seront plus supportées d’ici un an, il peut s’agir de technologies abouties et maîtrisées par leurs utilisateurs. Ce qui, dans un environnement mouvant (rappelons que le troisième grand éditeur de distribution Hadoop, MapR, a lui aussi été racheté par HPE), peut constituer une alternative intéressante.

Par ailleurs, nous avons déjà assisté à des retours arrière dans le monde Open Source, après que des éditeurs aient été confronté à un manque d’adhésion des utilisateurs (Sqoop v2 est revenu en v1, malgré l’annonce de l’abandon de cette dernière dans un premier temps).

Cela reste un pari dangereux, bien que l’on puisse comprendre le raisonnement des entreprises qui continueraient à investir sur une plateforme maîtrisée.

2. Migrer vers Cloudera

Le choix de migration vers Hortonworks v3 ou directement vers la Cloudera Data Platform implique de mettre en place un projet structurant :

  • Migration des données entre les deux plateformes,
  • Recodage de la quasi-totalité des traitements Hive.

Au-delà même des questions relatives à la continuité de la production lors de cette opération, il est ici question d’un effort très significatif, estimé entre 20 et 30% de l’effort de départ pour les applications en production. Ce choix peut donc avoir un impact sur les environnements dont le retour sur investissement n’est pas encore totalement établi.

Nous observons peu d’initiative lancées en ce sens par les entreprises, qui préfèrent attendre avant de lancer les demandes d’investissements en interne. Et ce, même si les échéances se rapprochent dangereusement, avec la fin du support d’Hortonworks 2.6 en 2021 et celle du support de la v3 en 2022.

Un constat à prendre en considération par les grands comptes hexagonaux de la banque, de l’assurance ou de l’énergie qui font tourner des dizaines d’applications en production sur des data lakes Hortonworks.

> À LIRE AUSSI : Big Data : 10 raisons pour migrer vers le cloud

3. Créer une nouvelle communauté Hadoop

Contrairement au logiciel propriétaire, l’Open Source offre toujours à ses utilisateurs une porte de sortie de dernier recours : la reprise en main de la technologie. La fin du support d’Hortonworks et le fait que Cloudera, son repreneur, base son modèle économique sur des licences classiques pourraient inciter certaines organisations à se regrouper pour créer leur propre distribution Hadoop sur mesure.

Une alternative qui pourrait, par exemple, tenter des acteurs du secteur public qui ont beaucoup investi sur la donnée et se détournent massivement du modèle de licences.

4. Profiter de cette transition pour aller dans le PaaS

L’obsolescence d’Hortonworks illustre les dangers de la dépendance des entreprises aux évolutions des technologies, dictées par les éditeurs. Migrer vers des services Hadoop en mode PaaS permet d’être plus indépendant des évolutions des technologies, qui sont prises en charge par les fournisseurs de Cloud public.

D’autant que le modèle économique du Cloud est souvent bien adapté pour des applications décisionnelles qui constituent l’essentiel des usages des environnements Big Data aujourd’hui. Attention toutefois : le choix du PaaS recrée une autre forme de dépendance technologique… vis-à-vis du fournisseur de Cloud cette fois.

 

La rédaction vous conseille 

> Points de vigilance pour réussir sa migration Big Data

> Quels coûts directs et indirects pour votre migration Big Data ?

Nos ressources

Livre Blanc

Mise en oeuvre d'une stratégie 
de qualité des données 

Livre Blanc

Feuille de route d'une stratégie
de Data Management 

Enquête Nationale

État des lieux du pilotage 
dans le secteur public en 2021 

Share This