Effet du hype Big Data : les environnements Hadoop ne sont pas intégrés au SI
Selon certains experts, les entreprises qui ont cédé aux sirènes marketing du Big Data ont certes implémenté des environnements Hadoop, mais ceux-ci restent en silo, isolés du SI. Les premières approches restent encore expérimentales.
Le hype autour du Big Data, très prononcé en 2012, a causé une forme de désordre, presqu’infantile, dans l’organisation des entreprises. Des environnements Hadoop en silo, un excès d’expérimentation, une exagération de l’importance des data scientists sont les problèmes de jeunesse pointés du doigt par certains experts, qui proposent que les entreprises gèrent leurs données comme un actif à part entière.
Steve Shelton, qui dirige le département Data Services au sein du cabinet de conseil Detica, une division de BAE Systems, affirme que les silos Hadoop sont devenus une composante des systèmes des entreprises, à la fois du secteur privé et public. « Les entreprises se sont focalisées sur cette nouvelle chose appelée Big Data et ont essayé de l’isoler (en 2011, comme en 2012). »
Cet effort s’est surtout concentré sur les types de données qui n’étaient pas traditionnelles. Poussé par les fournisseurs de technologies. La valeur métier des données se révèle pourtant davantage lorsqu’on considère qu’elles font partie d’un ensemble, qu’elles soient « big » ou pas, ajoute-t-il.
Les technologies Big Data ont-elles distrait les entreprises ? « Je crois que cela a fait évoluer les choses en terme d’apprentissage, mais les entreprises font aujourd’hui machine arrière. Lorsqu’on parle de gouvernance de l’information, vous devez considérer les données dans leur ensemble », soutient Shelton.
Selon lui, Detica a entendu des réclamations, des plaintes à propos de silos Hadoop, et ceux-là étaient l’oeuvre de personnes qui ont dépassé les phases de Proof-of-concept, mis rapidement en place un cluster Hadoop et ont monté une équipe. Mais une plate-forme Hadoop nécessite des dépenses supplémentaires en terme de gestion et d’intégration avec les processus existants de l’entreprise.
« Il ne s’agit pas d’une perte de temps et d’argent. Il s’agit juste d’une étape. Et ce n’est pas un défi insurmontable. La prochaine étape est d’intégrer ces silos, mais aujourd’hui, la réflexion est encore immature comparé à la technologie en elle-même », souligne encore Shelton.
Les problèmes de jeunesse du Big Data
Debra Logan, une analyste reconnue, spécialisée dans l’information management au sein de Gartner, soutient de son côté qu’il existe une exagération cohérente avec la rhétorique du Big Data. « C’est le numéro deux des termes le plus recherchés sur Gartner.com, après le Magic Quadrant, mais selon moi, d’après les entretiens menés en face à face avec les clients, il apparait que 97% des entreprises sont uniquement dans une phase exploratoire », affirme-t-elle. « Nous avons certes des clients dans les médias, qui gèrent de la vidéo, par exemple. Mais, même les banques ne gèrent pas vraiment des Big Data. Leurs données sont très organisées. L’analytique pour la détection de fraudes, par exemple, repose sur des méthodes qui n’ont pas beaucoup changé », commente-t-elle. Bien que, finalement, Hadoop soit intéressant d’un point de vue infrastructure sous-jacente, ajoute-t-elle.
Logan affirme que l’emballement actuel du marché, autour de la gestion de l’information, représente une « bonne opportunité de développement de carrière », et confirme qu’il existe bien un manque en terme de compétences et d’expertises mathématiques. Les clients de Gartner sont partis chercher de l’expertise autour de la donnée dans la communauté de fournisseurs, mais ils ne l’ont pas trouvée », affirme-t-elle.
Il y a eu certes une explosion des postes et fonctions liée à la gestion de l’information, démontrant ainsi que presque personne jusqu’alors ne contrôlait la gestion des données comme un composant métier dans les entreprises.
Gartner a parlé à près de 50 CDO (Chief Data Officer), la plupart en Amérique du nord et au Royaume-Uni et la plupart employés par des sociétés des services financiers, souvent avec une forte exigence en terme de conformité, et formés à extraire de la valeur des données.
Bien que les DSI affirment que le recrutement de data scientists soit lié au hype qui entoure le Big Data, poursuit-elle, ils reconnaissent toutefois qu’il existe bien un actif dans l’entreprise - la donnée - qui n’est aujourd’hui justement pas géré comme un actif.
Traduit de l’anglais par la rédaction