Analyse : Embrasser le Big Data ou perdre du terrain face à la concurrence

Lors de la conférence Talend Connect, nos partenaires de SearchDatamanagement ont assisté à une session portant sur la nécessité pour les entreprises de mieux appréhender les technologies du Big Data. Car il s’agit aujourd’hui de mettre un premier pied dans le mouvement avant de se laisser distancer, expliquent deux analystes.

Les entreprises qui ne tirent pas profit des opportunités offertes par la gestion du Big Data et des technologies analytiques associées risquent de prendre du retard par rapport à la concurrence, voire se faire irrémédiablement distancer, a affirmé un analyste lors l’événement Talend Connect.

Le monde entier ne fait que débuter avec les technologies liées au Big Data comme Hadoop ou MapReduce, et certains obstacles, comme la pénurie de compétences et la traditionnelle résistance au changement - continuent de faire barrage à leur adoption, explique Jeff Kelly, analyste contributeur du site Wikibon.org.

Mais, poursuit-il, les entreprises qui adhèrent au principe aujourd’hui sont celles qui guideront les autres dans un futur pas si éloigné, lorsque les barrières à l’adoption ne seront plus si élevées. Les entreprises qui exploitent les Big Data auront ainsi accès à de meilleures capacités décisionnelles prédictives pour au final générer davantage de revenus que celles qui auront laissé de côté ces techniques.

«Nous observons le phénomène du Big Data depuis plusieurs années et nous sommes arrivés à la conclusion que ces technologies constituent désormais un avantage concurrentiel pour toutes les industries, souligne Kelly. Bien que cela puisse paraître quelque peu passe-partout comme argument, nous réalisons aujourd’hui qu’il n’existera pas une industrie qui ne sera pas impactée par le Big Data.»

L’expression «Big Data» fait référence à la vaste quantité de données, tant structurées que non structurées, générés par les machines, les sites sociaux et les terminaux mobiles. Elle  est également utilisée dans le monde du stockage et dans les technologies analytiques pour désigner les analystes prédictives que l’on peut en tirer. Les technologies bien connues de gestion des Big Data sont Hadoop Distributed File System, MapReduce, Hive, Pig et Mahout.

Les avantages d’être «data-driven»

Kelly n’était pas le seul à s’exprimer sur l’importance pour les entreprises d'inclure toutes leurs données dans leurs schémas décisionnels. Tony Fraser, partenaire de Neo@Ogilvy, le bras marketing de Ogilvy & Mather, une société spécialisée dans les relations publiques et dans la publicité en ligne et le numérique, était également présent.

Fraser a présenté aux participants de la conférence quelques exemples concrets de processus de décision ancrés dans la gestion des données. L’hôtel Casino Paris de Las Vegas a par exemple signé un partenariat avec NEO@Ogilvy pour augmenter sa base clientèle. Le groupe de Fraser est parvenu à mener cette opération en analysant, dans un premier temps,  tout ce que les clients avaient à dire de positif sur Paris, sur les plates-formes sociales ainsi que sur les sites de voyage. Il en est ressorti que de nombreux exemples et expériences positives des clients étaient liées à la vue sur la fontaine de l’Hotel Casino Le Bellagio, située de l’autre côté du boulevard. Grâce à ces données, l’équipe NEO@Ogilvy a développé une nouvelle publicité, mettant en valeur ce panorama. «Dès que cette publicité est sortie, les réservations ont augmenté», commente Fraser.

Les obstacles à l’adoption du Big Data

Si les technologies de gestion des Big Data créent le buzz, il apparait toutefois que leur niveau d’adoption reste bas pour deux raisons principales, note Kelly. Premièrement, Hadoop et les autres technologies liées au Big Data sont particulièrement difficiles à utiliser et les profils adéquats se font rares. Aujourd’hui, les entreprises recrutent des doctorants pour gérer le côté analytique de l’équation Big Data, et ces profils très qualifiés demandent des salaires élevés. «Les compétences nécessaires pour gérer, déployer et monitorer Hadoop ne sont pas forcément les mêmes que celles d’un administrateur de base de données Oracle, affirme Kelly. Par exemple, si vous voulez devenir «data scientist» sur la partie analytique, nous devez savoir comment développer un job MapReduce, ce qui ne revient pas à écrire une requête SQL.»

Le deuxième obstacle réside dans le fait que la plupart des entreprises n’ont pas l’approche ni la culture pour tirer profit des Big Data. Les grandes entreprises sont aujourd’hui sont davantage habituées à cartographier leurs activités via une combinaison entrepôt de données et technologies de Business Intelligence. Mais selon Kelly, ce tandem correspond à analyser le passé, tandis que le Big Data est davantage tourné vers le futur et la prédiction. «Appréhender les Big Data nécessite un changement, un virage fondamental que doivent négocier certaines entreprises pour avoir confiance dans les données et suivre la voie qu’elles ouvrent, dit-il. Le Big Data, c’ est regarder le futur, faire des prédictions et agir.»

Vers une démocratisation du Big Data ?

Comme bon nombre de technologies émergentes, la gestion des Big Data et de l’analytique risque fort, à terme, de devenir accessible à tous. Une démocratisation ?  Des étapes importantes devront d'abord  être franchies, nuance Kelly.

En ce qui concerne les débutants, de nouveaux outils et technologies sont nécessaires pour réduire la complexité associée aux technologies de Big Data. Des entreprises, comme Talend, Hortonworks et Cloudera - travaillent à cela. Mais, souligne-t-il, des travaux doivent être réalisés pour faciliter le déploiement, l’administration et la sécurité des clusters Hadoop et créer ainsi des intégrations entre les processus et les sources de données. «Aujourd’hui, soit vous disposez de compétences avancées en MapReduce ou sur d’autres langages, soit vous faites de SAS ou d’autres éditeurs votre data scientist, indique Kelly. Nous avons besoin d’outils qui permettent de faire abstraction de certains domaines d’expertise de façon à pouvoir se passer d’un doctorant pour explorer le monde du Big Data.»

La démocratisation du Big Data nécessitera également une bonne dose de formation et d’apprentissage sur des sujets comme l’infrastructure Big Data, le déploiement et l’administration Hadoop, l’intégration et le scheduling de jobs MapReduce, ajoute Kelly. «Nous devons vraiment prendre le problème par les deux bouts. D’abord rendre les outils et les technologies plus faciles à utiliser. Puis nous devons également investir dans la formation et les ressources éducatives afin d’accompagner les DBA et les analystes métiers dans l'ère du Big Data.»

Pour approfondir sur Outils décisionnels et analytiques