Hadoop et Big Data se rapprochent du monde relationnel en 2013
Nos confrères de SearchDataManagement ont interrogé plusieurs spécialistes du secteur de la gestion des données afin de réaliser leur précieuse prévision pour 2013. Résultat, un rapprochement des systèmes Big Data et de NoSQL avec le monde plus traditionnel de SQL.
Le phénomène du Big Data s’est façonné en 2011, mais a connu une croissance fulgurante en 2012, modifiant partiellement, mais d’une façon drastique, tous les aspects de la gestion des données. Les systèmes de Big Data ont ainsi entrainé des changements dans les méthodes de gestion et de traitements de données machine, dans les opérations d’extraction (ETL), désormais gérées en continu, dans la BI opérationnelle, le datawarehouse cloud... et bien d’autres encore. Ce qui est incontestable.
Pourtant, à l’aube de 2013, aucune des technologies Big Data ne semblent être plus actives que les bases de données NoSQL et le framework Hadoop. Et, surtout, leur marge de progression semble aujourd’hui presque sans limite. A lui seul, par exemple, le marché des technologies Hadoop - MapReduce doit progresser en moyenne de 58 % par an, pour atteindre 2,2 milliards de dollars en 2018, selon une étude de MarketAnalysis datant d'août 2012.
NoSQL et Hadoop semblent ainsi être les deux moyens clés pour prendre en charge les données non-structurées, comme les textes ou encore les logs. Comme le montre Apache Hadoop, ces technologies ont souvent des racines liées à l’Open Source, et sont entrés très récemment dans le monde commercial.
Selon Judith Hurwitz, présidente et CEO de Hurwitz and Associates, les architectures Big Data et les traitements massivement parallèles ont incroyablement modifié le monde de la donnée. « Jusqu’alors, même si les données étaient un élément important pour les entreprises, elles ne disposaient pas de la capacité suffisante pour collecter de grands volumes de données et les analyser en temps réel, affirme-t-elle. Mais aujourd’hui, les choses jusqu’alors peu pratiques le sont devenues. Cela a poussé les données hors de leur zone de confort », affirme-t-elle.
SQL, sonné, revient à la charge
Comme souvent évoqué dans nos colonnes, 2012 a débuté avec la prédiction d’une vague de tumultes sur le segment des bases de données relationnelles. Ce qui s’est en partie concrétisé. Après avoir affronté pendant des années de prétendues alternatives, les bases de données relationnelles ont en effet rencontré cette fois-ci quelques concurrents sérieux, en matière de gestion de grands volumes de données, problématique à laquelle sont confrontées actuellement les entreprises.
Derrière cette tendance, la volonté des entreprises de prendre en compte et de traiter davantage de données non structurées, à un rythme plus rapide afin d’intégrer les données au cœur des processus de décision. Les méthodes et processus habituels sont ainsi retravaillés pour y intégrer le meilleur de ces nouvelles techniques.
Et, à en juger certaines décisions des géants de la gestion des données en 2012, l’impact du Big Data et d’Hadoop sur les bases relationnelles est évident:
- IBM a poursuivi sa stratégie d’acquisitions dans le domaine de l’analytique, sur un rythme certes plus ralenti qu’en 2011. Sur ce segment, les travaux de Big Blue ont consisté à d’abord améliorer certains produits, comme avec NoSQL Graph Store for DB2 10 et InfoSphere Warehouse 10, ou encore à déployer un arsenal avec son PureData dont la vocation est de « domestiquer » les Big Data dans l’entreprise.
- En début d’année, Oracle a annoncé son appliance Big Data, suivi peu de temps après par Oracle NoSQL Database 2.0 douée de possibilités de re-équilibrage automatique, de nouvelles API pour la manipulation d’objets et une intégration plus étroite avec la base de données de la marque (permettant par exemple d'effectuer directement une requête sur Oracle NoSQL avec SQL).
- Microsoft a quant à lui présenté en avant-première le support de Hadoop dans Windows Azure et Windows Server, Teradata a lancé son Aster Big Analytics Appliance ; Informatica a présenté une édition Big Data de sa suite PowerCenter qui porte les développement pour Hadoop dans l’environnement de développement d’Informatica.
SQL a ainsi encaissé quelques coups en 2012, mais a refusé de se coucher. Les éditeurs, spécialisées dans Hadoop et NoSQL ont de leur côté mis à niveau leur stratégie SQL cette année. A l’image de Cloudera, ce pure-player du monde Hadoop, dont le projet Impala, un moteur de requête SQL pour Hadoop, est dans tous les esprits.
Le virage Big Data
Une telle tendance est révélatrice d’un mouvement : celui qui rapproche de plus en plus SQL et NoSQL. En un sens, avec le buzz provoqué par le Big Data, SQL avait quelque peu été laissé de côté. « Ces dernières années, à cause du mouvement Big Data, SQL s’est un peu effacé du discours », commente Ronnie Beggs, vice-président du marketing de SQLstream, qui développe des bases de données. Entretemps, poursuit-il, le Big Data et NoSQL ont décollé en tant que problématiques et sont entrés dans le vocabulaire commun.
En 2013, les premiers fruits devraient être visibles. Il y a eu de nombreux projets ces dernières années pour rapprocher les bases de données NoSQL du développement SQL, ajoute-t-il. Cela est en train d’évoluer. Nous allons assister ces prochaines années au retour de SQL en tant qu’interface de toutes les plates-formes Big Data, affirme Beggs.
Cette évolution, qui consiste à faire co-exister le framework Hadoop, NoSQL et SQL pourrait marquer une nouvelle étape dans la maturité du Big Data. En 2013, ainsi, il est possible que le Big Data passe d’un statut de sujet à la mode, à une réalité concrète. « Je pense que les entreprises essaient de dépasser le hype qui entoure le Big Data pour vraiment comprendre où se trouve sa valeur », confirme Colin White, président et fondateur du cabinet BI Research. « En 2013, je suis sûr de trouver de vrais cas d’usage au sein d’entreprises qui tentent d’extraire de la valeur de ces données en volume. Il ne s’agit pas que de Big Data, mais de ce que l’entreprise fait avec les bonnes données. »
Même si l’intérêt pour les nouvelles technologies va grandissant, toutes les entreprises ne passeront pas sur des systèmes Big Data au même rythme, a récemment indiqué un responsable des services d’intégration d’une grande banque à nos confrères de SearchDataManagement. Selon lui, le secteur bancaire est aujourd’hui l’un des secteurs où les principes du Big Data sont, parfois partiellement, en action. La banque, comme d’autres industries, considére les données en volume, mais pas nécessairement l’aspect non structuré de ces données. C’est au moins le cas aujourd’hui.
« Lorsqu’on considère les principes du Big Data, on remarque deux faces : primo, le volume. Deuxio, les données non structurées. Les banques ne sont confrontées qu’à la première, affirme-t-il. Mais nous ne collectons pas les tweets, du moins pas encore. Nous sommes encore dans l’expectative, à réfléchir encore sur comment les services de données financières pourraient en profiter. »
Traduit et adapté de l’anglais par la rédaction