HP fond IDOL 10.5 dans son approche Big Data
Avec la sortie de sa plate-forme IDOL 10.5, HP intègre un peu plus les briques technologiques de sa plate-forme conceptuelle Haven et décline les fonctions d’extraction et d’analyse de données de la solution Autonomy à Vertica, ArcSight et bien sûr Hadoop.
HP a finalement décidé de renforcer les ponts d’intégration entre ses solutions qu’il destine au segment très convoité du Big Data. A la clé, la sortie de la version 10.5 de IDOL, la solution de recherche et d’extraction de données non structurées de HP (acquise avec Autonomy) dont la particularité fondamentale est de cimenter un peu plus fort les différentes briques de la plate-forme Haven du groupe.
Pour mémoire, Haven est un concept de plate-forme qui vise à proposer une cartographie des différentes technologies avec lesquelles HP entend répondre aux problématiques du Big Data. Présentée lors de l’édition 2013 de la conférence Discover, Haven a pour objectif de démontrer, d’une façon très marketing, que le groupe de Meg Whitman a la capacité de répondre à tous les scenarri possibles dans le domaine du Big Data. Elle associe pour cela, Autonomy IDOL, Vertica et ArcSight, le tout au dessus de la sphère des technologies Hadoop. HP nous avait expliqué que l’intérêt était de faciliter le développement d’applications (le « n » de Haven) analytiques à partir de cette plate-forme. Selon HP, quelque 120 partenaires adosseraient leurs applications à Haven.
Pourtant, Haven ne constituait jusqu’alors pas une architecture de référence technique pure, avec peu d’intégration technique, pré-configurées, entre les différentes couches. Cette version connecte directement IDOL à Hadoop et rapproche un peu plus la plate-forme de Vertica et d’Arcsight, indique en substance HP dans un communiqué. « Les entreprises ont désormais la possibilité de tirer profit de la vitesse de traitement de données de Vertica, de la sécurité de l’information de Arcsight ainsi que de leur investissement en créant des répositories de données Hadoop - le tout au sein d’une unique plate-forme intégrée », résume ainsi le groupe.
Appliquer les fonctions IDOL à Hadoop
Concrètement, cela se traduit par une connexion des fonctions coeur d’IDOL à Hadoop (ce que HP baptise HP IDOL for Hadoop). « Il s’agit de porter les fonctions analytiques de la plate-forme de HP aux données stockées dans un cluster Hadoop, évitant notamment les va-et-viens entre les deux plate-formes. IDOL for Hadoop, qui fonctionne avec les distributions Hadoop de Cloudera, MapR, Hortonworks et Intel (ainsi qu’avec l’édition communautaire du framework) propose donc un SDK pour embarquer des fonctions IDOL comme l’extraction d’entités, l’extraction de texte, l’analyse d’image au plus près des noeuds Hadoop, indique une FAQ sur la solution. Inutile donc de déplacer les données d’une plate-forme à l’autre. IDOL for Hadoop est disponible en trois versions (Basic, Standard, Advanced), permettant d’appliquer différentes fonctions IDOL à un cluster Hadoop (de l’extraction de texte et l’image pour la première à toutes les fonctions analytiques pour la dernière).
Autre point d’intégration : Vertica, via l’extension IDOL UDx (pour User-Defined Extension) pack for HP Vertica, dont la vocation est « d’augmenter » la base en colonne de HP avec les fonctions d’IDOL pour analyser notamment les données non structurées. Surtout, précise encore HP, il s’agit de permettre aux utilisateurs de Vertica d’utiliser SQL sur des données à la transactionnelles et non structurées. Pour la première fois, nous assure HP, les entreprises vont pouvoir utiliser des outils SQL pour analyser 100% des informations, quelles soient issues de machines, des applications d’entreprises ou généré par l’humain, comme le vidéo par exemple (structures et non structurées donc) Les fonctions proposées par IDOL, liées à l‘extraction d’entités, la géolocalisation, et les données extraites avec KeyView seront accessibles depuis Vertica.
Enfin, dernière connexion d’IDOL, celle qui relie la solution à ArcSight Enterprise Security Manager (avec les packs HP IDOL Email Analytics Pack et IDOL Social Media Analytics Pack for HP ArcSight ). L’idée est ainsi de combiner les données opérationnelles (liées à la sécurité des communications et du réseau) générées par ArcSight à l’analyse du contenu d’IDOL (des mails ainsi que des réseaux sociaux,) - afin de mieux anticiper toute perte, ou fuite, de données critiques.