Insight 2015 : IBM concrétise sa stratégie autour de Spark

IBM lance officiellement un service Spark pour Bluemix et généralise l’intégration des bibliothèques du projet Open Source à ses applications.

Sans surprise, IBM a profité de sa conférence Insight 2015 qui se tient actuellement aux Etats-Unis pour déployer officiellement son arsenal Spark. Mettant ainsi en marche sa stratégie dévoilée en juin dernier et concrétisant ses ambitions fortes dans la technologie Open Source. 

Il faut dire que des ambitions pour Spark, IBM n’en manque pas. Big Blue a ainsi confirmé avoir progressivement intégré les bibliothèques de Spark (Machine learning, In-Memory et streaming de données) au sein de ses applicatifs, à commencer évidemment par les outils analytiques du groupe, mais également certaines solutions eCommerce. Plus de 15 applications ont ainsi été optimisées avec Spark, dont IBM BigInsights, IBM Stream ou encore SPSS.  La base de données Informix a subi le même sort.

 « SPSS utilise l’infrastructure de Spark pour accélérer le traitement des Big Data », ajoute Rajesh Bordawekar, qui présentait la plateforme Spark sur l’événement. Les équipes d’IBM ont également travaillé à optimiser Spark pour Power 8. « Les bibliothèques de Spark ont été adaptées à la plateforme d’IBM. Des travaux ont aussi été effectués pour que Spark exploite les capacités des GPU – l’utilisateur n’a pas à modifier le code, assure-t-il encore. 

Plus encore, capitaliser sur Spark a permis à IBM de rationaliser les architectures de ses applications, en les dotant des puissantes fonctions de Spark d’abord (comme les capacités de dimensionnement, de répartition et de connectivités aux données), mais aussi en faisant maigrir leurs bases de code. Par exemple, Dataworks, un service de raffinement et de préparations de données, a vu son code réduit de 87%, assure IBM. De 40 millions de lignes de code à…5 millions.

Un service Spark pour Bluemix 

Autre pan de l’engagement d’IBM dans Spark concrétisé lors d’Insight 2015, la disponibilité d’un service Cloud Spark pour Bluemix ,le Paas du groupe, hébergé sur l’infrastructure SoftLayer. Ce Spark-as-a-service cible évidemment les développeurs et a pour vocation de leur permettre d’intégrer facilement – dixit IBM – des capacités analytiques à leurs applications. Encore une fois, il est question ici d’abaisser les barrière à l’entrée de Spark en s’appuyant sur le Cloud et les capacités d’intégration promises par Bluemix. Et sans avoir à gérer les questions de gestions des clusters Spark. 

Enfin, IBM confirme aussi avoir finalisé la mise à l’Open Source de SystemML, la bibliothèque de Machine Learning du groupe et avoir effectué une soixantaine de contributions à la communauté Spark. Le Technology Center, basé à San Francisco, compte désormais 35 contributeurs Spark.

 Faire du Spark sans le savoir ?

 Restera enfin une question : si comme l’assure Rob Thomas, en charge du développement produit IBM Analytics, la technologie va assurément gagner en maturité, il apparaît toutefois que les entreprises ne sont pas toutes au même stade en matière d’usage de la donnée. Sur ce point, le poids d’IBM pourrait faire accélérer les processus d’adoption.

 Car l’une des ambitions d’IBM est justement de gommer la complexité induite de Spark, assure Beth Smith à la tête des activités Analytics Platform. Il s’agit là de simplifier Spark et « de porter la data science au cœur des entreprises ».  Avec le service Spark dans Bluemix et l’intégration des bibliothèques au sein des applicatifs IBM, il se pourrait bien que les entreprises finissent par faire du Spark, sans le savoir.

 

 

Pour approfondir sur Outils décisionnels et analytiques