idspopd - Fotolia
IBM muscle les services de Watson Data Platform
Un nouveau moteur analytique pour faciliter la mise en place de clusters Hadoop et Spark, un service de préparation de données et un autre de catalogue de métadonnées…IBM veut mieux préparer les entreprises à l’IA dans le Cloud (que l’on ne doit plus prononcer Bluemix)
Accompagner les entreprises dans la mise en place de politiques de gouvernance de données. C’est ainsi que pourraient être interprétées plusieurs annonces d’IBM autour de son offre Watson Data Platform dont la vocation est de compiler un ensemble de services Cloud pour gérer de bout en bout le cycle des données. Objectif avancé d’IBM : permettre aux entreprises de mieux préparer et gérer leurs données pour exploiter les outils d’intelligence artificielle chers à la marque. Mais avant cela, la gouvernance s’impose.
Analytic Engine : un BigInsight remodelé
Big Blue a d’abord annoncé la dernière évolution de IBM BigInsight on Cloud, un service Cloud qui jusqu’alors permettait de provisionner des clusters Hadoop sur le Cloud IBM. Ce service se transforme aujourd’hui en un service plus global, nommé sobrement Analytic Engine, et dont l’ambition première est de simplifier l’expérience utilisateur des développeurs, des ingénieurs de la donnée et des data scientists, résume IBM dans un billet de blog.
Si évidemment, ce service permet de provisionner des clusters Hadoop et Spark « en quelques minutes », la particularité de ce moteur analytique est de proposer une architecture censée favoriser cette notion d’élasticité – une des spécificités du Cloud. Analytic Engine sépare clairement la couche traitement de celle du stockage des données – une architecture empruntée également par Snowflake pour son entrepôt de données dans le Cloud.
Avec cette approche, les données sont stockées dans un service commun, Cloud Object Storage Service, et les clusters sont provisionnés au- dessus. Ces derniers se connectent à façon à cette source de données . Cette séparation « apporte une plus grande flexibilité et fiabilité. Parce que les clusters se sont pas acteurs dans le stockage des données, vous pouvez provisionner un cluster le temps d’un unique job, et le supprimer une fois la tâche finalisée, sans risquer de perdre des données », résume IBM, dans ce même billet de blog.
Un catalogue de données et métadonnées
L’autre nouveau service de la Watson Data Platform s’apparente à un outil qui permet de cataloguer les données dont les sources sont hétérogènes et disséminées dans nombre de systèmes – en silo – de l’entreprise. L’idée est ici de proposer un index général qui référence les données tant structurées et non structurées, et les classe afin d’en faciliter l’utilisation et le partage, le tout à partir de politique d’accès.
Ce service (Data Catalog) permet de « découvrir ou d’apporter du contexte aux données. Il classe automatiquement (via des algorithmes de Machine Learning, NDLR) les données pour que vous puissiez savoir où les données critiques sont stockées, reliées à des définitions métiers », explique IBM dans un billet de blog.
Une raffinerie de données
Data Refinery est le 3e service présenté par IBM. Celui-ci est un outil de transformation des données qui se connecte aux sources des données des entreprises, (tant sur site que dans le Cloud) via des connecteurs pour ainsi les préparer à de futurs usages dans d’autres outils tiers. Cette raffinerie de la donnée permet, via glisser-déposer, de définir des séquences de transformation – des recettes – qui seront ensuite appliquées aux jeux de données. Spark sert de moteur d’exécution à l’ensemble, précise IBM dans un billet de blog.
Bluemix disparaît, fondu dans IBM Cloud
La donnée, ainsi que l’ensemble des services qui s’y raccordent, sont devenus l’un des principaux moteurs d’IBM, alors que le groupe tente d’orienter de plus en plus son discours et sa stratégie vers les usages de l’IT et non plus vraiment sur l’infrastructure et la « plomberie ». Après avoir gommé SoftLayer de son discours, c’est désormais au tour de Bluemix de changer de nom pour se voir désormais fondu dans une seule et même marque : IBM Cloud. Celle-ci sera désormais la seule enseigne Cloud de Big Blue.