ktsdesign - stock.adobe.com
DataRobot acquiert Paxata et ajoute la préparation de données à sa plateforme IA
DataRobot a signé un accord pour acquérir Paxata, l’éditeur d’un outil de data preparation en self-service. Il souhaite améliorer les capacités de sa plateforme de création de modèles de machine learning automatisés.
DataRobot, le spécialiste de l’automatisation du machine learning basé à Boston, veut s’offrir des outils de préparation de données qui pourraient lui fournir un avantage certain sur ses concurrents.
« La vision fondatrice de DataRobot a été d’automatiser autant d’étapes que possible lors de la conception de modèles d’intelligence artificielle. Paxata comblera une lacune importante de la plateforme d’IA », déclare Mike Gualtieri, analyste chez Forrester.
DataRobot « rehausse la barre » face aux concurrents
La plupart de systèmes de création d’algorithmes ont au moins quelques fonctionnalités de préparation de données. Tout du moins, ils se connectent à des outils tiers comme ceux de Trifacta ou d’Alteryx, selon Mike Gualtieri.
« Cependant, l’intégration de Paxata au sein de la solution DataRobot rehausse la barre pour les autres éditeurs », ajoute-t-il.
Doug Hengshen, un analyste chez Constellation Research, partage ce point de vue.
« DataRobot et ses concurrents n’embarquent pas forcément des fonctionnalités de data preparation. La plupart du temps, ils s’associent à des acteurs de ce domaine particulier », déclare-t-il. « Il y a cependant une forme de pression qui pèse sur les épaules des indépendants spécialisés dans la préparation de données. Par opposition à ceux présents dans l’analytique avancée et dans la data science, les éditeurs BI ont déjà mis au point ce type de fonctionnalités ».
« En quelque sorte, cela oblige les spécialistes de la data preparation à répondre aux exigences de plus en plus sophistiquées des clients, ce qui est un bon signe pour la data science », ajoute-t-il.
Les acteurs des différents marchés se croisent et se rencontrent. En octobre dernier, MicroStrategy a annoncé la connexion avec la solution de DataRobot au sein de sa plateforme de business analytics. De son côté, Alteryx a présenté des fonctionnalités d’automatisation du machine learning par le biais de son outil Designer. Amazon Web Services a récemment montré Autopilot, un service similaire lié à AWS SageMaker.
De la préparation de données automatisée en 2020
À ce jour, Paxata a été ajoutée à l’AI Catalog de DataRobot, un environnement qui doit permettre aux utilisateurs de partager, de rechercher et d’étiqueter les données.
Disponible depuis septembre 2019, l’IA Catalog est issu de l’acquisition en début d’année de Cursor, un outil de data collaboration.
Si peu de détails ont filtré concernant le rachat de Paxata, DataRobot devrait compléter sa plateforme avec des fonctions d’automatisation processus de data preparation.
Ainsi, l’éditeur proposera d’une offre de machine learning bout en bout, de la sélection des informations aux déploiements automatisés de modèles. Idéalement, l’ajout de Paxata facilitera la mise en œuvre de la première portion d’un pipeline ML, souvent redouté par les entreprises.
« Les environnements de données des grands groupes sont volumineux et complexes », affirme Mike Gualtieri. « Des fonctionnalités de préparation comme ceux de Paxata devraient accélérer les cas d’usage de l’intelligence artificielle chez les clients de DataRobot ».
Paxata a levé près de 86 millions de dollars depuis sa date de création. De son côté, DataRobot a finalisé une levée en série E de 206 millions de dollars cette année et a collecté 430,6 millions de dollars au total auprès de fonds d’investissement. Les deux sociétés n’ont pas communiqué le montant du rachat. DataRobot a affirmé qu’il maintiendrait les services pour les clients de Paxata.
Pour l’éditeur bostonien, il s’agit de sa troisième acquisition cette année et de la cinquième depuis 2017. Plus tôt cette année, il a assimilé ParellelIM et Cursor. Des trois opérations effectuées en 2019, la dernière serait la plus importante, selon le communiqué de presse.