IKATS, le projet français de Big Data industriel
Donner une plateforme Big Data complète assortie d’une boite à outils de modèles prédictifs conçu pour les besoins des industriels : telle est l’ambition du projet IKATS, un projet mené par CS avec le concours des chercheurs du LIG de Grenoble.
C’est l’un des projets du plan Big Data, l’un des 34 plans de reconquête de la nouvelle France industrielle. IKATS, pour Innovative ToolKit for Analysing Time Series est un projet de solution Big Data qui vise le secteur industriel. Son objectif est de leur fournir des modèles prédictifs notamment utilisables dans le cadre de la maintenance prédictive des équipements industriels, comme les moteurs.
Marjorie Allain-Moulet (en illustration), Responsable de l’offre Big Data chez CS et responsable technique du projet IKATS explique la genèse de cette initiative : « CS travaille sur les technologies depuis 2 à 3 ans maintenant, et l’idée a peu à peu germé : proposer un projet au Plan d’Investissements d’Avenir qui correspondait aux besoins les plus fréquemment observés chez nos clients. Nous nous sommes livrés à quelques investigations auprès d’eux et nous avons décidé par vote de nous intéresser aux problématiques de maintenance industrielle, une problématique commune à beaucoup d’industriels. »
CS est très présent dans le secteur de la Défense, auprès du Ministère de l’Intérieur, mais compte aussi de nombreux grands industriels français parmi ses clients, comme Airbus et Total. Des entreprises qui cherchent bien évidemment à optimiser les coûts de maintenance de leur outil industriel.
« Nous avions déjà commencé à nous pencher sur les technologies Big Data pour anticiper les besoins de nos clients or plusieurs personnes de CS travaillent en ce moment chez Airbus. Plusieurs étaient en prestation chez Total sur cette problématique de maintenance et nous avons très vite compris qu’il y avait dans ces entreprises un enjeu important sur le volet apprentissage et détermination de modèles prédictifs. Jusqu’à présent, les industriels ont une approche de type maintenance programmée. Cette approche leur permet d’éviter d’avoir des équipements en panne, mais elle n’est absolument pas optimisée. »
Les solutions prédictives actuelles s’apparentent à des boites noires
Cette approche de maintenance prédictive évoquée par Marjorie Allain-Moulet, les industriels français commencent à s’y intéresser depuis quelques mois, quelques années pour les plus avancés d’entre eux. Ceux-ci mettent notamment en œuvre des solutions prédictives industrielles telles que SmartSignal de General Electric.
« J’ai pu assister à une démonstration de SmartSignal, la solution de General Electric. J’ai aussi parlé avec EDF R&D qui utilise la solution PRiSM de l’éditeur Instep. On ne peut pas comparer directement ces offres à IKATS. Ces outils savent faire du prédictif, bien évidemment. Mais pour prendre l’exemple de SmartSignal, la solution apprend la signature de la machine via ses données de fonctionnement, puis le modèle est capable de dire si la machine s’écarte de ce modèle. Pour prendre un exemple, il n’est pas possible de lui apprendre à distinguer différentes classes d’anomalies. Il n’est pas possible de lui apprendre à détecter telle ou telle anomalie. GE a annoncé que SmartSignal va migrer sur une plateforme Big Data, mais le rôle de SmartSignal est de déclencher une alerte lorsqu’un écart de fonctionnement est détecté et pas de fournir des modèles prédictif ouverts. Le rôle d’IKATS sera de fournir les modèles sous forme de boite à outils. Libre à l’utilisateur de définir ses alertes, de classifier les alertes, de faire du prédictif pour le système d’information métier, etc. Les gens d’EDF R&D nous ont confiés qu’IKATS pourrait trouver sa place chez eux carleurs Data Scientists voudraient customiser les modèles. »
La boite à outil IKATS doitpermettre aux utilisateurs de construire leurs modèles prédictifs à partir de données issues de leurs capteurs, des données temporelles.
« C’est l’une des caractéristiques de ce domaine et c’est notre ambition d’être le plus complet possible sur ce domaine des séries temporelles. Cela concerne tous types d’équipements, tous types de capteurs, qu’ils soient de pression, de températures et pour lesquels on enregistre leur valeur. La série de valeurs n’est pas forcément continue, avec une mesure à un instant t, une série 6 mois plus tard, à une fréquence variable, etc. Les difficultés liées aux séries temporelles ne sont pas bien traitées par les outils du marché. A l’échelle du Big Data, c’est très complexe », estime la chef de projet.
IKATS veut être une plateforme ouverte pour les Data Scientists
Le projet IKATS a été soumis au jury des projets d’investissement d’avenir en juin 2014 et a pu démarrer en janvier 2015. C’est un projet qui va durer 3 ans. Il est mené par CS en partenariat avec le laboratoire Informatique de Grenoble (LIG) dont Gilles Bisson, chercheur spécialiste du Machine Learning, un spécialiste de l’analyse des données de l’équipe de recherche AMA et un spécialiste de la visualisation de données à grande échelle de l’IIHM. Trois doctorants vont travailler sur la durée des 3 années du projet.
Les résultats de leurs recherches seront intégrés à la boite à outils IKATS qui sera livrée à l’issue du projet. Enfin, IKATS intégrera un volet « data visualisation », un outil nécessaire afin de naviguer dans les très gros volumes de données générés par les équipements industriels.
Pour l’instant, les efforts de l’équipe projet IKATS se sont portés sur l’architecture de la plateforme. Une plateforme qui va être constituée par étapes. « Nous privilégions la plus grande ouverture possible carles choses évoluent très vite dans le Big Data », estime Marjorie Allain-Moulet. « Nous devons pouvoir échanger à tout moment une brique technologique par une autre. »
IKATS s’appuie pour l’heure sur la plateforme Big Data Spark et le langage Python. Les premiers développements ont été menés sur ces éléments. A terme, nous pourrons développer d’autres briques en Java ou en Scala, si ces langages s’avèrent plus efficaces pour certains calculs.
En termes de base de données, les ingénieurs ont fait le choix d’OpenTSDB, une base de données spécialisée dans les séries temporelles. « Notre objectif est de privilégier l’Open Source car les communautés Open Source sont très présentes dans le Big Data. Nous veillerons à ce qu’IKATS soit compatible avec diverses distributions Hadoop. »
Un atout pour IKATS : être conçu au plus près de ses futurs utilisateurs
« Le soutien d’utilisateurs potentiels de la plateforme nous a aidés à convaincre le jury des projets d’investissement d’avenir. Airbus et EDF R&D ont rédigé des lettres de soutien au projet et s’ils ne se sont pas engagés formellement dans le projet, ils vont intervenir à titre participatif. Ils vont participer à certains de nos choix et vont nous alimenter en « data » avec des données réelles sur lesquelles nous pourrons valider nos modèles. »
Ce choix d’associer des industriels de nature relativement différente doit permettre, selon Marjorie Allain-Moulet, de garantir de ne pas faire d’IKATS une plateforme prédictive dédiée à l’aéronautique ou l’énergie.
« Ce choix nous garantit une certaine généricité de la plateforme. Les industriels vont nous fournir des « use cases ». Nous irons les interviewer, bien identifier les problèmes qu’ils cherchent à résoudre, de quels modèles prédictifs ils ont besoin. A charge pour nous de les développer et de leur prouver l’efficacité de la plateforme IKATS. En échange de leur participation, ils disposeront des résultats de nos analyses. »
Outre les chercheurs, ce sont en moyenne une dizaine de personnes qui vont travailler sur le projet chez CS, le prestataire étant responsable de l’intégration de projet. CS s’est engagé à livrer une version par an du prototype.
Que deviendra IKATS à l’issue des 3 années du projet ? Les responsables de CS n’ont pas encore totalement défini le business model de la solution.
« Le mode de commercialisation d’IKATS n’a pas été formellement établi. Il est assez clair que nous n’irons pas vers un modèle de vente de licence et que nous devrions privilégier la vente de services et de ressources pour aider nos clients dans leurs projets Big Data », conclut Marjorie Allain-Moulet.