L’analyse prédictive : une pilule miracle pour le monitoring d’applications distribuées
L'analyse des données des performances des applications n'est pas un processus instantané, mais permet de résoudre plus rapidement les problèmes IT.
Comment disposer d’une vue complète d’une application en un clin d’œil, depuis un unique tableau de bord, alors que justement une application a tout de distribué ?
Pour leurs applications, les entreprises s’appuient sur de multiples plateformes, que ce soit sur site, dans un ou plusieurs clouds, utilisent des architectures hautement distribuées, des microservices et des conteneurs. Comparées aux applications monolithiques, les applications distribuées diminuent la capacité de surveillance, ainsi que l'efficacité et la précision des analyses. Les entreprises doivent choisir les bons outils et mettre en place un processus distribué de suivi des applications.
Avec la montée en puissance des applications distribuées, des outils d'analyse prédictive sont apparus sur le marché pour mieux traiter les problèmes liés à cette forme de réactivité, induite par les microservices par exemple.
Cette technologie prédictive évalue statistiquement les tendances et les données historiques, puis utilise des techniques, comme le Machine Learning et l'exploration de données, pour faire des suggestions sur des événements – qu’ils soient à venir ou inconnus. Bien qu'elle ne soit pas infaillible, l'analyse prédictive a la capacité de réduire ne serait-ce que quelques événements au cours du cycle de vie d'une application. Cela peut donc générer d'énormes économies de coûts. Cependant, le monitoring et l'analyse prédictives ne résolvent pas tous les problèmes, car les services informatiques doivent encore décider ce qu'ils surveillent et à quel moment.
L’architecture distribuée : quels sont les problèmes
Les applications sont passées d'une conception monolithique, bâtie sur un serveur unique, à une approche distribuée, avec des composants autonomes qui résident sur des éléments dynamiques de l'infrastructure IT. Le monitoring ne peut pas avoir un seul objectif ; il doit couvrir un large éventail de ressources, comme le stockage externe, le réseau et la puissance de calcul.
L'analyse prédictive devient donc encore plus compliquée. Pour déterminer les éléments de l'application et d'infrastructure à surveiller, il convient de commencer par le haut et le bas de la pile, puis ajouter les autres éléments. La couche la plus haute concerne l'expérience qu’a le client avec l'application.
L'aspect client de l'application est essentiel à l'évaluation de la performance globale, mais il est difficile d'y appliquer l'analyse prédictive. Les problèmes de performance des applications peuvent apparaître à n’importe quel moment et sont, par conséquent, difficiles à prévoir.
La valeur de l’analyse prédictive diminue si l'information ne peut être utilisée sur plusieurs systèmes pour obtenir une image complète. Sans cette cartographie d’ensemble, il est difficile de déterminer l'impact des problèmes sur l'ensemble des applications. L'époque de l'application en silo est révolue, dépassée par l’interconnexion de composants. Pour les équipes opérationnelles, il manque des pièces au puzzle.
Les éléments qu’il faut écouter
Pour monitorer complétement une application distribuée, il faudrait une petite armée d'informaticiens avec, à leur disposition, de nombreux outils cloud et sur site. À moins d'avoir un budget illimité, ce n'est pas faisable. En matière d’analyse prédictive, la clé du succès réside dans la méthode utilisée pour collecter, partager et utiliser les données, plus que dans la capacité de Machine Learning brute ou dans la reconnaissance des patterns.
Une recommandation est de corréler l'analyse prédictive à l'expérience client. Si les analyses prennent en compte l’expérience utilisateur, l'équipe d'exploitation peut soit prévenir ou minimiser l'impact des bogues et des défaillances, soit, au moins, comprendre quel sera l'impact et fournir des solutions de contournement.
Limites de l'analyse IT prédictive
En matière de monitoring d’applications distribuées, l'objectif de l'analyse prédictive est de détecter et d’anticiper les problèmes, mais toutes les pannes ou tous les incidents ne sont pas évitables. L'analyse ne peut en effet pas se faire en temps réel.
Le délai d'exécution de l'analyse prédictive est une vraie préoccupation. L'apprentissage machine et le data mining ne vont pas de pair avec le reporting en temps réel. Les responsables tout comme les ingénieurs doivent comprendre que les systèmes d'analyse prédictive nécessitent du temps pour traiter suffisamment de données et les analyser avant que les résultats apparaissent. Le temps peut varier de quelques heures à quelques jours selon le volume de données. Les administrateurs peuvent certes réduire les jeux de données, mais cela nuit à la précision de l'analyse.
L'analyse prédictive ne peut pas traiter tous les incidents susceptibles de perturber les applications. Les pannes d'électricité à grande échelle, les fournisseurs de cloud computing qui flanchent et les pannes matérielles sont des événements imprévisibles. Mais plus votre entreprise dispose de données, meilleurs seront les résultats.