Cisco Live : ThousandEyes prédit les mauvaises expériences utilisateurs
Le nouveau logiciel WAN Insights est capable de dire à quelle date des ralentissements impacteront les applications en ligne. Ce moteur prédictif devrait à terme fonctionner pour les équipements réseau de Cisco.
L’expérience utilisateur ne sera plus dégradée quand les salariés utilisent des applications en ligne comme Office 365. ThousandEyes, la branche de Cisco qui édite des outils pour monitorer la performance d’Internet, lance WAN Insights. Ce logiciel SaaS prédit quand des engorgements vont avoir lieu sur le lien WAN d’une succursale et indique sur quel autre lien il faudrait basculer pour ne pas en souffrir. Auparavant, les logiciels de ThousandEyes ne faisaient que diagnostiquer un incident en cours.
« Quand vous comparez l’environnement utilisateur d’aujourd’hui à celui d’il y a trois ans, vous vous rendez compte que la plupart des applications ont basculé sur Internet. Or, le problème d’Internet est que vous ignorez si les liens vont fonctionner avec la bande passante et la latence attendues. Contrairement au SI que vous avez dans votre datacenter, vous ne maîtrisez rien », lance Mohit Lad, le directeur général de ThousandEyes.
Mohit LadDirecteur général, ThousandEyes
« Pour combler ce manque, nous avons eu l’idée d’analyser le trafic passé afin d’y détecter les signes avant-coureurs d’une congestion. Il suffit ensuite à WAN Insights de détecter ces signes avant-coureurs pour prédire quand arrivera le prochain engorgement. »
Selon les dires de Mohit Lad, WAN Insights serait non seulement capable de faire des prédictions sur le long terme – au minimum 24 heures avant un incident – mais il saurait aussi moduler ses recommandations selon les usages. Il pourrait recommander de passer les communications vocales par une route bis uniquement, ou alors dévier à certaines heures le trafic d’Office 365, de Salesforce. Le DG de ThousandEyes affirme que Cisco pourra paramétrer son produit pour l’adapter aussi à n’importe quelle application métier qu’une entreprise aurait fait développer à façon.
Demander au SD-WAN de changer de route vers les applications
Les entreprises concernées par ce produit sont typiquement celles qui disposent de plusieurs succursales équipées d’un SD-WAN. Avant que l’essentiel des applications fonctionne depuis Internet, les succursales étaient reliées uniquement au datacenter de leur siège local, qui hébergeait les applications d’entreprise (serveurs NAS, Exchange, Intranet, etc.). Ce datacenter faisait la jonction vers Internet si les succursales nécessitaient d’aller chercher des informations sur le web.
La montée en puissance des applications sur Internet a transformé le datacenter en goulet d’étranglement. Cela a incité les entreprises à doter leurs succursales de plusieurs liens : le lien d’origine (MPLS, souvent), un lien direct vers Internet (une connexion publique fibre ou ADSL généralement) et d’autres liens de secours (cellulaire 4G/5G, voire liens fibres/ADSL additionnels). La bascule entre ces différents liens, appelés WAN, est assurée par un boîtier SD-WAN qui fait office de box multiopérateurs. Les boîtiers SD-WAN sont configurables pour que tel ou tel flux passe par tel ou tel lien. Mais ce design fait par l’entreprise ne vaut que si tous les liens fonctionnent parfaitement.
Mohit LadDirecteur général, ThousandEyes
Lors des démonstrations auxquelles LeMagIT a pu assister, les congestions que WAN Insights permettait d’éviter étaient récurrentes, suggérant que le logiciel ne servirait en définitive qu’une seule fois, juste pour découvrir les heures fixes où il est nécessaire de programmer une bonne fois pour toutes des changements de route. « La réalité est que les congestions n’arrivent pas à heures fixes », tranche Mohit Lad. Selon lui, il ne s’agit pas non plus de simplement acheter plus de bande passante sur un lien pour régler les problèmes une bonne fois pour toutes.
« Les impressions de ralentissement dont souffriront les utilisateurs sont une combinaison de problèmes qui peuvent arriver sur un lien, sur un segment de chemin vers une application, sur la zone qui héberge l’application. Pour faire nos prédictions, nous nous basons sur l’historique des bandes passantes enregistrées au niveau du SD-WAN, mais aussi sur l’historique des données classiques d’Internet qui constituent le métier traditionnel de ThousandEyes », dit-il.
Un Français à la tête des recherches prédictives chez Cisco
En vérité, WAN Insights n’est pas un produit conçu par ThousandEyes, mais bien par Cisco lui-même, ou plus exactement par son centre de R&D en machine Learning dirigé par le Français Jean-Philippe Vasseur.
« Nous travaillons sur les réseaux prédictifs depuis 2019. Le produit que nous lançons aujourd’hui, qui s’appelle WAN Insights sous la marque ThousandEyes, sera décliné ensuite sur toute notre gamme d’équipements réseau, avec le même principe : nous prenons un historique des métriques enregistrées par l’équipement, nous le chargeons dans un moteur de machine learning en cloud et nous en tirons des prédictions de congestion à une date donnée, ainsi que des conseils pour éviter le problème », dit l’intéressé.
Pour une raison stratégique que leMagIT n’a pas bien comprise, WAN Insights sera lui-même recommercialisé plus tard dans l’année sous la marque Viptela, celle des SD-WAN que vend Cisco.
Selon Jean-Philippe Vasseur, WAN Insights est déjà en test depuis six mois chez une vingtaine de clients de Cisco pour monitorer 150 SD-WAN. « L’intérêt principal de notre modèle prédictif est qu’une entreprise ne se trouve plus à devoir être très réactive quand un problème arrive, elle prend les mesures très en amont pour ne pas que le problème arrive. »
Pour fonctionner, le moteur prédictif aurait besoin d’au moins deux semaines d’historique. Dans le cas de WAN Insights, Cisco a choisi de remonter deux mois d’historique. « C’est juste une question d’implémentation », précise notre interlocuteur. « Si vous êtes déjà client de Viptela, l’historique est chargé et les prédictions peuvent être faites une heure et demie seulement après avoir activé le service. SI vous installez un nouveau SD-WAN, alors vous attendrez deux semaines. »
Il sous-entend que la plupart des autres produits prétendant faire de la détection de pannes par intelligence artificielle ne se basent pas réellement sur un moteur de machine learning, mais juste sur des statistiques.
« Honnêtement, ça fait des années que tous les fournisseurs parlent d’être prédictifs, mais personne n’y est véritablement arrivé. Si nous y parvenons, c’est parce que nos équipements produisent bien plus de métriques que ceux de nos concurrents et que nous donnons à notre moteur de machine learning des données que nous allons chercher loin dans l’historique. »
L’enjeu d’un moteur de machine learning qui fonctionne à grande échelle
« Le problème du machine learning, c’est que c’est très facile à faire à petite échelle. Mais dès qu’il faut analyser beaucoup de données, cela devient éminemment scientifique. Ce n’est même pas une question d’algorithme, il y a l’enjeu de savoir quelles données utiliser comment. Nous travaillons depuis dix ans sur ce sujet. »
Jean-Philippe VasseurDirecteur centre de R&D en machine Learning, Cisco
Parmi les concurrents de Cisco sur le SD-WAN, seul Versa Networks utiliserait véritablement du machine learning pour prédire les pannes. Mais son moteur ne serait alimenté que par une seule source de données : les logs.
« Pour faire des prédictions valables, vous ne pouvez pas vous contenter d’une seule source de données. Vous devez en prendre un maximum. La difficulté est alors que ces données ne sont pas de même nature. Notre solution consiste donc dans un premier temps à prendre toutes ces métriques et à les transformer pour qu’elles présentent toutes la même forme, afin qu’elles soient toutes analysables par notre moteur de machine learning. Mais, en soi, notre moteur ne sait même pas d’où viennent les métriques qu’il analyse. »
Tout comme pour les nouvelles consoles SaaS que Cisco vient de lancer pour le monitoring réseau, WAN Insights se contente de donner des conseils pour éviter les problèmes, mais il ne prend pas automatiquement la main sur les équipements pour les reconfigurer lui-même. « Techniquement, faire du self-healing n’est pas très compliqué et nous pensons pouvoir le proposer à terme. En revanche, les entreprises ne veulent généralement pas d’un système qui prend des décisions tout seul pour des questions de réglementations », conclut Jean-Philippe Vasseur.