alphaspirit - stock.adobe.com

IA : Amazon Lookout for Metrics part à la chasse aux anomalies

À la fin du mois de mars, AWS a annoncé la disponibilité générale d’Amazon Lookout for Metrics. Ce service propulsé au machine learning doit aider ses utilisateurs à détecter toute sorte d’anomalies dans des données de séries chronologiques, qu’elles soient issues d’un flot de logs ou de transactions financières.

Qui a dit que la détection d’anomalie et de causes profondes est réservée à la supervision IT ? C’est sans doute avec cette question dans le coin de la tête que les responsables du développement d’AWS ont imaginé Amazon Lookout for Metrics.

Présenté en décembre 2020, le service suit le calendrier traditionnel des produits du géant du cloud. Il s’inscrit dans la gamme Lookout, des services dédiés à la détection d’anomalies. Là où Lookout for Equipment mesure de potentiels défauts en provenance d’appareils connectés et Lookout for Vision se destine à l’inspection visuelle à partir de flux vidéo, Lookout for Metrics est sans doute le service le plus généraliste des trois.

« De manière générale, nous essayons d’aider les clients à entraîner et déployer des modèles de machine learning pour résoudre des problèmes business clairement identifiés sans avoir des compétences de machine learning fortes, voire sans aucune compétence ML et sans gérer d’infrastructure », déclare Julien Simon, Global Technical Evangelist, Artificial Intelligence & Machine learning, chez AWS.

« Lookout for Metrics part de séries temporelles en provenance de n’importe quelles divisions de l’entreprise afin d’y détecter des anomalies ».
Julien SimonGlobal Technical Evangelist, Artificial Intelligence & Machine learning, AWS

« Lookout for Metrics part de séries temporelles en provenance de n’importe quelles divisions de l’entreprise afin d’y détecter des anomalies ».

Dans un billet de blog, AWS, assure que Lookout for Metrics est compatible avec 19 sources de données dont Amazon S3, Redshift, Cloudwatch, Amazon RDS, ainsi que Salesforce, Zendesk ou encore Marketo.

Dans sa foire aux questions, le géant du cloud est plus précis. Il indique que Lookout for Metrics se connecte aux « magasins de données courants », dont S3, RDS, Redshift et Cloudwatch. En revanche, il « utilise » des applications SaaS, celles citées au-dessus, mais aussi AWS Lambda, Amazon SNS, Slack, PagerDuty ou Datadog pour transmettre les résultats des détections.

Comment fonctionne Amazon Lookout for Metrics ?

Pour charger des données en provenance des applications externes, il faut utiliser Amazon AppFlow, l’outil d’intégration avec des logiciels SaaS tiers d’AWS. Celui-ci fait converger les séries temporelles dans un bucket S3 accessible par Lookout for Metrics.

Une fois le flux de données et le jeu de donnée associés à un bucket, il convient de créer un « détecteur », le fameux modèle de détection d’anomalies. Avant de confier les accès ARN à partir d’AWS IAM, l’on décide si l’on étudie des données historiques ou si l’on analyse des informations à intervalle régulier. Lookout for Metrics reconnaît automatiquement le schéma de données des fichiers CSV ou JSON en entrée. Sur une page nommée Map files, Lookout for Metrics demande les champs sur lequel il faudra appliquer les détections. Le fournisseur indique qu’il est possible de désigner cinq mesures (champs) et cinq dimensions (catégories) par jeux de données afin de créer, en quelque sorte, la table qui emmagasine les résultats des traitements.

La combinaison de champs associés à un tampon chronologique génère ce qu’AWS appelle une métrique, l’unité employée pour facturer le service.

Cette combinaison de colonnes et de lignes est transmise à un moteur d’AutoML qui sélectionne le modèle de machine learning le plus pertinent pour la tâche à accomplir. La première fois, l’entraînement dure 20 à 25 minutes, selon AWS, ensuite le job peut être appliqué toutes les cinq minutes, 10 minutes, une heure ou 24 heures.

Puis, l’utilisateur peut définir une alerte qui sera envoyée vers Amazon SNS, Datadog, PagerDuty, des webhooks, Slack. Lambda permet de créer des actions personnalisées en réponse à une détection d’anomalie. Pour configurer l’alerte, le service donne un score de confiance sur 100 à partir duquel l’utilisateur s’appuie pour indiquer un seuil.

« Il y a beaucoup d’algorithmes de détection qui existent, mais il faut préparer les données time series, appliquer une bonne dose de feature engineering. La majorité des entreprises n’ont pas ces compétences. Il s’agit d’offrir un service disposant d’une palette d’outils, d’algorithmes et un moteur qui va effectuer le traitement et trouver le bon modèle », assure Julien Simon.

Amazon oblige, le service a d’abord été pensé pour détecter des anomalies sur une plateforme e-commerce, par exemple une chute de trafic entraînée par un bug IT ou encore une promotion qui généreraient un fort afflux ou une augmentation hors norme des transactions financières. Le service est également ancré dans un contexte de supervision IT.

Un certain manque d’explicabilité

À travers sa FAQ, AWS assure que Lookout for Metrics supporte « une grande variété de mesures commerciales liées à l’engagement des clients, aux opérations, aux ventes et au marketing dans des secteurs tels que la vente au détail, les jeux, la technologie publicitaire et les télécommunications ».

« [Lookout for Metrics] permet de détecter des transactions anormales (des retraits bancaires, des achats, des activités suspectes sur les marchés financiers) en temps réel ou non. »
Julien SimonGlobal Technical Evangelist, Artificial Intelligence & Machine learning, AWS

Lookout for Metrics se prête également bien au jeu des services financiers, selon Julien Simon. Il « permet de détecter des transactions anormales (des retraits bancaires, des achats, des activités suspectes sur les marchés financiers) en temps réel ou non ». « C’est un service qui devrait beaucoup plaire aux personnes qui ont énormément de données et qui souffrent devant la charge de travail pour réaliser les explorations en data science », vante-t-il.

Cependant, les secteurs financiers ont des contraintes fortes en matière d’explicabilité des modèles employés pour effectuer les détections. « Aujourd’hui, nous ne communiquons pas d’information sur l’algorithme exploité [en arrière-plan]. Cela pourrait être une évolution du service », reconnaît Julien Simon. « En revanche, il y a tout de même le mécanisme de feedback, avec le score de sévérité, et l’on peut indiquer au service si l’anomalie détectée est valable ou non ». 

Pour l’instant, des entreprises comme Nextroll (ad marketing), Playrix (studio de développement de jeux mobiles) ou encore Quantiphi (ESN spécialisée dans la data science, également partenaire de Looker) sont parmi les premiers utilisateurs déclarés de Lookout for Metrics.

La facturation dépend du nombre de métriques calculées par mois. À cela, il faut ajouter les coûts supplémentaires associés à AWS IAM, S3, Appflow, Lambda ou SNS.

« Nous verrons au fil du temps, mais nous partons sur des tarifs qui nous paraissent compétitifs, et surtout sur une consommation à l’usage », défend Julien Simon qui considère que le Lookout for Metrics peut être facilement testé en quelques jours, avant une possible industrialisation.

Pour approfondir sur Intelligence Artificielle et Data Science