singkham - Fotolia
Observabilité : New Relic met open source et simplicité dans le même panier
Comme ses concurrents, New Relic veut simplifier l’observabilité de Kubernetes et le support des technologies open source de télémétrie, mais il doit en sus le faire dans une période mouvementée pour son organisation.
En décembre 2020, New Relic annonçait l’acquisition de Pixie Labs. Au début du mois de mai, l’éditeur spécialiste de l’observabilité a officialisé la donation de la technologie développée par la startup à la CNCF (Cloud Native Computing Foundation). Par la même occasion, il a pris sa carte de membre platine de la fondation pour devenir l’un des influenceurs de cet écosystème open source.
Lors de son événement FutureStack, New Relic a présenté l’édition managée de Pixie, rebaptisée Auto-telemetry with Pixie dans cette version bêta.
Pixie est une pensée comme une plateforme « d’auto-instrumentation » de l’observabilité dédiée à Kubernetes. En avril, l’éditeur a ouvert cet outil propriétaire en adoptant la licence Apache 2.0. Pour récupérer les traces distribuées, l’outil s’appuie sur le protocole eBPF, tout comme Flowmill, la brique NPM de Splunk. À la différence que Pixie a été conçue pour superviser la santé des clusters, tracer les envois de paquet (DNS, HTTP, HTTP2, gRPC, TLS, TCP), effectuer le logging, profiler les requêtes de bases de données (MySQL, PostgreSQL, Cassandra, Redis), analyser les méthodes de déploiement au sein d’une infrastructure Kubernetes sur site, dans le cloud ou même sur Minikube.
L’auto-instrumentation comme remède à la complexe surveillance de Kubernetes
« En une ligne de code, Pixie permet d’obtenir simplement et rapidement une télémétrie riche sur toutes les transactions HTTP, le réseau, les bases de données, l’infrastructure cohorte qui supporte les clusters Kubernetes » vante Gregory Ouillon, CTO EMEA chez New Relic.
Pixie dispose d’un CLI, mais il est également possible de faire figurer les commandes d’exécution dans un manifeste YAML ou un Helm chart. La plateforme dépend de modules. Les Pixie Vizier sont des services K8s responsables de l’exécution des scripts, l’agrégation, l’intégration et le backup des données. Les modules Pixie Edge (PEM) sont des objets DeamonSet qui injectent les collecteurs eBPF chargés de superviser les transactions réseau et les métriques système « sans aucun changement de code ». Une API permet de transmettre les données (métriques, traces, logs, événements) au CLI et à Pixie Live, une interface de data visualisation qui génère automatiquement des tableaux de bord de type graphe. La version managée intègre Pixie Control Cloud, un control plane pour administrer l’accès aux données et l’audit des métadonnées.
La plateforme inclut une collection de scripts pour les différentes données à collecter et les usagers peuvent développer les leurs pour compléter le champ des possibles.
« Les programmeurs peuvent – sans installer d’agents, sans redémarrer un conteneur, un proxy side-car ou un nœud – injecter un script dans Pixie pour obtenir de la télémétrie supplémentaire », assure Gregory Ouillon.
Les modules Pixie Edge peuvent être considérés comme des agents, mais les utilisateurs ne les déploient plus manuellement et ils ne réclament pas d’attache dans le code. Pixie applique plusieurs algorithmes de machine learning sans échantillonnage dans le but d’affiner les analyses.
L’autre particularité de Pixie tient dans le fait que les données de télémétrie sont stockées sur le cluster Kubernetes. Selon les fondateurs de Pixie Labs, cela permettrait de renforcer la sécurité de la supervision, puisqu’il n’y a pas besoin de faire transiter les données par le réseau. Ils y voient également une manière de réduire le coût de stockage de la télémétrie, car les données sont placées dans des couches de stockage à froid.
New Relic sort lui aussi les cartes Prometheus et OpenTelemetry
Cette approche a convaincu AWS de lancer un partenariat avec New Relic pour permettre à ses clients d’utiliser Pixie sur les clusters EKS. Par ailleurs, le géant du cloud a promis de participer au projet open source.
La version managée proposée par New Relic s’adosse désormais à sa plateforme de télémétrie (New Relic One) et est incluse dans l’offre Full Stack Observability. L’outil doit aider à surveiller des clusters Kubernetes des distributions K8s, Amazon EKS, Google GKE, Azure AKS, Red Hat OpenShift et Pivotal Container Service (PKS).
Cela doit permettre de compléter les analyses et les détections d’erreurs. L’éditeur veut aussi réunir les données sur son interface et ses tableaux de bord. Il est par exemple possible de combiner l’outil avec New Relic APM à l’aide d’attributs personnalisés pour tracer les transactions dans une application qui s’appuie sur des ressources Kubernetes (nœud, pod, namespace). Dans ce cas-là, il faut tout de même préparer son cluster Kubernetes pour l’agent APM de New Relic. Auto-telemetry with Pixie a accès au point de terminaison Prometheus de l’éditeur et bientôt disposera d’un endpoint OpenTelemetry.
« Même si le standard n’est pas encore totalement figé, notamment sur la question des traces et des métriques, notre direction stratégique est d’aller vers OpenTelemetry », affirme Gregory Ouillon. « Nous nous assurons de la compatibilité de notre plateforme avec les outils et les spécifications de ce standard afin qu’il n’y ait pas de hiérarchie entre nos agents et ceux des composants open source », promet-il.
L’éditeur ne veut plus imposer ses agents et veut laisser en quelque sorte « le choix des armes » à ses utilisateurs. « Nous avons des clients qui ont explicitement choisi de se passer de nos agents parce qu’ils avaient déjà effectué des investissements considérables sur de l’OpenTelemetry ou Prometheus et qui emploient la plateforme New Relic par-dessus ces bases », indique Gregory Ouillon.
Il reste encore quelques limitations, mais New Relic promet de « suivre de très près » les évolutions de ces projets gouvernés au sein de la CNCF.
Attirer de nouveaux utilisateurs
C’est un changement profond qui ne s’observe pas seulement chez New Relic, mais dans toute l’industrie de la supervision IT. Les acteurs majeurs, dont AppDynamics, Datadog, Dynatrace ou Splunk, se retrouvent confrontés aux challengers tels Grafana ou Elastic. Ils doivent non seulement proposer des outils pour les environnements complexes de Kubernetes, adopter les standards open source de plus en plus répandus chez les clients et revoir leurs modèles économiques parfois pointés du doigt par les clients.
En ce sens, l’éditeur fournit deux nouvelles éditions, l’une gratuite pour les étudiants (500 Go d’ingestion, 3 sièges administrateurs) conçus pour diffuser l’expertise New Relic au niveau académique, et l’autre pour les startups via le programme Activate d’AWS.
Il faut dire que ces derniers mois ne furent pas de tout repos pour New Relic. À la fin de l’année 2020, l’éditeur a revu son modèle économique. En janvier, l’entreprise a promu Bill Staples, un cadre qui a rejoint l’entreprise début 2020, au poste de président et chef des produits ; à partir du 1er juillet, il remplacera le fondateur Lew Cirne au poste de PDG, selon le site Web de l’entreprise. New Relic a également licencié 160 employés, soit 7 % de ses effectifs, en avril.
En mai, la compagnie a dévoilé ses résultats financiers pour l’année fiscale 2021. Du premier mai 2020 au 31 mars 2021, l’éditeur a généré 667,6 millions de dollars de chiffre d’affaires, soit une hausse de 11 % par rapport à l’année précédente. Seulement, les pertes nettes ont grimpé de 88,9 millions à 192,6 millions de dollars en un an.
Combler le trou dans la raquette NPM avec Kentik
Par ailleurs, New Relic One comprend désormais une boîte de réception des erreurs (Errors Inbox) qui alerte les développeurs des erreurs récurrentes dans les applications et l’infrastructure, y compris celles en provenance des ressources serverless. Cette fonctionnalité comprend également des intégrations avec Slack, Jira et ServiceNow pour la collaboration en matière de dépannage entre les équipes de développeurs. « C’est un produit de triage des erreurs afin de les assigner aux bonnes personnes », assure Gregory Ouillon.
Enfin, New Relic s’est associé au spécialiste du NPM Kentik pour renforcer les données d’infrastructure collectées par sa plateforme de télémétrie, telles que les flux réseau d’AWS VPC. Les utilisateurs de Full-Stack Observability peuvent visualiser et analyser les données dans le cadre de cette préversion. L’offre Full-Stack Observability prend également en charge les tableaux de bord personnalisés grâce à un partenariat avec le cabinet de conseil en ingénierie et en design Formidable.
L’outil de monitoring réseau de Kentik comble une lacune importante dans le portefeuille de collecte de données de New Relic, en suivant le rythme de concurrents tels qu’AppDynamics, qui prévoit de s’intégrer à ThousandEyes, une autre acquisition de Cisco. LogicMonitor, un spécialiste de la surveillance des infrastructures, s’est lui aussi étendu à la gestion de la performance des applications, le domaine traditionnel de New Relic, avec l’acquisition d’Airbrake en février.
New Relic a fait plusieurs emplettes au cours des deux dernières années, mais les responsables de la société ont déclaré que le partenariat avec Kentik était le moyen le plus rapide d’ajouter des données d’infrastructure réseau pour les clients.
« La partie réseau est de plus en plus critique si vous voulez commercialiser un produit d’observabilité », car les applications microservices reposent beaucoup plus sur la communication réseau entre les composants que les applications monolithiques traditionnelles, estime Stephen Elliot, analyste chez IDC. « Les dirigeants de New Relic verront probablement comment se déroule le partenariat, et s’ils ont besoin d’acquérir Kentik, je suis sûr qu’ils sont ouverts à le faire ».