Lenovo : « l’IA sera surtout utilisée en Edge, pour analyser les images »
Numéro deux des fournisseurs d’équipements x86, le constructeur estime qu’il vendra cette année beaucoup de serveurs Edge, en appui des caméras de vidéosurveillance en magasin ou en usine.
Selon Lenovo, 2024 sera l’année de tous les investissements dans les équipements Edge. Il les définit comme des serveurs que l’on peut accrocher aux murs des boutiques et des usines, pour évaluer en temps réel les événements filmés par des caméras de vidéosurveillance. Il estime d’ailleurs que cette analyse continue des images sera la principale activité de ses clients en matière d’intelligence artificielle, l’autre technologie qui devrait concentrer l’essentiel des budgets cette année.
Crédité d’un dernier CA trimestriel connu de 14 milliards de dollars (en baisse de 16 % en un an) et se targuant d’équiper un tiers des supercalculateurs du Top500, Lenovo est le second plus important fournisseur d’équipements x86, derrière Dell (22,25 mds $ de CA trimestriel), mais devant HPE (7,4 mds $ de CA trimestriel).
Pour se démarquer, le constructeur mise sur son savoir-faire en matière de design ; plusieurs laboratoires indépendants ont par le passé salué ses brevets exclusifs en ce qui concerne la fabrication de serveurs silencieux, durcis et particulièrement résistants aux pannes. En toute logique, ce savoir-faire est particulièrement bien adapté aux serveurs dits de « Edge » et c’est sans doute pour cela que le constructeur veut croire au succès de cette gamme de machines.
Cela dit, Lenovo se prédisait déjà un succès inédit dans le « Edge »… il y a un an. Selon ses dires, 2023 aurait bel et bien servi à déployer des maquettes intéressantes. Et, le prétexte nouveau de l’IA devrait lui permettre cette année de passer de la planche à dessin au bon de commande.
Pour comprendre l’approche de Lenovo en France, LeMagIT est parti à la rencontre de son nouveau directeur général pour l’activité data centers (ISG, soit Infrastructure Solution Group), Jean-Christophe Morisseau (en photo), ex-directeur général de Red Hat en France. Il était accompagné de Charles Ferland, le directeur général au niveau mondial des produits Edge Computing chez Lenovo. Interview.
LeMagIT : Que vous demandent vos clients en ce début d’année 2024 ?
Jean-Christophe Morisseau : La problématique numéro 1 des entreprises est de ne plus mettre tous les œufs dans le cloud et d’avoir une approche hybride, avec une partie des serveurs installés sur site. Que ce soit dans un datacenter en colocation, comme dans leurs succursales, avec des configurations d’appoint.
Pour satisfaire ce besoin, les demandes concernent principalement des configurations hyperconvergées. Soit notre gamme ThinkAgile pour les installations en rack ou ThinkEdge pour celles d’appoint. Avec des systèmes – VMware, Nutanix, Red Hat, Microsoft Hyper-V – qui permettent de passer simplement de serveurs physiques à des offres en cloud public ou privé qui reposent sur les mêmes systèmes.
LeMagIT : À ce propos, la demande a-t-elle évolué en faveur de systèmes concurrents à VMware depuis son rachat par Broadcom ?
Jean-Christophe Morisseau : Il est trop tôt pour le dire, car les clients de VMware ont majoritairement renégocié des contrats de longue durée juste avant l’officialisation de son rachat pour s’assurer bénéficier de conditions commerciales connues. Cependant, nous nous sommes assurés d’avoir fait certifier nos gammes sous tous les autres systèmes.
LeMagIT : Observez-vous également une explosion des demandes pour l’intelligence artificielle ?
Jean-Christophe Morisseau : C’est un domaine dans lequel nous pouvons mettre en avant notre savoir-faire de machines à la fois performantes et économiques en énergie grâce aux nombreux modèles de supercalculateurs sous notre marque qui occupent le Top500 – soit près d’un tiers du palmarès – et notre système de refroidissement à eau Neptune.
Pour autant, les inquiétudes des entreprises à ce sujet concernent moins leur faculté à se doter de puissance de calcul que le risque environnemental auquel elles s’exposent. Notre approche consiste donc à proposer les solutions qui offrent la meilleure maîtrise de la consommation d’énergie.
Outre le refroidissement à l’eau Neptune que j’ai déjà évoqué, nous avons mis au point des designs de cartes mères de pointe, avec des GPUs qui sont installés plus près des processeurs pour réduire la latence et maximiser les opérations par kilowatt avec des soudures à froid, qui résistent mieux à la chaleur et en dissipent moins.
Jean-Christophe MorisseauDirecteur général pour l’activité datacenters France, Lenovo
Nous proposons aussi un programme commercial TruScale qui a la particularité de facturer nos équipements, nos logiciels et nos services selon la consommation électrique. Aucun de nos concurrents ne propose une telle approche. En positionnant la puissance informatique comme une énergie, il devient beaucoup plus simple pour les entreprises de poser des seuils et de présenter une comptabilité carbone très claire.
Mais pour revenir sur l’intelligence artificielle, nous pensons que c’est surtout en périphérie que ses usages vont exploser. Donc sur des équipements d’appoint, des serveurs durcis, petits, silencieux, qui s’accrochent au mur et qui analyseront sur site les données générées localement, typiquement les images des caméras de vidéosurveillance.
LeMagIT : Pouvez-vous détailler les scénarios d’usage que vous envisagez ?
Charles Ferland : Le propos de notre gamme de machines ThinkEdge est de remplacer la multitude de systèmes que vous aviez jusqu’ici sur un lien de vente, dans un hôpital, un entrepôt, une école, etc., par un seul serveur hyperconvergé qui peut exécuter plusieurs fonctions sous la forme de machines virtuelles.
Par exemple, l’un de nos clients est une chaîne de stations-service. Précédemment, il utilisait trois systèmes sur chaque site ; un pour la gestion des pompes à essence, un autre pour la caisse enregistreuse et encore un autre pour les bornes multimédias. Cela faisait trois systèmes à maintenir et à sécuriser, avec trois exploitations différentes, trois dispositifs de mise à jour différents, etc. En condensant tout sur une seule machine, vous rationalisez tous ces efforts.
Mais surtout, il devient simple d’ajouter une nouvelle application, par exemple l’analyse temps réel de vos caméras de surveillance pour compter le nombre de personnes qui entrent, pour identifier un vol, ou un danger, via l’installation d’une machine virtuelle.
Charles FerlandDirecteur général au niveau mondial produits Edge Computing, Lenovo
Nous n’avons pas vocation à vendre des applications. C’est le travail de nos partenaires intégrateurs. Dans ce contexte, nous leur proposons des infrastructures prêtes à l’emploi. Chaque équipement ThinkSystem Edge est configuré en usine pour s’interfacer avec un service cloud que nous avons mis au point, Lenovo Open Cloud Automation (LOC-A). C’est depuis ce service que les partenaires vont déployer des machines virtuelles, typiquement celles qui vont analyser les images de vos caméras.
Sur site, vous n’avez pas besoin d’informaticien. À l’installation du serveur, un technicien configure son adresse IP, son système d’exploitation depuis une app sur smartphone ou tablette.
LeMagIT : Mais ces applications d’IA qui analysent les images, elles existent ?
Charles Ferland : Leur écriture est à la charge d’éditeurs tiers. Mais, de manière assez étonnante, vous retrouvez toujours les mêmes cas d’usage partout dans le monde et pour lesquels il existe déjà des applications. En magasin, tout le monde utilise une application qui détecte qu’un client a oublié de scanner un produit sur la caisse automatique et qui le lui signale sur l’écran de la caisse. Nous savons même que ce système est rentabilisé au bout de deux mois, en moyenne.
Sur les chaînes de production, on retrouve dans pratiquement tous les cas la détection d’un problème sur un tapis roulant, suivi de l’arrêt automatique de ce tapis. Mais aussi la détection d’une personne à proximité d’une zone dangereuse où des charges lourdes sont en cours de manipulation.
Après, bien entendu, tout est possible et de nombreux développements originaux sont encore en cours. La ville de Barcelone, par exemple, a déployé un système à base de lunettes connectées à un téléphone Motorola (marque que nous avons rachetée en 2014) pour personnes non voyantes. La caméra embarquée dans les lunettes envoie ses images à un serveur ThinkSystem Edge de la ville, lequel renvoie une description audio de l’environnement à l’usager. Ainsi, il sait si un feu est rouge, si un vélo arrive sur lui, etc.
Aux USA, pour les drive-in de la plus grande chaîne de fast food, les images des caméras servent à corréler le trafic entrant avec les besoins en cuisine, les véhicules avec les commandes, les commandes avec ce qui est mis dans les paniers. Le serveur de Edge convertit également les commandes vocales en commandes texte, en anglais, en français et en espagnol. Grâce à cela, la chaîne de fast food a pu réaffecter les trois quarts de son personnel en drive-in vers ses salles de restaurant, où il est plus agréable de travailler.
Les opportunités sont infinies.
LeMagIT : Mais comment parvenez-vous à mettre de l’analyse vidéo temps réel dans un format que l'on peut accrocher au mur ? Les possibilités techniques doivent être très limitées, non ?
Charles Ferland : Justement pas ! Grâce à notre design de pointe ! Nous pouvons mettre six cartes GPU dans un serveur ThinkEdge qui ne dépasse pas 50 décibels d’émission sonore. Nos concurrents ne parvenant pas à aller au-delà de deux GPUs dans une telle configuration, cela signifie que notre solution analyse trois fois plus de flux vidéo, qu’elle prend en charge trois fois plus de caméras.
Nous avons apporté une attention extrême à l’aspect physique de nos machines pour proposer une solution très en avance sur la concurrence. Nos machines sont refroidies par des ventilateurs avec des ailettes qui émettent des ondes sonores contraires pour qu’elles se suppriment avant d’atteindre votre oreille. Il y a un système qui est capable d’évaluer la quantité d’air qui entre dans la machine et envoie une alerte quand un objet obstrue la ventilation.
Nos machines ThinkEdge sont durcies pour résister à la poussière, à la température et aux intrusions malveillantes, ne serait-ce qu’au niveau des connecteurs USB que l’on peut désactiver. Nos ingénieurs de Motorola ont mis au point des antennes Wifi qui communiquent dans les environnements les plus contraints, ne serait-ce que pour éviter d’avoir à passer par des câbles Ethernet. Ils ont aussi créé un dispositif de géolocalisation qui fonctionne depuis l’intérieur de la machine pour pouvoir la suivre en cas de vol.
Rien de tout cela n’existe chez nos concurrents qui proposent des équipements en Edge.
LeMagIT : Vos chiffres sont étonnants. Comment parvenez-vous à ne pas souffrir de la chaleur et de la haute consommation électrique des GPUs Nvidia ?
Charles Ferland : Il se trouve que nous n’utilisons pas forcément de GPUs Nvidia. Selon les cas, nous sommes capables d’utiliser des GPU AMD pour l’inférence, mais aussi des puces SnapDragon Cloud AI100, des puces ARM que Qualcomm a configurées comme des GPUs.
Nous utilisons aussi souvent la technologie OpenVINO d’Intel, qui consiste à utiliser les ressources libres du processeur pour simuler un GPU. Évidemment, cela n’est pas aussi rapide qu’un véritable GPU, mais cela se montre très efficace sur les traitements courants de l’inférence.
Par exemple, dans l’analyse de flux vidéo, ce qui coûte le plus en temps de calcul, ce n’est pas l’inférence en elle-même, mais le décodage du flux. Or, on ne gagne rien à décoder ce flux avec un véritable GPU. Vous économisez bien plus d’énergie en utilisant un FPGA Xilinx (d’AMD) pour décoder ce flux et en confiant l’inférence au processeur, ou au GPU de Qualcomm.
En parlant d’AMD, nous utilisons aussi souvent des processeurs Epyc 8004, qui sont très efficaces pour exécuter plusieurs VM en consommant un minimum d’énergie.
Toutes nos machines sont fabriquées dans des usines locales – en Hongrie pour l’Europe – sans sous-traitant, avec une gestion optimisée de nos pièces. Cela nous offre une très grande flexibilité pour construire des configurations qui correspondent exactement à un besoin, avec une disponibilité maximale.