HPE met à jour ses infrastructures d’IA pour l’entreprise
Après avoir dévoilé en 2023 des machines pour centres de supercalcul, HPE a présenté lors de son salon Discover des machines Proliant équipées de H200, des bundles pour l’inférence et des outils d’administration.
Lors de sa conférence Discover qui s’est tenue fin juin à Las Vegas, HPE s’est engagé à assurer le succès de l’IA dans l’entreprise sur la base d’un partenariat avec Nvidia. Après les supercalculateurs Cray présentés l’année dernière pour les centres de calcul, le constructeur a annoncé trois solutions pour les entreprises.
Tout d’abord, le serveur ProLiant DL384 Gen12 avec carte accélératrice GH200 NVL2 et le serveur ProLiant DL380a Gen12 avec huit cartes GPU H200 NVL. Si le H200 est le GPU qui succède à l’actuel H100, le module GH200 est en revanche une carte qui comprend à la fois un GPU H200 et un processeur ARM Grace. Ces deux machines sont conçues pour l’entraînement de modèles.
Ensuite, la gamme commerciale Nvidia AI Computing by HPE. Il s’agit d’un ensemble de configurations serveur de petite, moyenne, grande et très grande taille qui sont livrées préinstallées avec des GPU et les logiciels de Nvidia pour l’inférence. HPE vante que ses offres clés en main, disponibles d’ici à cet automne, peuvent se déployer en seulement trois clics de souris.
Enfin, une mise à jour d’OpsRamp. Cette plateforme d’AIOps et d’observabilité, rachetée l’année dernière par HPE, se pare de fonctionnalités pour les GPU de Nvidia, pour les mises en réseau de clusters d’IA et pour des logiciels d’IA spécifiques. L’intérêt d’OpsRamp est de proposer une plateforme d’administration globale pour des infrastructures hétérogènes. OpsRamp est capable de dire pourquoi une application fonctionne lentement ou, à présent, pourquoi un GPU Nvidia est sous-utilisé.
La possibilité d’acquérir ces solutions à l’aide du programme commercial HPE GreenLake a été fortement applaudie lors de la présentation. Et pour cause : dans l’excitation qui entoure les projets d’IA, un surinvestissement précoce peut conduire à des retours sur investissement décevants.
HPE GreenLake permet de répartir le coût de l’infrastructure sur sa durée de vie afin de réduire l’impact budgétaire initial lors du déploiement. Selon une étude du cabinet ESG, 46 % des clients qui paient des services d’infrastructure sur site selon l’usage qu’ils en font – c’est le modèle de HPE GreenLake – ont indiqué qu’ils seraient en mesure d’accélérer les projets d’IA en reportant les coûts sur les trimestres suivants.
Selon une autre étude du cabinet ESG, 54 % des entreprises prévoient d’avoir un projet d’IA générative en production dans les 12 prochains mois.