Le guide des annonces d’AWS re:Invent 2024
Introduction
L’événement annuel AWS re:Invent 2024 s’est tenu à Las Vegas en toute fin d’année et a été le théâtre d’une soixantaine d’annonces de nouveaux services et partenariats, dont plus d’un tiers concernent l’IA générative. L’événement qui a accueilli 60 000 personnes semble à la mesure de la position de la filiale d’Amazon sur le marché du cloud. AWS demeure leader des services en cloud – des cabinets comme Synergy Research Group et Statista lui attribuaient 31 % des parts de marché au troisième trimestre, contre 20 % pour Azure et 12 % pour GCP – tout en affichant une attitude de suiveur technologique en matière d’IA.
En plus du partenariat privilégié qu’il entretient avec Anthropic et ses collections de LLM Claude (rival des GPT d’OpenAI mis en avant chez Azure), AWS peut compter sur l’exclusivité des modèles dédiés Amazon Titan, et désormais, Nova pour proposer aux développeurs des modèles qu’ils peuvent exploiter en inférence, au cœur de leurs applications.
En parlant d’inférence, l’intégralité des modules assemblables pour bâtir un flux d’IA générative est réunie sous la marque Bedrock. À la fois place de marché pour récupérer des LLMs et bibliothèque de fonctions prêtes à l’emploi, Bedrock s’enrichit de capacités comme le RAG (contextualisation et ancrage des réponses des modèles avec les données de l’entreprise), le routage des prompts entre différents LLM pour maximiser à la fois la précision des réponses et l’économie des coûts, ou encore de garde-fous contre la toxicité des contenus.
Toujours au chapitre des services dédiés à l’IA, la plateforme d’entraînement et de déploiement de modèles IA/ML évolue. Elle se pare désormais de fonctionnalités que l’on trouve d’ordinaire dans l’analytique (Snowflake, Databricks...) pour agglomérer les silos, assembler automatiquement des pipelines entre les services de données et d’IA d’AWS, ou encore mieux réguler les droits d’exploitation des informations. La communauté des ingénieurs de données a surtout retenu l’arrivée de S3 Table, une prise en charge native du format de table ouvert Apache Iceberg au sein du service de stockage objet.
À l’autre bout du spectre, l’assistant Amazon Q, équivalent de Copilot chez Azure et Gemini chez Google, est maintenant capable d’exécuter plus d’une cinquantaine d’actions dans une dizaine d’applications métiers en ligne. Mais AWS met surtout l’accent sur l’aide à la programmation, avec des fonctionnalités spécifiques à son contexte. Outre le fait qu’Amazon Q Developer pourrait générer des tests unitaires, agrémenter un code de commentaires explicatifs, il saurait diagnostiquer des ralentissements et des failles à l’échelle de son infrastructure cloud. Il saurait même rendre des applications Windows compatibles Linux et convertir des VM VMware en VM EC2.
Enfin, AWS lance des machines virtuelles basées sur la dernière génération des puces Trainium qu’il a lui-même mises au point. Comme le font Azure et GCP. Le point sans doute important ici est que les hyperscalers ne cherchent pas seulement à élargir l’offre en ressources de supercalcul. Ils sont surtout les seuls à savoir proposer une alternative crédible aux solutions de Nvidia.
Si ce dernier devait faire souffrir sa clientèle d’une pénurie quelconque, les entreprises en mal de puissance de calcul n’auraient d’autre choix que d’abandonner les datacenters d’appoint au profit des hyperscalers. À moins qu’AMD et Intel finissent par rattraper leur retard, les hyperscalers sont doucement en train de prendre une position dominante dans l’entraînement des modèles d’IA.
Ce guide essentiel s’est aussi attaché à prendre le témoignage de clients français d’AWS. Il apparaît que le numéro un des hyperscalers américains les séduit par une approche particulièrement technophile. Là où ses concurrents mettent en avant des conditions commerciales, AWS mise sur un esprit d’atelier, avec des méthodes éprouvées pour essayer rapidement une nouvelle technologie dès que germe une idée en entreprise.
1Infrastructure-
Être meilleur que les offres en datacenter
AWS réduit sa dépendance à Nvidia avec les instances Trainium
Avec un prix horaire un peu inférieur aux instances à base de GPU Nvidia H200 et une puissance de calcul plus variable, les instances basées sur les derniers Trainium veulent séduire les entreprises qui ont besoin d’entraîner des modèles d’IA. Lire la suite
Cloud : AWS a de nouveau le droit de commercialiser VMware
Revirement de situation. AWS commercialise un nouveau service Elastic VMware Service, après s’être vu interdire de commercialiser un service similaire, en mai dernier. Lire la suite
Stockage : AWS enrichit S3 pour l’analytique
S3 Tables, un nouveau format de bucket, permet d’utiliser des requêtes SQL pour modifier et sélectionner des archives de bases de données au format Iceberg. Lire la suite
AWS lance un service automatisé de réponse aux incidents
AWS Security Incident Response, qui a été lancé avant la conférence re:Invent 2024 cette semaine, peut automatiquement trier et remédier aux événements détectés dans AWS GuardDuty. Lire la suite
Green IT : AWS ouvre son premier programme de recyclage de hardware en Europe
La filiale cloud d’Amazon ouvre une installation de logistique inverse à Dublin, sa première en Europe. Selon AWS, ses programmes de recyclage auraient permis, dans le monde en 2023, d’éviter d’envoyer à la décharge 14,6 millions de composants issus de ses datacenters. L’annonce intervient alors que son rapport ESG 2024 avait été critiqué. Lire la suite
2IA-
Rattraper Azure et GCP
Amazon double son investissement dans Anthropic
Le géant de l’e-commerce et du cloud compte sur les papas des modèles Claude 3.5 pour faire venir à lui davantage de clients, tandis qu’il devrait soulager la facture de calcul de son protégé, contre des efforts de R&D dans ses puces dédiées à l’IA. Lire la suite
AWS unifie IA, analytique et gouvernance de données… dans SageMaker
Le service est désormais une plateforme unifiée comprenant un catalogue de données, un lakehouse et des intégrations avec d’autres services de gestion de données. Lire la suite
AWS combine IA générative et IA symbolique
AWS a largement mis en avant l’importance d’une architecture RAG lors de Re:Invent 2024, mais son autre priorité n’est autre que la maîtrise des hallucinations et le développement d’agents capables de collaborer entre eux. Lire la suite
Amazon Bedrock : AWS étoffe ses fonctionnalités RAG
Outre la refonte de SageMaker, AWS a également présenté de nombreuses améliorations pour Amazon Bedrock. La majorité d’entre elles visent à améliorer la conception d’architecture RAG, plus performante et moins chère. Lire la suite
Amazon Q : AWS élargit son arsenal GenAI pour les développeurs
S’il n’a pas encore l’aura de Microsoft Copilot pour les métiers, AWS tente de rattraper son retard avec Amazon Q. En revanche, le fournisseur cloud a les armes pour rivaliser avec GitHub Copilot sur son terrain de prédilection. Lire la suite
3Clients-
Une approche technophile qui fait mouche
AWS : « Nos clients français passent l’IA en production »
Dans cette interview, le DG d’AWS pour la France et l’Europe du Sud et son directeur technique expliquent que l’hyperscaler s’efforce de proposer des solutions plus intégrées pour répondre à des entreprises qui ont déjà dépassé le stade des expérimentations. Lire la suite
DSI du Puy-du-Fou : « passer au cloud a fait de nous une direction de l’innovation »
À la base, le Puy-du-Fou souhaitait juste déplacer certains de ses serveurs dans un cloud public pour réduire ses coûts fixes. À l’arrivée, son équipe informatique permet aux métiers de tester en temps réel toutes leurs idées. Lire la suite
Berger-Levrault : « Nous passons au cloud pour simplifier l’édition de logiciels »
Éditeur de logiciels pour les collectivités, l’Éducation, la Santé ou encore l’industrie, Berger-Levrault peine à maintenir ses produits sur les serveurs de ses clients. Au 1er janvier, son infrastructure sera un Kubernetes managé en cloud. Lire la suite
4Partenaires-
Les mêmes fonctions sont désormais disponibles sur Azure et AWS
ERP : SAP mise sur AWS pour faire décoller S/4 dans les ETI
La nouvelle offre commune de SAP et d’AWS vise à simplifier l’adoption de S/4HANA Cloud Public Edition dans le midmarket, tout en restant attrayante pour les grandes entreprises. Lire la suite
AWS et Box étendent leur partenariat pour l’IA générative Q et le développement d’applications
Les utilisateurs de Box bénéficient d’intégrations AWS plus poussées pour animer les agents d’IA générative de Q Business, et permettent de créer des applications dans Bedrock, la plateforme d’IA multi-LLM d’AWS. Lire la suite
Sauvegarde : Rubrik devient aussi fonctionnel sur AWS que sur Azure
Les clients de Rubrik peuvent désormais transférer leurs données sauvegardées aux IA du service Bedrock d’AWS. L’éditeur utilise également des services étendus d’AWS pour mieux protéger les sauvegardes contre les cyberattaques. Lire la suite
Commvault apporte la sauvegarde incrémentale aux données S3
En attendant d’être intégré à Commvault cloud, le système Clumio, racheté en septembre, conserve une copie de chaque donnée modifiée. Et, ce, en limitant le coût du stockage sur S3. Lire la suite
5Ateliers-
Cas pratiques pour administrer EC2 comme un datacenter
AWS : comment bien dimensionner les instances EC2
Les instances EC2 mal dimensionnées coûtent plus que nécessaire et limitent les performances des applications. Cet article explique comment éviter cet écueil. Lire la suite
Cloud IaaS : quelle VM EC2 choisir pour votre IA ?
Certains traitements nécessitent des instances spécifiques sur le cloud public AWS. Cet article explique lesquelles équilibrent les exigences fonctionnelles, les performances et les coûts pour entraîner des modèles d’IA. Lire la suite
Administration cloud : comment créer une VM EC2 en ligne de commande
Les administrateurs de ressources sur le cloud AWS peuvent utiliser la ligne de commande AWS CLI pour lancer et gérer des instances EC2. Cet article explique comment le faire. Lire la suite