Alerte : des barrettes mémoire défectueuses dans certains produits Cisco
Le constructeur vient de s’apercevoir que plusieurs lots de ses serveurs et de ses équipements réseau avaient été livrés avec des DIMMs susceptibles de provoquer pertes de données et redémarrages intempestifs.
Cisco vient de publier une alerte : plusieurs barrettes de mémoire DIMM fournies dans plusieurs de ses produits sont susceptibles de provoquer des pannes. Les barrettes dont les puces de DRAM sont défectueuses sont celles de 16, 32 et 64 Go, fabriquées au cours du second semestre de 2020. On les trouve dans les serveurs UCS, dans les routeurs CNBR, dans les boîtiers réseau CSP (qui servent à virtualiser des fonctions réseau) et dans les équipements de téléphonie sur IP Business Edition 6000 et 7000.
D’ordinaire, les utilisateurs devraient pouvoir identifier des défauts sur leurs barrettes depuis des outils de types RAS (Reliability, Availability and Service) proposés pour leurs systèmes d’exploitation. Cisco prévient néanmoins que ces outils ne sont pas fiables, car les relevés peuvent masquer certains problèmes. A la place, le constructeur recommande plutôt à ses clients d'utiliser son outil de validation du numéro de série pour vérifier si le matériel en leur possession contient des DIMMs défectueuses. Seuls certains lots de machines ont été livrés avec ces DIMMs.
Commander des pièces de rechange avant le plantage... ou la pénurie
Il y a un risque de ne pas remplacer ces barrettes défectueuses. Dans un premier temps, les modèles défectueux produisent des alertes que les utilisateurs sont invités à corriger simplement en validant la proposition faite par leur système d’exploitation. Cependant, cette correction a juste pour effet de ne plus montrer les alertes. Les erreurs de mémoire persistent et, au bout d’un moment, corrompent tellement les données qu’elles deviennent irrécupérables. Puis, la machine redémarrera sans crier gare. Dans le pire des cas, les composants défectueux finiront même par ne plus fonctionner, ce qui réduira d’autant la capacité mémoire de la machine.
Cisco invite les entreprises à lui commander des pièces de rechange sans attendre. Outre circonscrire le problème le plus rapidement possible, l’urgence de commander des pièces de rechange serait aussi relative aux stocks disponibles. Hors Europe et États-Unis, les entreprises sont déjà averties qu’elles ne pourront pas être livrées avant trois mois.
Le remplacement de barrettes mémoire n’étant plus forcément dans les compétences des utilisateurs, Cisco recommande à ses clients de scrupuleusement lancer des diagnostics mémoire depuis les outils livrés avec ses systèmes avant de les remettre en production. Le constructeur observe en effet que nombre d’utilisateurs insèrent les barrettes de manière incorrecte.
De manière assez ironique, la découverte de cette panne coïncide avec l’annonce d’un nouvel outil en SaaS, à base d’IA, pour détecter les défaillances sur les équipements réseau. Cet outil devrait être entièrement dévoilé lors de Cisco Live, l’événement annuel du constructeur qui se tiendra en juin à Las Vegas.