everythingpossible - Fotolia
Pour ou contre le stockage en mode objet avec l’IA ?
Le stockage en mode objet est une tendance technologique contemporaine de l’intelligence artificielle. Les deux domaines peuvent se conjuguer pour gagner en versatilité, mais cela pose des contraintes.
La question du type de stockage à utiliser dans les applications d’intelligence artificielle se pose, car ici, ce sont les données, et non le modèle d’IA/ML, qui sont au centre des préoccupations. De fait, les entreprises s’interrogeront plus souvent sur leur stockage que sur leur capacité de calcul.
Dans ce contexte, le stockage objet – qui peut accueillir d’énormes quantités de données non structurées (fichiers) et structurées (bases de données), dans pratiquement n’importe quel format – se présente comme le support de stockage idéal pour le Machine learning.
Pour autant, s’en servir dans ce cadre pose des contraintes. Des contraintes de coût, de bande passante et d’usage.
Quels sont les avantages du stockage objet pour l’IA ?
Pour les applications d’IA/ML, il est important de trouver les bonnes données. Le stockage objet s’accompagne de métadonnées qui décrivent chaque contenu, ce qui constitue une aide utile dans de telles applications. On y trouve également un identifiant qui permet de retrouver le bon objet.
Les formes traditionnelles de stockage en mode fichiers et blocs sont généralement destinées à des applications plus transactionnelles. Le stockage objet traite de grandes quantités de données qui ne nécessitent pas nécessairement un accès rapide et répété. C’est important pour l’IA/ML, car l’application a besoin de temps pour apprendre ses tâches.
La versatilité du mode objet est l’un de ses principaux avantages. Les objets peuvent correspondre à n’importe quel type de fichier, comme du texte ou de la vidéo. Dans les cas où le stockage objet contient beaucoup de données non structurées, les utilisateurs peuvent avoir besoin de passer par un processus appelé munging – ou data wrangling – pour reconstruire les données dans un format utilisable par l’application d’IA/ML.
Le stockage objet est facilement extensible en fonction de l’évolution des besoins, en particulier dans les situations d’IA/ML où les utilisateurs gèrent des quantités de données importantes et changeantes. Les entreprises peuvent également stocker des objets presque partout, ce qui explique pourquoi ils constituent une option de stockage importante dans les environnements en cloud. Les utilisateurs peuvent facilement créer et stocker plusieurs copies à différents endroits, que ce soit sur site ou en cloud.
Quelles sont les contraintes du mode objet ?
Le stockage de grandes quantités de données en mode objet nécessite une plus grande capacité qu’en mode fichiers ou qu’en mode bloc. De fait, les entreprises ont tendance à plutôt utiliser le stockage objet via des services de stockage en cloud. Mais dans le cadre d’une utilisation par une application de Machine learning, les accès intensifs au cloud peuvent présenter des contraintes de coût et de bande passante que n’aurait pas une baie de stockage en mode fichiers ou en mode bloc sur site.
Lorsque les entreprises stockent des objets en cloud, elles doivent prendre en compte les questions liées à la gestion des différents clouds qu’elles utilisent : les coûts, la sécurité (notamment en ce qui concerne les personnes qui ont un droit d’accès) et les niveaux de service. Le stockage sur site ne pose pas ces problèmes, bien que la capacité nécessaire – même avec la compression des données d’un objet – peut nécessiter d’investir dans une baie de stockage plus coûteuse.
Enfin, plusieurs utilisateurs travaillant sur un même objet peuvent en créer des versions différentes. Chaque fois qu’un objet est modifié, un nouvel objet est automatiquement créé. Il devient alors difficile de décider quelle version de l’objet doit être utilisée.