Comment réduire le gaspillage dans le stockage des données
30 % des données stockées dans une entreprise ne servent à rien. En revanche, elles coûtent en capacité, en bande passante, en efforts inutiles. Voici comment partir à la chasse contre ce gaspillage.
Au moins 30 % des données dans une entreprise sont redondantes, obsolètes ou inutiles selon les cabinets de conseil. Les Américains ont même inventé un nouvel acronyme pour les désigner : ROT (Redundant, Obsolet or Trivial), un mot qui signifie « pourriture » en anglais. Ces données sont des e-mails en double, des fichiers périmés, des sites web en développement qui multiplient les versions historiques, des communications inutiles. Elles pèsent sur les capacités de stockage, sur les besoins en bande passante, sur les efforts d’administration et, in fine, sur les dépenses.
La conservation de ces données peut également impacter la sécurité, la conformité réglementaire, la productivité et l’efficacité des décisions. Plus il y a de données à gérer, à trier, plus les problèmes augmentent.
Reprendre la main sur ces données ROT n’est pas une mince affaire. Tous les intervenants clés doivent participer. Cela exige un changement de mentalité à l’échelle de l’entreprise. Cet article a vocation à donner aux équipes informatiques les clés pour s’attaquer aux données ROT.
Être prêt à investir du temps et des ressources
Il faut du temps et des ressources pour réduire le pourcentage des données indésirables sans supprimer celles qui sont encore utiles. Les équipes informatiques qui se précipitent risquent d’effacer ce qu’il ne faut pas, ce qui les expose, en plus de la colère de leurs collaborateurs, au risque d’une violation de conformité ou de réglementation.
Une entreprise doit être prête à consacrer le personnel nécessaire pour que ses efforts soient efficaces. Elle doit également investir dans des outils qui rationalisent et simplifient les opérations de gestion des données. Par exemple, les équipes informatiques bénéficient souvent d’outils pour découvrir et cataloguer les fichiers, pour déterminer à quelle fréquence les collaborateurs utilisent ces fichiers.
Les bons outils permettent aux équipes informatiques d’automatiser un grand nombre d’opérations liées à l’identification et à la suppression des données ROT. L’automatisation peut également empêcher les nouvelles données ROT d’entrer sur les systèmes de stockage.
Faire l’inventaire des données existantes
Pour commencer à gérer les données ROT, faites l’inventaire des données existantes, afin de déterminer leur quantité, où elles se trouvent, qui les possède, qui peut y accéder et depuis combien de temps elles sont là. Tenez compte d’autres facteurs importants, par exemple si elles sont nécessaires à des fins de conformité ou à des fins commerciales, s’il existe une politique de conservation qui pourrait s’appliquer. L’inventaire doit prendre en compte les données stockées en cloud, celles stockées dans les succursales, celles présentes sur les serveurs, sur les ordinateurs de bureau, sur les NAS, sur les SAN.
Parallèlement au processus d’inventaire, utilisez une taxonomie pour définir les données, les étiqueter et les regrouper. Déterminez si les données sont toujours pertinentes, si elles sont périmées, si elles sont dupliquées ailleurs, si elles sont nécessaires pour des raisons juridiques ou de conformité, si elles ont une quelconque valeur pour votre entreprise. Ne partez pas du principe qu’un vieux document n’a automatiquement plus de valeur.
Supprimer les données ROT
Après avoir identifié les données périmées, commencez le processus de suppression. Commencez par les données en double, généralement la majorité des données ROT. Vous pouvez vous aider d’un outil de déduplication. De nombreux systèmes de stockage intègrent désormais une fonction de déduplication, mais si les données sont réparties sur plusieurs plateformes, optez pour un outil de déduplication global.
Ensuite, il faut éliminer toutes les données ROT qui se sont accumulées sur les systèmes de stockage. Cela nécessite une approche prudente et systématique qui garantit la suppression des seules données correctes, sans mettre en danger les bonnes données et sans enfreindre les obligations légales ou les exigences réglementaires. En cas de doute sur l’opportunité de supprimer certaines données, envisagez de les copier sur une plateforme de stockage moins chère, avant de les supprimer des systèmes de stockage primaires.
Mettre en œuvre des politiques de conservation des données
L’une des principales raisons de l’accumulation de données ROT est que les entreprises conservent leurs fichiers longtemps après en avoir eu besoin. La bonne pratique serait de mettre en œuvre une politique qui détermine quelles données conserver, combien de temps les conserver et quand les supprimer. Une telle politique peut également préciser comment organiser les données afin que l’entreprise puisse les rechercher et y accéder ultérieurement. L’objectif de la politique est de s’assurer que les données ne sont conservées que le temps nécessaire, que ce soit huit semaines, huit mois ou huit ans.
Une politique de conservation complète peut aider les entreprises à automatiser leur mise en conformité et à diminuer leurs coûts de stockage. Elle peut également accroître la pertinence des données lors des analyses décisionnelles. Pour être efficace, cependant, la politique de conservation doit tenir compte des exigences de l’entreprise et prendre en compte que certains types de données ont plus de valeur que d’autres.
Bâtir un référentiel central
L’une des stratégies les plus recommandées pour traiter les données ROT – et pour gérer les données en général – consiste à regrouper les données dans un dépôt central. Bien sûr, cela semble aller à l’encontre des tendances telles que le cloud hybride ou le Edge computing. Néanmoins, un référentiel central est la clé pour réduire la redondance des données, simplifier leur gestion et faciliter leur sécurisation. Il réduit également la nécessité pour les utilisateurs de stocker les données sur leurs propres systèmes.
Cela dit, le transfert de toutes les données dans un référentiel central ne convient pas à toutes les entreprises. Le plus important est de créer une source unique de vérité pour chaque catégorie de données. Une source unique de vérité élimine l’incertitude liée aux versions et contribue à normaliser les opérations, tout en améliorant la qualité des données. Elle permet également aux utilisateurs de travailler plus facilement avec les données. Ils savent où aller pour obtenir la bonne version et ils s’appuient tous sur le même contenu.
Mettre en œuvre un plan pour traiter les déchets
Élaborez soigneusement un plan qui détaille la manière de traiter en continu les données ROT. Un tel plan va de pair avec les politiques de conservation et de déduplication des données, ainsi qu’avec les stratégies globales de gouvernance et de gestion des données. Le plan « de ROT » doit définir les données à conserver dans le but de réduire la quantité de données stockées.
Cherchez des moyens de réduire la création de données inutiles, par exemple en décourageant la sauvegarde au format Web ou l’accumulation des versions successives. Analysez les flux de données actuels pour déterminer où les collaborateurs génèrent des données ROT de sorte à savoir quelles mesures peuvent être plus précisément prises. La planification de la réduction des déchets issus du stockage des données devrait également inclure une documentation qui décrit soigneusement les mécanismes et les processus qui permettent de faire face aux données ROT.
Former les collaborateurs
Lutter contre le gaspillage des données signifie s’appuyer sur les personnes qui travaillent quotidiennement avec les données. Elles doivent participer au processus de planification dans la mesure du possible. Elles doivent être pleinement informées de tout changement de stratégie concernant la réduction du gaspillage puisque cela pourrait avoir une incidence sur la façon dont elles travaillent avec les données.
Informez le personnel des enjeux concernant les données ROT. Formez-le aux moyens de réduire le gaspillage de données, en mettant l’accent sur les bonnes pratiques. De plus, communiquez soigneusement tout changement apporté aux processus de stockage et d’accès aux données, comme le déplacement des données vers un dépôt centralisé, afin que personne ne soit pris au dépourvu ou incapable de faire son travail.
Dans certains cas, les collaborateurs peuvent avoir besoin d’une formation spécifique, par exemple des développeurs pourraient vouloir connaître les moyens possibles afin de réduire la taille des sites Web. Mais, globalement, toute personne qui travaille avec des données devrait être formée à la manière d’éliminer le gaspillage du stockage.