La virtualisation des données : faire plus avec moins
La virtualisation des données permet aujourd’hui d’augmenter le rendement de ses opérations informatiques, en se reposant sur le célèbre adage “faire plus avec moins”. Passage en revue de la déduplication des données, du thin provisioning et des snapshots.
La virtualisation des données, qui est une représentation virtuelle des données au lieu d'une représentation physique, est peut-être le moyen le plus intéressant de gagner en efficacité dans la gestion de ses opérations informatiques. Mais de nombreux utilisateurs oublient souvent que les données sont la raison même d’exister de l'infrastructure informatique de l’entreprise. Aussi, le fait de s’attaquer aux inefficacités au niveau de la couche de données produit souvent les meilleurs rendements en matière de retour sur investissement. La déduplication, le thin provisioning et les snapshots sont des exemples de techniques qui réduisent considérablement ou éliminent les problèmes physiques associées aux données, tout en fournissant un accès illimité et «virtuel» à ces données.
Prenons l’exemple de la déduplication des données. Au sein d’une infrastructure de stockage, les mêmes données sont dupliquées maintes et maintes fois (stressant au passage les limites de capacité de toutes les infrastructures et les processus opérationnels), souvent pour des raisons parfaitement valables. Toutefois, cette duplication massive a un impact exponentiel négatif sur les processus de sauvegarde, de récupération de données et de reprise après sinistre (DR). Par défaut, la plupart des outils de sauvegarde créent régulièrement des images complètes d’un jeu de données, ce qui se traduit fréquemment par des dizaines de copies. Les bénéfices générés par l’élimination de ces doublons peuvent se faire sentir à travers toute l’organisation.
Par exemple, en sauvegardant vers une appliance de déduplication à base de disque, l’IT profite de gains immédiats en matière de performances du fait de la nature même des disques. Lorsque les données sont dédupliquées, elles occupent également beaucoup moins d’espace tant au repos que pour leur transport. Ainsi, les données dédupliquées au point A, nécessiteront beaucoup moins de moyens d’infrastructure (bande passante, capacité, etc) pour être stockées et transmises vers un point B et ainsi de suite. Parce que les taux typiques de déduplication en sauvegarde peuvent atteindre 20:1 ou plus, la conservation des données sur le disque virtuel peut considérablement améliorer l'efficacité des opérations de restauration, ce qui permet d’améliorer la qualité de service et les bénéfices pour les métiers. Ce gain en efficacité est encore amélioré du fait des gains induits en matière d’exploitation informatique et de temps, l’un des bien les plus précieux aujourd’hui au sein du datacenter.
Les contraintes réglementaires en matière de conservation de données pour les e-mails sont assez faciles à comprendre. Mais il est plus difficile de déterminer le moyen le plus efficace et économique de se conformer à ce mandat. La façon la plus simple de se conformer à la réglementation est d'appliquer bêtement une règle aux données, de les stocker dans un endroit donné et de ne plus jamais les déplacer. De cette façon, vous pourrez toujours les retrouver quand vous en aurez besoin. Mais cette pratique est souvent en contradiction avec les objectifs en matière d’optimisation du stockage. Un courrier électronique est une représentation des données, et au début de sa vie, il peut exiger un niveau de disponibilité qui ne sera tout simplement plus nécessaire après une certaine période de temps, par exemple, quand il devient une archive fixe (persistante) qui ne changera plus jamais. Il est donc logique de stocker à terme ce courrier électronique sur la plate-forme d'infrastructure la plus économique possible, qui ne sera sans doute pas celle d'origine. Ce n’est pas parce qu’il existe des contraintes de rétention et d’archivage que l'objet doit être condamné à un traitement inefficace pour toujours. La même logique doit être appliquée aux données sans contraintes de conservation et les bénéfices seront similaires. Chaque objet de données, indépendamment de sa forme, finira par devenir un actif persistant, immuable qui ne sera plus que rarement consulté. Les données de ce type représentent l'écrasante majorité des données gérées par l'entreprise et ont des exigences radicalement différentes de celles des données actives ou dynamiques. En règle générale, on peut appliquer la même logique aux données dés qu’elles cessent d’être actives ou accessibles et ce, qu’elles soient stockées dans une archive ou simplement sur une classe de stockage économique. En dédoublant ces données, nous pouvons plus facilement et plus efficacement les protéger, y accéder, les sécuriser et les stocker sans que cela ne nécessite des efforts surhumains de la part des personnels informatiques.
Le fait d’avoir moins de données «vivantes» consommant de précieuses ressources d’infrastructure permet d’avoir plus d’instances virtuelles de ces données et d’en retirer une valeur plus grande pour l’entreprise. C'est un cycle positif qui confirme un simple principe : on peut faire plus avec moins.
?