Nmedia - Fotolia
L'Institut Européen de Bio-informatique virtualise ses bases de données pour devenir plus agile
L'EBI a choisi Delphix pour diminuer le temps nécessaire à provisionner des instances de bases de données pour ses développeurs et économiser sur le stockage de ses 50.000 TB de données.
Dans son rôle de cerbère des données scientifiques, l'Institut Européen de Bio-informatique (European Bioinformatics Institute - EBI) doit s’assurer que les informations du monde biologique sont librement accessibles et disponibles pour la communauté des chercheurs.
L’organisation à but non lucratif est à la tête de 50.000 TB de données, hébergées dans trois centres de données en Grande-Bretagne. Selon l’EBI, ces données donnent lieu à 12 millions de requêtes par mois.
Les scientifiques du monde académiques et les acteurs du monde commercial sont invités à les utiliser pour leurs recherches, leurs développements d’applications ou à des buts de formations du personnel.
Les utilisateurs peuvent choisir de télécharger les données pour les analyser localement, ou bien utiliser le IaaS de l’EBI pour réaliser cette tâche d’analyse, mais en s’épargnant les tracas de l’infrastructure sur site.
« C’est une approche relativement nouvelle qui essaye de répondre au mieux aux différentes manières dont la communauté demande à consommer et à travailler sur les informations », explique Steven Newhouse, responsable technique de l’EBI.
Mais avec 20 % de son effectif (570 personnes) dédié à la réalisation et à la collecte d’informations et de recherches sur les sciences de la vie, la quantité de données que l’organisation doit gérer double chaque année.
A ce rythme, ce sont 1.5 millions de TB qu’il faudra stocker. De quoi mettre l’infrastructure de l’EBI sous haute pression.
Pour anticiper, l’organisation a décidé de passer à la virtualisation. Une manière d’entamer un mouvement de simplification dans la gestion de ses bases de données relationnelles et NoSQL qui lui servent à stocker les métadatas utilisées par les chercheurs pour retrouver les informations disséminées.
Virtualiser pour économiser
Pour mener à bien ce projet, l'Institut Européen de Bio-informatique a choisi de déployer l’offre de Data as a Service (DaaS) de Delphix.
Cette technologie capture et stocke une seule copie des métadonnées de la base, puis en fournit des copies virtuelles aux intéressés, comme les développeurs, mais sans faire de duplication.
EBI prévoit que ce déploiement devrait lui permettre de réduire l’empreinte de son stockage d'environ 70%.
« A mesure que la quantité de données que nous produisons augmente, toute l’infra dont nous avons besoin pour provisionner nos bases – et le nombre de bases dont nous avons besoin – va également augmenter », prédit Steven Newhouse. « Ce que Delphix devrait nous permettre de faire, c’est de diminuer la demande de stockage et les ressources humaines nécessaires pour gérer cette augmentation ».
Selon lui, la technologie devrait également réduire le volume de données qui transitent sur le réseau interne de l’EDI, tout en rendant la création d’instances de bases de données plus rapides et plus simple.
« Beaucoup de nos utilisateurs internes sont des développeurs qui utilisent les métadatas pour créer des applications qui peuvent ensuite être utilisées plus largement, par la communauté scientifique Européenne. Nos développeurs ont besoins de bases de données pour travailler dessus et ce que Delphix permet c’est justement de les cloner très rapidement », ajoute Steven Newhouse.
Cette dernière capacité diminue le temps qu'il faut à l’IT pour fournir des instances et des bases à jour pour les développeurs, permettant à ces derniers d'être plus productifs.
Concrètement, « Delphix nous permet d’identifier les différences entre plusieurs versions d’une base de données, de sorte que nous n’avons plus qu’à synchroniser ces différences plutôt que l'ensemble de la base ».
Projets pilotes
L'Institut Européen de Bio-informatique a commencé à déployer Delphix il y a environ 12 mois, après avoir effectué une série de tests pendant plus de trois ans.
« Nous avons réalisé plusieurs projets pilotes pour monter en expérience et en confiance. Puis nous sommes arrivés au moment de la décision, celui où nous devions dire si cette technologie était quelque chose que nous voulions laisser de côté ou au contraire, adopter à plus grande échelle », raconte Steven Newhouse.
Et comme les retours utilisateurs étaient suffisamment bons, c’est la deuxième option qui a été choisie.
Mais le fait d’avoir mis plusieurs années à choisir pourrait laisser planer un doute sur l’efficacité de Delphix. « En fait, c’est plutôt le temps qu’il nous a fallu à nous pour convaincre les différentes équipes que cela valait le coup ».
« Non seulement il y a les sceptiques habituels, mais nous voulions vraiment être sûrs à 100 % que la technologie allait fonctionner à grande échelle. Et qu’une fois déployée, nous serions capable de la supporter pour aller de l’avant ».
Cette décision de virtualiser une partie de son infrastructure et de ses bases de données a ouvert la voie à l’automatisation et devrait déboucher, dans un futur proche, sur une approche encore plus agile du développement applicatif.
« Nous voulons vraiment voir comment tout notre service hébergé sur notre datacenter peut devenir plus facilement déployable sur différentes infrastructures virtualisées, que ce soit dans des Cloud privés ou un Cloud public », annonce d’ores et déjà Steven Newhouse en guise de conclusion ambitieuse.