Mike Kiev - Fotolia
Inria construit la grande bibliothèque mondiale du code source
Le projet Software Heritage a l'ambition de collecter et d'organiser le patrimoine logiciel mondial. Démarrée il y a déjà un an et demi, cette initiative veut être une gigantesque bibliothèque du code source. Le projet initié par Inria a déjà reçu plusieurs soutiens dont le premier de Microsoft.
« Notre projet est de construire un outil pour protéger le patrimoine logiciel de l'humanité, une sorte de “bibliothèque d'Alexandrie” du logiciel, qui soit à la fois un référentiel du code source et un grand instrument de recherche pour l'informatique ». C'est ainsi qu'Antoine Petit, président-directeur général d'Inria, a présenté Software Heritage. Ce projet, initié par Inria, a été lancé discrètement début 2015. Software Heritage est développé par une équipe dirigée par Roberto Di Cosmo, professeur d'informatique détaché de l'Université Paris Diderot à Inria.
L'initiative vise à collecter le code source des logiciels disponibles publiquement, à l'organiser, à le préserver et à le rendre accessible à la communauté des développeurs et des chercheurs ainsi qu'aux enseignants et aux étudiants. Software Heritage a d'ores et déjà recueilli et archivé plus de 2,5 milliards de fichiers sources uniques, « ce qui représente 200 To de code source brut », précise Roberto Di Cosmo.
Le soutien de la communauté
Maintenant qu'il a été présenté « officiellement », ce projet a vocation à atteindre rapidement une dimension internationale et à être porté par les acteurs du logiciel libre. Jean-François Abramatic, un des trois conseillers scientifiques de Software Heritage aux côtés de Gérard Berry et de Serge Abiteboul, soulignait le parallèle qui existe entre ce projet et le Consortium international World Wide Web (W3C), qu'il a dirigé de 1996 à 2001. « Il s'agit désormais de créer quelque chose qui va appartenir à tout le monde, qui est né comme un projet avant de devenir un consortium et de créer une communauté autour d'un projet collaboratif », a-t-il détaillé.
L'omniprésence du logiciel
Microsoft a été le premier à soutenir Software Heritage. « Nous sommes de plus en plus impliqués dans l'open source, qui se développe rapidement dans les entreprises, porté notamment par le Cloud. Une machine sur trois dans le monde tourne aujourd'hui sous Linux », a expliqué Frédéric Aatz, directeur de la stratégie open source chez Microsoft France. La société utilise des logiciels open source dans son cloud Azure, dans ses solutions Big Data, etc. Un autre soutien est venu de DANS, une institution publique des Pays-Bas vouée à préserver l'information scientifique.
« Le logiciel est omniprésent dans nos activités et c'est une composante essentielle de la recherche scientifique, une connaissance précieuse. Mais il est fragile ! Nous devons le protéger », a insisté Roberto Di Cosmo, directeur de Software Heritage. Cette archive mondiale du code source bénéficie d'un financement de 1,5 million d'euros pour 3 ans. Antoine Petit affirme que « l'engagement moral d'Inria ira au-delà de cette période », mais qu'à court terme, l'outil sera porté par l'écosystème du logiciel libre. Software Heritage devrait rapidement devenir soit un consortium soit une fondation.