GTC 2014 : Map-D présente sa base de données pour GPU
Lors de la GPU Technology Conference, Map-D a dévoilé sa base in-memory tirant parti du parallèlisme massif et de la performance des GPU.
À l’occasion de la GPU Technology Conference de Nvidia, LeMagIT a pu découvrir Map-D, un jeune éditeur bostonien, qui a développé une base de données in-memory exploitant les capacités des accélérateurs graphiques Nvidia. Map-D s’est fait remarquer en remportant la compétition des sociétés émergentes (à laquelle participaient par ailleurs 4 sociétés françaises sur les 12 concurrents), une victoire accompagnée de la remise d’un chèque de 100 000 $.
Map-D est une base de données in-memory en colonnes, qui charge l’intégralité de ses données en mémoire. Selon les besoins, la base sait répartir ses données entre le pool de mémoire vive du serveur et la mémoire des accélérateurs graphiques (jusqu’à 100 Go sur un système équipé de 8 cartes NVIDIA Tesla K40). L’intérêt est que les GPU disposent d’une bande passante mémoire qui excède de bien loin celle des CPU traditionnels. Comme l'a expliqué Todd Mostak, l’un des cofondateurs de la firme (issu du laboratoire de recherche en informatique et en intelligence artificielle du MIT) au MagIT, Map-D peut traiter jusqu’à 2,3 To de données par seconde lors d’un query sur huit GPU. La base détermine automatiquement quelles sont les requêtes les plus efficacement traitées par un CPU et par un GPU en fonction de leur nature. La persistance des données est assurée sur une solution de stockage Flash qui, selon la firme, permet de soutenir des débits de 100 Go/s.
De façon intéressante, Map-D n’a pas pris la voie des bases NoSQL. La firme a intégré à sa base un mécanisme de query SQL qui, selon son fondateur, permet de faciliter grandement les requêtes et d’éviter de devoir recourir à des développeurs pour interroger les données. Avec sa technologie, toujours en phase de développement, Map-D vise le marché du Big Data et des sociétés ayant besoin d’analyser et de visualiser en temps réel de très grands volumes de données. La société a développé un ensemble de technologies de visualisation quasi-temps réel permettant de tirer parti des performances de sa base. Selon son fondateur, la technologie permet par exemple d’analyser 1 milliard de twitts en moins d’une milliseconde.
Selon Thomas Graham, le second cofondateur de Map-D, la firme devrait proposer le moteur de base de sa technologie en mode libre et commercialiser une version avancée de sa base avec une offre de support pour les entreprises. L’un des premiers utilisateurs de la base devrait être Facebook qui prévoit de tester la technologie en live dans ses datacenters dans les prochaines semaines. Mais les ambitions de la jeune société vont clairement au-delà des acteurs web hyperscale.
Il est à noter que si Map-D supporte aujourd’hui les accélérateurs de Nvidia, son objectif est aussi de supporter les accélérateurs Xeon Phi d’Intel et les accélérateurs d’AMD.