Apache : Drill devient un projet de premier niveau
Le projet Open Source de moteur de requête SQL pour Hadoop, développé initialement chez MapR et placé dans l’incubateur de la fondation Apache en août 2012, vient de gagner ses premières lettres de noblesse.
Le projet Open Source Drill vient de gagner ses premières lettres de noblesse. Placé dans l’incubateur de la fondation Apache en août 2012, ce projet de moteur de requête SQL pour Hadoop, développé initialement chez MapR, vient d’être élevé au rang de projet de premier niveau au sein de l'institution. Le projet dispose désormais de sa propre autonomie au sein d’Apache. Un comité dédié est maître de sa gouvernance.
Drill fait partie des projets Open Source qui gravitent autour d’Hadoop, avec pour objectif « d’augmenter » le framework, d’en faciliter l’usage ou tout simplement d’en corriger certaines lacunes. Citons également Spark, considéré comme un turbo pour Hadoop.
Inspiré du projet Dremel de Google, Drill, quant à lui, permet d’effectuer des requêtes interactives SQL au dessus d’Hadoop, avec pour objectif premier de donner accès aux utilisateurs non IT (comprendre les utilisateurs métiers d'outils BI ou les data scientists par exemple) de réaliser des analyses à partir de données stockées dans HDFS et Hadoop. Sa capacité à supporter les données sans schémas (comme celles de HDFS ou encore des bases NoSQL) lui permet de réaliser des analyses temps réel sur des données aux formats JSON, Parquet ou encore stockeés dans HBase. Pour l’utilisateur, un projet comme Drill permet tout simplement de mettre en place un service d’exploration en mode self-service sur Hadoop.
« Tout en proposant de créer plus rapidement de la valeur à partir de données dans Hadoop, Drill soulage également les développeurs et les administrateurs qui préparent et entretiennent les données à des fins d’analyses. Les analystes peuvent ainsi explorer des données en temps réel, injecter à la volée de nouvelles données et utiliser leur outils traditionnels de BI pour visualiser facilement les données - le tout par eux-même », affirme la fondation Apache dans un communiqué.
La communauté du projet prévoit de publier une première version stable courant 2015. Aujourd’hui Drill est en version 0.7. Outre MapR, Cisco, Hortonworks et Pentaho contribuent également à ce projet.