Moteur SQL : Apache Drill 1.20 rétrocompatible avec Hadoop 2

L’Apache Software Foundation (ASF) a publié Apache Drill 1.20. Le moteur de requêtes SQL peut être utilisé avec des bases de données et des systèmes de fichiers NoSQL tels que HBase, MongoDB, Amazon S3, Azure Blob Storage, Google Cloud Storage, NAS et des fichiers locaux. La nouvelle version mineure apporte des corrections de bugs, des nouveautés en matière d’utilisabilité et une connexion à Apache Phoenix à l’aide d’un nouveau connecteur. Outre Apache Hadoop 3, elle peut également être utilisée avec l’ancien Apache Hadoop 2.

Le cadre Big Data Apache Hadoop 2 est sorti en 2013, quatre ans plus tard, la version 3 était prête. Après la version 1.16, Apache Drill est passé à Hadoop 3 et n’était dès lors plus compatible avec Hadoop 2. Cela a apparemment empêché certaines entreprises qui utilisaient encore Hadoop 2 de procéder à une mise à niveau. En collaboration avec Deutsche Bahn Cargo, l’équipe Apache Drill a donc introduit dans la version actuelle une rétroportation vers Hadoop 2, afin que les utilisateurs d’Hadoop 2 ne soient plus obligés de revenir à la version 1.16, vieille de deux ans.

Apache Drill 1.20 peut être utilisé avec Apache Phoenix – un moteur de base de données relationnel, massivement parallèle et open source – grâce à un nouveau connecteur. Grâce à ce connecteur, les fonctions de requêtes et de jointures pour les données d’Apache Phoenix sont disponibles à partir de Drill. Une autre nouveauté d’Apache Drill est la possibilité d’écrire des données dans des systèmes de gestion de bases de données relationnelles (SGBDR) conformes à Java Database Connectivity (JDBC). Il s’agit notamment d’Oracle, de MySQL et de PostgreSQL.

Les nouveaux formats de fichiers utilisables dans Drill sont le format haute performance pour les jeux de données analytiques Apache Iceberg et le format de fichier SAS. Ce dernier a été développé par le SAS Institute, qui est à l’origine de la suite de logiciels statistiques SAS.

Toutes les informations complémentaires sur la nouvelle version sont disponibles sur le blog de l’Apache Software Foundation.