AccueilActualités informatiqueDremio met son service de data lakehouse gratuitement à la disposition de...

Dremio met son service de data lakehouse gratuitement à la disposition de tous

L’entreprise Dremio, qui se trouve entre autres derrière le projet open source Apache Arrow, annonce la mise à disposition gratuite de son service géré Dremio Cloud. Ce service d’analyse de données et de Business Intelligence (BI) adapté à SQL doit réunir les avantages des Data Lakes et des Data Warehouses, sans que les entreprises ne soient obligées de se rendre dépendantes des opérateurs de Data Warehouse en nuage. En tant que plateforme ouverte de data lakehouse, Dremio Cloud doit en outre être disponible gratuitement et durablement dans son édition standard, comme l’assure Tomer Shiran, fondateur de Dremio, dans le cadre de l’annonce.

Sommaire

Afin que les data scientists et les spécialistes de la BI dans les entreprises puissent se concentrer de manière plus ciblée sur l’analyse, l’évaluation et la visualisation de leurs données dans le Data Lake, le service Cloud de Dremio se charge des tâches complexes de mise en place, de configuration et de gestion d’une architecture Data Lakehouse. Afin d’automatiser et de simplifier largement les processus nécessaires à cet effet, la plateforme intègre entre autres deux autres nouveaux services : Dremio Sonar et Dremio Arctic.

En tant que méta-mémoire pour Apache Iceberg – un format de table ouvert pour les analyses Big Data avec SQL – Arctic met à disposition des outils d’ingénierie des données qui permettent de mettre en place des pipelines de données et des flux de travail selon les principes connus de la gestion des versions Git. En se basant sur le projet open source Nessie, les développeurs peuvent par exemple créer des copies de données issues de processus de production directement via le code source et les mettre à disposition pour un traitement ultérieur et une analyse – sans pour autant entraver les processus de travail critiques de l’entreprise. Pour la version des données, des fonctions typiques de Git telles que Branch, Merge et Tags sont entre autres disponibles.

Le concept de l’architecture ouverte du Data Lakehouse de Dremio.

(Image : dremio.com)

Le moteur SQL Dremio Sonar, basé sur Apache Arrow, permet d’établir des requêtes et des tableaux de bord BI directement sur les données du Data Lake. En cas de besoin, des connecteurs externes permettent d’intégrer d’autres données qui n’ont pas encore été transférées dans le Data Lake. Sonar met à disposition les fonctions connues des entrepôts de données classiques, qui peuvent être utilisées au moyen de la syntaxe SQL. Les analystes peuvent utiliser le SQL Runner intégré comme IDE pour la création et l’exécution des requêtes, et surveiller les requêtes avec le SQL Profiler de Sonar et ajuster leur performance si nécessaire.

Lire aussi

Vous trouverez de plus amples informations sur la plateforme Data-Lakehouse gratuite et désormais disponible pour tous dans l’article de blog sur Dremio Cloud ainsi que sur le site web du projet.

Plus d'articles