AccueilActualités informatiqueData Science : Databricks investit dans le savoir-faire low-code et acquiert 8080...

Data Science : Databricks investit dans le savoir-faire low-code et acquiert 8080 Labs

Le fournisseur de logiciels Databricks annonce l’acquisition de la start-up allemande 8080 Labs. Son outil d’analyse des données Bamboolib, conçu comme une interface graphique, fera à l’avenir partie intégrante de l’architecture Lakehouse, avec laquelle Databricks souhaite réunir les avantages individuels des lacs de données et des entrepôts de données sur une plateforme centrale. Databricks est à l’origine des projets de science des données et de ML Apache Spark, Delta Lake et MLflow, qui sont gérés par la Fondation Linux,

Sommaire

Alors que l’introduction en bourse de la société richement capitalisée, attendue par les analystes, n’a pas encore eu lieu cette année, Databricks poursuit sans relâche sa stratégie d’acquisition. L’acquisition de 8080 Labs s’inscrit dans la continuité du rachat de Redash à l’été 2020, souligne Ali Ghodsi, le PDG et cofondateur de Databricks. Dans les deux cas, l’objectif principal est de simplifier l’utilisation de l’architecture Lakehouse et de rendre les possibilités de la science des données accessibles à un plus grand nombre d’utilisateurs.

Avec Bamboolib, 8080 Labs a développé une interface graphique extensible pour Pandas qui permet d’effectuer des tâches typiques de la science des données et de l’apprentissage automatique, comme la préparation, la transformation, la visualisation et l’exploration des données, même sans connaissances approfondies en programmation. Au lieu de cela, Bamboolib adopte l’approche familière de la création de macros dans des feuilles de calcul telles qu’Excel. En tant qu’interface graphique pour les DataFrames de Pandas, la bibliothèque exporte un code Python prêt à être utilisé dans Jupyter Notebooks ou Jupyter Lab pour une analyse interactive des données. Si Pandas et Bamboolib n’ont jusqu’à présent été conçus que pour une utilisation sur une seule machine, Databricks souhaite également mettre en œuvre la connexion directe à des clusters Spark plus importants via le projet Koala afin de permettre une analyse simplifiée des données dans des environnements distribués.

Lire aussi

Intégrée à la plateforme Lakehouse, la fonctionnalité no-code de Bamboolib sera utilisée à l’avenir pour un large éventail d’applications, allant des services de visualisation et de tableaux de bord à Databricks AutoML, avec lequel de nombreuses étapes du développement et de la formation des modèles ML, qui devaient auparavant être effectuées manuellement par les scientifiques des données, peuvent déjà être largement automatisées aujourd’hui. En plus des experts en données éprouvés, Databricks et 8080 Labs veulent permettre à toutes les équipes de données des entreprises – y compris les « Citizen Data Scientists » – d’effectuer des analyses de données et des tâches ML, même complexes, de manière autonome.

Dans le cadre de cette acquisition, l’équipe de 8080 Labs autour des cofondateurs Tobias Krabel et Florian Wetschoreck passe également à Databricks. De plus amples informations sur l’acquisition sont disponibles dans l’annonce officielle. Aucune des parties ne fait de commentaires publics sur les détails financiers de la transaction. 8080 Labs précise toutefois que l’édition communautaire actuelle de Bamboolib ne restera probablement disponible gratuitement – et sans support supplémentaire – que jusqu’au début de 2022. Comme l’a expliqué Clemens Mewald, directeur de la gestion des produits chez Databricks, lors d’un entretien avec développeur heise mais assure que l’ensemble des fonctionnalités sera disponible dans l’édition communautaire de la plateforme Databricks à l’avenir, dès que l’intégration sera terminée.

Plus d'articles