AccueilActualités informatiqueAnalyse de données : Elastic 8.0 apporte de nouvelles fonctionnalités pour la...

Analyse de données : Elastic 8.0 apporte de nouvelles fonctionnalités pour la recherche vectorielle

La version 8.0 du portefeuille de logiciels Elastic Stack est disponible. Avec cette mise à jour, les développeurs d’Elastic étendent la fonction de recherche pour les vecteurs dans Elasticsearch et introduisent un support natif pour les modèles de traitement du langage naturel. Selon un article de blog, cette version devrait marquer le début d’une « nouvelle ère de vitesse, d’échelle et de pertinence ».

Sommaire

Elastic 8 propose de nouvelles fonctions de recherche pour les vecteurs, qui doivent permettre aux utilisateurs de rechercher des vecteurs dans Elasticsearch avec leurs propres mots et leur propre langue. Elasticsearch 7.0 avait déjà introduit des types de champs pour les vecteurs à haute dimension. Les versions 7.3 et 7.4 avaient apporté le support pour les fonctions de similarité vectorielle.

La version actuelle va plus loin et met à la disposition des utilisateurs un support natif pour les modèles de traitement du langage naturel (NLP). Jusqu’à présent, il était apparemment nécessaire, outre l’écriture de plug-ins coûteux, d’exploiter une partie du traitement NLP en dehors d’Elasticsearch. Avec la version 8.0, les utilisateurs peuvent notamment effectuer la reconnaissance d’entités nommées, l’analyse de sentiments et la classification de textes directement dans Elasticsearch. Des composants ou une programmation supplémentaires ne sont apparemment pas nécessaires.

En outre, Elasticsearch 8.0 offre un support natif pour la recherche ANN (Approximate Nearest Neighbour), une forme de recherche de proximité dans l’analyse de données. Elle doit permettre aux utilisateurs de comparer rapidement et à grande échelle des requêtes basées sur des vecteurs avec un corpus de documents basés sur des vecteurs.

Les modèles PyTorch pour l’apprentissage automatique peuvent dès à présent être utilisés directement dans Elasticsearch et, en outre, effectuer des inférences directement dans Elasticsearch – les modèles peuvent être définis par l’utilisateur ou mis à disposition par la communauté. Ce soutien doit simplifier le processus de traitement et accélérer le NLP, car les données ne doivent pas être déplacées vers un processus ou un système séparé.

Elastic introduit également deux nouvelles intégrations AWS pour Lambda et S3 Storage Lens. Cela attire l’attention, car le fournisseur se trouve dans un conflit de licence avec le fournisseur de cloud. Elastic ne supportait pas la manière dont les fournisseurs de cloud comme Amazon profitaient de sa propre pile ELK. Cela a conduit à la fin de la version libre d’Apache et AWS a lancé un fork du logiciel appelé OpenSearch. Ce dernier existe désormais dans une version stable. Des organisations telles que l’OSI ne considèrent pas la licence gratuite d’Elastic comme une source ouverte.

Elastic 8 peut être téléchargé par les personnes intéressées via l’Elastic Cloud. De plus amples informations sur la version sont disponibles dans l’article d’annonce sur le blog officiel d’Elastic.

Plus d'articles