AccueilActualités informatiqueAtelier en ligne : Scalable Data Science with Python and Spark

Atelier en ligne : Scalable Data Science with Python and Spark

Spark permet aux applications d’analyse de données et d’apprentissage automatique d’être mises à l’échelle de manière flexible sur des grappes de calcul. Cet outil, qui est basé à l’Apache Software Foundation, est un outil standard pour l’analyse et l’évaluation de grandes quantités de données. L’API PySpark constitue l’interface entre le moteur Spark et vos programmes Python auto-écrits.

Dans le cours de formation en ligne de deux jours intitulé « Big Data Analysis with PySpark », vous recevrez une introduction approfondie au framework Spark au moyen de nombreux exercices pratiques. Vous apprendrez à développer des applications Python productives et évolutives basées sur Spark. Vous aurez un aperçu de Spark SQL pour travailler avec des données tabulaires, l’API Spark Streaming, GraphX pour les calculs de graphiques et Spark ML.

L’atelier aura lieu du 4 au 5 novembre 2021 et est limité à un maximum de 15 personnes, ce qui garantit un échange intensif entre l’intervenant et les autres participants.

L’intervenant, le Dr Christian Staudt, est un informaticien et un data scientist expérimenté. Il est spécialisé dans l’exploration de données, le big data, l’apprentissage automatique et l’intelligence artificielle. Pour une participation réussie, vous devez avoir une solide connaissance de base de Python et une première expérience des applications Big Data.

Informations complémentaires et inscription :

  • Big Data Analysis and ML with PySpark, Atelier en ligne, 4-5.11.2021

Plus d'articles