Dans le domaine de la data, l’un des enjeux est de gérer de fortes volumétries de données. Spark est un framework qui permet de relever ce challenge. L’objectif de cette vidéo est de vous présenter le framework distribué Apache Saprk, à travers de nombreux exemples en Python, pour que vous soyez en mesure de l’utiliser dans une situation concrète d’analyse et de traitement de données.
Ainsi, après une présentation générale du framework, vous commencerez par en découvrir les rouages avant d’entrer ensuite dans le vif du sujet en apprenant à manipuler Spark pour enrichir des données et pour faire du Machine Learning.

Auteur(s)

Nastasia SABY
Nastasia SABY est ingénieur en Machine Learning. Après avoir débuté sa carrière en tant que développeuse back-end, elle a suivi la révolution de la data et s’est notamment spécialisée dans le développement avec le framework Apache Spark. Elle est aujourd’hui experte de la mise en production de systèmes prédictifs dans le domaine du streaming. Conférencière et rédactrice d’articles de blog, elle aime partager son savoir au plus grand nombre.
Réf. ENI :