Spark Un framework distribué pour le Big Data et le Machine Learning
Présentation
Dans le domaine de la data, l’un des enjeux est de gérer de fortes volumétries de données. Spark est un framework qui permet de relever ce challenge. L’objectif de cette vidéo est de vous présenter le framework distribué Apache Spark, à travers de nombreux exemples en Python, pour que vous soyez en mesure de l’utiliser dans une situation concrète d’analyse et de traitement de données.
Ainsi, après une présentation générale du framework, vous commencerez par en découvrir les rouages avant d’entrer ensuite dans le vif du sujet en apprenant à manipuler Spark pour enrichir des données et pour faire du Machine Learning.
Ainsi, après une présentation générale du framework, vous commencerez par en découvrir les rouages avant d’entrer ensuite dans le vif du sujet en apprenant à manipuler Spark pour enrichir des données et pour faire du Machine Learning.
Table des matières
- Durée totale02h13
- Le framework Spark et ses rouages
- Spark pour l'enrichissement de données
- L'API DataFrame0350
- Mise en pratique – Ajouter et renommer des colonnes avec DataFrame0354
- Mise en pratique – Sélectionner des colonnes avec DataFrame0237
- Mise en pratique – Filtrer des colonnes avec DataFrame0404
- Mise en pratique – Joindre des données avec DataFrame0541
- Introduction à l'API SQL0637
- Introduction à l'API Dataset0648
- Introduction à l'API Spark Streaming0713
- Spark pour l'apprentissage automatique
- Introduction0706
- Les différentes étapes d'un projet d'apprentissage automatique0613
- La classification0658
- Mise en pratique – Classification0944
- La régression0315
- Mise en pratique – Régression0919
- L'apprentissage non supervisé 0537
- Mise en pratique – Apprentissage non supervisé 0523
- La recommandation0540
- Mise en pratique – Recommandation0311
Auteur
Nastasia SABYEn savoir plus
Nastasia SABY est ingénieur en Machine Learning. Après avoir débuté sa carrière en tant que développeuse back-end, elle a suivi la révolution de la data et s’est notamment spécialisée dans le développement avec le framework Apache Spark. Elle est aujourd’hui experte de la mise en production de systèmes prédictifs dans le domaine du streaming. Conférencière et rédactrice d’articles de blog, elle aime partager son savoir au plus grand nombre.
Retrouvez la liste de ses réalisations sur www.editions-eni.fr
Caractéristiques
- Niveau Confirmé
- Durée 2h13
- Parution juin 2022
- Vidéo en ligne
- Ref. ENI : VTSPARK