Se repérer dans la documentation

1. La documentation générale

L’entrée pour la documentation générale est à la page https://spark.apache.org/docs/latest/, qui donne accès à différents onglets.

L’onglet Overview donne un aperçu de Spark. C’est une introduction.

C’est dans l’onglet Programming Guides que vous trouverez le plus d’éléments, en particulier les informations concernant les API haut et bas niveaux.

L’onglet API Docs présente les mêmes éléments, mais sous une autre forme. Les fonctions sont classées selon le langage dans lequel elles sont écrites.

Ce sont ces deux derniers onglets qui vous serviront le plus a priori.

L’onglet Deploying correspond au déploiement de Spark, mais aussi à son intégration avec un manager de clusters. Plusieurs options sont possibles : Spark Standalone, Mesos, YARN et Kubernetes.

L’onglet More est dédié aux questions avancées de configuration, de performances et de sécurité.

2. La documentation Python

Spark a développé une documentation consacrée au langage Python. Elle est disponible à cette URL : https://spark.apache.org/docs/latest/api/python/index.html (ou par le biais de la page https://spark.apache.org/docs/latest/ via les onglets Programming Guides/Pyspark (Python on Spark) ou API Docs/Python.

L’onglet Getting started permet de démarrer avec...

couv_EISPARK.png

Découvrez 

le livre :

Aussi inclus dans nos :

Précédent
Déboguer avec Spark
Suivant
Déployer l’apprentissage automatique