Introduction
Ce livre s’adresse à toutes les développeuses et à tous les développeurs qui souhaitent découvrir le framework Spark et les concepts sous-jacents tels que l’analyse de données, le traitement de données volumineuses ou encore l’apprentissage automatique. Nous nous concentrerons sur ce qu’il est nécessaire de connaître du point de vue du développement. Des détails d’architecture et d’infrastructure seront donnés uniquement dans le but de développer avec Spark.
L’objectif est de vous fournir une vision non exhaustive, mais assez détaillée de ce que vous pouvez faire avec ce framework. Vous saurez dans quels cas l’utiliser et dans quels cas préférer d’autres solutions. Les différents composants et possibilités seront examinés, ce qui vous permettra de comprendre le champ d’application de Spark.
Spark est un outil fortement utilisé dans le monde des données. Parce qu’il est distribué notamment, mais aussi parce qu’il fait appel à des concepts relativement nouveaux tels que l’apprentissage automatique par exemple, il peut être compliqué de s’initier à ce framework. L’API (Application Programming Interface) de Spark est riche, ce qui en fait sa force, mais c’est aussi une difficulté. Vous pourriez vite vous retrouver perdu.
Le parti pris de ce livre est de simplifier les concepts...