L’objectif de ce chapitre est double :
Présenter différents outils qui peuvent s’intégrer dans un environnement Hadoop et offrir ainsi de nouvelles fonctionnalités (on parle aussi de l’écosystème de Hadoop).
Montrer comment ces outils peuvent contribuer à l’intégration de Hadoop dans l’existant informatique.
Les outils qui constituent l’écosystème de Hadoop peuvent se classer en quatre grandes catégories :
Pig, Hive et l’API de streaming, qui permettent de programmer des jobs Hadoop sans utiliser Java.
Les outils orientés bases de données, qui permettent d’interfacer Hadoop et une base de données existante, ou de donner à l’utilisateur de Hadoop des fonctionnalités de base de données.
Les outils d’exploitation, qui permettent d’automatiser l’exécution de jobs Hadoop en production.
Les outils qui n’entrent dans aucune de ces trois catégories.
Abonnement
tous les livres et vidéos ENI en illimité sans engagement
du livre imprimé ou du livre numérique