Sommaire

Objectif du chapitre Écosystème

L’objectif de ce chapitre est double :

  • Présenter différents outils qui peuvent s’intégrer dans un environnement Hadoop et offrir ainsi de nouvelles fonctionnalités (on parle aussi de l’écosystème de Hadoop).

  • Montrer comment ces outils peuvent contribuer à l’intégration de Hadoop dans l’existant informatique.

Les outils qui constituent l’écosystème de Hadoop peuvent se classer en quatre grandes catégories :

  • Pig, Hive et l’API de streaming, qui permettent de programmer des jobs Hadoop sans utiliser Java.

  • Les outils orientés bases de données, qui permettent d’interfacer Hadoop et une base de données existante, ou de donner à l’utilisateur de Hadoop des fonctionnalités de base de données.

  • Les outils d’exploitation, qui permettent d’automatiser l’exécution de jobs Hadoop en production.

  • Les outils qui n’entrent dans aucune de ces trois catégories.