Sommaire

Principes de fonctionnement de MapReduce

Un programme Hadoop se divise généralement en trois parties :

  • Le driver, Driver qui s’exécute sur une machine client, est chargé de configurer le job puis de le soumettre pour exécution.

  • Le mapper est Mapperchargé de lire les données stockées sur disque et les traiter.

  • Le reducer est Reducer chargé de consolider les résultats issus du mapper puis de les écrire sur disque.