Sommaire

Installer Hadoop en mode pseudo-distribué

1. Pré-requis matériels

Pour pouvoir tester Hadoop en mode pseudo-distribué, un micro-ordinateur de milieu de gamme (6 Go à 8 Go de RAM, disque dur de 500 Go ou 750 Go, et quatre ou six cœurs) est suffisant.

À titre indicatif, les exemples de programmes Hadoop présentés dans cet ouvrage ont été mis en œuvre sur un MacBook datant de fin 2008, disposant de 4 Go de RAM et d’un disque dur de 160 Go. Cette configuration est toutefois très limite en termes de performances.

images/02EP01.png

2. Pré-requis logiciels

a. Système d’exploitation

Hadoop a initialement été développé en Java dans un environnement Linux. Linux demeure le système d’exploitation de prédilection de Hadoop.

Il est aussi possible d’installer Hadoop sous Microsoft Windows (cf. chapitre Les apports de la version 2 de Hadoop).

b. Machine virtuelle

Enfin, il est également possible d’utiliser une machine virtuelle, sous VMware ou VirtualBox par exemple, pour tester Hadoop. Cette option est celle qui a été retenue dans cet ouvrage, car elle permet de réduire les risques d’interférence entre Hadoop et le reste du système d’exploitation et est simple et rapide à mettre en œuvre.

La solution de virtualisation retenue est VirtualBox.

Cloudera propose un paquet spécifique pour VirtualBox.