Sommaire

Installer Hadoop pas-à-pas sur une station de travail

1. Installation de VirtualBox

L’installation de VirtualBox est considérée comme acquise et n’est pas détaillée dans cet ouvrage.

2. Installation de Hadoop (distribution CDH4)

Connectez-vous sur le site de Cloudera à l’adresse : www.cloudera.com/content/support/en/downloads.html

images/02EP02.png

Descendez au bas de la page et recherchez le paragraphe Cloudera Quick-Start VM.

images/02EP03.png

Cliquez sur le bouton Downloads & Instructions. Dans la liste déroulante Version : choisissez VirtualBox, puis cliquez sur le bouton Download.

images/02EP04.png

Lisez et acceptez les Terms & Conditions.

images/02EP05.png

Le téléchargement commence (compter une heure environ avec une "box" Internet grand public).

images/02EP06.png

Décompressez le fichier téléchargé et sauvegardez le dossier cloudera-quickstart-vm-4.3.0-virtualbox dans un répertoire ad hoc. Nous avons choisi ici de sauvegarder ce dossier sur le bureau du Macintosh (le Finder).

images/02EP07.png

Lancez VirtualBox. Une nouvelle fenêtre, nommée Oracle VM VirtualBox - Gestionnaire de machines, s’affiche. Cliquez sur le bouton Nouvelle en haut et à gauche de la fenêtre, saisissez le nom que vous souhaitez donner à votre nouvelle machine dans le champ Nom (CDH4 dans cet exemple), sélectionnez Linux dans la première liste déroulante et Ubuntu (64 bit) dans la deuxième (en fait c’est la distribution CentOS 64 bits ...