Sommaire

Outils d’exploitation

1. ZooKeeperZooKeeper

images/08EP07.png

ZooKeeper est un projet de la fondation logicielle Apache.

ZooKeeper est un outil de coordination pour environnement distribué, dont Hadoop. ZooKeper offre à des clusters comportant un grand nombre de nœuds des fonctions :

  • De gestion des configurations, tâche quasiment impossible à assumer manuellement dès qu’un cluster dépasse une dizaine ou une vingtaine de nœuds.

  • De synchronisation des nœuds, par exemple dans le cadre de l’option High Availability (HA) de Hadoop (cf. chapitre Les apports de la version 2 de Hadoop pour une description de HA).

  • De gestion de groupes.

  • De gestion d’un registre de nommage.

Un des objectifs visés par le projet ZooKeeper est de rendre l’utilisation de services de coordination, tâche notoirement difficile à assurer en environnement distribué, aussi simple que possible pour l’administrateur d’un cluster.

ZooKeeper présente certaines caractéristiques de Hadoop :

  • Il fonctionne normalement dans son propre cluster, ce qui permet d’améliorer ses performances, si besoin est, en ajoutant des nœuds (scaling out).

  • Il inclut une fonction de réplication et peut, de ce fait, rester disponible tant que la majorité de ses nœuds restent opérationnels.

La raison pour laquelle ZooKeeper doit disposer de son propre cluster est qu’il est très sensible au niveau des performances de chacun de ses nœuds. Si ZooKeeper était ...