Sommaire

Conclusion

La version 2 de Hadoop :

  • Facilite l’évolution d’un cluster en supprimant le JT qui, dans certains cas, peut devenir un goulot d’étranglement : certains fournisseurs de solutions Hadoop ont testé la version 2 sur un cluster virtuel de 10 000 nœuds, sans difficulté particulière.

  • Rend possible l’utilisation d’autres modèles de traitement des données que celui de MapReduce.

  • Permet d’optimiser l’utilisation des ressources d’un cluster, et donc de réduire les coûts en retardant l’achat de nouveaux nœuds.

Les utilisateurs de Hadoop sont encouragés à adopter dès que possible la version 2.2.0, dans la mesure où :

  • Elle est significativement plus stable que les versions précédentes.

  • Elle demeure compatible, tant en termes d’API (Application Programming Interface) que de protocoles, avec les versions précédentes.

  • Elle apporte des nouveautés significatives par rapport à la version 1.

Du point de vue du développeur Hadoop, le passage de la version 1 à la version 2 de Hadoop est le plus souvent totalement transparent.