Sommaire

Conclusion

Lorsque l’on décide de développer un programme Hadoop, il convient de bien choisir l’outil que l’on va utiliser :

  • Si cela est possible, utiliser Pig ou Hive qui présentent le double avantage :

  • De s’appuyer sur des compétences assez facilement disponibles en interne ou sur le marché du travail.

  • De générer un overhead le plus souvent acceptable.

  • Lorsque cela n’est pas possible, se tourner :

  • Soit vers un langage de programmation de bas niveau de type Java, qui permet d’exploiter au mieux la puissance de Hadoop, au prix de compétences plus difficiles à acquérir, donc plus rares et plus onéreuses.

  • Soit vers un langage de scripting, par exemple Python, qui n’offre cependant qu’un accès limité aux fonctionnalités de Hadoop et génère un Overheadoverhead qui peut être rédhibitoire.