Lorsque l’on décide de développer un programme Hadoop, il convient de bien choisir l’outil que l’on va utiliser :
Si cela est possible, utiliser Pig ou Hive qui présentent le double avantage :
De s’appuyer sur des compétences assez facilement disponibles en interne ou sur le marché du travail.
De générer un overhead le plus souvent acceptable.
Lorsque cela n’est pas possible, se tourner :
Soit vers un langage de programmation de bas niveau de type Java, qui permet d’exploiter au mieux la puissance de Hadoop, au prix de compétences plus difficiles à acquérir, donc plus rares et plus onéreuses.
Soit vers un langage de scripting, par exemple Python, qui n’offre cependant qu’un accès limité aux fonctionnalités de Hadoop et génère un Overheadoverhead qui peut être rédhibitoire.
Abonnement
tous les livres et vidéos ENI en illimité sans engagement
du livre imprimé ou du livre numérique