Sommaire

CloudCloud et ETLETL

Au sein du Cloud de Microsoft, Azure, l’ETL (Extract Transform Load) proposé se nomme Azure Data FactoryAzure Data Factory (ADF) et tient une place centrale au sein de nombreuses architectures orientées données. Car ce service d’intégration de données hybrides (Cloud et On-Premise) répond aux problématiques de chargement de données depuis de nombreuses sources, sur Internet, ou dans les intranets des entreprises. Tout en permettant d’appliquer au besoin des transformations sur ces données afin de répondre à de nombreux cas d’usage tels que l’alimentation d’un Data Warehouse, d’un Data Lake, ou plus simplement la mise en place d’un flux d’alimentation d’une source depuis une destination.

Ce n’est pas tout. En plus de pouvoir ordonnancer des pipelines de chargement de données, ADF intègre des outils pour la planification des flux ainsi que le monitoring de ceux-ci.

À ce stade, si vous étiez à l’aise avec SSIS, il est possible de ne pas encore cerner les différences majeures entre ces deux produits qui partagent un certain nombre de mécanismes tels que la création de flux de données de manière graphique. Toutefois, l’utilisation du Cloud rend les deux outils radicalement différents : plus besoin de provisionner de machines, ADF est un service managé (PaaS). Les pipelines, les activités, les jeux de données ...