Sommaire

Mapping Data FlowMapping Data Flow

Les transformations supportées par Mapping Data Flow sont réparties en quatre catégories dans l’interface adf.azure.com :

  • Multiple inputs/outputs pour les transformations chargées de consolider les données de plusieurs jeux de données : Join, Conditional Split, Union, Lookup.

  • Schema modifier pour les transformations qui auront un impact sur les colonnes du jeu de données : Derived Column, Aggregate, Surrogate Key, Pivot, Unpivot, Window.

  • Row modifier afin d’apporter des modifications sur le contenu des jeux de données : Exists, Select, Filter, Sort, Alter Row.

  • Destination est une catégorie qui ne contient que le composant Sink nécessaire à l’insertion des données de destination.

images/3-5-EP-1.PNG

1. Source et destination

a. Source

Au moins une source est nécessaire par Data Flow. Ces sources sont le point de départ d’un flux de données. Une source est liée à un jeu de données, seuls les jeux de données de types : Azure Blob Storage, Azure Data Lake Storage (Gen 1 & 2), Azure SQL Data Warehouse et Azure SQL Database sont aujourd’hui supportés.

Pour toutes les autres sources, il est nécessaire de réaliser une activité de copie en amont du Data Flow afin de stocker les données sur l’un de ces stockages.

images/3-5-EP-2.PNG

L’onglet Source Settings expose les options :

  • Allow schema drift : lorsque cette option est activée, la source ...