Sommaire

Wrangling Data FlowWrangling Data Flow

Wrangling Data Flow permet de générer des traitements sur un cluster Databricks en partant d’un frontal Power Query.

Power Query permet aux utilisateurs familiers avec Power BI ou Excel, de transformer les données graphiquement grâce aux assistants intégrés dans l’outil, mais aussi à un langage de développement, le M.

Début d’été 2019, Wrangling Data Flow est en accès privé, il n’est donc pas possible pour l’instant de le documenter de façon satisfaisante. Cette section a donc pour objectif de présenter ce qui est disponible de l’outil tout en gardant à l’esprit que cela va certainement drastiquement changer d’ici la sortie officielle de la fonctionnalité.

1. Initialisation

La première étape lors de l’ajout d’un nouveau Wrangling Data Flow est de configurer les jeux de données sources et destination.

images/3-5-EP-49.PNG

Les jeux de données supportés sont des fichiers CSV et JSON depuis un Data Lake Storage Gen2.

L’écran d’initialisation fermé, l’interface de Power Query apparaît. Les jeux de données configurés apparaissent en tant que requêtes dans le dossier ADFResource.

2. Interface Power Query

images/3-5-EP-50.PNG

L’interface de Wrangling Data Flow est identique à la version de Power Query qu’il est possible de trouver au sein de Power BI Data Flow.

a. Liste des requêtes

La liste ...