1. Supports de cours
  2. Power Query et M - Extraire et préparer les données en vue de leur exploitation dans Excel ou Power BI

Power Query et M Extraire et préparer les données en vue de leur exploitation dans Excel ou Power BI

  • En stock
  • Expédié en 24h00
  • Personnalisable
  • Accessible immédiatement
  • Version HTML
  • Accès illimité 24h/24, 7J/7

Présentation

Power Query permet l’extraction, la transformation et le chargement de données depuis une multitude de sources vers les deux outils principaux que sont Power BI et Excel. C’est surtout l’étape de transformation qui va nous intéresser dans cet ouvrage : les plus simples consistent à filtrer les lignes, choisir les champs ou encore vérifier le type de la donnée. Mais il est souvent nécessaire de nettoyer les données (harmoniser les champs de type texte, supprimer les valeurs nulles ou une ligne de total…), de créer de nouveaux champs, de calculer de nouveaux indicateurs ou de scinder un champ complexe en plusieurs valeurs distinctes.

M est le langage de programmation disponible dans Power Query qui permet de travailler plus vite et d’aller plus loin.

Ce support s’adresse à toute personne devant traiter des données avec Power Query. Les utilisateurs de Power Query pouvant s’appuyer sur l’interface graphique exclusivement, ou saisir intégralement le code M, nous avons adopté dans ce livre une approche mixte : laisser l’interface graphique générer le code et y apporter des améliorations en code M lorsque cela est utile, tant en termes de rapidité de conception qu’en termes de possibilités de transformation.

Dans le premier chapitre, nous nous intéressons aux connecteurs. Nous évoquons un certain nombre de cas courants (fichier Excel, fichier Excel avec plusieurs feuilles, plusieurs fichiers Excel, tableaux croisés), puis nous voyons l’import de fichiers plats (TXT, JSON), l’import à partir de bases de données et l’import de données issues du Web. Nous évoquons aussi les jeux de données (datasets).

Le deuxième chapitre est consacré au nettoyage et à la préparation des données. Nous y voyons comment transformer des colonnes, dépivoter un tableau croisé, transformer successivement du texte, des numériques puis des dates, comment ajouter des colonnes, combiner (associer) des tables, comment gérer les erreurs de chargement. Nous voyons aussi comment accéder au code M, comment le lire et comment, après avoir utilisé l’interface graphique, reproduire ou améliorer l’opération à l’aide du code M.

Le troisième chapitre vous propose d’aller plus loin avec Power Query et M en travaillant sur les étapes de transformation, avec l'organisation des requêtes, les paramètres, les filtres dynamiques, l’agrégation des tables. Nous évoquons également dans ce chapitre le modèle « en étoile » qui est la structure de données recommandée.

Le quatrième chapitre se concentre sur les erreurs au chargement des données : comment les déceler, comment générer un rapport d’erreurs pour les corriger.

Dans le chapitre suivant, nous plongeons dans le code M pour mieux comprendre sa structure, ses entités, créer des fonctions personnalisées, utiliser l'actualisation incrémentielle, découvrir des cas complexes de transformation ou d’extraction de données à partir du Web.

Le support se termine par une annexe dans laquelle nous évoquons l'installation et l’utilisation de R ou de Python dans Power Query.

Table des matières

  • Introduction
    • A. Power Query, M et les produits Microsoft
    • B. À quoi sert Power Query ?
    • C. À qui s’adresse ce livre et comment est-il structuré ?
    • D. Aperçu général de l’interface de Power Query
      • 1. Les rubans
      • 2. Les requêtes
      • 3. La zone centrale
      • 4. La barre de formule
      • 5. Les étapes
    • E. Power Query et le modèle de données
    • F. Le modèle en étoile
    • G. Power Query et le modèle composite
    • H. Les ressources
    • I. Note importante à propos des versions du logiciel Power BI Desktop
  • Acquérir les données
    • A. Introduction
      • 1. Organisation des fichiers exemples et des sources
      • 2. Les principes généraux
      • 3. L’accès à la collection de connecteurs
    • B. Les sources de type fichier
      • 1. Fichier Excel
        • a. Une feuille dans un fichier
        • b. Plusieurs feuilles dans un fichier
        • c. Plusieurs feuilles de structure identique dans un seul fichier
        • d. Plusieurs fichiers avec des feuilles de structure identique
        • e. Plusieurs fichiers avec des feuilles de noms différents
        • f. Obtenir une liste de répertoires ou une liste de fichiers
        • g. Cas particulier du tableau croisé
      • 2. Fichiers plats
        • a. Fichier TXT ou CSV
        • b. Le cas des données empilées dans un fichier TXT ou CSV
        • c. Fichier XML
        • d. Fichier JSON
        • e. Fichier PDF
    • C. Les base de données
      • 1. Base Access
      • 2. SQL Server
        • a. Accéder aux tables
        • b. Effectuer une recherche sur la base
        • c. Le mode Import et le mode DirectConnect (ou LiveConnect)
        • d. Utiliser les options avancées
    • D. Les sources web
      • 1. Extraire les fichiers d’un dossier SharePoint
      • 2. Extraire un tableau d’une page web
      • 3. Extraire une liste structurée implicite d’une page web
      • 4. Autre sources web
        • a. API
        • b. Flux Odata
        • c. Microsoft 365
        • d. Google Analytics
    • E. Les sources de données de la Power Platform
      • 1. Les jeux de données
      • 2. Les flux de données (Dataflows)
      • 3. Le Common Data Service ou Dataverse
        • a. Connexion par le CDS
        • b. Connexion par le connecteur Dataverse
    • F. Changer la source de données d'une requête
    • G. Exporter et partager une source de données
    • H. Épingler une source de données
  • Nettoyer et transformer les données
    • A. Introduction
    • B. Fonctionnement général
    • C. Lire et comprendre le code M
      • 1. Aperçu de la structure d’un code M
      • 2. Afficher et éditer le code M
    • D. Transformer les colonnes
      • 1. Conserver ou supprimer les colonnes
        • a. Conserver ou supprimer les colonnes à l’aide de l’interface
        • b. Supprimer ou conserver les colonnes ?
        • c. Maîtriser la suppression de colonnes à l’aide du code M
      • 2. Ajouter les en-têtes
      • 3. Renommer les colonnes
        • a. Avec l’interface
        • b. Avec M
      • 4. Changer le type de la colonne
        • a. Changer le type d’une colonne
        • b. Changer le type de plusieurs colonnes d’un coup
      • 5. Conserver ou supprimer les lignes
      • 6. Développer les colonnes
    • E. Transformer le texte
      • 1. Remplacer des portions de texte
      • 2. Fractionner une colonne, extraire, recombiner
      • 3. Ajouter un préfixe ou un suffixe
      • 4. Nettoyer le texte à l’aide du code M
    • F. Transformer les numériques
      • 1. Remplacer le séparateur de décimales
      • 2. La fonction Modulo et List.Split
    • G. Transformer les dates
      • 1. Utiliser l’interface pour générer des champs liés à la date
      • 2. Utiliser l’interface pour créer une table du temps
      • 3. Générer une table du temps avec le code M
      • 4. Quelques éléments de M
        • a. Obtenir la date d’aujourd’hui
        • b. Convertir du texte en date
      • 5. Travailler avec les durées
        • a. Utiliser les fonctionnalités de calcul de durée de Power Query
        • b. Générer un identifiant pour travailler avec une table des heures
    • H. Transformer les requêtes
      • 1. Ajouter des colonnes
        • a. Ajouter des colonnes à l’aide d’une formule (Colonne personnalisée)
        • b. Ajouter des colonnes à partir d’exemples
        • c. Ajouter des colonnes conditionnelles
        • d. Ajouter des colonnes à l’aide d’une fonction personnalisée
        • e. Ajouter une colonne d’index
      • 2. Dépivoter un tableau croisé
        • a. En utilisant l’interface
        • b. En utilisant le code M
        • c. Cas particulier d’un tableau avec des sous-totaux
      • 3. Combiner des requêtes
        • a. Empiler les lignes (ajouter)
        • b. Remarques sur la combinaison de fichiers avec le connecteur Dossier
        • c. Assembler les colonnes (fusionner)
      • 4. Importer plusieurs fichiers avec des feuilles de noms différents
  • Exploiter la puissance de Power Query
    • A. Introduction
    • B. Organiser les requêtes et les étapes
      • 1. Gérer les requêtes
        • a. Créer des répertoires pour regrouper les requêtes
        • b. Dupliquer ou référencer une requête
      • 2. Travailler avec les étapes
        • a. Renommer une étape
        • b. Gérer et modifier une étape
    • C. Récupérer le contexte de la requête
    • D. Dynamiser la requête et travailler avec les paramètres
      • 1. Travailler sur des périodes glissantes
      • 2. Travailler avec les paramètres de requête
        • a. Créer et utiliser un paramètre pour filtrer la requête
        • b. Créer un paramètre de type texte avec une liste de valeurs dynamiques
        • c. Créer et utiliser un paramètre pour changer la source de la requête
        • d. Paramètres et modèle de document
    • E. Entrer des données
      • 1. Entrer des données par copier-coller
        • a. Où trouver la fonctionnalité ?
        • b. Copier-coller à partir d’Excel
        • c. Copier-coller à partir d’un fichier texte
        • d. Copier-coller à partir d’un tableau PDF
        • e. Copier-coller à partir d’un tableau Word
      • 2. Ajouter une table par saisie manuelle
      • 3. Ajouter une table avec du code M
        • a. Ajouter une table du temps
        • b. Ajouter une table et son contenu manuellement
    • F. Analyser le texte avec un produit cartésien
      • 1. Avec un nombre de termes de recherche limité
      • 2. Avec un produit cartésien
    • G. Agréger les tables
      • 1. Comprendre l’agrégation
        • a. Définition standard de l’agrégation
        • b. Définition étendue de l’agrégation
        • c. Pourquoi et quand recourir à un agrégat dans Power BI
        • d. Comment s’utilise un agrégat
      • 2. Mettre en place les données agrégées
        • a. Agréger un indicateur dans une table dimension
        • b. Créer une table agrégée
        • c. Ramener un modèle en flocon à un modèle en étoile
        • d. Utiliser la fonction d’agrégation Toutes les lignes
  • Gérer les erreurs au chargement
    • A. Introduction
    • B. Comment repérer les erreurs
      • 1. Dans Power Query
      • 2. Au moment du chargement complet des données
    • C. Supprimer les erreurs sur une colonne
    • D. Construire un rapport d’erreur lors du chargement
    • E. Erreurs liées aux paramètres régionaux
    • F. Utiliser la fonction TRY localement
    • G. Les messages d’erreurs courants
      • 1. Expression.Error : La clé ne correspondait à aucune ligne dans la table
      • 2. Expression.Error : Désolé... Nous n'avons pas trouvé la colonne « nom » de la table
      • 3. DataSource.error : Le fichier <chemin/nom du fichier> est introuvable
      • 4. Expression.Error : Le nom « Table.promoteHeaders » n'a pas été reconnu
      • 5. DataFormat.Error : Désolé... Nous ne pouvons pas procéder à la conversion en un nombre.
  • Guide pratique du code M
    • A. Introduction
    • B. Présentation générale du code M
      • 1. DAX ou M ?
      • 2. Afficher la librairie des fonctions
      • 3. Les étapes
      • 4. Les types de valeurs primitives
      • 5. Les types complexes (ou abstraits)
    • C. Réutiliser le code M entre plusieurs requêtes ou documents
    • D. Créer et utiliser une fonction personnalisée
      • 1. Créer la fonction personnalisée
      • 2. Utiliser la fonction personnalisée
      • 3. Créer une fonction complexe
    • E. Travailler avec les tables
      • 1. Manipulations courantes avec les tables
      • 2. Fonctions de table courantes
      • 3. Exemples de manipulations de tables
        • a. Extraire des colonnes dynamiquement
        • b. Ajouter un suffixe aux noms des colonnes
        • c. Nettoyer le nom des colonnes
    • F. Travailler avec les listes
      • 1. Manipulations courantes avec les listes
      • 2. Fonctions de liste courantes
    • G. Travailler avec les enregistrements (records)
      • 1. Manipulations courantes avec les enregistrements
      • 2. Fonctions d’enregistrement courantes
    • H. Les fonctions Texte, Date et Nombre
    • I. L’expression each
    • J. Comprendre l’actualisation incrémentielle
      • 1. Comment la mettre en place ?
      • 2. Limitations et réserves
    • K. Extraire les données sur plusieurs pages d’un site avec le code M
      • 1. Créer la requête sur la première page
      • 2. Transformer cette requête en fonction personnalisée
      • 3. Créer une table à une colonne contenant les numéros de page
      • 4. Créer une colonne personnalisée appelant la fonction
      • 5. Opérer des transformations
    • L. Où trouver des ressources sur M ?
  • R et Python dans Power Query : premier pas
    • A. Utiliser R dans Power Query
      • 1. Installation (R et R Studio)
      • 2. R pour importer les données
      • 3. R pour transformer les données
    • B. Utiliser Python dans Power Query
      • 1. Installation
      • 2. Python pour importer les données
      • 3. Python pour transformer les données
      • Index

Auteur

André MEYER-ROUSSILHONEn savoir plus

André MEYER-ROUSSILHON suit depuis 20 ans l’évolution des méthodes et outils de BI dans un parcours de consultant et formateur, de Business Objects à Cognos, de Microstrategy à, aujourd’hui, Tableau et Power BI ; il a également développé de nombreuses compétences dans le domaine de la modélisation dimensionnelle pour les bases de données et de la conduite de projet décisionnel. Surpris par la facilité de mise en oeuvre de Power BI, son puissant langage et son évolution permanente, il est passionné par cet outil de BI. Il a créé le site www.daxone.fr où il publie régulièrement des articles pour vous inviter à continuer à approfondir votre connaissance de Power BI.

Caractéristiques

  • Nombre de pages 306 pages
  • Parution septembre 2021
    • Reliure spirale - 17 x 21 cm (Médian)
    • ISBN : 978-2-409-03193-9
    • EAN : 9782409031939
    • Ref. ENI : SOBMPOWQUE
  • Parution septembre 2021
    • HTML
    • ISBN : 978-2-409-03194-6
    • EAN : 9782409031946
    • Ref. ENI : LNSOBMPOWQUE

Téléchargements

En complétant ce formulaire, vous acceptez d'être contacté afin de recevoir des informations sur nos produits et services ainsi que nos communications marketing. Vous aurez la possibilité de vous désabonner de nos communications à tout moment. Pour plus d'informations sur notre politique de protection des données, cliquez ici.
  • Des fichiers complémentaires (4 251 Ko)