Sommaire

Développer des flux ETL pour le décisionnel

Flux:décisionnel

1. Déroulement de l’exécution d’un processus ETL

Dans cette partie, nous allons vous présenter les différents types de flux, que vous serez en mesure de rencontrer pour alimenter votre entrepôt de données.

Entrepôt de données

Dans les faits, les données ne vont pas transiter directement des systèmes sources vers l’entrepôt de données. Les données vont transiter par au moins un palier : le sas de données. Dans notre cas, nous appellerons cette base DistrisysSA (SA en anglais signifiant Staging Area).

Système:sources Sas de données Staging Area

Le chargement va se faire suivant ce schéma de principe :

images/05SO0160.png

Architecture de chargement de données

La base SQL MDS fait référence aux bases de données de référentiel du produit SQL Server Master Data Services. Nous présenterons cet outil dans le chapitre suivant Gérer les données de référence avec MDS.

Le SA a plusieurs rôles :

  • Rapatrier les informations émanant de sources multiples, en garantissant qu’il n’y ait pas de pertes de données lors de ce processus.

  • Faire une zone mémoire tampon d’un état brut de la source à un instant passé et ainsi, faciliter la mise en œuvre d’un processus de reprise Données:reprise de données, que nous verrons dans ce chapitre à ...