Sommaire

L’audit des flux ETL

Extract Transform Load (ETL):audit des flux

1. Les objectifs de l’audit de flux ETL

Les exemples qui ont été présentés précédemment sont des flux inachevés, dans le sens où ses flux n’intègrent pas la gestion d’erreurs et l’audit du déroulement du flux.

Par expérience, l’audit de processus ETL, souvent appelé à tort gestion des rejets, génère soit beaucoup de fausses croyances, soit beaucoup de faux espoirs. Dans la plupart des cas, elle est même mise de côté. Une des principales idées reçues consiste à faire croire qu’un logiciel ou qu’un package miracle permet de mieux gérer la qualité des données. Dans les faits, l’audit des processus ETL est un travail de finesse du concepteur ETL, traitant un cas ou un contexte particulier. Si un cas peut difficilement être retranscrit à l’identique pour un autre cas, il en reste néanmoins des bonnes pratiques. C’est ce que nous allons voir au cours de cette partie.

Tout d’abord, nous allons nous poser les questions suivantes : qu’est donc l’audit de flux ETL ? Quel est son objectif ?

En fait, l’audit de processus ETL poursuit des objectifs multiples et permet de répondre à de nombreuses questions. Cela signifie que suivant le contexte, on va rendre plus performant l’audit sur certains points plutôt que sur d’autres. ...