1. Espace Professionnels
  2. Modélisation BI et OLAP - L’art de concevoir des architectures décisionnelles performantes

Modélisation BI et OLAP L’art de concevoir des architectures décisionnelles performantes

Bientôt disponible !
Suivez-nous pour être informé dès la sortie

Nous n’avons jamais autant stocké d’informations, et pourtant, nous peinons souvent à obtenir des réponses simples aux questions métiers complexes. Cet ouvrage s’adresse à tous les artisans de l’information (développeurs BI, architectes de données, analystes ou étudiants) qui souhaitent dépasser la simple accumulation technique pour maîtriser l’art de la modélisation multidimensionnelle. Conçu comme une progression structurée en dix chapitres, cet ouvrage vous accompagne de la page blanche àune...
Aperçu de la version papier
  • Niveau Expert
  • Nombre de pages 297 pages
  • Parution juin 2026

Nous n’avons jamais autant stocké d’informations, et pourtant, nous peinons souvent à obtenir des réponses simples aux questions métiers complexes. Cet ouvrage s’adresse à tous les artisans de l’information (développeurs BI, architectes de données, analystes ou étudiants) qui souhaitent dépasser la simple accumulation technique pour maîtriser l’art de la modélisation multidimensionnelle.

Conçu comme une progression structurée en dix chapitres, cet ouvrage vous accompagne de la page blanche àune architecture décisionnelle robuste. Vous poserez d’abord les fondations essentielles en distinguant clairement OLTP et OLAP, en maîtrisant les schémas en étoile, en flocon et les constellations de faits.

Vous plongerez ensuite au cœur du modèle pour sculpter les dimensions (hiérarchies, gestion du temps, Slowly Changing Dimensions), définir les faits avec la bonne granularité et concevoir des agrégats performants.

Au-delà de la conception, l’ouvrage vous conduit vers une maîtrise technique approfondie : gestion des relations complexes (many-to-many), optimisation des performances, sécurité, gouvernance et historisation des données. Enfin, il ouvre la voie vers les modèles tabulaires modernes, le cloud, le lakehouse et les nouvelles architectures data.

Loin d’un catalogue théorique, cet ouvrage est pragmatique : mises en situation concrètes, extraits de code (SQL, MDX, DAX) et retours d’expérience terrain jalonnent votre progression. Plus qu’un manuel technique, c’est une boussole méthodologique pour transformer la donnée brute en intelligence décisionnelle durable.

Caractéristiques

  • Livre (broché) - 17 x 21 cm
  • ISBN : 978-2-409-05459-4
  • EAN : 9782409054594
  • Ref. ENI : EPMOD

Caractéristiques

  • HTML
  • ISBN : 978-2-409-05460-0
  • EAN : 9782409054600
  • Ref. ENI : LNEPMOD
Avant-propos
  1. 1. Introduction
  2. 2. La mission de l’ouvrage
  3. 3. À qui s'adresse ce livre ?
  4. 4. La construction du livre
  5. 5. Ce qu'il faut avoir dans son sac (prérequis)
  6. 6. Quelques conventions pour la route
Introduction à la modélisation multidimensionnelle
  1. 1. Définition et rôle des cubes OLAP dans la Business Intelligence
  2. 2. Différences entre bases transactionnelles (OLTP) et analytiques (OLAP)
    1. 2.1 Fondements et objectifs : le transactionnel au service de l'opérationnel, l'analytique au service de la stratégie
      1. 2.1.1 L'OLTP : moteur des opérations quotidiennes
      2. 2.1.2 L'OLAP : boussole de la prise de décision stratégique
    2. 2.2 Divergences architecturales : modélisation et structure des données
      1. 2.2.1 La charge de travail : le point de rupture fondamental
      2. 2.2.2 Modèle de données : normalisation contre dénormalisation
      3. 2.2.3 Portée et origine des données
    3. 2.3 Implications pratiques et écosystème des données
      1. 2.3.1 Performance et volumétrie
      2. 2.3.2 Utilisateurs et applications
      3. 2.3.3 Un écosystème complémentaire : le rôle du processus ETL
      4. 2.3.4 Tableau récapitulatif : OLTP vs OLAP
  3. 3. Types d’OLAP : MOLAP, ROLAP, HOLAP
    1. 3.1 Fonctionnalités et principes de chaque type
      1. 3.1.1 Cube MOLAP (Multidimensional OLAP)
      2. 3.1.2 Cube ROLAP (Relational OLAP)
      3. 3.1.3 Cube HOLAP (Hybrid OLAP)
    2. 3.2 Cas d’usage et critères de choix
  4. 4. Présentation des modèles multidimensionnel et tabulaire
    1. 4.1 Le modèle relationnel
    2. 4.2 Le modèle tabulaire
    3. 4.3 Le modèle multidimensionnel
  5. 5. Concepts clés : faits, dimensions, mesures et granularité
    1. 5.1 Nature et rôle des faits et des dimensions
    2. 5.2 Mesures, agrégations et granularité
  6. 6. Avantages et limites des modèles multidimensionnels et tabulaires
Modélisation physique et conceptuelle OLAP
  1. 1. Principes fondamentaux de la conception OLAP
  2. 2. Modèle en étoile (Star Schema)
    1. 2.1 Structure et organisation des tables
    2. 2.2 Avantages et cas d’usage
  3. 3. Modèle en flocon (Snowflake Schema)
    1. 3.1 Impacts sur la normalisation des données
    2. 3.2 Optimisation des jointures et performances
  4. 4. Modèle en constellation de faits
    1. 4.1 Gestion des relations complexes
    2. 4.2 Cas où l’utiliser et impact sur les performances
  5. 5. Comparaison des performances entre étoile, flocon et constellation
  6. 6. Hybridation des modèles et cas d’usage spécifiques
Modélisation des dimensions et hiérarchies
  1. 1. Organisation hiérarchique et attributs des dimensions
  2. 2. Conception et optimisation des hiérarchies et niveaux d’agrégation
  3. 3. Gestion des Slowly Changing Dimensions (SCD)
    1. 3.1 Typologie des SCD (type 0, 1, 2, 3...)
    2. 3.2 Cas d’usage et meilleures pratiques
  4. 4. Modélisation des dimensions complexes
    1. 4.1 Multi-hiérarchies et relations parent-enfant
    2. 4.2 Dimensions multivaluées
    3. 4.3 Dimensions à rôles multiples (Role-Playing Dimensions)
    4. 4.4 Dimensions dégénérées (Degenerate Dimensions)
    5. 4.5 Dimensions fourre-tout (Junk Dimensions)
  5. 5. Gestion des dimensions volumineuses
    1. 5.1 Stratégies de stockage et compression
    2. 5.2 Optimisation des performances et indexation
Modélisation des tables de faits et des agrégats
  1. 1. Définition et structuration
    1. 1.1 Définition et structuration des tables de faits
    2. 1.2 Implémentation de la dimension dégénérée
  2. 2. Types de faits
    1. 2.1 Faits additifs
    2. 2.2 Faits semi-additifs
    3. 2.3 Faits non additifs
    4. 2.4 Table de faits de type Periodic Snapshot (instantané périodique)
    5. 2.5 Faits de type Accumulating Snapshot (instantané cumulatif)
    6. 2.6 Tables de faits sans fait (Factless Fact Tables)
  3. 3. Choix de la granularité et impact sur la performance
  4. 4. Stratégies d’agrégation
    1. 4.1 Pré-agrégations et cubes matérialisés
    2. 4.2 Gestion des calculs à la volée
    3. 4.3 Navigation dans les agrégats (Aggregate Navigation)
    4. 4.4 Distinctions des mesures (calculées vs de base)
Optimiser les relations faits et dimensions
  1. 1. Gestion des clés primaires et clés étrangères
    1. 1.1 Clés entreprises simples
    2. 1.2 Clés entreprises composites
    3. 1.3 Clés artificielles (surrogate key)
  2. 2. Relations entre plusieurs tables de faits
    1. 2.1 Drill-across et gestion des niveaux de granularité
    2. 2.2 Cas des modèles multi-faits
      1. 2.2.1 Standardisation des dimensions partagées
      2. 2.2.2 Création de vues matérialisées
  3. 3. Relations plusieurs-à-plusieurs dans un modèle OLAP
    1. 3.1 Table de pont (bridge table)
    2. 3.2 Factless fact table (table de faits sans mesures)
    3. 3.3 Fact table helper (table de faits auxiliaire)
  4. 4. Réduction des jointures complexes et optimisation des performances
    1. 4.1 Dénormalisation
    2. 4.2 Vues matérialisées
    3. 4.3 Indexation stratégique
    4. 4.4 Partitionnement
    5. 4.5 Hash keys
Optimisation des performances des cubes OLAP
  1. 1. Indexation et partitionnement des tables
    1. 1.1 L’indexation
    2. 1.2 Partitionnement
  2. 2. Techniques de pré-agrégation et stockage en cache
    1. 2.1 Pré-agrégation
      1. 2.1.1 Sélection des agrégats à pré-agréger
      2. 2.1.2 Pré-agréger les mesures non-additives
      3. 2.1.3 Pré-agréger les mesures semi-additives
      4. 2.1.4 La pré-agrégation et les architectures : MOLAP, ROLAP, HOLAP
    2. 2.2 Mise en cache mémoire
  3. 3. Optimisation des temps de réponse des requêtes MDX
    1. 3.1 Indexation des structures multidimensionnelles
      1. 3.1.1 Pré-agrégations du cube (Aggregation Design/ Aggregate Views)
      2. 3.1.2 Index hiérarchiques via les relations d’attributs
      3. 3.1.3 Index du SGBD sousjacent pour les cubes ROLAP/HOLAP
      4. 3.1.4 Partitionnement et “Slice” (élimination de partitions)
      5. 3.1.5 Vues d’agrégats relationnels matérialisées et indexées
    2. 3.2 Optimisation des parcours d’arborescence
      1. 3.2.1 Exemple SSAS Multidimensionnel (AdventureWorks)
      2. 3.2.2 Exemple Oracle Essbase
    3. 3.3 Bonnes pratiques d'écriture des requêtes MDX
  4. 4. Bonnes pratiques pour la maintenance et l’évolution des cubes
Gérer l’historisation et les données temporelles
  1. 1. Prise en charge des évolutions temporelles
    1. 1.1 Gestion de l'historique des dimensions
    2. 1.2 Gérer les faits dans le temps
    3. 1.3 La bonne mesure au bon endroit
    4. 1.4 Optimisation du cube
    5. 1.5 Gérer les cas exceptionnels
    6. 1.6 La méthode pour historiser vos données
    7. 1.7 Maîtriser la sémantique de vos indicateurs
    8. 1.8 Fuseaux horaires et calendriers
  2. 2. Stratégies avancées pour les Slowly Changing Dimensions
    1. 2.1 La mini-dimension pour les attributs volatils
    2. 2.2 Gérer les relations complexes dans le temps
    3. 2.3 Mettre en place un pipeline d'historisation fiable
    4. 2.4 Une historisation raisonnable
    5. 2.5 Les clés de l'optimisation OLAP
    6. 2.6 La contrainte d'unicité et le contrôle qualité
    7. 2.7 La gestion des mesures semi-additives
    8. 2.8 Choisir la fréquence des snapshots
    9. 2.9 Mettre en œuvre le suivi des changements (CDC)
    10. 2.10 Gérer les corrections rétroactives
    11. 2.11 Les snapshots accumulés
    12. 2.12 Modélisation des données périodiques
  3. 3. Cas spécifique des cubes temporels
    1. 3.1 La dimension Temps et ses rôles
    2. 3.2 Optimiser les calculs temporels
    3. 3.3 Gérer les fuseaux horaires et les jointures d'intervalles
    4. 3.4 La gouvernance des données temporelles
Sécurité, gouvernance et déploiement des cubes
  1. 1. Gestion des rôles et des accès utilisateurs
    1. 1.1 Principes généraux et segmentation des accès
    2. 1.2 Sécurité dimensionnelle et stratégies d’application
    3. 1.3 La sécurité hiérarchique par encodage de chemin
    4. 1.4 Traçabilité, audits et maintien des droits
  2. 2. Sécurisation et anonymisation des données OLAP
    1. 2.1 Chiffrement et gestion des clés
    2. 2.2 Masquage, cloisonnement et pseudonymisation
    3. 2.3 Le risque d’inférence
    4. 2.4 Ajout de bruit statistique et contrôle des détails
    5. 2.5 Conformité, gouvernance et cycle de vie des données
  3. 3. Gouvernance BI et bonnes pratiques
    1. 3.1 Les fondations de la gouvernance BI
    2. 3.2 Traçabilité des calculs et gestion du changement
      1. 3.2.1 La discipline de versionnage
      2. 3.2.2 Anticiper les changements majeurs
    3. 3.3 Gestion des environnements et qualité continue
    4. 3.4 Animation et gouvernance collective
    5. 3.5 Le self-service BI gouverné
    6. 3.6 Traçabilité, conformité et responsabilité
    7. 3.7 Rétention, archivage et bonnes pratiques transverses
  4. 4. Surveillance et monitoring des performances
    1. 4.1 Quand un cube rame
    2. 4.2 La gestion des partitions
    3. 4.3 Les agrégations tabulaires
    4. 4.4 Le code des mesures
    5. 4.5 Le multidimensionnel
    6. 4.6 Le cache warming
      1. 4.6.1 MDX - exécuter les vues standard avant les pics (8h45, 13h55)
      2. 4.6.2 SSAS - vérifier cache & concurrency throttling
    7. 4.7 Exemple
    8. 4.8 Les alertes et le suivi
Modèle multidimensionnel vs tabulaire
  1. 1. Différences fondamentales entre les deux approches
  2. 2. Langages de requêtage : MDX vs DAX
  3. 3. Stockage : OLAP en colonnes vs stockage en ligne
    1. 3.1 Stockage en ligne (rowstore) : l’utilisation de l’index seek (saut d’index), limites du scan
    2. 3.2 Stockage en colonnes : compression, scans sélectifs, exécution vectorisée
    3. 3.3 Cubes multidimensionnels : matérialisation des agrégats
  4. 4. Performance et gestion des relations dans un modèle tabulaire
    1. 4.1 Contexte, périmètre et modèle de référence
    2. 4.2 Gérer plusieurs dates pour une même vente
    3. 4.3 Maîtriser les relations plusieurs-à-plusieurs : table de pont et granularité temporelle
    4. 4.4 La bidirectionnalité
    5. 4.5 Les mesures DAX évolutives
    6. 4.6 Relations et sécurité (RLS)
    7. 4.7 Partitionnement et rafraîchissement incrémental
    8. 4.8 Outils de diagnostic pour les relations qui posent problème
    9. 4.9 Résumé
  5. 5. Cas pratique : migration d’un cube OLAP vers un modèle tabulaire
    1. 5.1 L'analyse et la compréhension du modèle existant
    2. 5.2 L'extraction des données sources et la modélisation
    3. 5.3 La construction du modèle de données tabulaire
    4. 5.4 La traduction de la logique métier de MDX vers DAX
    5. 5.5 Le défi des mesures complexes
    6. 5.6 La validation, l'optimisation et les tests
    7. 5.7 Le déploiement, la formation et la conduite du changement
Évolutions et tendances de la modélisation OLAP
  1. 1. OLAP et Big Data : intégration avec les plateformes cloud
    1. 1.1 Élasticité et accès direct (DirectQuery)
    2. 1.2 Formats colonnes et index implicites
    3. 1.3 Cubes logiques sur stockage objet
    4. 1.4 Fédération de requêtes
    5. 1.5 Coût, performance et latence à froid
  2. 2. Automatisation et usage du machine learning
    1. 2.1 Automatisation du machine learning
    2. 2.2 Prédiction de cartes de jointure et routage adaptatif
    3. 2.3 Détection automatique des SCD et comblement temporel
    4. 2.4 Feature Store analytique
  3. 3. Nouvelles architectures : Data Lakehouse et Data Mesh
    1. 3.1 Data Lakehouse
      1. 3.1.1 La transformation du fichier en table transactionnelle
      2. 3.1.2 Des opérations de manipulation de données enfin possibles
      3. 3.1.3 L’impact concret sur la mise à jour des agrégats
      4. 3.1.4 Les bénéfices pour le modèle OLAP final
    2. 3.2 Le paradigme du maillage de données (Data Mesh)
      1. 3.2.1 Des domaines autonomes et des produits de données
      2. 3.2.2 Dimensions conformes et contrat de données
    3. 3.3 Les modèles composites
  4. 4. Exploration des technologies émergentes : OLAP en mémoire, Graph OLAP
    1. 4.1 Le pouvoir de la vectorisation et de la compression
    2. 4.2 La matérialisation tardive ou l'art d'être paresseux
    3. 4.3 L'écriture de mesures qui plaisent au processeur
    4. 4.4 L'OLAP sur graphe
    5. 4.5 La synergie inévitable
Conclusion et synthèse
  1. 1. Introduction
  2. 2. Récapitulatif des meilleures pratiques en conception OLAP
  3. 3. Checklist pour la réussite d’un projet BI basé sur les cubes OLAP
  4. 4. Perspectives pour approfondir le sujet et aller plus loin
  5.  
  6.  
  7. Index

Mohamed BOUABOULA

Diplômé en informatique décisionnelle et en intelligence artificielle, Mohamed BOUABOULA conçoit et optimise des architectures de données critiques depuis plus de treize ans, notamment dans le secteur de l’assurance. Ancien Responsable Data, il est devenu consultant indépendant et accompagne aujourd’hui les entreprises dans l’audit de leurs plateformes BI, la modernisation de leurs modèles OLAP et la mise en place d’architectures robustes et gouvernées. Son approche conjugue exigence technique, vision stratégique et pragmatisme opérationnel, avec une conviction forte : une bonne modélisation vaut mieux qu’un empilement d’outils.

Nos nouveautés

voir plus