1. Livres et vidéos
  2. Modélisation décisionnelle - Concevoir la base de données pour les traitements OLAP

Modélisation décisionnelle Concevoir la base de données pour les traitements OLAP

  • Accès illimité 24h/24, 7J/7
  • Tous les livres en ligne, les vidéos et les cours enregistrés ENI
  • Plus de 10 nouveautés livres et vidéos chaque mois
  • Les nouveautés disponibles le jour de leur sortie
  • Accès 100% en ligne
  • En stock
  • Expédié en 24h00
  • Livraison à partir de 0,01 €
  • Version en ligne offerte
  • 1 h d'accès gratuit à tous nos livres et vidéos pour chaque commande
  • Accessible immédiatement
  • Version HTML
  • Accès illimité 24h/24, 7J/7

Présentation

Ce livre a pour objectif de fournir au lecteur toutes les clés pour concevoir une base de données décisionnelle efficace, s'intégrant parfaitement à une solution OLAP et permettant également d'entrevoir des nouvelles possibilités dans la manipulation de la donnée. Il s'adresse à un public ayant déjà des connaissances en bases de données. La connaissance des progiciels décisionnels est un plus mais n'est pas indispensable.

L'auteur suit un fil conducteur pour la conception d'un modèle de données et répond aux questions que se posera naturellement le lecteur au fur et à mesure de l'avancement, notamment sur les contraintes inhérentes à un choix de modélisation, et lui permet de trouver les compromis entre la théorie et la réalité du terrain.

À travers les premiers chapitres, le lecteur est invité à repenser et réorganiser la donnée technique autour d'une vision objet, la transformant ainsi en une véritable ressource. Les chapitres qui suivent lui permettent de saisir et de mettre des noms sur les concepts de modélisation propres au décisionnel (dimension, cube, langage, modèle...). La suite du livre permet au lecteur de savoir identifier et formaliser un besoin pour réussir à le transposer dans cette architecture si spéciale mais si puissante. Enfin, le lecteur apprendra à enrichir et optimiser le modèle créé.


Les chapitres du livre :
Avant-propos – Aborder le décisionnel – Repenser la donnée – Comprendre les spécificités du décisionnel – Identifier le projet – Concevoir le modèle – Historiser les données – Enrichir le modèle – Charger les données – Optimiser le modèle – Glossaire



Quizinclus dans
la version en ligne !
  • Testez vos connaissances à l'issue de chaque chapitre
  • Validez vos acquis

Table des matières

  • Avant-propos
    • 1. But de l'ouvrage
    • 2. De multiples concepts et quelques outils
      • 2.1 Une modélisation indispensable et des outils utiles
      • 2.2 Un concept, de multiples modèles
    • 3. Rapports versus décisionnel
    • 4. Le quiproquo du Big Data
    • 5. Utilisateurs visés
    • 6. À propos du contenu
      • 6.1 Technologies utilisées
      • 6.2 Code couleur pour les schémas
  • Aborder le décisionnel
    • 1. Quid des termes décisionnels
      • 1.1 De nombreux termes pour de nombreux concepts
      • 1.2 Détails par catégorie
        • 1.2.1 Le projet : décisionnel, aide à la décision ou la Business Intelligence
        • 1.2.2 Le système d'information : SID ou système d'information décisionnel
        • 1.2.3 Les données : base de données décisionnelle relationnelle, entrepôt de données et magasin de données
        • 1.2.4 La modélisation spécifique : base de données multidimensionnelle, OLAP, cubes
        • 1.2.5 Le chargement des données : ETL, intégration
        • 1.2.6 La restitution de la donnée : reporting, restitution, rapports, états, tableaux de bord, analyse, reporting ad hoc
      • 1.3 Synthèse
    • 2. La justification du décisionnel
      • 2.1 Des données et un besoin déjà présents
        • 2.1.1 Un besoin analytique
        • 2.1.2 Bien qualifier ce besoin
      • 2.2 La réponse à un besoin métier
      • 2.3 Une nécessité technique
      • 2.4 Une nécessaire historisation
      • 2.5 Nécessaire mais dispensable
    • 3. Mise en œuvre du projet
      • 3.1 Les étapes
      • 3.2 Découper le projet
    • 4. Identification du besoin
      • 4.1 Identifier les utilisateurs cibles
      • 4.2 Reprise de l'existant
        • 4.2.1 Reprise en l'état
        • 4.2.2 Identification des éléments clés
      • 4.3 Demandes récurrentes
      • 4.4 Identification des nouveaux besoins
      • 4.5 Formaliser le besoin
        • 4.5.1 Matrice des besoins
        • 4.5.2 Détails complémentaires
      • 4.6 La réalité
  • Repenser la donnée
    • 1. De la technique au métier
    • 2. Des "applications" aux "objets"
    • 3. De l'événement à la période
    • 4. Du transactionnel à l'analyse
    • 5. De l'exhaustivité à la simplicité
  • Comprendre les spécificités du décisionnel
    • 1. Le multidimensionnel : hiérarchiser la donnée
      • 1.1 Les dimensions
      • 1.2 Les cubes
      • 1.3 Densité d'un cube
      • 1.4 Les technologies de cubes
      • 1.5 L'interaction avec le datawarehouse
      • 1.6 Un langage spécifique : le MDX
      • 1.7 Les modes de stockage
        • 1.7.1 Différents modes de stockage
        • 1.7.2 MOLAP
        • 1.7.3 ROLAP
        • 1.7.4 HOLAP
        • 1.7.5 Synthèse et choix
        • 1.7.6 Autres technologies
    • 2. Les fondamentaux de la base de données relationnelle
      • 2.1 Le rôle de la base de données relationnelle
      • 2.2 La dénormalisation
        • 2.2.1 Principe
        • 2.2.2 Dénormaliser les référentiels
        • 2.2.3 Dénormaliser les transactions
      • 2.3 Pourquoi ne pas tout dénormaliser ?
      • 2.4 Les modèles de données
        • 2.4.1 Dimensions versus référentiels
        • 2.4.2 Modèle en étoile
        • 2.4.3 Modèle en flocon
        • 2.4.4 Choix du modèle
        • 2.4.5 Modèle en galaxie ou constellation
  • Identifier le projet
    • 1. Entrepôts et magasins de données
      • 1.1 Deux éléments distincts
      • 1.2 Identification des caractéristiques
    • 2. Méthodologies de conception
      • 2.1 Inmon : de l'entrepôt aux magasins
      • 2.2 Kimball : des magasins à l'entrepôt
      • 2.3 Une même vision cible
      • 2.4 Choisir une méthode et Middle-Out
      • 2.5 Le piège de la technique
    • 3. Formaliser l’entrepôt et les magasins de données
      • 3.1 Les différents rôles de l’entrepôt de données
      • 3.2 Les multiples concepts du magasin de données
        • 3.2.1 Les limites de la définition de base
        • 3.2.2 Le magasin de données comme nécessité technique
        • 3.2.3 Ordonnancement avec l'entrepôt
        • 3.2.4 Cardinalités entre datamarts et restitutions
    • 4. La base de données opérationnelle
      • 4.1 L'ODS
      • 4.2 La Staging Area ou Landing Zone
    • 5. Identifier les contraintes
      • 5.1 Avant-propos
      • 5.2 Contraintes technologiques
        • 5.2.1 Processus de choix des technologies
        • 5.2.2 Choix d'une solution pour la modélisation de la base de données relationnelle
        • 5.2.3 Choix d'une solution pour la modélisation des cubes
      • 5.3 Contraintes techniques
        • 5.3.1 Accès aux données
        • 5.3.2 Espace disque
        • 5.3.3 Exploitation
      • 5.4 Contraintes projet
        • 5.4.1 Attentes utilisateurs
        • 5.4.2 Planning
        • 5.4.3 Normes et modélisation
        • 5.4.4 Sécurité
  • Concevoir le modèle
    • 1. Identifier les étoiles
      • 1.1 L'importance des étoiles
      • 1.2 Structuration ascendante
      • 1.3 Identifier un fait
    • 2. Formaliser une dimension
      • 2.1 Dimension référentielle et dimension de faits
      • 2.2 Les hiérarchies
        • 2.2.1 Identifier une hiérarchie
        • 2.2.2 Construire une hiérarchie
        • 2.2.3 Ascendance unique
        • 2.2.4 Homogénéité des niveaux
        • 2.2.5 Profondeur limitée et prédéfinie
        • 2.2.6 Les éléments communs entre les branches
      • 2.3 Dimension basée sur les faits
        • 2.3.1 Dans la base de données relationnelle
        • 2.3.2 Dans la base de données multidimensionnelle
        • 2.3.3 Alternatives à l'absence de référentiel
      • 2.4 Structure d'une table de dimension
        • 2.4.1 Identifiants techniques
        • 2.4.2 Codes, libellés et attributs fonctionnels
        • 2.4.3 Structure des tables
      • 2.5 Le cas particulier de la dimension temps
    • 3. Formaliser les indicateurs
      • 3.1 Différents termes et différents concepts
      • 3.2 Indicateur intensif et indicateur extensif
      • 3.3 Indicateurs calculés simples
      • 3.4 Indicateurs calculés complexes
    • 4. Identifier les données
      • 4.1 Dans la base de données décisionnelle
      • 4.2 Dans la base de données opérationnelle
    • 5. Formaliser la table de faits
      • 5.1 La structure type d'une table de faits
      • 5.2 Les sources des tables de faits
      • 5.3 Consolidation de tables de faits
      • 5.4 Contraintes techniques
      • 5.5 La gestion des valeurs nulles
      • 5.6 Granularité de la table de faits
        • 5.6.1 Finesse des données
        • 5.6.2 Impact sur la volumétrie
    • 6. Formaliser la table d'agrégats
      • 6.1 Rôle et structure d'une table d'agrégats
      • 6.2 Utilisation de filtres
      • 6.3 Utilisation d'agrégats de dimension
        • 6.3.1 Méthodes et limites
        • 6.3.2 Impacts sur la granularité
      • 6.4 Utilisation d'agrégats de faits
      • 6.5 Suppression de dimension
      • 6.6 Contraintes techniques
    • 7. Nommer les objets
    • 8. Schéma synthétique des flux et types d'objets
      • 8.1 Entrepôt en flocon et magasins en étoile
      • 8.2 Entrepôt en étoile et magasins en étoile
      • 8.3 Entrepôt en flocon et magasins en flocon
  • Historiser les données
    • 1. Les raisons de l'historisation
    • 2. Historisation des dimensions
      • 2.1 Une évolution de la réalité métier
      • 2.2 Dimension à évolution lente
        • 2.2.1 Les méthodes courantes
        • 2.2.2 Ajout d'une nouvelle ligne
        • 2.2.3 Ajout d'une nouvelle colonne
      • 2.3 Dimension à évolution rapide
      • 2.4 Choix de la période
    • 3. Historisation des faits
      • 3.1 Identification des faits
      • 3.2 Problématique et historisation des faits
    • 4. Historiser ou corriger ?
      • 4.1 Identification du contexte analytique de la donnée
      • 4.2 Le temps des choix et concessions
    • 5. Initialisation d'un système historisé
      • 5.1 Des données historiques mais non historisées
      • 5.2 Utiliser le contexte initial du SID
      • 5.3 Autres méthodes
    • 6. Durée d'historisation idéale
      • 6.1 Entre contrainte technique et utilité métier
      • 6.2 Historisation des indicateurs agrégés
    • 7. Remarques complémentaires
      • 7.1 Reconsidérer le problème
      • 7.2 Calcul sur une période
      • 7.3 Impact sur la volumétrie
      • 7.4 Dates d'effet, saisie et chargement
  • Enrichir le modèle
    • 1. Problématique de conception des objets
      • 1.1 Limiter le découpage des objets
      • 1.2 Les plages de dates dans les faits
        • 1.2.1 Périodes basiques
        • 1.2.2 Chevauchements de périodes
      • 1.3 L'utilisation d'une mesure comme dimension
      • 1.4 Les indicateurs distinctifs
      • 1.5 Transformer un attribut en dimension
      • 1.6 La relation many-to-many dans une dimension
        • 1.6.1 Présentation du problème
        • 1.6.2 Répartir les parents dans plusieurs hiérarchies
        • 1.6.3 Répartir les parents dans plusieurs dimensions
      • 1.7 Diviser une étoile en plusieurs étoiles
        • 1.7.1 En enlevant une dimension
        • 1.7.2 En rajoutant une dimension
        • 1.7.3 Influence des données sources
    • 2. Problématiques de la dimension temps
      • 2.1 Les valeurs par défaut sur la dimension temps
      • 2.2 Les dimensions temps métier
      • 2.3 L'utilisation parcimonieuse des dates
      • 2.4 L'analyse sur les heures
    • 3. Problèmes de granularité des transactions reçues
      • 3.1 Description du problème
      • 3.2 Des données opérationnelles trop fines
      • 3.3 Des données opérationnelles trop larges
      • 3.4 Des données opérationnelles hétérogènes
    • 4. Problématiques des référentiels
      • 4.1 Stratégies de rejet
      • 4.2 Utilisation d'alias
      • 4.3 Les référentiels non analytiques
      • 4.4 Les référentiels autoalimentés
        • 4.4.1 Justification et création d'un référentiel autoalimenté
        • 4.4.2 Regroupements et hiérarchies des référentiels autoalimentés
    • 5. Problématiques de correction des faits
      • 5.1 Création d'un flux de correction
      • 5.2 Corriger une mesure
      • 5.3 Corriger une ventilation
  • Charger les données
    • 1. Le choix de la solution d'intégration
      • 1.1 SQL versus ETL
      • 1.2 Choix techniques
        • 1.2.1 Performances
        • 1.2.2 Fonctions avancées
        • 1.2.3 Formats de données
      • 1.3 Une interface explicite
      • 1.4 Compétences
      • 1.5 Bilan
    • 2. Chargement des éléments du modèle
      • 2.1 Les différents types de chargements utilisables dans un SID
        • 2.1.1 Annule et Remplace
        • 2.1.2 Insertion ou Mise à jour (alias UPSERT)
        • 2.1.3 Insertion des modifications (alias INSERT)
      • 2.2 Utilisation des types de chargements dans le SID
        • 2.2.1 Synthèse par flux
        • 2.2.2 L'effet boule de neige dans les flux transactionnels
        • 2.2.3 L'évolutivité du contexte
    • 3. Ordonnancement des éléments
      • 3.1 Dépendances des objets
      • 3.2 Compartimentage des objets
      • 3.3 Fréquence d'intégration
    • 4. En dehors des phases d'exploitation
      • 4.1 Chargement initial
      • 4.2 Reprises de données
  • Optimiser le modèle
    • 1. Identifier les optimisations
    • 2. Optimisation de la base de données relationnelle
      • 2.1 Utilisation des index
      • 2.2 Utilisation des partitions
      • 2.3 Types de colonnes
      • 2.4 Utilisation des vues et tables temporaires
      • 2.5 Suppression des contraintes
    • 3. Optimisation de l'utilisation du serveur ETL
    • Glossaire
    • Index

Auteur

Thibault BOURCYEn savoir plus

Ingénieur en informatique décisionnelle de l'École des Mines de Nantes, Thibault Bourcy a travaillé sur la mise en place de nombreux systèmes décisionnels pour des entreprises de transport, vente au détail, banques, assurances, télécoms ou encore des administrations publiques. Certifié sur plusieurs technologies de Business Intelligence, il transmet à travers les pages de ce livre toute son expertise technique enrichie de nombreux retours d'expérience.

Caractéristiques

  • Niveau Initié à Confirmé
  • Nombre de pages 392 pages
  • Parution mai 2017
    • Livre (broché) - 17 x 21 cm
    • ISBN : 978-2-409-00793-4
    • EAN : 9782409007934
    • Ref. ENI : DPMODEC
  • Niveau Initié à Confirmé
  • Parution mai 2017
    • HTML
    • ISBN : 978-2-409-00912-9
    • EAN : 9782409009129
    • Ref. ENI : LNDPMODEC