Blog ENI : Toute la veille numérique !
-25€ dès 75€ sur les livres en ligne, vidéos... avec le code FUSEE25. J'en profite !
Accès illimité 24h/24 à tous nos livres & vidéos ! 
Découvrez la Bibliothèque Numérique ENI. Cliquez ici
  1. Livres et vidéos
  2. Pentaho
  3. Introduction : présentation de Pentaho
Extrait - Pentaho Mise en place d'une solution Open Source de Business Intelligence
Extraits du livre
Pentaho Mise en place d'une solution Open Source de Business Intelligence Revenir à la page d'achat du livre

Introduction : présentation de Pentaho

Qu’est-ce que l’Informatique Décisionnelle ?

L’Informatique Décisionnelle (ou BI pour Business Intelligence) regroupe un ensemble de moyens informatiques (méthodes, outils logiciels) qui permettent de collecter, corriger, valider, consolider, modéliser et restituer des résultats sous des formes diverses (rapports, graphiques, tableaux de bord...). Il arrive aussi que les résultats produits par les logiciels de Business Intelligence soient réutilisés dans des environnements tiers (logiciels d’analyse statistique, suites bureautiques comme Microsoft Office ou Open Office).

Dans les organisations (entreprises publiques, privées...) quelle que soit leur taille de nombreuses données sont manipulées. À titre d’exemple, un opérateur de télécom peut stocker pour ses milliers (ou millions) de clients un nombre considérable de données liées aux appels téléphoniques passés par ceux-ci. Ces données sont stockées dans une base de données gérée par un SGBD (Système de Gestion de Bases de Données). La plupart du temps, le choix retenu est une architecture relationnelle avec des supports comme Microsoft SQL Server, Oracle, DB2, MySQL, PosgreSQL...

Les données, bien que stockées dans un environnement structuré (tables, enregistrements...) dans ces SGBD...

Environnement logiciel requis pour utiliser au mieux ce livre

Ce livre constitue une présentation des composants majeurs constituant la suite BI Pentaho.

Pour pouvoir tirer profit de sa lecture, il faut bien entendu être familier des SGBD et avoir une bonne culture de base en informatique (système d’exploitation Windows ou Linux, méthode d’analyse de données comme MERISE). Pour les familiers des solutions logicielles en BI, la consultation de ce document sera facilitée et ils pourront se limiter à la lecture de certains chapitres. Il est aussi évident que la connaissance préalable des concepts liés à la BI (ETL, Datawarehouse, Datamart, modélisation en étoile, modélisation en flocon...) serait également un plus mais il n’y a pas à s’inquiéter outre mesure, tout ceci sera revu dans les différents chapitres de ce livre.

L’environnement logiciel requis pour utiliser les études de cas (la méthode d’apprentissage de Penhaho dans ce livre fait la part belle à des cas pratiques) est par définition gratuit.

L’utilisation d’autres logiciels que ceux de la suite Pentaho, notamment de SGBD comme MySQL (SGBD libre) ou Microsoft Access ou encore Microsoft SQL Server (en cas d’utilisation de l’environnement Microsoft Windows), sera faite pour les besoins de certains exercices....

Version Pentaho utilisée

Pentaho est une suite logicielle orientée BI intégrant un grand nombre de composants conçus soit par la société Pentaho elle-même, soit par des sociétés tierces, soit bien sûr par la communauté Pentaho.

Il peut paraître surprenant à ce niveau de l’exposé de découvrir que Pentaho est une entité commerciale (société de développement informatique américaine). En réalité, c’est assez simple, Pentaho (comme d’autres prestataires en BI tel JasperSoft) développe des logiciels de BI et les propose aux utilisateurs sous deux formules :

  • Open Source : les composants de la suite sont librement téléchargeables,

  • Produit payant : dans ce cas, des prestations de service supplémentaires sont fournies (assistance technique, support, documentation...).

L’option retenue dans ce livre est de présenter les versions Open Source des composants de la suite Pentaho. Ces composants font partie de la Community Edition (CE).

Il sera aisé de transposer ce qui aura été vu sur la version payante (appelée Enterprise Edition (EE)) car en réalité les différences entre les deux versions sont peu significatives.

Dans les chapitres suivants, lors de l’étude des différents composants...

Description générale de l’offre Pentaho

De multiples documentations décrivant les fonctionnalités des produits existent sur le site de la société Pentaho (http://www.pentaho.com).

Par ailleurs de nombreux prestataires mettent en avant des offres de service autour de Pentaho (choix d’architecture, installation, paramétrage, formation, développement...).

Pentaho est une suite logicielle orientée Informatique Décisionnelle extrêmement puissante. Le point fort est indiscutablement l’intégration de grande qualité des différents composants dans cette suite. La société Pentaho qui commercialise en parallèle ces mêmes logiciels joue véritablement le jeu de l’Open Source :

  • en encourageant ses propres collaborateurs à contribuer aux versions Open Source,

  • en limitant les différences fonctionnelles entre les versions Open Source et commerciales,

  • en favorisant l’interopérabilité avec des briques logicielles Open Source non directement incluses au projet Pentaho, notamment les logiciels de gestion de rapports BIRT et JasperReports/iReport,

  • en intégrant des projets Open Source novateurs comme Weka pour l’analyse des données,

  • ...

L’ensemble des composants de cette suite logicielle est disponible en Open Source et Pentaho est devenu une alternative crédible aux solutions commerciales...

Objectifs de ce livre

Au travers de la lecture de ce livre vous allez apprendre à utiliser les différentes briques incluses dans la suite BI Pentaho. Le plan de l’exposé est le suivant :

  • Une présentation rapide des concepts utilisés en BI est fournie dans ce chapitre.

  • Dans la prise en main rapide de Pentaho, outre l’installation de la suite, les interfaces d’administration utilisateur (PUC) et administrateur (PAC) sont décrites (chapitre "Prise en main rapide de Pentaho").

  • Quelques-uns des nombreux exemples accompagnant la suite sont présentés (chapitre "Exemples Pentaho").

  • Des rappels sont faits sur la modélisation (modèle en étoile, modèle en flocon de neige, cube, dimension, mesure...) et sur la construction d’un Datawarehouse (chapitre "Modélisation en Informatique Décisionnelle").

  • Les fonctionnalités de l’ETL Pentaho Data Integration sont listées et de nombreuses transformations (nom donné aux retraitements des données sous PDI) sont analysées (chapitres "Présentation de l’ETL PDI" et "Mise en œuvre de PDI").

  • Le générateur de rapports Adhoc (WAQR) est décrit, y compris au travers d’exemples (chapitres "Présentation de WAQR" et "Mise en œuvre de WAQR").

  • Une partie importante du livre...