- Supports de cours
- Data Science avec Microsoft Azure - Maîtrisez le Machine Learning sur Cortana Intelligence Suite
Data Science avec Microsoft Azure Maîtrisez le Machine Learning sur Cortana Intelligence Suite
Présentation
Préface de Pierre BRUNO - Vice-Président et Directeur Général, Europe du Sud, DXC Technology
Ce livre sur la Data Science a pour objectif de donner au lecteur les connaissances théoriques et pratiques nécessaires pour appréhender le Machine Learning sous Microsoft Azure. Les étudiants ou les lecteurs novices découvriront pas à pas et à travers des exemples pratiques les concepts algorithmiques du Machine Learning et la solution Cortana Intelligence Suite. Les lecteurs avertis ou les Data Scientists découvriront l'environnement de développement et de déploiement des modèles prédictifs Microsoft Azure Machine Learning Studio.
Dans le premier chapitre, l'auteur donne les clés pour comprendre les enjeux de la Data Science, les notions fondamentales du Machine Learning, la démarche théorique d'une expérimentation Data Science, les notions de modélisation d'un problème et le choix des métriques pour mesurer les performances d'un modèle.
Le deuxième chapitre est entièrement dédié à la présentation de la solution Cortana Intelligence Suite. Le lecteur est ainsi invité à développer et à configurer les composants les plus couramment utilisés de cette solution.
Les chapitres suivants permettent au lecteur de découvrir les notions mathématiques sous-jacentes aux algorithmes du Machine Learning (régression, arbres de décision, algorithme K-means, réseaux de neurones, Support Vector Machine…) et d'appliquer ces algorithmes sur des exemples concrets dans l'environnement Microsoft Azure Machine Learning Studio. Le dernier chapitre de ce livre est consacré aux possibilités d'extension de l'environnement Azure Machine Learning Studio avec le langage R.
Les chapitres du livre :
Préface – Avant-propos – La Data Science – Microsoft Cortana Intelligence Suite – La régression linéaire et polynomiale – La régression logistique – Arbres de décision et Random Forest – L'algorithme k-means – Analyse en composantes principales – Réseaux de neurones – Support Vector Machine – R et Azure ML Studio – Conclusion
Ce livre sur la Data Science a pour objectif de donner au lecteur les connaissances théoriques et pratiques nécessaires pour appréhender le Machine Learning sous Microsoft Azure. Les étudiants ou les lecteurs novices découvriront pas à pas et à travers des exemples pratiques les concepts algorithmiques du Machine Learning et la solution Cortana Intelligence Suite. Les lecteurs avertis ou les Data Scientists découvriront l'environnement de développement et de déploiement des modèles prédictifs Microsoft Azure Machine Learning Studio.
Dans le premier chapitre, l'auteur donne les clés pour comprendre les enjeux de la Data Science, les notions fondamentales du Machine Learning, la démarche théorique d'une expérimentation Data Science, les notions de modélisation d'un problème et le choix des métriques pour mesurer les performances d'un modèle.
Le deuxième chapitre est entièrement dédié à la présentation de la solution Cortana Intelligence Suite. Le lecteur est ainsi invité à développer et à configurer les composants les plus couramment utilisés de cette solution.
Les chapitres suivants permettent au lecteur de découvrir les notions mathématiques sous-jacentes aux algorithmes du Machine Learning (régression, arbres de décision, algorithme K-means, réseaux de neurones, Support Vector Machine…) et d'appliquer ces algorithmes sur des exemples concrets dans l'environnement Microsoft Azure Machine Learning Studio. Le dernier chapitre de ce livre est consacré aux possibilités d'extension de l'environnement Azure Machine Learning Studio avec le langage R.
Les chapitres du livre :
Préface – Avant-propos – La Data Science – Microsoft Cortana Intelligence Suite – La régression linéaire et polynomiale – La régression logistique – Arbres de décision et Random Forest – L'algorithme k-means – Analyse en composantes principales – Réseaux de neurones – Support Vector Machine – R et Azure ML Studio – Conclusion
Table des matières
Avant-propos
- 1. Introduction
- 2. À qui s'adresse ce livre ?
- 3. Organisation de ce livre
- 4. Comment lire ce livre ?
- 5. Prérequis pour la lecture de ce livre
- 6. Qui est l'auteur ?
- 7. Remerciements
La Data Science
- 1. Objectif du chapitre
- 2. L'objectif recherché en Machine Learning
- 2.1 Exemple de modélisation
- 3. Une expérimentation Machine Learning
- 3.1 Type de données
- 3.2 Préparation des données
- 4. Cycle de vie d'un projet Data Science
- 5. Algorithmes du Machine Learning
- 6. Problème de surapprentissage
- 7. Validation croisée
- 8. Métriques de performance
- 8.1 Métrique pour les problèmes de régression
- 8.2 Métrique pour la classification
- 8.2.1 Matrice de confusion binaire
- 8.2.2 Matrice de confusion générale
- 8.2.3 Exemple de matrice de confusion
- 8.2.4 La courbe ROC
- 8.3 Métriques pour le clustering
Microsoft Cortana Intelligence Suite
- 1. Objectif du chapitre
- 2. Présentation du portail Microsoft Azure
- 2.1 Créer un tenant Azure gratuit
- 3. L'espace de travail Azure Machine Learning
- 3.1 Création de l'espace de travail Machine Learning
- 3.2 Présentation de Azure ML Studio
- 3.3 Charger un Dataset dans Azure ML
- 3.4 Visualiser un Dataset dans Azure ML
- 3.5 Structure d'un module dans Azure ML
- 3.6 Quelques modules couramment utilisés
- 3.6.1 Le module Select Columns in Dataset
- 3.6.2 Le module Clean Missing Data
- 3.6.3 Le module Remove Duplicate Rows
- 3.6.4 Le module Clip Values
- 3.6.5 Le module Edit Metadata
- 3.6.6 Le module Summarize Data
- 3.6.7 Le module Normalize Data
- 3.6.8 Le module Compute Linear Correlation
- 3.6.9 Le module Add Columns
- 3.6.10 Le module Split Data
- 3.6.11 Le module SMOTE
- 4.1 Microsoft Event Hub
- 4.1.1 Création d'un service Event Hubs
- 4.1.2 Envoyer des messages à un Event Hub
La régression linéaire et polynomiale
- 1. Objectif du chapitre
- 2. La régression linéaire simple
- 2.1 La régression linéaire simple du point de vue géométrique
- 2.2 La régression linéaire simple du point du vue analytique
- 2.2.1 La méthode des moindres carrés
- 2.2.2 Quelques considérations statistiques sur les données
- 3.1 La méthode des moindres carrés pour la régression multiple
- 3.2 La méthode de la descente de gradient
- 4.1 Construire le modèle de régression dans Azure ML
- 4.2 Publication du modèle dans Azure ML
La régression logistique
- 1. Objectif du chapitre
- 2. La régression logistique
- 3. Prédire les survivants du Titanic
- 3.1 Régression logistique dans Azure ML
- 4. L'algorithme One-vs-All
- 5. Conclusion
Arbres de décision et Random Forest
- 1. Objectif du chapitre
- 2. Construction d'un arbre de décision
- 3. Random Forest
- 4. Exemple de Random Forest dans Azure ML
- 5. Conclusion
L’algorithme k-means
- 1. Objectif du chapitre
- 2. k-means du point de vue géométrique
- 3. k-means du point de vue algorithmique
- 4. Exemple de k-means dans Azure ML
- 5. Conclusion
Analyse en composantes principales
- 1. Objectif du chapitre
- 2. Pourquoi l'ACP ?
- 3. L'ACP du point de vue géométrique
- 4. L'ACP du point de vue analytique
- 5. Indicateurs de la qualité de la représentation
- 5.1 Indicateurs liés aux individus
- 5.1.1 Score des individus
- 5.1.2 Contribution des individus
- 5.1 Indicateurs liés aux individus
- 5.2 Indicateurs liés aux variables
- 5.2.1 Le cercle des corrélations
- 5.2.2 Contribution des variables
- 6.1 Interprétation des résultats sur les individus
- 6.2 Interprétation des résultats sur les variables
Réseaux de neurones
- 1. Objectif du chapitre
- 2. Modélisation d'un neurone artificiel
- 3. Architecture d'un réseau de neurones
- 4. L'algorithme de rétropropagation
- 5. Réseau de neurones dans Azure ML
- 6. Conclusion
Support Vector Machine
- 1. Objectif du chapitre
- 2. Le SVM du point de vue géométrique
- 2.1 La démarche de SVM
- 3. Le SVM du point de vue analytique
- 4. Données non linéairement séparables
- 4.1 Le Kernel Trick
- 4.2 La condition de Mercer
- 4.3 Exemple de fonction noyau
- 5. Détecter les fraudes de cartes de crédit
- 5.1 Les données des transactions de cartes de crédit
- 5.2 Implémenter un SVM dans Azure ML
- 6. Détecter la présence d'une maladie
- 6.1 Définition des données médicales
- 6.2 Détecter la présence d'une maladie
- 7. Conclusion
R et Azure ML Studio
- 1. Objectif du chapitre
- 2. L'interpréteur R et RStudio
- 2.1 Installation de l'interpréteur R et de RStudio
- 2.2 Description de l'environnement RStudio
- 3. Le module Execute R Script
- 3.1 Présentation générale du Module Execute R Script
- 3.2 Insérer du code R dans Execute R Script
- 3.3 Copier/coller du code R avec Execute R Script
- 3.4 Injecter un script R dans Execute R Script
- 4. Créer un module R personnalisé
- 4.1 Développer un module R personnalisé
- 4.1.1 La forme générale du fichier XML d’un module personnalisé
- 4.1.2 Forme générale du script R d’un module personnalisé
- 4.1.3 Déploiement d’un module personnalisé dans Azure ML
- 4.1 Développer un module R personnalisé
- 4.2 Exemple d'un module R personnalisé
- 5.1 Fonctionnement d'un module Create R Model
- 5.2 Exemple d'utilisation du module Create R Model
Auteur
Madjid KHICHANE En savoir plus
Après un diplôme d'ingénieur en Informatique obtenu à l'université Mouloud Mammeri à Tizi-Ouzou en Algérie puis un Master en Intelligence Artificielle - Systèmes multi-agents obtenu à l'université Paris 5 (René Descartes), Madjid KHICHANE a soutenu son PhD en Intelligence Artificielle en collaboration entre l'Université Claude Bernard Lyon 1 et IBM. Cette thèse doctorale a donné naissance à des innovations algorithmiques dans le domaine de l'apprentissage par renforcement qui sont aujourd’hui publiées dans des conférences internationales de premier niveau.
Caractéristiques
- Niveau Expert
- Nombre de pages 346 pages
- Parution mars 2018
- Livre (broché) - 17 x 21 cm
- ISBN : 978-2-409-01278-5
- EAN : 9782409012785
- Ref. ENI : EPDSAZ
- Niveau Expert
- Parution mars 2018
- HTML
- ISBN : 978-2-409-01304-1
- EAN : 9782409013041
- Ref. ENI : LNEPDSAZ
Téléchargements
- Des fichiers complémentaires (157 Ko)