Introduction

Préface

Avant-propos

Introduction générale
Pourquoi ce livre ?
À qui s'adresse ce livre ?
Comment est organisé ce livre ?
Comment lire ce livre ?
Quels sont les prérequis pour la lecture de ce livre ?
Qui est l'auteur ?
Remerciements

La Data Science

Objectif du chapitre
L'objectif recherché en Machine Learning
Une expérimentation Machine Learning
1. 1. Types de données
2. 2. Préparation des données
Cycle de vie d'un projet Data Science
Les algorithmes du Machine Learning
Le problème de surapprentissage
Les paramètres et les hyperparamètres
Validation croisée
Données d'entraînement, de validation et de test
Métriques de performance
1. 1. Métriques pour les problèmes derégression
2. 2. Métriques pour la classification
  1. a. Matrice de confusion binaire
  2. b. Matrice de confusion générale
  3. c. Exemple de matrice de confusion
  4. d. La courbe ROC
3. 3. Métriques pour le clustering
Conclusion

Le langage Python

Objectif du chapitre
Python en deux mots
Installer l'interpréteur Python
Les bases de la programmation Python
1. 1. Hello world avec Python
  1. a. La fonction print
  2. b. La fonction input
2. 2. Les structures de données
  1. a. Les variables numériques
  2. b. Les chaînes de caractères
  3. c. Le type booléen
  4. d. Les listes
  5. e. Les tuples
  6. f. Les dictionnaires
  7. g. Les ensembles
  8. h. Liste vs tuple vs dictionnaire vs ensemble
3. 3. Structurer un code Python
  1. a. L’indentation et les blocs de code
  2. b. Écrire une instruction sur plusieurs lignes
  3. c. Écrire plusieurs instructions sur une ligne
  4. d. Les commentaires en Python
4. 4. Les instructions conditionnelles
  1. a. Les conditions avec la structure if
  2. b. Les conditions avec la structure if-else
  3. c. Les conditions avec la structure if-elif-else
5. 5. Les boucles
  1. a. La boucle for
  2. b. La boucle for et la fonction zip
  3. c. La boucle while
  4. d. Contrôler les boucles avec break
  5. e. Contrôler les boucles avec continue
6. 6. Les fonctions
  1. a. Définir et utiliser une fonction sans paramètre
  2. b. Les fonctions avec paramètres
  3. c. Les valeurs par défaut des paramètres
  4. d. Renvoi de résultats
  5. e. La portée des variables
  6. f. Passage d’arguments à une fonction
  7. g. Les fonctions récursives
7. 7. Les listes en compréhension
  1. a. Les origines des listes en compréhension
  2. b. Construire une liste avec les listes en compréhension
  3. c. Application de fonction avec une liste en compréhension
  4. d. Utiliser if-else avec les listes en compréhension
  5. e. Filtrer avec les listes en compréhension
8. 8. Les expressions régulières
  1. a. Regex sans caractères spéciaux
  2. b. Regex avec caractères spéciaux
  3. c. Regex avec les multiplicateurs
  4. d. Regex avec un nombre d’occurrences limité
  5. e. Regex avec groupage des résultats
  6. f. Taille des motifs
  7. g. Aller plus loin avec les expressions régulières
9. 9. Gestion des exceptions
  1. a. La levée des exceptions
  2. b. Utiliser le bloc try-except
  3. c. Gérer plusieurs exceptions
  4. d. Utiliser la clause finally
  5. e. Utiliser la structure try-except-finally-else
  6. f. Lever une exception avec raise
Conclusion

La bibliothèque NumPy

Objectif du chapitre
NumPy en deux mots
Les tableaux NumPy
1. 1. Création de tableaux NumPy
  1. a. Créer un tableau à une dimension
  2. b. Créer un tableau à plusieurs dimensions
2. 2. Les dimensions d’un tableau NumPy
3. 3. Le type et la taille d’un tableau NumPy
4. 4. Fonction d’initialisation de tableaux NumPy
Accéder aux données d'un tableau NumPy
1. 1. Accès aux données d’un tableau à unedimension
2. 2. Accès aux données d’un tableau à deuxdimensions
3. 3. Accès aux données d’un tableau à troisdimensions
Modifier les données d'un tableau NumPy
Copier un tableau NumPy dans un autre tableau NumPy
Algèbre linéaire avec NumPy
1. 1. Opérations mathématiques de baseavec NumPy
2. 2. Opérations sur les matrices avec NumPy
Réorganiser des tableaux NumPy
1. 1. Restructurer un tableau NumPy
2. 2. Superposer des tableaux NumPy
Statistiques descriptives avec NumPy
Lire des données NumPy à partir d'un fichier
Les masques booléens avec NumPy
1. 1. Créer et utiliser un masque booléen
2. 2. Un masque avec plusieurs conditions
3. 3. Les fonctions numpy.any et numpy.all
Tableaux NumPy versus listes Python
1. 1. Comparaison des tailles en mémoire
2. 2. Comparaison des temps de calcul
  1. a. Temps de calcul sur une liste Python
  2. b. Temps de calcul sur un tableau NumPy
Conclusion

La bibliothèque Pandas

Objectif du chapitre
C'est quoi, Pandas ?
Installation de Pandas
DataFrame Pandas
1. 1. Création d’un DataFrame à partird’un dictionnaire
2. 2. Création d’un DataFrame à partird’un tableau NumPy
3. 3. Chargement des données à partirde fichiers
  1. a. Lecture des données d’un fichier CSV
  2. b. Lecture d’un fichier texte
Accès aux données d'un DataFrame
1. 1. Lire les lignes d’un DataFrame
  1. a. Lire une ligne d’un DataFrame
  2. b. Lire plusieurs lignes d’un DataFrame
  3. c. Parcourir les lignes d’un DataFrame
  4. d. Filtrer les lignes avec une condition
  5. e. Filtrer les lignes avec plusieurs conditions
  6. f. Filtrage avec des critères textuels
  7. g. Réinitialiser les index
  8. h. Filtrer avec les valeurs uniques
  9. i. Filtrer avec une expression régulière
2. 2. Accéder aux variables d’un DataFrame
  1. a. Liste des variables d’un DataFrame
  2. b. Accès aux valeurs d’une colonne
  3. c. Accès à plusieurs colonnes
3. 3. Lire une cellule spécifique avec les index
Modifier un DataFrame
1. 1. Modifier les valeurs dans un DataFrame
2. 2. Modifier la structure d’un DataFrame
  1. a. Ajouter une variable à un DataFrame
  2. b. Réordonner les variables d’un DataFrame
  3. c. Supprimer une variable d’un DataFrame
  4. d. Utiliser la méthode melt pour diminuer lenombre de variables
3. 3. Appliquer une fonction sur une variable avec la méthode apply
4. 4. Modification avec conditions
5. 5. Ajouter des lignes dans un DataFrame
Tri sur les données d'un DataFrame
1. 1. Tri avec un seul critère
2. 2. Tri avec plusieurs critères
Sauvegarder les données d’un DataFrame
Faire des statistiques sur un DataFrame
1. 1. Faire un résumé direct
2. 2. Faire un résumé par agrégation
3. 3. Agrégation avec plusieurs paramètres
Lecture des fichiers de grande taille
Conclusion

Travailler avec Jupyter

Objectif du chapitre
Installation de l'environnement Anaconda et Jupyter
Travailler avec Jupyter
1. 1. Les documents dans Jupyter
  1. a. Créer un dossier
  2. b. Renommer un dossier
  3. c. Déplacer un dossier
  4. d. Charger des documents
  5. e. Supprimer des éléments
  6. f. Navigation dans l’arborescence des dossiers
  7. g. Créer un notebook
2. 2. Utiliser un notebook Jupyter
  1. a. Renommer un notebook
  2. b. Les cellules Jupyter
  3. c. Les fonctionnalités d’un notebook
3. 3. Utiliser les widgets Jupyter
  1. a. Le widget FloatSlider
  2. b. Associer une fonction à un slider
  3. c. Le widget interact
  4. d. Le widget Image
  5. e. Le widget DatePicker
Conclusion

Statistiques

Objectif du chapitre
Les statistiques descriptives
1. 1. Paramètres de position
  1. a. La moyenne
  2. b. Le mode
  3. c. La médiane
  4. d. Les quartiles
2. 2. Paramètres de dispersion
  1. a. La variance
  2. b. Calcul de la variance avec la formule de Koenig
  3. c. L’écart-type
  4. d. L’écart interquartile
Les lois de probabilité
La loi normale
L'échantillonnage
1. 1. Principe de l’échantillonnage
2. 2. Résultats sur la distribution des moyennes
3. 3. Résultats sur la distribution des proportions
4. 4. Théorème central limite
Les statistiques inférentielles
1. 1. Estimation ponctuelle
2. 2. Estimation de la moyenne par intervalle de confiance
3. 3. Estimation d’une proportion par intervalle de confiance
4. 4. Test d’hypothèse
  1. a. Tests paramétriques
  2. b. Tests non paramétriques
  3. c. Construire un test d’hypothèse
5. 5. Types de tests d’hypothèse
  1. a. Test de conformité
  2. b. Test d’adéquation
  3. c. Tests d’homogénéité
  4. d. Test d’indépendance de variables
6. 6. Exemple numérique de test de conformité d’unemoyenne
7. 7. Le paradoxe de Simpson
Les séries temporelles
1. 1. Techniques d’analyse des séries temporelles
  1. a. La décomposition des séries temporelles
  2. b. Lissage des données
  3. c. Modèles de prévision
2. 2. Stationnarité des séries temporelles
  1. a. Tests de stationnarité
  2. b. Transformation pour rendre une série stationnaire
Conclusion

La régression linéaire et polynomiale

Objectif du chapitre
La régression linéaire simple
1. 1. La régression linéaire simple depoint de vue géométrique
2. 2. La régression linéaire simple depoint de vue analytique
  1. a. La méthode des moindres carrés
  2. b. Quelques considérations statistiques surles données
La régression linéaire multiple
1. 1. La méthode des moindres carrés pourla régression multiple
2. 2. La méthode de la descente de gradient
3. 3. Exemple de régression linéaire multiple
  1. a. Définition du jeu de données utilisées
  2. b. Régression linéaire multiple avecScikit-learn
  3. c. Importer les modules Scikit-learn
  4. d. Lecture des données dans un DataFrame
  5. e. Normalisation des données
  6. f. Construction d’un modèle linéaire
  7. g. Évaluation d’un modèle linéaire
  8. h. Évaluer le futur comportement d’un modèle
  9. i. Cross-validation avec KFold
La régression polynomiale
1. 1. Exemple de régression polynomiale
  1. a. Construction d’un modèle polynomial
  2. b. Le coefficient de détermination R<sup class="superscript">2</sup>
  3. c. R<sup class="superscript">2</sup> et les valeurs extrêmes
  4. d. Modèle polynomial et surapprentissage
Aller plus loin avec les modèles de régression
1. 1. La régularisation Lasso
2. 2. La régularisation Ridge
Conclusion

La régression logistique

Objectif du chapitre
La régression logistique
Prédire les survivants du Titanic
1. 1. Définition du jeu de données Titanic
2. 2. Réalisation du modèle de régressionlogistique
  1. a. Chargement des modules Scikit-learn
  2. b. Lecture des données
  3. c. Traitement des valeurs manquantes
  4. d. Transformation de variables
  5. e. Sélection des variables
  6. f. Traitement des variables catégorielles
  7. g. Entraînement du modèle logistique
  8. h. Le seuil de décision
L'algorithme One-vs-All
Conclusion

Arbres de décision et Random Forest

Objectif du chapitre
1. 1. Construction d’un arbre de décision
2. 2. Prédire la classe d’appartenance avec unarbre de décision
3. 3. Considérations théoriques sur lesarbres de décision
  1. a. Choix de la variable de segmentation
  2. b. Profondeur d’un arbre de décision
Problème de surapprentissage avec un arbre de décision
Random Forest
Exemple de Random Forest avec Scikit-learn
Conclusion

L’algorithme k-means

Objectif du chapitre
k-means du point de vue géométrique
k-means du point de vue algorithmique
Application de k-means avec Scikit-learn
L'algorithme k-means et les valeurs extrêmes
Choisir le k de k-means
1. 1. Déterminer k avec la méthode Elbow
2. 2. Déterminer k avec le coefficient de silhouette
Les limites de k-means
Avantages et inconvénients de l'algorithme k-means
Quelques versions de l'algorithme k-means
Conclusion

Support Vector Machine

Objectif du chapitre
Le SVM du point de vue géométrique
Le SVM du point de vue analytique
Données non linéairement séparables
1. 1. Le Kernel Trick
2. 2. La condition de Mercer
3. 3. Exemple de fonction noyau
Détecter les fraudes de cartes de crédit
1. 1. Les données des transactions de cartes decrédit
2. 2. Application de l’algorithme SVM pour la détectiondes transactions bancaires frauduleuses
  1. a. Application de l’algorithme SVM sur les donnéescreditcard.csv
  2. b. Application du SVM sur un sous-ensemble de creditcard.csv
  3. c. Application du SVM sur des données normalisées
3. 3. Les paramètres de l’algorithme SVM
  1. a. Le paramètre Kernel pour la variation dela fonction noyau
  2. b. Le paramètre C
  3. c. Le paramètre Gamma
  4. d. Le paramètre C versus le paramètreGamma
  5. e. Tuning des hyperparamètres d’un SVM avecGridSearchCV
Conclusion

Analyse en composantes principales

Objectif du chapitre
Pourquoi l'ACP ?
L'ACP du point de vue géométrique
L'ACP du point de vue analytique
Indicateurs de la qualité de la représentation des données
1. 1. Indicateurs liés aux individus
  1. a. Score des individus
  2. b. Qualité de la représentation desindividus
  3. c. Contribution des individus
2. 2. Indicateurs liés aux variables
  1. a. Le cercle des corrélations
  2. b. Qualité de la représentation desvariables
  3. c. Contribution des variables
Exemple d'ACP avec Python
1. 1. Déterminer le nombre de facteurs pertinents
2. 2. Interprétation des résultats surles individus
  1. a. Représentation des individus
  2. b. Calcul de la qualité de la représentationdes individus
  3. c. Calcul de la contribution des individus
3. 3. Interprétation des résultats surles variables
  1. a. Tracer un cercle des corrélations
  2. b. Calcul de la qualité de la représentationdes variables
  3. c. Calcul des contributions des variables
4. 4. Représentation de nouveaux individus
Conclusion

Les réseaux de neurones

Objectif du chapitre
Modélisation d'un neurone artificiel
1. 1. Le neurone biologique
2. 2. Le neurone artificiel
Architecture d'un réseau de neurones
L'algorithme de rétropropagation
Exemple d'un réseau de neurones avec Scikit-learn
Conclusion

Le Deep Learning avec TensorFlow

Objectif du chapitre
Le Deep Learning : notions générales
1. 1. Réseau de neurones avec plusieurs couchesd’entrée
2. 2. Réseau de neurones avec plusieurs couchesde sortie
3. 3. Réseau de neurones avec des branchementsconditionnels
4. 4. Réseau de neurones avec de la récurrenceRNN
5. 5. Réseau de neurones avec couches de convolutionCNN
6. 6. Éviter le surapprentissage avec les couchesDropout
7. 7. Le Transfer Learning
Introduction à TensorFlow
1. 1. Installer TensorFlow
  1. a. Créer un environnement virtuel
  2. b. Installer des bibliothèques dans un environnementvirtuel avec Anaconda
  3. c. Installer la bibliothèque TensorFlow
  4. d. Tester TensorFlow
2. 2. Opérations élémentairesavec les tensors
  1. a. Travailler avec les tensors
  2. b. Les tensors variables
  3. c. Initialiser les tensors
  4. d. Opérations algébriques avec lestensors
Les réseaux de neurones avec Sequential API
1. 1. Charger les données
2. 2. Définir un MLP avec Sequential API
3. 3. Accéder aux éléments d’unréseau de neurones
4. 4. Initialisation des poids et des biais d’un réseaude neurones
5. 5. Compiler un réseau de neurones
6. 6. Entraîner un réseau de neurones
7. 7. Analyser les résultats de l’entraînementd’un réseau de neurones
8. 8. Évaluer un réseau de neurones
9. 9. Prédire avec un réseau de neuronespour la classification
Utiliser Functional API
1. 1. Un modèle Functional API avec plusieurs couchesd’entrée
2. 2. Un modèle Functional API avec plusieurs couchesde sortie
Opérations avancées sur les réseaux de neurones
1. 1. Monitorer un réseau de neurones
  1. a. Contrôler les critères d’arrêtavec les callbacks
  2. b. TensorBoard
  3. c. Sauvegarder un réseau de neurones
  4. d. Charger et utiliser un réseau de neurones
2. 2. Réseaux de neurones de convolution
3. 3. Réutiliser un réseau de neurones
4. 4. Le Transfer Learning
  1. a. Chargement des données locales
  2. b. Chargement du modèle VGG16
  3. c. Extraction des features
  4. d. Étendre un modèle
  5. e. Chargement des données de test pour le TransferLearning
Aller plus loin avec le Deep Learning et TensorFlow
Conclusion

Le Deep Learning avec OpenCV

Objectif du chapitre
Introduction à OpenCV
1. 1. Qui utilise OpenCV ?
2. 2. Exemples de cas d’utilisation d’OpenCV
L'architecture d'OpenCV
Installer et tester OpenCV
Manipuler les images avec OpenCV
1. 1. Charger une image
2. 2. Capturer le flux d’une vidéo
3. 3. Ajouter des objets dans une image
4. 4. Ajouter des objets dans une vidéo
5. 5. Gérer les clics de la souris sur une vidéo
6. 6. Comprendre la structure d’une image
7. 7. Modifier les pixels d’une image
8. 8. Flouter une image
La détection et la reconnaissance d'objets
1. 1. La détection faciale sur une image
2. 2. La détection faciale sur une vidéo
3. 3. Traquer les mouvements
4. 4. Détecter des objets avec YOLO
Conclusion

Les réseaux de neurones antagonistes génératifs

Objectif du chapitre
Introduction au GAN
1. 1. Comprendre les différents types de modèles d’IAgénérative
2. 2. Définition et origine des GAN
3. 3. Importance des GAN dans l’apprentissage profond
4. 4. Les différents types de GAN
5. 5. Quelques exemples de GAN
6. 6. Avantages et inconvénients des GAN
  1. a. Avantages
  2. b. Inconvénients
Fonctionnement des GAN
Mes premiers pas avec PyTorch
1. 1. Tester PyTorch dans Google Colab
2. 2. Transformer une image en tensors
3. 3. Appliquer des filtres sur les images
  1. a. Accentuer les bords dans une image
  2. b. Détecter des bords verticaux
  3. c. Détecter des bords horizontaux
  4. d. Appliquer un noyau gaussien
  5. e. Donner un effet de gravure à une image
Développer des réseaux de neurones avec PyTorch
1. 1. Entraîner un modèle à rejeterles mauvaises images
2. 2. Entraîner un modèle à accepterles images réalistes
Générer des images réalistes avec un GAN
1. 1. Chargement des vraies images de référence
2. 2. L’entrée du Generator ou le vecteur latent
  1. a. Pourquoi le vecteur latent est-il important ?
  2. b. Quel est l’effet de modifier la taille du vecteurlatent ?
3. 3. Définition du réseau de neurones Generator
4. 4. Définition d’un réseau de neurones Discriminator
5. 5. Tester le Generator et le Discriminator avant la boucle d’apprentissage
6. 6. Implémentation de la boucle d’apprentissagedu GAN
7. 7. Tester le Generator et le Discriminator
Conclusion

Le traitement automatique du langage

Objectif du chapitre
NLP : concepts généraux
1. 1. Le nettoyage des données textuelles
  1. a. Suppression des stopwords
  2. b. Appliquer le Stemming sur un texte
  3. c. Appliquer la Lemmatization sur un texte
  4. d. Stemming versus Lemmatization
2. 2. Vectorisation des données textuelles
  1. a. La vectorisation par comptage d’occurrences des mots
  2. b. La vectorisation avec TF-IDF
  3. c. La vectorisation avec N-Gram
  4. d. Feature Engineering sur des documents
Exemple complet pour la détection des spams
1. 1. Installation de la NLTK
2. 2. Modèle de détection de spams
Conclusion

Le prompt engineering

Objectif du chapitre
Le prompt engineering
1. 1. Concepts généraux
2. 2. Les tokens
3. 3. Comment écrire un prompt efficace et précis ?
Exemples de prompts
1. 1. Les prompts simples et naïfs
2. 2. Les prompts zero-shot
3. 3. Les prompts few-shot
4. 4. Les prompts Chain-of-Thought
5. 5. Les prompts de type Generated-Knowledge-Prompting
6. 6. Les prompts Directional-stimulus-prompting
7. 7. Les prompts OPRO
8. 8. Résoudre les problèmes de logiqueavec des prompts
9. 9. Faire des résumés avec Chain-of-Density
10. 10. Générer du code avec les LLM
Conclusion

La programmation orientée objet avec Python

Programmation orientée objet avec Python
1. 1. Pourquoi la programmation orientée objet??
2. 2. Classes et objets
  1. a. Définir une classe
  2. b. La fonction __init__
  3. c. Instanciation d’un objet
  4. d. Les attributs d’un objet
  5. e. Les méthodes d’objet
  6. f. Les attributs de classe
  7. g. Les méthodes de classe
  8. h. Les méthodes statiques
  9. i. Sécuriser les attributs
3. 3. L’héritage
  1. a. L’héritage simple
  2. b. L’héritage multiple
4. 4. Les classes abstraites
5. 5. Les interfaces
6. 6. Les méthodes spéciales
  1. a. Afficher un objet avec la fonction print()
  2. b. Personnaliser les accès aux attributs d’uneclasse
  3. c. Vérifier la validité d’un attribut
  4. d. Comparer deux objets
  5. e. Rendre les objets callable
Les modules
1. 1. Importer des modules
2. 2. Le module principal
Pour aller plus loin avec Python