Sommaire

Les statistiques, un outil d’aide à la compréhension des données

Dans les chapitres à venir, nous serons amenés à analyser des données d’apprentissage afin de permettre à notre machine d’apprendre à résoudre un problème par le biais de prédictions. Comme nous le verrons, pour que la machine puisse apprendre, il ne suffit pas de choisir une collection d’observations, de choisir un algorithme d’apprentissage et de cliquer sur un bouton en espérant obtenir une bonne prédiction. Nous serons amenés à comprendre par nous-mêmes ce jeu d’observations pour en sélectionner les informations pertinentes et importantes. Pour réaliser cette tâche, les statistiques nous seront d’une grande aide.

Bien entendu, en ce qui concerne la programmation, nous utiliserons par la suite des modules Python spécifiques comportant toutes les fonctionnalités d’analyse nécessaires. Mais dans ce chapitre, nous vous proposons d’agrémenter chaque notion statistique par quelques lignes de code "faites maison", c’est-à-dire dans utilisation de librairie spécifique. Cela permet entre autres de mieux comprendre la logique mathématique qui se cache derrière chaque notion, mais aussi d’approfondir la connaissance et l’usage du langage Python.

Le code Python peut être utilisé dans un nouveau projet que vous aurez préalablement ...