Sommaire

Une petite pause s’impose

Avant d’aller plus loin, revenons quelques instants sur ce que nous avons appris.

Dans ce chapitre, nous avons découvert la mise en place des premières étapes permettant de mener à bien un projet de machine learning, à savoir :

  • La définition du problème à résoudre

  • L’acquisition de données

  • La préparation des données

Comme vous pouvez le constater, le temps de préparation des données est assez important. Et c’est ainsi pour tout projet de Machine Learning. En effet, comme nous l’avons indiqué, sans données, pas de Machine Learning. Sans oublier que ces données doivent être de bonne qualité due à une bonne préparation de celles-ci.

Nous avons également abordé quelques fonctions du module Pandas de Python, permettant d’interroger les données afin de mieux les comprendre, mais aussi à les modifier et à les agréger en vue d’obtenir un jeu de données qualitatif.

Dans le chapitre suivant, nous allons nous focaliser sur la visualisation des données, l’analyse approfondie de celle-ci et terminer par la recherche d’un modèle de prédiction capable de répondre au problème donné. Tout un programme !