Une petite pause s’impose
Avant d’aller plus loin, revenons quelques
instants sur ce que nous avons appris.
Dans ce chapitre, nous avons découvert
la mise en place des premières étapes permettant
de mener à bien un projet de machine learning, à savoir :
Comme vous pouvez le constater, le temps de
préparation des données est assez important. Et
c’est ainsi pour tout projet de Machine Learning. En effet, comme
nous l’avons indiqué, sans données, pas de Machine
Learning. Sans oublier que ces données doivent être
de bonne qualité due à une
bonne préparation de celles-ci.
Nous avons également abordé quelques
fonctions du module Pandas de Python, permettant d’interroger les
données afin de mieux les comprendre, mais aussi à les
modifier et à les agréger en vue d’obtenir un
jeu de données qualitatif.
Dans le chapitre suivant, nous allons nous
focaliser sur la visualisation des données, l’analyse approfondie
de celle-ci et terminer par la recherche d’un modèle de
prédiction capable de répondre au problème
donné. Tout un programme !