Différentes étapes d’un projet d’apprentissage automatique

Un projet d’apprentissage automatique se découpe en plusieurs étapes. Plusieurs « découpages » sont proposés sur la Toile. Nous allons en voir un qui n’est pas l’absolue vérité, mais un point de vue. Connaître les différentes étapes d’un projet d’apprentissage machine permet de comprendre les options que Spark met à notre disposition.

  • La première étape est le prétraitement des données. Les données vous arrivent rarement dans un état directement exploitable. La plupart du temps, il s’agit de les retravailler pour s’en servir. Cela comprend des phases de nettoyage, de filtrage et d’enrichissement. Nombre d’opérations peuvent d’ailleurs se faire par l’intermédiaire des API que nous avons vues précédemment. Il y a aussi d’autres transformations spécialisées pour l’apprentissage automatique. Vous les trouvez dans le module MLlib de Spark. Ces différentes phases de prétraitement permettent d’extraire des caractéristiques (il est habituel de parler de features, mais nous nous en tiendrons au terme français dans cet ouvrage) ; le concept de "caractéristiques" sera expliqué dans un second temps. Les caractéristiques constituent notre base pour appliquer un algorithme capable...

couv_EISPARK.png

Découvrez 

le livre :

Aussi inclus dans nos :

Précédent
Introduction à l’apprentissage automatique
Suivant
Classification