Apprentissage non supervisé Apprentissage:non supervisé
1. Définition
Dans l’apprentissage supervisé, nous avons des Ciblecibles que nous cherchons à prédire. Dans l’apprentissage non supervisé, qui suit un autre raisonnement, nous cherchons toujours à repérer des structures dans les données, mais il n’y a plus vraiment d’idée de prédictions. Vous retrouverez cependant le terme quelquefois, et notamment dans Spark, mais la logique est différente. L’exemple qui est le plus célèbre et qui est une bonne entrée en matière est le partitionnement de données (clustering). Il ne s’agit pas là de mettre au point une action technique pour choisir la meilleure manière de ranger nos données sur les machines. Nous parlons ici de partitionnement au sens fonctionnel du terme. Le but est de réunir les données qui présentent des similarités dans un même groupe. C’est assez utile dans l’étude des populations. Les diamants qui sont présents sur la Toile sont achetés par des personnes que nous pouvons catégoriser par exemple selon la quantité de diamants achetée : il y a les acheteurs occasionnels, qui acquièrent un diamant uniquement pour de grandes occasions, comme un mariage ; il y a les acheteurs compulsifs, très à l’aise financièrement ; et entre les deux, doit se situer...