Sommaire

Les Algorithmes:non supervisésalgorithmes pour les Apprentissage:non superviséapprentissages non supervisés

Nous entrons à présent dans le monde des algorithmes d’apprentissage non supervisés. C’est-à-dire que lors de la phase d’apprentissage, nous n’indiquons pas à la machine si l’observation étudiée appartient à un groupe précis comme nous le faisons lors d’un apprentissage supervisé. Charge donc à la machine de déterminer ce groupe d’appartenance (appelé Clustercluster) toute seule.

1. K-Moyennes (KMeans)

L’algorithme des K-Moyennes (K-means) est l’un des algorithmes de clustering les plus utilisés.

Son principe de fonctionnement est relativement simple, car après avoir indiqué à l’algorithme le nombre de clusters à trouver, celui-ci tente par itérations successives de déterminer des centroïdes (un par cluster) autour desquels il est possible de regrouper les données. Ces regroupements s’effectuant en calculant la distance de chaque observation par rapport à un point central de regroupement appelé Centroïdecentroïde et permettant ainsi de classer les observations en plusieurs groupes de façon automatique.

Dans la figure suivante, nous avons indiqué à l’algorithme de classer les observations en deux clusters. Il y est parvenu en trouvant de façon automatique deux centroïdes permettant ...