Sommaire

Algorithme de mélanges gaussiens ou Gaussian Mixture Model (GMM)Gaussian Mixture Model (GMM)

Dans la plupart des cas, les données suivent ce que l’on appelle une distribution normale ou gaussienne, pouvant se représenter sous forme d’une cloche symétrique en son milieu. Dans le cas de classification, le jeu d’observation peut se décomposer en plusieurs cloches correspondant aux différents clusters contenant chacune des observations.

images/10FL05.png

Courbes gaussiennes

Nous avons représenté dans la figure ci-dessous les différentes courbes gaussiennes en 3D de notre jeu d’observation. On constate une première courbe représentant nos cerises et une seconde un peu moins marquée pour nos abricots.

Le code de cette représentation est disponible en téléchargement depuis la page Informations générales.

L’algorithme GMM (Mélange gaussien) permet de déterminer les différents clusters en séparant les données contenues dans les différentes courbes en forme cloche. Trop complexe pour cet ouvrage, nous ne nous attarderons pas sur son fonctionnement détaillé. Sachez néanmoins que pour chaque cluster, l’algorithme détermine une moyenne et une variance, puis pour chaque observation il détermine une probabilité d’appartenir ou non à ce cluster.

Pour utiliser cet algorithme et visualiser la clusterisation effectuée (figure suivante), nous vous invitons ...