Sommaire

Laisser la machine classifier seule

Place maintenant à la machine. Saura-t-elle classer correctement les cerises et les abricots ?

Pour cela, nous allons utiliser l’ Algorithme K-Meanalgorithme K-Mean en le paramétrant comme suit :

from sklearn.cluster import KMeans 
modele=KMeans(n_clusters=2)

Nous lui avons indiqué le nombre de Clusterclusters à déterminer, c’est-à-dire deux dans notre cas (Cerise ou Abricot).

Une fois ce paramétrage réalisé, passons à la phase d’apprentissage :

modele.fit(fruits)

Puis à la phase de prédictions avec un affichage graphique de celles-ci et les centroïdes des deux clusters :

#Predictions 
predictions_kmeans = modele.predict(fruits) 
 
#Affichage de la clusterisation 
plt.scatter(fruits.DIAMETRE, fruits.POIDS, c=predictions_kmeans, 
s=50, cmap=’viridis’) 
plt.xlabel("DIAMETRE") 
plt.ylabel("POIDS") 
 
#Affichage des centroïdes 
centers = modele.cluster_centers_ 
plt.scatter(centers[:, 0], centers[:, 1], c=’black’, s=200, 
alpha=0.5) 
plt.show()
images/10FL03.png

Résultat de la classification

D’après ce graphique, on constate que la machine a réussi à classer correctement nos observations. En bas du graphique se trouvent comme nous l’avions prévu les cerises et dans la partie de droite les abricots.

Les couleurs du graphique sont générées à l’aide ...