Sommaire

Un peu de Visualisation graphiquevisualisation graphique

Une des étapes importantes lorsque nous sommes amenés à analyser une série d’observations est d’en réaliser une représentation graphique.

Cela permet notamment de nous rendre compte rapidement des spécificités de celle-ci (dispersion, valeur aberrante) ce qui permet entre autres de valider nos hypothèses de calcul et d’interprétation.

images/04FL11.png

Représentation graphique à l’aide du module Python MatplotLib

On constate aisément que la valeur 3 peut être considérée comme une valeur extrême, car elle se trouve détachée de l’histogramme général, mais il n’en est pas de même pour la valeur 19. On peut aussi constater que les notes obtenues se situent autour de la moyenne et de la médiane (soit la valeur de 12). La boîte à moustaches montre les valeurs aberrantes.

Pour réaliser la visualisation des données en Python, nous utilisons le module matplotlib utilisé sous l’alias plt.

def visualisation(self,moyenne,mediane,quartile_1,quartile_2,quartile 
_3): 
 
   plt.subplot(2, 2, 1) 
   plt.hist(self.feature) 
   plt.title("Histogramme et moyenne") 
   plt.axvline(moyenne, color=’red’, linestyle=’dashed’, 
linewidth=1,label = str(moyenne)) 
   plt.legend(loc=’upper right’)  ...