Un peu de Visualisation graphiquevisualisation graphique
Une des étapes importantes lorsque
nous sommes amenés à analyser une série d’observations
est d’en réaliser une représentation graphique.
Cela permet notamment de nous rendre compte
rapidement des spécificités de celle-ci (dispersion,
valeur aberrante) ce qui permet entre autres de valider nos hypothèses
de calcul et d’interprétation.
Représentation graphique à l’aide
du module Python MatplotLib
On constate aisément que la valeur
3 peut être considérée comme une valeur extrême,
car elle se trouve détachée de l’histogramme général,
mais il n’en est pas de même pour la valeur 19. On peut
aussi constater que les notes obtenues se situent autour de la moyenne
et de la médiane (soit la valeur de 12). La boîte à moustaches
montre les valeurs aberrantes.
Pour réaliser la visualisation des
données en Python, nous utilisons le module matplotlib utilisé sous l’alias plt.
def visualisation(self,moyenne,mediane,quartile_1,quartile_2,quartile
_3):
plt.subplot(2, 2, 1)
plt.hist(self.feature)
plt.title("Histogramme et moyenne")
plt.axvline(moyenne, color=’red’, linestyle=’dashed’,
linewidth=1,label = str(moyenne))
plt.legend(loc=’upper right’) ...