Sommaire

Distribution gaussienneDistribution gaussienne et l Loi normaleoi normale

Nous allons quelque peu nous écarter de l’analyse descriptive de nos données pour aborder un point important qui vous sera utile dans la compréhension de certains algorithmes du Machine Learning : la distribution gaussienne ou encore appelée loi normale appliquée aux statistiques et aux probabilités.

1. Un exemple pour faire connaissance

Pour faire connaissance avec la distribution gaussienne, laissons de côté les notes obtenues à l’examen et concentrons-nous sur les critiques de films.

Voici les avis (notés de 0 à 5) obtenus par un film. 5 étant la meilleure note que peut obtenir le film : les fameuses 5 étoiles que l’on retrouve sur l’ensemble des sites de critiques de films.

Avis

Nombre de votants

5

42

4

96

3

132

2

124

1

88

0

58

Si nous réalisons une représentation graphique de ces données, nous obtenons une forme particulière : une cloche.

images/04FL12.png

Courbe de GaussCourbe de Gauss

Lorsque nous sommes en présence de ce type de graphique, nous pouvons affirmer que la série d’observations suit une loi mathématique appelée loi normale ou loi de Gauss (du nom de Karl Friederich Gauss (1777-1855)).

En statistique et en probabilité, la loi normale permet de représenter beaucoup de phénomènes aléatoires naturels. Lorsqu’une série d’observations obéit à la loi normale, ...