Covariance et coefficient de corrélation

En statistique, il est fréquent d’observer conjointement deux caractères statistiques pour déterminer s’ils sont indépendants ou si, au contraire, il existe une corrélation entre eux.

1. Historique

Soit x1, x2, x3, ......., xn et y1, y2, y3, ....., yn deux séries statistiques de n éléments chacune de moyennes mx et my, de variances Vx et Vy. On peut représenter graphiquement ces deux séries par un nuage de points en prenant xi et yi pour coordonnées du point Mi. Prenons par exemple 2, 3, 3, 5, 7, 12, 15 comme série des x et 1, 4, 3, 7, 10, 12, 15 comme série des y :

images/RI68.png

Les 7 points ne semblent pas disposés au hasard et il semble y avoir une certaine « corrélation » entre les deux séries. La notion de corrélation provient de la biologie. Selon le grand naturaliste Cuvier, il existe nécessairement des corrélations entre les différentes parties du corps d’un animal. Selon lui, ces corrélations peuvent concourir à adapter une espèce à un milieu ou à un régime alimentaire précis ou, au contraire, n’avoir aucune utilité en tant que telles. Corrélation

La notion a été introduite en statistique par Francis Galton (1822-1911), un cousin de Charles Darwin (1809-1882). Elle a été mathématisée par le mathématicien britannique Karl Pearson...

couv_RIPYTCN.png

Découvrez 

le livre :

Aussi inclus dans nos :

Précédent
Les paramètres d'une série statistique
Suivant
Ajustements linéaires et autres