Analyse de la variance (ANOVA)

Dans le précédent chapitre, on a abordé plusieurs tests, dont notamment le test de comparaison de moyennes d’un - cas de comparaison par rapport à une référence, c’est pour ça que l’on parle de test de conformité - ou deux échantillons de données. L’ensemble de ces tests est souvent dénommé T-Test à cause de la loi T de Student que suit la distribution sous-jacente de l’échantillon.

Maintenant, on pourrait s’interroger sur le recours au T-Test dans le cas où l’on dispose de plus de deux échantillons, ou plus spécifiquement où l’on dispose de trois échantillons ? On peut penser utiliser un T-Test en couplant deux à deux les moyennes, ce qui revient à comparer la moyenne de l’échantillon images/eq68.png à celle de images/eq69.png, de images/eq68.png à celle de images/eq83.png et finalement de images/eq69.png à images/eq83.png. Ça pourrait fonctionner si ça n’impliquait pas un risque d’erreur de Type I plus important (voir dans le précédent chapitre pour la définition). En effet, si l’on fixe ce risque pour chaque T-Test à 5 % comme on a l’habitude de faire, pour la comparaison combinée des trois T-Test, en supposant les échantillons indépendants, on se retrouve avec un risque d’erreur de Type I égal à images/eq84.png, ce qui est évidemment trop élevé pour un risque d’erreur de Type I surtout...
Pour consulter la suite, découvrez le livre suivant :
couv_RISTATR.png
60-signet.svg
En version papier
20-ecran_lettre.svg
En version numérique
41-logo_abonnement.svg
En illimité avec l'abonnement ENI
130-boutique.svg
Sur la boutique officielle ENI
Précédent
Introduction
Suivant
Modèles de régression linéaire