Sommaire

Détection:valeurs extrêmesDétection de valeurs extrêmes (outliers en anglais)

Outre le fait d’exprimer la dispersion des données autour de la médiane, l’interquartile nous permet également de détecter les valeurs extrêmes de la série d’observations grâce à la méthode de Tuckey.

Les Boîtes à moustachesboîtes à moustaches de John Wilder Tuckey

Il existe plusieurs méthodes de détection des valeurs extrêmes d’une série, mais nous avons choisi de vous présenter celle de Tuckey, simple à mettre en œuvre.

John Wilder Tukey (16 juin 1915 - 26 juillet 2000) est l’un des plus importants statisticiens américains du XXe siècle. Il a créé et développé de nombreuses méthodes statistiques. Il publia en 1977 son livre le plus diffusé, Exploratory Data Analysis6, traitant de méthodes d’analyse descriptive et de représentation graphique des données. Il y présente entre autres le principe de la boîte à moustaches (ou diagramme de quartiles), mais aussi les arbres et feuilles (en) (stem-and-leaf), une variante des histogrammes (source Wikipédia).

La méthode consiste à déterminer les valeurs des bornes inférieures et supérieures d’une boîte (appelée aussi boîte à moustaches) comme suit : ...