Visualisation graphique des données

Laissés pour compte en analyse des données, les graphiques sont primordiaux pour cerner certains aspects d’une variable ou d’un jeu de données en général. Les graphiques permettent notamment :

  • D’inférer sur les hypothèses et orienter le statisticien sur le choix d’un tel ou tel autre modèle.

  • De détecter l’existence d’un schéma ou pattern dans les données, détecter une tendance…

  • De deceller les valeurs extrêmes ou aberrantes.

  • De présenter des concepts complexes (les mesures quantitatives) plus simplement pour les non-initiés.

Une illustration typique pour démontrer la nécessité de combiner l’analyse graphique à l’analyse quantitative lors d’une phase exploratoire des données se trouve dans le célèbre jeu de données d’Anscombe :

images/06EP118.png

Comme on peut lire dans le code ci-dessus, on a des variables x et y, indicées pour indiquer qu’elles appartiennent en fait à 4 jeux de données (d’où l’appellation quartet) :

images/06EP119.png

Une analyse descriptive avec la fonction summary() montre une similitude entre les variables pour les différentes mesures statistiques ci-après.

images/06EP120.png

Ainsi, on pourrait par exemple inférer sur la base de ces résultats une possible appartenance des quatre échantillons à une même population.

Toutefois, une analyse graphique...

Pour consulter la suite, découvrez le livre suivant :
couv_RISTATR.png
60-signet.svg
En version papier
20-ecran_lettre.svg
En version numérique
41-logo_abonnement.svg
En illimité avec l'abonnement ENI
130-boutique.svg
Sur la boutique officielle ENI
Précédent
Analyse descriptive des variables catégorielles
Suivant
Introduction