Les data frame

Un data frame ("trame de donnée" en français) est un tableau à deux dimensions comme une matrice, mais à la différence de cette dernière un data frame admet des colonnes ou vecteurs de types différents (numérique, chaîne de caractères, booléens, etc.), de mêmes tailles. Structurellement, un data frame est une liste de vecteurs de même taille et de types différents.

C’est la structure de donnée la plus répandue étant donnée l’hétérogénéité des types de données que l’on manipule, celles-ci n’étant pas que numériques ou chaînes de caractères ou booléens, mais le plus souvent un mélange de ces types de données.

1. Description d’un data frame

R permet l’accès à un certain nombre de données fournies avec les packages que l’on peut facilement consulter et extraire pour une utilisation voulue, grâce à la fonction data(). C’est un peu comme une base de données interne à R.

La commande suivante affiche la liste de tous les jeux de données disponibles :

images/03EP184.png

Ainsi, parmi les packages de bases que R charge au démarrage, le package datasets offre plusieurs jeux de données dont l’un des plus fameux, le jeu de données iris (qui décrit les caractéristiques de trois espèces de fleurs d’iris) dû...

Pour consulter la suite, découvrez le livre suivant :
couv_RISTATR.png
60-signet.svg
En version papier
20-ecran_lettre.svg
En version numérique
41-logo_abonnement.svg
En illimité avec l'abonnement ENI
130-boutique.svg
Sur la boutique officielle ENI
Précédent
Les facteurs ou variables catégoriels
Suivant
Les listes