Accéder aux données depuis un fichier de données

Un data file est un fichier dont les caractéristiques permettent de structurer, stocker et restituer des données. Ce sont souvent des fichiers qui stockent des données se rapportant à une application spécifique, pour une utilisation ultérieure. On verra comment acquérir des données depuis différents types de fichiers de données avec R.

1. Fichier texte délimité

a. La fonction read.table()

Les données stockées dans un fichier texte peuvent être lues avec la fonction read.table(). Le plus souvent les données lues avec cette fonction sont structurées en colonnes délimitées par défaut par des espaces comme ci-dessous :

images/05EP25.png

Pour commencer, on s’assure d’avoir placé le dossier data (dossier livré avec l’acquisition de l’ouvrage) dans le répertoire de travail courant, autrement on devra fournir un chemin d’accès vers ce dossier. Par ailleurs, les données du fichier GOOGP.txt (visible ci-dessus) contiennent des en-têtes gérés avec l’argument header qui par défaut vaut FALSE :

images/05EP26.png

Comme on peut le voir ci-dessus, par défaut R a considéré les données de type character comme des facteurs.

Pour pallier ce problème, on utilise l’argument stringsAsFactors comme ci-dessous :

images/05EP27.png

Mais après cela, un problème persiste ! En effet, on peut...

Pour consulter la suite, découvrez le livre suivant :
couv_RISTATR.png
60-signet.svg
En version papier
20-ecran_lettre.svg
En version numérique
41-logo_abonnement.svg
En illimité avec l'abonnement ENI
130-boutique.svg
Sur la boutique officielle ENI
Précédent
Saisir/éditer les données depuis le clavier
Suivant
Importer des données d’autres logiciels d’analyse de données