Télécharger des données depuis le Web

Parfois, les données sont stockées dans un fichier de données sur un site Internet ou carrément contenues dans un tableau d’une page web. On va voir maintenant comment importer ou télécharger des données grâce à une URL.

1. Télécharger un fichier de données grâce à l’URL

La plus grande part des fonctions qu’on a étudiées précédemment peut prendre en argument des URL pointant vers des fichiers *.txt, *.csv, etc. Notamment les fonctions read.table(), read.csv() et leurs autres fonctions dérivées. Voici ci-dessous l’illustration du téléchargement des données depuis un fichier *.csv ; étant donnée la longueur de l’URL (il est logé dans le fichier URL.txt du dossier data), il est courant dans la pratique de le découper et de concaténer chaque morceau du lien avec la fonction paste0() :

images/05EP81.png

2. Extraire les données d’un tableau HTML

Il est également possible d’importer des données du Web qui ne sont pas stockées dans un fichier de données mais contenues dans un tableau en HTML ou XML. On va continuer avec les données utilisées précédemment qui proviennent originellement du site Yahoo finance :

images/05EP82.png

Pour pouvoir extraire les données contenues dans le tableau ci-dessus, on va d’abord installer les packages : RCurl qui va permettre...

Pour consulter la suite, découvrez le livre suivant :
couv_RISTATR.png
60-signet.svg
En version papier
20-ecran_lettre.svg
En version numérique
41-logo_abonnement.svg
En illimité avec l'abonnement ENI
130-boutique.svg
Sur la boutique officielle ENI
Précédent
Importer des données d’autres logiciels d’analyse de données
Suivant
Accéder aux données depuis une base de données