Importer des données d’autres logiciels d’analyse de données

Parfois, il est question des données dont on dispose déjà et qui sont produites par d’autres logiciels d’analyse de données comme SPSS, Stata, MATLAB... Voici ci-dessous un tableau récapitulatif des différents packages qui permettent l’interopérabilité entre R et les données résultantes des autres logiciels :

images/05EP72.png

1. Logiciel IBM SPSS : *.sav

a. Le package foreign

La fonction read.spss() permet d’importer des données depuis un fichier *.sav en format liste. Parmi les arguments dont elle dispose, on trouve to.data.frame, qui permet de convertir les données en data frame et use.value.labels qui est l’équivalent de stringsAsFactor, et donc empêche la coercition automatique des variables chaînes de caractères en facteur.

images/05EP73.png

On observe qu’un problème se pose au niveau des dates. En effet, IBM SPSS encode les dates en nombre de secondes écoulées depuis le 14 octobre 1582, alors que R encode les dates en nombre de jours écoulés depuis le 1er janvier 1900. Il faut donc convertir les secondes en jours et définir le paramètre origin de la fonction as.Date(), à "1582-10-14" :

images/05EP74.png

b. Le package haven

Le package Haven propose une solution plus directe pour importer des données d’un fichier *.sav, avec la fonction read_spss() :

images/05EP75.png

2. Logiciel SAS : *.sas7bdat

a. Le package sas7bdat

La fonction...

Pour consulter la suite, découvrez le livre suivant :
couv_RISTATR.png
60-signet.svg
En version papier
20-ecran_lettre.svg
En version numérique
41-logo_abonnement.svg
En illimité avec l'abonnement ENI
130-boutique.svg
Sur la boutique officielle ENI
Précédent
Accéder aux données depuis un fichier de données
Suivant
Télécharger des données depuis le Web