Sommaire

Utiliser des CSV CSV

Outre le format texte et le format binaire, qui permettent d’enregistrer et plus généralement de manipuler des données, un format s’est imposé pour stocker des données : le CSV.

Le formalisme du CSV est très simple, ce qui permet à un développeur de créer un fichier à partir de quasiment n’importe quel langage, sans librairie particulière.

Le CSV est surtout intéressant pour stocker plusieurs échantillons d’un phénomène (ces phénomènes peuvent être par exemple physique : plusieurs mesures de températures ou des données par exemple age...). C’est typiquement le genre d’informations qui sont stockés dans un tableur. Le format CSV est d’ailleurs facilement importable et exportable dans un tableur, tel LibreOffice Calc disponible sur un système Raspbian.

Un CSV contient donc des données d’un tableau en deux dimensions représentées sous forme de lignes.

Prenons les données concernant les passagers du Titanic, disponibles sur un depôt GitHub à l’adresse suivante : https://github.com/mwaskom/seaborn-data/blob/master/titanic.csv

La première ligne du fichier contient le nom des champs décrivant les données. Ces éléments sont séparés par des virgules :

survived,pclass,sex,âge,sibsp,parch,fare,embarked,class,  
who,adult_male,deck,embark_town,alive,alone ...