Sommaire

Python pour la Data ScienceAnalysez vos données par la pratique avec NumPy, Pandas, Matplotlib et Seaborn

Ce livre alliant théorie et pratique sur l'analyse de données avec le langage Python s'adresse aux étudiants et professionnels (ingénieurs, chercheurs, enseignants) souhaitant apprendre à analyser des données avec Python, aux informaticiens adeptes du langage Python et souhaitant découvrir l'analyse de données avec ce langage, ou encore à toute personne intéressée par le domaine.

La première partie du livre introduit le langage Python et son utilisation dans le domaine de l'analyse de données. Le lecteur y découvre la mise en place de l'environnement de travail ainsi que des rappels sur le langage Python en général.

Dans une deuxième partie, le lecteur apprend à manipuler efficacement ses données grâce aux librairies NumPy et Pandas. Chaque notion est introduite théoriquement, puis illustrée par un exemple concret permettant de comprendre son application. Il apprend à importer ses données sous Python et à utiliser les fonctions, méthodes et attributs fournis pour les explorer et les manipuler les données afin d'en faire ressortir des informations et tendances.

Dans une troisième partie, le lecteur apprend à visualiser ses données avec les librairies Matplotlib et Seaborn, afin de comprendre l'architecture et le fonctionnement de la création de figures avec Python, ainsi que les types de graphiques à utiliser selon le type de variable à représenter.

Enfin, dans le dernier chapitre, l'auteur propose un exercice complet avec sa correction permettant de mettre en pratique les notions apprises. Il permet au lecteur d'écrire le code permettant de répondre aux questions de l'exercice.

Pour chaque chapitre, un fichier contenant le code source utilisé, appelé notebook, est disponible en téléchargement sur cette page. Ce notebook permet au lecteur de tester le code, de le modifier et d'y tester ses propres lignes de code. De plus, deux jeux de données réels sont disponibles en téléchargement et utilisés dans ce livre pour illustrer les propos de l'auteur.
Amandine VELT
Diplômée du master Bioinformatique Modélisation et Statistique de l’Université de Rouen Normandie, Amandine VELT est ingénieure en Bioinformatique à l’INRAE (Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement). Passionnée par la programmation, le traitement de données de grandes volumétries et l’enseignement, elle est aussi formatrice indépendante en Data Science avec les langages de programmation Python et R. Ses deux formations en ligne dans le domaine regroupent environ 3000 participants. Ce livre, qu’elle a voulu pratique et concret, est dédié aux lecteurs désireux d’apprendre à analyser des données ave le langage Python.
Parution : août 2020
Réf. ENI : EIPYTDAT
ISBN : 9782409026263
Commander
la version impriméePython pour la Data Science