Blog ENI : Toute la veille numérique !
Accès illimité 24h/24 à tous nos livres & vidéos ! 
Découvrez la Bibliothèque Numérique ENI. Cliquez ici
Accès illimité 24h/24 à tous nos livres & vidéos ! 
Découvrez la Bibliothèque Numérique ENI. Cliquez ici
  1. Livres et vidéos
  2. Langage R et statistiques - Initiation à l'analyse de données

Langage R et statistiques Initiation à l'analyse de données

1 avis

Informations

Livraison possible dès le 18 septembre 2024
  • Livraison à partir de 0,01 €
  • Version en ligne offerte pendant 1 an
Livres rédigés par des auteurs francophones et imprimés à Nantes

Caractéristiques

  • Livre (broché) - 17 x 21 cm
  • ISBN : 978-2-409-03693-4
  • EAN : 9782409036934
  • Ref. ENI : RIRANADO

Informations

  • Consultable en ligne immédiatement après validation du paiement et pour une durée de 10 ans.
  • Version HTML
Livres rédigés par des auteurs francophones et imprimés à Nantes

Caractéristiques

  • HTML
  • ISBN : 978-2-409-03694-1
  • EAN : 9782409036941
  • Ref. ENI : LNRIRANADO
Le langage R est un outil puissant pour l'analyse statistique de données. Utilisé par de nombreux professionnels de la science des données, il permet de manipuler et de visualiser facilement les données, ainsi que d'effectuer des tests statistiques avancés. Il permet plus globalement de traiter une grande variété de données, telles que des données tabulaires, des séries chronologiques, des données spatiales, des données textuelles et des images.
Consulter des extraits du livre en ligne Aperçu du livre papier
  • Niveau Initié à Confirmé
  • Nombre de pages 396 pages
  • Parution septembre 2022
  • Niveau Initié à Confirmé
  • Parution septembre 2022
Que vous soyez débutant, novice ou junior dans la science des données, ce livre est là pour vous accompagner dans l’acquisition des connaissances indispensables pour la réalisation de statistiques et l’analyse de tous types de données avec le langage R.

Une courte introduction au langage R avec RStudio vous permet, sans connaissances ni compétences spécifiques en la matière, de prendre en main rapidement l’Environnement de Développement Intégré (EDI ou IDE en anglais) le plus utilisé, ainsi que la création de rapports automatisés grâce au R Markdown.

Les bases mathématiques d’un niveau de Terminale Scientifique, indispensables pour comprendre les statistiques et mieux appréhender la lecture de ce livre, sont ensuite succinctement présentées.

L’auteur fait alors la part belle aux tests d’hypothèses paramétriques et non paramétriques, c’est-à-dire aux tests statistiques courants tels que les tests de Student et de Khi-2, mais aborde aussi les régressions linéaires ou généralisées, simples et multiples, ainsi que les modèles linéaires généralisés à effets fixes ou mixtes. L’analyse en composantes principales est également détaillée. Les statistiques approfondies permettent de généraliser les mesures réalisées sur un échantillon à une population ou de comparer des groupes ou des populations entre eux.

La réalisation des différents modèles et statistiques est accompagnée de mises en application avec des exemples variés appliqués à différents domaines (biologie, physique, marketing...). L’intégralité des codes utilisés est disponible en téléchargement sur le site www.editions-eni.fr avec un script R Markdown pour chaque chapitre permettant de refaire chez soi la totalité des graphiques et des tests réalisés.

Téléchargements

Avant-propos
  1. 1. Introduction
  2. 2. À qui s'adresse cet ouvrage ?
  3. 3. Comment utiliser cet ouvrage ?
Le langage R
  1. 1. Histoire du langage R
  2. 2. Installation de R et de RStudio
    1. 2.1 Comprehensive R Archive Network (CRAN)
    2. 2.2 Installation de R via le CRAN
    3. 2.3 Installation de RStudio
    4. 2.4 Paramétrage de RStudio
    5. 2.5 Trucs et astuces avec RStudio
  3. 3. Packages
    1. 3.1 Qu'est-ce qu'un package ?
    2. 3.2 Installation d'un package
    3. 3.3 Utilisation d'un package, d'une fonction
    4. 3.4 Trouver de l'aide à propos d'un package ou d'une fonction
  4. 4. Travail sous forme de projet
  5. 5. Réalisation de rapports avec R Markdown
  6. 6. Initiation au codage en R
    1. 6.1 Nomenclature du langage R
    2. 6.2 Importer des données
    3. 6.3 Manipuler les données
    4. 6.4 Concaténation de tables
Les statistiques
  1. 1. Notions clés sur les statistiques
    1. 1.1 Histoire rapide de la discipline des statistiques
    2. 1.2 Définitions des mots-clés importants
  2. 2. Initiation à la réalisation de graphiques avec {ggplot2} dans R
  3. 3. Lois de probabilités statistiques
    1. 3.1 Introduction aux lois de probabilités
    2. 3.2 Loi uniforme
    3. 3.3 Loi binomiale
    4. 3.4 Loi de Poisson
    5. 3.5 Loi normale
    6. 3.6 Loi exponentielle
    7. 3.7 Résumé des paramètres liés aux lois de probabilités
  4. 4. Réalisation de statistiques descriptives dans R
    1. 4.1 Principe des statistiques descriptives
    2. 4.2 Statistiques descriptives univariées dans R
      1. 4.2.1 Type de données
      2. 4.2.2 Variable qualitative
      3. 4.2.3 Variable quantitative
    3. 4.3 Statistiques descriptives bivariées dans R
      1. 4.3.1 Deux variables qualitatives
      2. 4.3.2 Une variable qualitative et une variable quantitative
      3. 4.3.3 Deux variables qualitatives
  5. 5. Détection et visualisation des données manquantes dans R
La régression
  1. 1. Définitions et limites de la régression
  2. 2. Régression linéaire simple
    1. 2.1 Objectif de la régression linéaire simple
    2. 2.2 Réalisation d'une régression linéaire simple dans R
    3. 2.3 Limites d'application de la régression linéaire simple
      1. 2.3.1 Visualisation de la corrélation entre les données
      2. 2.3.2 Indépendances des données
      3. 2.3.3 Analyse des résidus
    4. 2.4 Intervalle de confiance de la régression dans R
  3. 3. Généralisation de la régression paramétrique dans R
    1. 3.1 Régression polynomiale
    2. 3.2 Régressions exponentielle et logarithmique
    3. 3.3 Introduction à la régression logistique binomiale
    4. 3.4 Régression multiple
  4. 4. Régression non paramétrique dans R
    1. 4.1 Définitions et limites de la régression non paramétrique
    2. 4.2 Régression non paramétrique univariée
    3. 4.3 Modèles additifs généralisés
Les tests d'hypothèses
  1. 1. Vocabulaire lié aux tests d'hypothèses
  2. 2. Démarche du test d'hypothèses
  3. 3. Test de Shapiro-Wilk
  4. 4. Test du Khi-2
    1. 4.1 Paramétrique ou non paramétrique, le test du Khi-2 ?
    2. 4.2 Loi du Khi-2 à k degrés de liberté
    3. 4.3 Test du Khi-2 d'adéquation
    4. 4.4 Test du Khi-2 d'indépendance
    5. 4.5 Test du Khi-2 d'homogénéité
La comparaison à une valeur théorique
  1. 1. Quand comparer à une valeur théorique ?
  2. 2. Théorème central limite
    1. 2.1 Histoire et utilisation du théorème central limite
    2. 2.2 Énoncé du théorème central limite
  3. 3. Comparaison d'une proportion à une valeur théorique
    1. 3.1 Exemples de comparaison d'une proportion à une valeur théorique
    2. 3.2 Test de comparaison d’une proportion à une valeur théorique avec R
  4. 4. Comparaison d'une moyenne à une valeur théorique
    1. 4.1 Test de Student
    2. 4.2 Exemple d'utilisation du test de Student dans R
    3. 4.3 Test de Student apparié
    4. 4.4 Test de Wilcoxon apparié
  5. 5. Comparaison d'une variance à une valeur théorique
    1. 5.1 Variance d'une variable
    2. 5.2 Test de comparaison de la variance à une valeur théorique
    3. 5.3 Exemple de comparaison d'une variance à une valeur dans R
  6. 6. Test de Kolmogorov-Smirnov
La comparaison de deux groupes
  1. 1. Généralités sur la comparaison de deux groupes
  2. 2. Comparaison de proportions de groupes dans R
    1. 2.1 Utilisation de la comparaison de proportions
    2. 2.2 Test z à deux proportions et test du Khi-2
    3. 2.3 Test exact de Fisher
    4. 2.4 Test de McNemar
  3. 3. Comparaison de variances de deux groupes dans R
    1. 3.1 Mise en situation de la comparaison de variances
    2. 3.2 Test F de Fisher
    3. 3.3 Test de Bartlett
    4. 3.4 Test de Levene
    5. 3.5 Test de Fligner-Killeen
  4. 4. Comparaison de moyennes de deux groupes dans R
    1. 4.1 Choix du test de comparaison de moyennes à utiliser
    2. 4.2 Test t de Student
    3. 4.3 Test t de Welch
    4. 4.4 Test de Wilcoxon-Mann-Whitney
  5. 5. Comparaison de moyennes/médianes de plus de deux groupes
    1. 5.1 Pourquoi ne pas comparer deux à deux ?
    2. 5.2 ANOVA : analyse de variance dans R
    3. 5.3 Test de Kruskal-Wallis dans R
Les modèles linéaires généralisés
  1. 1. Modèles linéaires classiques
    1. 1.1 Rappel
    2. 1.2 Les tests post-hoc
  2. 2. Généralisation des modèles linéaires en R
    1. 2.1 Utilisation des modèles linéaires généralisés
    2. 2.2 Régression logistique binomiale
    3. 2.3 Régression de Poisson
  3. 3. Modèles linéaires mixtes
    1. 3.1 Généralités et utilisation des modèles linéaires mixtes
    2. 3.2 Réalisation de modèles linéaires mixtes dans R
  4. 4. Traitement des données manquantes dans les GLM
  5. 5. Modèles non linéaires à effets fixes ou mixtes
L'analyse en composantes principales
  1. 1. Utilisation de l'ACP
  2. 2. Bases mathématiques de l'ACP
    1. 2.1 Approche par les individus
    2. 2.2 Approche par les variables
  3. 3. Mise en place de l'ACP
    1. 3.1 Déroulement de l'ACP
    2. 3.2 Sélection des variables actives
    3. 3.3 Réduction des variables
    4. 3.4 Réalisation de l'ACP dans R
      1. 3.4.1 Lignes de code et sorties automatiques
      2. 3.4.2 Représentativité des axes
      3. 3.4.3 Graphique des individus
      4. 3.4.4 Graphique des variables
    5. 3.5 Sélection du nombre de dimensions à interpréter dans R
      1. 3.5.1 Significativité des dimensions obtenues par l'ACP dans R
      2. 3.5.2 Nombre de dimensions à interpréter
    6. 3.6 Interprétation des sorties de l'ACP et indicateurs supplémentaires dans R
    7. 3.7 Ajout de variables supplémentaires dans R
  4. 4. Limites et ouverture des analyses factorielles
    1. 4.1 Données manquantes en ACP
    2. 4.2 Analyse factorielle des correspondances
    3. 4.3 Pour conclure sur les analyses factorielles
    4. Index
5/5 1 avis

J'en suis au début mais l'installation est très bien expliquée, le livre est très pédagogique avec beaucoup de ressources.

Anonyme
Auteur : Marie VAUGOYEAU

Marie VAUGOYEAU

Après un cursus d'ingénieur agronome et cinq années dans la recherche publique en écologie, Marie VAUGOYEAU, docteure en écologie et biologie évolutive, s'est ouverte au monde de la data d'entreprise, en tant que data scientist. Elle accompagne en tant que mentore free-lance les personnes désireuses de se former à l'analyse de leurs données. Rédactrice d'un blog de statistiques et R, et utilisatrice du langage R depuis plus de 10 ans, elle a écrit ce livre qui est un condensé de ce qu'elle transmet au quotidien dans son travail.
En savoir plus

Nos nouveautés

voir plus