Aucune commande, ni expédition ne seront traitées le 7 octobre 2022 Merci de votre anticipation et compréhension.
  1. Supports de cours
  2. Langage R et statistiques - Initiation à l'analyse de données

Langage R et statistiques Initiation à l'analyse de données

  • En stock
  • Expédié en 24h00
  • Personnalisable
  • Accessible immédiatement et pour une durée de 10 ans
  • Version HTML
  • Accès illimité 24h/24, 7J/7

Présentation

Que vous soyez débutant, novice ou junior dans la science des données, ce livre est là pour vous accompagner dans l’acquisition des connaissances indispensables pour la réalisation de statistiques et l’analyse de tous types de données avec le langage R.

Une courte introduction au langage R avec RStudio vous permet, sans connaissances ni compétences spécifiques en la matière, de prendre en main rapidement l’Environnement de Développement Intégré (EDI ou IDE en anglais) le plus utilisé, ainsi que la création de rapports automatisés grâce au R Markdown.

Les bases mathématiques d’un niveau de Terminale Scientifique, indispensables pour comprendre les statistiques et mieux appréhender la lecture de ce livre, sont ensuite succinctement présentées.

L’auteur fait alors la part belle aux tests d’hypothèses paramétriques et non paramétriques, c’est-à-dire aux tests statistiques courants tels que les tests de Student et de Khi-2, mais aborde aussi les régressions linéaires ou généralisées, simples et multiples, ainsi que les modèles linéaires généralisés à effets fixes ou mixtes. L’analyse en composantes principales est également détaillée. Les statistiques approfondies permettent de généraliser les mesures réalisées sur un échantillon à une population ou de comparer des groupes ou des populations entre eux.

La réalisation des différents modèles et statistiques est accompagnée de mises en application avec des exemples variés appliqués à différents domaines (biologie, physique, marketing...). L’intégralité des codes utilisés est disponible en téléchargement sur le site www.editions-eni.fr avec un script R Markdown pour chaque chapitre permettant de refaire chez soi la totalité des graphiques et des tests réalisés.

Table des matières

  • Avant-propos
    • 1. Introduction
    • 2. À qui s'adresse cet ouvrage ?
    • 3. Comment utiliser cet ouvrage ?
  • Le langage R
    • 1. Histoire du langage R
    • 2. Installation de R et de RStudio
      • 2.1 Comprehensive R Archive Network (CRAN)
      • 2.2 Installation de R via le CRAN
      • 2.3 Installation de RStudio
      • 2.4 Paramétrage de RStudio
      • 2.5 Trucs et astuces avec RStudio
    • 3. Packages
      • 3.1 Qu'est-ce qu'un package ?
      • 3.2 Installation d'un package
      • 3.3 Utilisation d'un package, d'une fonction
      • 3.4 Trouver de l'aide à propos d'un package ou d'une fonction
    • 4. Travail sous forme de projet
    • 5. Réalisation de rapports avec R Markdown
    • 6. Initiation au codage en R
      • 6.1 Nomenclature du langage R
      • 6.2 Importer des données
      • 6.3 Manipuler les données
      • 6.4 Concaténation de tables
  • Les statistiques
    • 1. Notions clés sur les statistiques
      • 1.1 Histoire rapide de la discipline des statistiques
      • 1.2 Définitions des mots-clés importants
    • 2. Initiation à la réalisation de graphiques avec {ggplot2} dans R
    • 3. Lois de probabilités statistiques
      • 3.1 Introduction aux lois de probabilités
      • 3.2 Loi uniforme
      • 3.3 Loi binomiale
      • 3.4 Loi de Poisson
      • 3.5 Loi normale
      • 3.6 Loi exponentielle
      • 3.7 Résumé des paramètres liés aux lois de probabilités
    • 4. Réalisation de statistiques descriptives dans R
      • 4.1 Principe des statistiques descriptives
      • 4.2 Statistiques descriptives univariées dans R
        • 4.2.1 Type de données
        • 4.2.2 Variable qualitative
        • 4.2.3 Variable quantitative
      • 4.3 Statistiques descriptives bivariées dans R
        • 4.3.1 Deux variables qualitatives
        • 4.3.2 Une variable qualitative et une variable quantitative
        • 4.3.3 Deux variables qualitatives
    • 5. Détection et visualisation des données manquantes dans R
  • La régression
    • 1. Définitions et limites de la régression
    • 2. Régression linéaire simple
      • 2.1 Objectif de la régression linéaire simple
      • 2.2 Réalisation d'une régression linéaire simple dans R
      • 2.3 Limites d'application de la régression linéaire simple
        • 2.3.1 Visualisation de la corrélation entre les données
        • 2.3.2 Indépendances des données
        • 2.3.3 Analyse des résidus
      • 2.4 Intervalle de confiance de la régression dans R
    • 3. Généralisation de la régression paramétrique dans R
      • 3.1 Régression polynomiale
      • 3.2 Régressions exponentielle et logarithmique
      • 3.3 Introduction à la régression logistique binomiale
      • 3.4 Régression multiple
    • 4. Régression non paramétrique dans R
      • 4.1 Définitions et limites de la régression non paramétrique
      • 4.2 Régression non paramétrique univariée
      • 4.3 Modèles additifs généralisés
  • Les tests d'hypothèses
    • 1. Vocabulaire lié aux tests d'hypothèses
    • 2. Démarche du test d'hypothèses
    • 3. Test de Shapiro-Wilk
    • 4. Test du Khi-2
      • 4.1 Paramétrique ou non paramétrique, le test du Khi-2 ?
      • 4.2 Loi du Khi-2 à k degrés de liberté
      • 4.3 Test du Khi-2 d'adéquation
      • 4.4 Test du Khi-2 d'indépendance
      • 4.5 Test du Khi-2 d'homogénéité
  • La comparaison à une valeur théorique
    • 1. Quand comparer à une valeur théorique ?
    • 2. Théorème central limite
      • 2.1 Histoire et utilisation du théorème central limite
      • 2.2 Énoncé du théorème central limite
    • 3. Comparaison d'une proportion à une valeur théorique
      • 3.1 Exemples de comparaison d'une proportion à une valeur théorique
      • 3.2 Test de comparaison d’une proportion à une valeur théorique avec R
    • 4. Comparaison d'une moyenne à une valeur théorique
      • 4.1 Test de Student
      • 4.2 Exemple d'utilisation du test de Student dans R
      • 4.3 Test de Student apparié
      • 4.4 Test de Wilcoxon apparié
    • 5. Comparaison d'une variance à une valeur théorique
      • 5.1 Variance d'une variable
      • 5.2 Test de comparaison de la variance à une valeur théorique
      • 5.3 Exemple de comparaison d'une variance à une valeur dans R
    • 6. Test de Kolmogorov-Smirnov
  • La comparaison de deux groupes
    • 1. Généralités sur la comparaison de deux groupes
    • 2. Comparaison de proportions de groupes dans R
      • 2.1 Utilisation de la comparaison de proportions
      • 2.2 Test z à deux proportions et test du Khi-2
      • 2.3 Test exact de Fisher
      • 2.4 Test de McNemar
    • 3. Comparaison de variances de deux groupes dans R
      • 3.1 Mise en situation de la comparaison de variances
      • 3.2 Test F de Fisher
      • 3.3 Test de Bartlett
      • 3.4 Test de Levene
      • 3.5 Test de Fligner-Killeen
    • 4. Comparaison de moyennes de deux groupes dans R
      • 4.1 Choix du test de comparaison de moyennes à utiliser
      • 4.2 Test t de Student
      • 4.3 Test t de Welch
      • 4.4 Test de Wilcoxon-Mann-Whitney
    • 5. Comparaison de moyennes/médianes de plus de deux groupes
      • 5.1 Pourquoi ne pas comparer deux à deux ?
      • 5.2 ANOVA : analyse de variance dans R
      • 5.3 Test de Kruskal-Wallis dans R
  • Les modèles linéaires généralisés
    • 1. Modèles linéaires classiques
      • 1.1 Rappel
      • 1.2 Les tests post-hoc
    • 2. Généralisation des modèles linéaires en R
      • 2.1 Utilisation des modèles linéaires généralisés
      • 2.2 Régression logistique binomiale
      • 2.3 Régression de Poisson
    • 3. Modèles linéaires mixtes
      • 3.1 Généralités et utilisation des modèles linéaires mixtes
      • 3.2 Réalisation de modèles linéaires mixtes dans R
    • 4. Traitement des données manquantes dans les GLM
    • 5. Modèles non linéaires à effets fixes ou mixtes
  • L'analyse en composantes principales
    • 1. Utilisation de l'ACP
    • 2. Bases mathématiques de l'ACP
      • 2.1 Approche par les individus
      • 2.2 Approche par les variables
    • 3. Mise en place de l'ACP
      • 3.1 Déroulement de l'ACP
      • 3.2 Sélection des variables actives
      • 3.3 Réduction des variables
      • 3.4 Réalisation de l'ACP dans R
        • 3.4.1 Lignes de code et sorties automatiques
        • 3.4.2 Représentativité des axes
        • 3.4.3 Graphique des individus
        • 3.4.4 Graphique des variables
      • 3.5 Sélection du nombre de dimensions à interpréter dans R
        • 3.5.1 Significativité des dimensions obtenues par l'ACP dans R
        • 3.5.2 Nombre de dimensions à interpréter
      • 3.6 Interprétation des sorties de l'ACP et indicateurs supplémentaires dans R
      • 3.7 Ajout de variables supplémentaires dans R
    • 4. Limites et ouverture des analyses factorielles
      • 4.1 Données manquantes en ACP
      • 4.2 Analyse factorielle des correspondances
      • 4.3 Pour conclure sur les analyses factorielles
      • Index

Auteur

Marie VAUGOYEAUEn savoir plus

Après un cursus d'ingénieur agronome et cinq années dans la recherche publique en écologie, Marie VAUGOYEAU, docteure en écologie et biologie évolutive, s'est ouverte au monde de la data d'entreprise, en tant que data scientist. Elle accompagne en tant que mentore free-lance les personnes désireuses de se former à l'analyse de leurs données. Rédactrice d'un blog de statistiques et R, et utilisatrice du langage R depuis plus de 10 ans, elle a écrit ce livre qui est un condensé de ce qu'elle transmet au quotidien dans son travail.

Caractéristiques

  • Niveau Initié à Confirmé
  • Nombre de pages 310 pages
  • Parution septembre 2022
    • Reliure spirale - 17 x 21 cm (Médian)
    • ISBN : 978-2-409-03695-8
    • EAN : 9782409036958
    • Ref. ENI : RIMRANADO
  • Niveau Débutant à Initié
  • Parution septembre 2022
    • HTML
    • ISBN : 978-2-409-03696-5
    • EAN : 9782409036965
    • Ref. ENI : LNRIMRANADO

Téléchargements

En complétant ce formulaire, vous acceptez d'être contacté afin de recevoir des informations sur nos produits et services ainsi que nos communications marketing. Vous aurez la possibilité de vous désabonner de nos communications à tout moment. Pour plus d'informations sur notre politique de protection des données, cliquez ici.
  • Des fichiers complémentaires (23 Ko)