Sommaire

Petites notions de vocabulaire avant de commencer

1. Statistiques:observationsObservations et Statistiques:featuresfeatures

Toute étude statistique se réalise sur une population, composée d’individus. Ces individus peuvent être des personnes ou des choses. Chaque individu dispose de caractères. En Machine Learning, les individus sont appelés des observations et les caractères des features (caractéristiques).

Tout au long de cet ouvrage, nous privilégierons le terme de feature à celui de caractéristique, car c’est ce terme que vous rencontrerez le plus dans vos différentes lectures et cas pratiques.

2. Les Statistiques:types de donnéestypes de données

Il existe deux types de données : les d Données:quantitativesonnées quantitatives et les Données:qualitativesdonnées qualitatives.

Les données quantitatives sont des nombres sur lesquels il est possible de faire des opérations mathématiques. Ces données peuvent être classées en deux groupes distincts :

  • les données quantitatives continues ayant une valeur infinie et pouvant être énumérée (nombre d’éléments d’une liste…),

  • les données quantitatives discrètes ont quant à elles une valeur finie dans un intervalle de valeurs (le nombre de pattes d’un animal…).

Quant aux données qualitatives, celles-ci ont pour but de décrire ...