Que s’est-il passé ? L’analyse descriptive des données et le diagnostic
Introduction
Les chapitres précédents nous ont permis de comprendre l’intérêt des data dans la démarche marketing (chapitre Les data, pour quoi faire ?), de découvrir les outils de la data (chapitre Les outils du data marketing) et d’auditer son système data (chapitre Auditer son système marketing). Dans ce quatrième chapitre, nous allons rentrer concrètement dans la manipulation des données. Pour cela, nous allons aborder le premier niveau d’analyse des données, l’analyse descriptive. Nous verrons également certains tests qui relèvent des statistiques inférentielles.
Les statistiques inférentielles permettent, à partir d’un échantillon, d’extrapoler des comportements sur la population totale.
Les outils utilisés seront Excel ou R. Ils nous permettront très simplement d’avoir une première approche des données.
Choisir ses KPI
Les KPI (Key Performance Indicators) sont les indicateurs qui vont vous permettre de suivre votre activité marketing et commerciale. Ils vous permettent de donner un cap à vos actions (objectifs), de mesurer la réussite des actions lorsqu’elles ont été mises en œuvre et, éventuellement, de réajuster ces actions dans le temps en fonction de l’analyse que vous aurez faite des résultats.
Il s’agit d’une démarche PDCA : Plan, Do, Act, Check qui doit guider vos actions et votre stratégie.

Les data sont au service de cette démarche d’amélioration. Elles vont permettre de planifier l’activité et ses objectifs, de mesurer a posteriori les résultats obtenus en les comparant aux objectifs et aux résultats des périodes précédentes. Enfin, elles permettront de réajuster les actions futures.
Plan : planifier les actions marketing et les objectifs
Les KPI vont donc être l’outil de pilotage de votre stratégie marketing et de chacune de vos actions. Ils vont également permettre de comparer les résultats entre eux. Par exemple, par canal d’achat, par établissement, par commercial, etc.
Le nombre de KPI pouvant être suivi est infini. Ils dépendent de votre activité (online ou offline, B to C ou B to B, du secteur d’activité)...
Analyse univariée : étudier les variables une à une
La première étape de l’analyse descriptive consiste à analyser les variables une à une pour avoir une première compréhension des données disponibles. On appelle cette analyse l’analyse univariée en opposition avec les analyses multivariées qui traitent de plusieurs variables à la fois. L’analyse descriptive univariée comprend des mesures souvent connues, mais parfois mal interprétées, nous allons donc passer en revue les indices statistiques présentant les tendances centrales (la moyenne, la médiane, le mode), la dispersion (la variance, l’écart-type, les minimum et maximum, la fréquence et les fractiles) et la forme des données (asymétrie et aplatissement). Enfin, nous aborderons en complément l’intervalle de confiance.
L’objectif ici est de résumer au mieux chacune des variables afin de faciliter la compréhension d’un phénomène (achat de produits, visites en magasin, visites sur un site Internet par exemple). Nous allons donc passer d’une base de données comprenant de nombreuses observations à quelques indicateurs-clés. Pour illustrer ce type d’analyse, nous prendrons l’exemple d’un hôtel qui propose depuis peu ses chambres à différents prix en fonction de la date de réservation et du support de réservation (site Internet, référenceur, etc.).
Il souhaite s’assurer de la rentabilité de cette nouvelle stratégie de prix. La base de données que vous pouvez retrouver dans le classeur BDD_exemples_chapitre_4.xlsx, comprend 200 réservations et se présente comme suit :
À partir de cette base de données, nous allons calculer les indices de tendance centrale et de dispersion.
La tendance centrale
Dans le chapitre Auditer son système marketing, nous avions évoqué les différents types de variables : numériques, ordinales ou nominales. Lorsque nous souhaitons connaître la tendance centrale de données, plusieurs indices statistiques existent. Le choix d’un indice dépend du type de variable. Ainsi pour des données numériques (par exemple, le CA) nous pouvons...
Analyse bivariée : faire des rapprochements entre deux variables
Après avoir vu comment nous pouvions étudier les variables une à une, nous allons voir qu’il est également possible d’étudier les variables deux à deux pour établir des liens entre celles-ci. Nous allons par exemple chercher à mesurer si les changements d’une variable sont liés aux changements d’une autre variable. Les analyses bivariées vont donc nous permettre de répondre à des questions comme : est-ce que l’âge de mes clients influence leur panier moyen d’achats ? Est-ce que les clients qui reçoivent ma newsletter commandent plus régulièrement que les autres (et par conséquent, est-ce que ma newsletter est un outil de marketing direct efficace ?) ?
Nous verrons dans un premier temps comment faire des rapprochements entre deux variables qualitatives. Dans un deuxième temps, nous nous intéresserons aux variables numériques. Le troisième point portera sur les variables ordinales. Enfin, nous aborderons la comparaison de moyennes pour un rapprochement entre une variable nominale et une variable numérique.
Deux variables qualitatives
Créer un tableau de contingence dans R
Un tableau de contingence (appelé également tableau croisé dynamique dans Excel et que nous avons déjà présenté pour les analyses univariées) est un tableau qui présente une variable en ligne et une variable en colonne comme nous l’avons vu dans le chapitre Les data, pour quoi faire ?.
Les chiffres contenus dans les cellules indiquent les effectifs concernés par les deux variables. Pour le créer sous Excel, nous utiliserons l’outil tableau croisé dynamique que nous avons déjà utilisé pour la mesure du mode et de la fréquence, réalisé à la section Analyse univariée : étudier les variables une à une. La seule différence est que nous ajouterons ici une variable en colonne.

Nous avons fait le choix de grouper les sites Internet externes à l’entreprise (Trivago, Booking et Tripadvisor) ce qui a créé une nouvelle variable dans le champ Lignes. Pour cela, il faut sélectionner ces trois...
Conclusion
Pour conclure ce chapitre, nous retiendrons que l’analyse descriptive des données est un outil permettant de comprendre ce qu’il s’est passé et de mesurer les résultats des actions mises en place. Cette étape de l’analyse des données ne doit pas être négligée pour la définition d’actions futures pertinentes et efficaces. Nous pouvons parfois être tentés de nous fonder sur notre intuition, notre expérience ou les retours de nos équipes pour prendre des décisions. Ces aspects sont bien sûr essentiels, mais peuvent parfois être trompeurs et nous emmener dans la voie qui nous plaît le plus, mais pas forcément dans celle qui est la plus efficace. Analyser ses données est encore le meilleur moyen d’avoir une vision objective de la situation. C’est également une base d’échanges neutre au sein de l’équipe pour faire comprendre les décisions qui seront prises ensuite.