Blog ENI : Toute la veille numérique !
Accès illimité 24h/24 à tous nos livres & vidéos ! 
Découvrez la Bibliothèque Numérique ENI. Cliquez ici
Accès illimité 24h/24 à tous nos livres & vidéos ! 
Découvrez la Bibliothèque Numérique ENI. Cliquez ici
  1. Livres et vidéos
  2. Data Marketing
  3. Que peut
Extrait - Data Marketing Statistiques appliquées au marketing avec Excel et R
Extraits du livre
Data Marketing Statistiques appliquées au marketing avec Excel et R Revenir à la page d'achat du livre

Que peut-il se passer dans le futur ? Le marketing prédictif

Introduction

Le précédent chapitre nous a permis de mieux comprendre la première étape d’une stratégie de data marketing : l’analyse descriptive des données. Cette étape offre au responsable marketing une vue d’ensemble sur la situation passée (qu’ont acheté les clients, quels profils ont-ils, où ont-ils acheté, à quelle action marketing ont-ils été les plus sensibles ? etc.). Après cette description des données, nous avons montré comment le diagnostic permet d’avoir une vue d’ensemble de la situation marketing de l’entreprise. La marche suivante à passer pour améliorer ses résultats est l’analyse prédictive.

L’analyse prédictive permet de répondre à la question « Que va-t-il se passer ? » ou, plus précisément, « que peut-il se passer dans le futur ? » En effet, nous le verrons au fil de ce chapitre, une analyse prédictive comprend toujours une part d’incertitude. Certains facteurs ou événements ne peuvent être prédits, la prudence reste donc de rigueur dans ce type d’analyse et l’analyse des données ne saurait s’exonérer du regard de l’expert marketing et de l’expert commercial.

La classification : segmenter ses clients ou ses prospects

La classification est la méthode statistique à mettre en œuvre pour segmenter son portefeuille clients ou ses prospects. Stricto sensu, elle relève plus des statistiques descriptives, mais nous prenons la liberté de l’introduire dans ce chapitre sur le marketing prédictif, car elle est un bon préalable au scoring que nous verrons ensuite. En outre, nous utiliserons la même base de données pour ces deux types d’analyse.

En statistique, nous parlons de classification alors qu’en marketing nous parlons plutôt de segmentation. Ces deux termes recoupent un même objectif : organiser un ensemble d’individus en classes (segments ou catégories). On considère que les individus d’un même segment sont homogènes dans leurs profils sociodémographiques, psychographiques et comportementaux. La classification, ou segmentation, permet alors de proposer les offres les plus adaptées à une cible.

En référence au chapitre Les data, pour quoi faire ?, la segmentation s’inscrit dans l’étape du marketing stratégique dans un plan marketing. Elle permet d’avoir une vue d’ensemble et une vue découpée par segments du marché pour ensuite définir la stratégie de ciblage.

La classification, une des méthodes d’analyse multivariée

La classification fait partie d’un ensemble plus large de méthodes statistiques appelées analyses multivariées. Nous avons vu, dans le chapitre Que s’est-il passé ? L’analyse descriptive des données et le diagnostic, les analyses univariées et bivariées. Cependant, ces méthodes trouvent leurs limites lorsque le jeu de données comprend un grand nombre de variables et que nous souhaitons analyser l’ensemble de ces variables ensemble. L’analyse multivariée répond à cette problématique.

Méthodologie

Pour réaliser une classification, nous procéderons par étapes statistiques.

Tout d’abord, nous réaliserons une analyse en composantes principales (ACP). L’ACP va nous permettre de résumer nos variables en un nombre plus réduit appelé composantes ou dimensions....

Les modèles de régression

Les modèles de régression ont pour objectif de prédire un événement (comportement, montant d’achat, évaluation d’un produit, etc.) en fonction de facteurs connus. En langage statistique, nous dirons qu’il s’agit de prédire une variable à partir d’une ou plusieurs autres variables. Par exemple, si nous connaissons les achats passés d’un client, son genre, sa catégorie socioprofessionnelle et s’il a des allergies ou non, nous pourrons prédire une probabilité qu’il achète des produits bio.

La base de données clients, si elle est bien qualifiée (voir à ce sujet le chapitre Auditer son système marketing et plus précisément la section Nettoyer ses bases de données), permettra donc de diffuser ses actions marketing de manière ciblée en allant jusqu’à personnaliser pour chaque client l’action marketing adéquate.

Méthodologie

Nous proposons deux types de modèles de régression qui correspondent aux situations les plus courantes en marketing. Vous pouvez ainsi chercher à prédire une valeur quantitative ou une valeur qualitative (oui/non par exemple). Une valeur quantitative peut être le montant des achats d’un client, le chiffre d’affaires d’un futur point de vente, le volume d’affaires à venir. Une valeur qualitative peut être une nouvelle visite dans votre magasin (oui/non), l’ouverture de votre newsletter (oui/non) ou encore le fait de se désabonner à votre newsletter (oui/non). La valeur qualitative n’est pas systématiquement binaire, elle peut aussi être ordinale comme, par exemple, lorsque vous souhaitez prédire l’évaluation d’un produit sur une échelle de « pas du tout intéressant » à « très intéressant » ; elle peut également être catégorielle comme les catégories socio-professionnelles.

Pour les valeurs quantitatives, nous utiliserons un modèle de régression multiple et pour les valeurs qualitatives, un modèle de régression logistique.

Prévoir le prix de vente d’un bien immobilier : valeur continue...

Le scoring

Dans la lignée des méthodes de régression, nous allons maintenant nous intéresser au scoring qui est une pratique courante en marketing (et dans bien d’autres domaines !). L’objectif du scoring est d’attribuer à chaque client ou chaque prospect un score qui déterminera les actions spécifiques à mener pour lui.

Différentes méthodes de scoring sont employées par les statisticiens. Parmi celles-ci, certaines rencontrent plus ou moins de succès. Dans un sondage réalisé sur le site de référence www.data.mining.free.fr, les résultats suivants sont présentés :

Quelle méthode de data mining utilisez-vous le plus ?

Analyse

Nombre de réponses

% de réponses

Régression logistique

462

35 %

Arbres de décision

239

18 %

Analyse discriminante

217

16 %

Réseaux de neurones

124

9,5 %

Régression PLS

94

7 %

Autres

65

5 %

Support Vector Machines

63

5 %

Réseaux bayésiens

58

4,5 %

Total

1 322

100 %

La régression logistique arrive donc largement en tête dans les analyses menées par les statisticiens dans les entreprises.

Nous verrons dans un premier temps ce que sont ces différentes analyses et en quoi elles se distinguent les unes des autres. Nous nous focaliserons ensuite sur la plus commune, la régression logistique.

Data mining et scoring

Dans le premier chapitre, nous avions défini le concept de data mining. Les techniques de scoring relèvent typiquement du data mining : nous allons chercher à établir un score pour un client ou un prospect en établissant des associations ou en révélant des tendances entre différentes variables. L’objectif final est de disposer d’un outil d’aide à la décision.

À cet égard, la méthode de scoring employée au sein d’une entreprise devra être comprise par toutes les parties prenantes internes. Par exemple, dans le cas d’une banque, si l’équipe de data scientists trouve un excellent algorithme de prédiction, elle ne pourra se contenter de l’implémenter dans le système d’information de la banque pour que les conseillers aient ce score « magique »...

Conclusion

Nous avons vu dans ce chapitre trois grandes méthodes utiles dans le cadre du marketing prédictif : la classification, les modèles de régression et le scoring. Elles vous permettront de faire parler vos données existantes dans l’optique d’adapter vos campagnes futures. À travers les exemples que nous avons vus, nous pouvons répondre à des questions comme :

  • Quel prix fixer pour maximiser les ventes ?

  • À quelle cible adresser ma campagne ?

  • À quel moment lancer ma campagne de marketing direct ?

  • Quel contexte économique et social est le plus favorable pour la vente de mon produit ?

  • Comment contacter ma cible ?

  • Faut-il augmenter le nombre de contacts à établir lors de la campagne ?

Bien d’autres facteurs peuvent bien sûr être pris en considération en fonction de votre secteur d’activité, de vos pratiques et de vos données. Et, d’un secteur à un autre, d’une campagne à une autre, d’un produit à un autre, les variables expliquant votre succès varieront. En cela, les outils du marketing prédictif seront un allié pour piloter de manière optimale votre activité.