Kmeans bright data marketing

Le k-means clustering, la segmentation algorithmique au service des stratégies CRM.

Introduction

Clustering (Segmentation)

La capacité de bien segmenter et cibler ses prospects et clients est capitale pour toute entreprise.

Cela permet de mieux répondre aux besoins et d’apporter des réponses marketing plus pertinentes car personnalisées. Attribuer davantage de budget sur des segments plus rentables et moins se focaliser sur ceux qui le sont moins sont également des décisions rendues possibles par une bonne segmentation.

A terme, une bonne segmentation permet un meilleur engagement et doit se traduire par un boost dans les ventes.

Dans cet article nous vous présenterons une méthode de segmentation

  • Orientée data,
  • Offrant la possibilité de faire des segments combinant beaucoup de dimensions,
  • Permettant la création de segments de manière automatisée,
  • Facile a reproduire/modifier,
  • Facile à intégrer au sein d’un processus continu (nouveaux clients, nouvelles transactions, etc.)

Mais, avant cela, en quoi cela consiste et quelles sont les meilleures méthodes de segmentation? C’est ce que nous allons vous expliquer dans cet article en utilisant le modèle RFM et l’utilisation de clusters pour illustrer les bénéfices et les inconvénients des méthodes de segmentation.

N.B: Les aspects techniques seront expliqués à la fin de l’article.

Abstract:

De manière générale, la segmentation consiste à regrouper des données en sous-groupes distincts et mutuellement exclusifs.

Dans un cadre marketing, l’objectif est souvent de grouper des clients similaires afin de pouvoir s’adresser de manière uniforme et appropriée à chaque segment. Une entreprise peut, par exemple, décider de former des segments en fonction des caractéristiques des personnes qui les composent.

Par exemple, en fonction de critères démographiques, géographiques ou comportementaux (habitudes d’achat, âge, genre, revenu, etc.).

Il est possible de faire de la segmentation de manière manuelle ou de manière algorithmique. Bien qu’une approche manuelle soit souvent plus intuitive et compréhensible, des algorithmes de machine learning permettent d’identifier des patterns difficilement repérables et de réduire la part d’arbitraire dans les choix faits.

Parmi les autres points positifs, les algorithmes peuvent traiter des quantités de données trop importantes pour un être humain.

Commençons par l’explication d’un modèle manuel:

Modèle RFM:

Le modèle de segmentation RFM est un outil couramment utilisé en marketing pour analyser ses clients et les segmenter en fonction de leur valeur pour l’entreprise. Les règles de segmentation sont souvent définies manuellement. De manière générale , elles s’articulent autour de trois critères:

Recency (Récence) : temps écoulé depuis la dernière transaction.
Frequency (Fréquence) : nombre de transactions effectuées.
Monetary (Monétaire) : montant total des transactions.

En fonction de leur score RFM, les clients sont classés en groupes (ex: ceux qui font des achats régulièrement, ceux qui n’ont acheté qu’une seule fois, ceux qui ont fait une grosse dépense etc.) en fonction de leur qualité perçue.

Ainsi, les clients avec une récence faible, une fréquence élevée et un montant d’achat important seront les meilleurs clients (dans cet exemple: segment “Champions”). A l’inverse, les clients qui n’ont fait qu’un seul achat il y a longtemps seront les moins bons clients et seront classés, par exemple, dans le segment “Perdus” ou “Hibernating”.

Même s’il s’agit d’une méthode de segmentation couramment utilisée, elle comporte quelques inconvénients:

  • La taille et l’homogénéité des clients au sein de chaque segment est fortement influencée par des règles arbitraires (les règles inhérentes à la construction des segments sont choisies de manière non-automatisée).
  • Les trois mêmes axes sont toujours utilisés (stratégie difficile à utiliser pour segmenter par produit par exemple).
  • Méthodologie relativement manuelle, donc processus assez long pour mettre à jour ou refaire une segmentation.

Afin de pallier à ces défauts, nous pouvons utiliser le modèle algorithmique suivant:

K-means

Les algorithmes de clustering, dont K-means fait partie, permettent une segmentation efficace (du moins d’un point de vue mathématique) en un nombre de segments choisi en amont.

Les données sont alors regroupées de façon à faire en sorte que les éléments d’un même segment soient plus ou moins similaires entre eux, et différents des éléments des autres segments.

Afin d’en faire bon usage dans un cadre business, il est impératif de bien définir les besoins au préalable afin que les segments obtenus soient exploitables. Pour ce faire, il faut:

1. Identifier les axes sur lesquels nous souhaitons segmenter.

Exemple de segments pour une entreprise de vélos:

En fonction du type de produits qu’ils achètent

  • Clients VTT
  • Clients vélos électriques
  • Clients vélos de route
  • Clients équipements & réparations
  • Etc.

En fonction des montants dépensées, de leurs fréquences d’achat et de leurs récence (RFM)

  • Clients VIP
  • Clients fidèles actif
  • Clients fidèles en hibernation
  • Clients perdus
  • Etc.

En fonction de l’heure d’achat de visite du site/magasin

  • Clients matinaux
  • Clients soirée
  • Clients travail
  • Clients nuit
  • Etc.

De multiples angles peuvent être adoptés lors de la segmentation. Néanmoins, les axes de segmentation doivent être judicieusement choisis afin de servir l’objectif défini en amont. Par exemple, pour la segmentation par produit, nous pourrions envisager des suggestions de produits différents en fonction du segment d’appartenance du client.

2. Définir le nombre de segments différents.

Bien que des méthodes mathématiques existent pour définir le nombre de segments optimal, il se peut que le résultat mathématique ne soit pas en adéquation avec les besoins de l’entreprise.

Par exemple, si le but de la segmentation est d’écrire et d’envoyer une newsletter différente par segment, il faut que le nombre de segments ne soit pas trop important, sans quoi le travail de rédaction serait trop chronophage. Un équilibre doit être trouvé entre granularité et généralisation.

Exemple:

Voici un cas concret en utilisant un clustering pour segmenter la clientèle de l’un de nos clients.

L’entreprise voulait s’adresser à chaque client de manière plus personnalisée en fonction du type d’achat que ces derniers ont effectué. Elle souhaitait, par exemple, mettre une page d’accueil personnalisée en fonction des préférences du client lorsque ce dernier est loggé.

Nous avons donc segmenté la base de données clients en utilisant la méthode k-means, ce qui nous a permis d’identifier de manière mathématique et automatisée 4 segments de clients très distincts.

En effet, nous pouvons constater dans le graphique suivant que les consommateurs appartenant à chacun des clusters ont une préférence marquée pour une seule catégorie d’articles et ne s’intéressent pas (ou peu) aux autres catégories.

L’entreprise identifie donc les acheteurs qui sont similaires dans leur comportement d’achat et les place dans un même segment. Elle peut ensuite:

  1. Leur envoyer des newsletters uniquement pour les produits qui les intéressent (afin de ne pas les surcharger tout en restant pertinent),
  2. Adapter l’expérience client sur le site en fonction du segment d’appartenance,
  3. Détecter des interactions entre différents produits et encourager le cross-sell.

Dans l’exemple proposé ci-dessus, on note que le segment 4 est fortement intéressé par la catégorie de produit 3. Mais en regardant plus attentivement, on note que la catégorie 7 est aussi quasi exclusivement achetée par ces mêmes clients. Il y a une opportunité de cross-sell entre la catégorie de produit 3 et 7.

découvrir quels produits connaissent le plus de succès auprès de ses différents groupes de clients (indiqué par la taille des segments),

En résumé, l’utilisation de la segmentation en marketing permet de regrouper efficacement les clients en différents clusters au travers de caractéristiques similaires. Cela permet aux entreprises de cibler efficacement leurs efforts de marketing et d’améliorer l’efficacité de leurs campagnes. Les méthodes de segmentation les plus utilisées actuellement sont assez limitées et manuelles. Nous recommandons par conséquent l’utilisation du clustering k-means qui est non seulement semi-automatisée mais également beaucoup plus flexible, ouvrant la possibilité de segmenter sur une multitude de dimensions possibles.

Pour les plus curieux(se) qui veulent en apprendre plus sur les aspects techniques de notre méthode de clustering, n’hésitez pas à lire la suite!

Aspects Techniques:

La méthode de clustering k-means, citée précédemment, est définie de la manière suivante:

L’algorithme fonctionne par itération, c’est-à-dire en déplaçant chaque centre de cluster (ou centroid) vers les données les plus proches, jusqu’à ce qu’un état stable soit atteint, c’est-à-dire que les éléments ne bougent plus de cluster.

Pour définir le centroid d’un cluster, on peut utiliser la méthode des moindres carrés. Elle minimise la somme des distances au carré entre les centroids et les points, ce qui aura pour but de regrouper les données les plus similaires d’un point de vue mathématique.

On commence par initialiser les centroids de chaque cluster de manière aléatoire, puis on répète les étapes suivantes jusqu’à convergence :

Formule k-means

1. On associe chaque donnée au centroid le plus proche.

Processus de segmentation - étape 1

2. On met à jour (déplace) les centroïdes de manière à minimiser la distance moyenne des données qui lui sont associées.

Processus de segmentation - étape 2

3. On attribue une nouvelle fois les données vers le centroid le plus proche et on réitère les opérations précédentes jusqu’à ce qu’un état stable soit atteint (les données ne changent plus de cluster)

Processus de segmentation - étape 3

Le nombre de centres de cluster est choisi par l’utilisateur avant de lancer l’algorithme et dépend de la structure des données et de l’objectif de l’analyse. Cependant, il peut être complexe de déterminer en amont le nombre optimal, c’est pour cela qu’a été mise en place la méthode du “coude”.

Elle consiste à tracer le nombre de clusters sur l’axe des abscisses et la distance moyenne des points de données aux centres de leurs clusters respectifs sur l’axe des ordonnées. On obtient alors une courbe en « coude » comme sur le graphique suivant :

The elbow point graph

Le nombre de clusters optimal est généralement considéré comme étant celui qui correspond au “coude” de la courbe. C’est-à-dire que pour un nombre de clusters inférieur à celui du coude, la distance moyenne des points de données aux centres de leurs clusters diminue rapidement, tandis que pour des valeurs supérieures, cette diminution est moins prononcée.

Il faut cependant noter que la méthode du coude n’est pas infaillible et que son résultat dépend de la façon dont les données sont distribuées. Il est donc recommandé de vérifier les résultats obtenus avec d’autres méthodes ou indicateurs pour s’assurer de la pertinence du nombre de clusters choisis.

Inconvénients

Les points négatifs de la méthode de clustering k-means sont les suivants:

De par le fait qu’il fonctionne en attribuant des données à son centre de cluster le plus proche, il peut être amené à regrouper des données de manière non-optimale d’un point de vue extérieur.

Nous pouvons illustrer ces problèmes via l’image suivante:

Bien que deux segments soient visuellement identifiables dans les 2 premiers graphiques (données regroupées sous la forme d’un petit et d’un grand cercles & données constituant 2 arcs), nous pouvons constater que ce n’est pas le résultat que nous donne l’algorithme.

En effet, il crée simplement des groupements de données qui sont les plus proches, ce qui ne fait pas trop de sens de ces cas, comme pour le 3e où il n’y aurait pas de raison logique de structurer les données de cette façon.

Parmi les autres inconvénients, nous pouvons citer la nécessité d’avoir un logiciel particulier et des compétences avancées pour faire mettre en production des algorithmes, une méthodologie de création de segments peu intuitive (surtout s’il y a un nombre important de segments) et parfois une difficulté pour interpréter les résultats et en tirer parti.