Ceci est la suite de l’article de mardi 4 juin : Coheris Spad une solution de Text Mining qui donne du sens aux données Clients (1/2)
Je propose de considérer le logiciel Coheris Spad, pour ses fonctionnalités de Text Mining, d’un point de vue étude d’opinion ou de satisfaction, avec l’analyse des commentaires libres de l’enquête.
Le processus se décline en 9 phases :
Coheris_Spad_processus
- L’importation des données : on choisit et on importe les données textuelles et données numériques que l’on joint dans une base de données commune. Par ex. partir de l’info structurée du CRM et celles des données d’enquêtes.
- La construction du vocabulaire : comptage et fréquence des mots. On paramètre le logiciel pour faire apparaître d’après les commentaires, l’ensemble des mots pour les classer par occurrence (ceux qui ressortent le plus fréquemment). Il se trouve qu’il y a pas mal de ménage à faire car ceux qui se répètent le plus ne sont pas toujours les plus pertinents (articles, pronoms, etc.). Cette phase permet de voir la richesse potentielle des mots employés par les gens.
- La construction de segments répétés (fréquences de mots) ; on fait du ménage dans les mots (ceux qui ont la même racine on les met ensemble, etc.). Par ex. si le mot « satisfait » est répété plusieurs fois, il faut se demander s’il y a des segments comme « pas satisfait », car même si le même mot est répété, dans ce cas précis, cela ne veut pas dire la même chose !
- L’édition des contextes des mots : avec la lemmatisation (la prochaine phase) on se retrouve avec une liste conséquente de mots. D’où l’intérêt de créer des équivalences : des mots qui on les mêmes racines, la même forme de conjugaison (mots racines de mots : « satisf » pour « satisfaction », « satisfait », etc.). Mais ce n’est pas suffisant ! Il faut encore agréger. Pour cela, on réunit des grandes familles de mots. Mais attention, selon les contextes les mots peuvent avoir des significations différentes. Coheris n’a pas choisit d’utiliser un dictionnaire des synonymes, pour Spad, car l’éditeur part du principe que l’on peut avoir envie/besoin d’utiliser des mots, même s’ils véhiculent des nuances différentes ou identiques. D’où l’intérêt de définir des contextes.
- La lemmatisation : cette opération consiste à regrouper les occurrences d’un texte sous des adresses lexicales. Le lemmatiseur va permettre de faire des équivalences de mots de façon automatique dans les verbatims. Une fois effectuée, les résultats de lemmatisation s’affichent sur Excel. Cette phase est importante car elle permet de préparer l’analyse. Plus précisément, elle permet de regrouper intelligemment l’ensemble des verbatim.
Coheris_Spad_Lemmatisateur Coheris_Spad_Lemmatisation-terminee
- Le vocabulaire spécifique de groupes d’individus : il est possible de regrouper les formes lexicales par segment de mots ; Cette fonctionnalité est utilisée pour distinguer 2 populations. Cela concerne un aspect purement descriptif : par ex. est ce que les hommes et les femmes ont utilisé les mêmes mots ?
- La construction d’un tableau lexical de contingence : imaginons que les interviewés ont le choix entre 3 opinions. On a des rubriques de mots, on va essayer de rapprocher les opinions libres de ses rubriques de mots. Ont-il utilisé un vocabulaire très spécifique à cette opinion ? ex. l’association du mot « mariage » au mot « sacré » pour ceux qui refusent l’idée du divorce. Autre ex. une étude d’une compagnie d’assurances sur la satisfaction concernant la Relation Client. Il s’agit de détecter à partir des commentaires libres les raisons de dire qu’ils ne sont pas satisfaits. Un commentaire libre associé à une question fermée. Très utile pour le Marketing ! On arrive à identifier d’autres sources d’insatisfaction, grâce aux commentaires libres, alors même que la question n’a pas été posée. Le tableau lexical de contingence est une étape intermédiaire pour faire l’AFC.
Coheris_Spad_Tableau-de-Contingence
- L’AFC (Analyse Factorielle des Correspondances) : Il est possible d’éditer graphiquement un plan factoriel avec 2 axes sur lesquels sont classés des mots sous forme de groupes de mots classables ensemble. Voyez l’image ci-dessous avec l’exemple d’un questionnaire d’opinion sur le mariage.
Coheris_Spad_Classification-Expressions
- Création d’une table de mots/segments/variables d’origine : le text mining a permis de structurer les commentaires libres. On est capable d’enrichir notre fichier initial composé de questions fermées, du CRM. On peut l’enrichir d’autres variables : est ce que les personnes ont utilisé tels ou tels mots… Avec ces grandes rubriques de mots créées par la lemmatisation, on crée des variables de mots et on enrichit le fichier de départ avec des données extraites du fichier de text mining.
À noter qu’avec Coheris Spad, on peut aussi faire :
- du scoring et de la modélisation ;
- des arbres de décisions ;
- des règles d’associations ;
- des tableaux multiples ;
- des modèles structurels ;
- des statistiques avec R (interface de programmation libre, pour statisticiens, permettant de programmer de nouveaux algorithmes qui ne seraient pas intégrés dans Spad).
En conclusion, Coheris Spad est très utile pour décrypter les feedback clients issus de commentaires libres des enquêtes de satisfaction ou d’opinion, mais aussi les verbatim du SAV et ceux des réseaux et médias sociaux et pour les intégrer avec des données numériques plus structurées comme celles des logiciels CRM et Marketing, par ex. Il est indispensable de l’utiliser pour mieux comprendre et anticiper les réactions des clients et des prospects.
Ces logiciels de Text Mining sont des fonctionnalités permettant de mieux capter l’opinion, les attentes, les besoins des clients et sont complémentaires à des techniques que j’utilise justement pour confirmer ces tendances issues de ces enquêtes ou conversations sociales.
Je me souviens d’un prospect, dans les assurances également, me déclarant : « nous avons un logiciel e-Réputation, nous surveillons les conversations des clients et prospects mais ne savons pas quoi en faire, après ! ». Les Comités Consultatifs Clients, les Cartographies de Processus Client et les Persona sont des techniques de feedback et d’analyse des verbatim des clients qu’on utilise en complément et en aval, de ce type de logiciels de Text Mining. Une fois que l’on a implémenté l’une de ses techniques, on obtient des résultats qui peuvent être des projets résultant sur des « quick wins » ou des investissements à moyen ou long termes avec un ROI (retour sur investissement) à moyen ou long termes. Ce qui est souvent le cas lorsque l’on parle d’Expérience Client, car on n’est jamais loin de la Culture du Client et donc des mentalités à faire évoluer…
C’est pour cette raison que je me suis intéressé à Coheris Spad et autres technologies de Data Mining et Business Intelligence.
À suivre, la semaine prochaine : un article sur l’Analyse Prédictive.
Merci Lidia pour cet article très complet sur notre outil de Text Mining.
J’ai constaté que les liens utilisés correspondent aux anciennes URLs de notre site.
Le lien vers la page produit SPAD à changé, le voici http://www.coheris.com/produits/analytics/logiciel-data-mining/
Bonjour,
Merci pour cette information. J’ai donc mis à jour le lien sur les 2 parties de l’article. Je vous encourage à partager cet article, même s’il est ancien, car les informations sont toujours utiles aux professionnels de la Relation Client et de l’Expérience client.