connaissanceclient-enrichissement

Connaissance client « augmentée » : comment enrichir un profil utilisateur ?

Enrichissement de données & statistiques pour une connaissance client "augmentée"

Qu'est-ce que l'enrichissement ?

L’enrichissement consiste à aller chercher, sans limitation et sans aucun préjugé, des données complémentaires, provenant de sources externes, qui vont être mises en corrélation avec l'ensemble des données communiquées par les entreprises utilisatrices.

L’enrichissement va permettre de reconstituer le profil et l’environnement d’un individu à partir de simples données, jugées pauvres d’un premier abord.

Les étapes de l'enrichissement de données

Deux étapes principales sont à distinguer dans un processus d’enrichissement.

  • La recherche de sources de données permettant de récolter un maximum d’informations brutes sur un individu.

  • L’utilisation de méthodes statistiques permettant d’agréger ces données entre elles de la manière la plus juste et efficace possible et de les regrouper dans un Data-Frame sur lequel les algorithmes pourront « apprendre ».

L'enrichissement par ETIC DATA

Sources de données

3 sources de données différentes : internes, externes et propriétaires ETIC DATA avec plus de 20 millions de profils stockés et analysés en continu.

En savoir plus

Méthodes d'agrégation

3 méthodes d’agrégation : stricte/semi stricte, par loi de probabilité et par score (résultant de mini modèles en apprentissage continu sur la base de données ETIC).

En savoir plus

D'un data-frame "figé" à un data-frame "évolutif"

En utilisant ces différentes méthodes d’agrégation ETIC DATA a introduit des statistiques dans un système d’enrichissement de base de données permettant ainsi d’obtenir des estimations plus justes et de se distinguer des enrichissements classiques et figés. Les humains évoluent et changent dans le temps et les données qui les caractérisent aussi, ainsi la base de données enrichie n’est plus constituée de données figées comme on a l’habitude de la rencontrer mais « variables », en constante évolution et réapprentissage. Face à cette nouvelle architecture de data-frame « évolutif », ETIC DATA a dû développer des algorithmes spécifiques capables de gérer de la manière la plus pertinente possible ces nouveaux flux de données « vivantes » générés par l’enrichissement.

+1200 variables additionnelles

Au total la phase d’enrichissement permet d’ajouter plus de 1200 variables à la base de données initiale. Ces variables reconstituent de manière très fine, le profil d’un individu, son environnement, son comportement, son évolution uniquement à partir de données externes. Elles sont évolutives et en constant réapprentissage.

L’apport de cet enrichissement couplé à un algorithme adapté peut être mesuré sur les taux de bonne classification (principal indicateur de performance d’un modèle prédictif) qu’il induit. On observe en moyenne une augmentation de 15% de ce dernier suite à la phase d’enrichissement proposée par ETIC DATA (écart mesuré entre le taux de bonne classification obtenu sur base brute et sur base enrichie, moyenne sur 10 études de cas client).

Les limites de l'enrichissement

Actuellement l’enrichissement proposé par ETIC DATA permet d’ajouter plus de 1200 variables, mais il existe une infinité de sources disponibles et ce nombre ne cesse d’augmenter. Cette augmentation est d’autant plus grande que les algorithmes et les méthodologies utilisées permettent de traiter tout type de données, quantitatives, qualitatives, ordinales, structurées, non structurées, …

Équilibre entre enrichissement et robustesse des modèles

Face à cet enrichissement massif et à tant de données on peut se poser la question de la perte de robustesse des modèles qu’il peut induire. En effet, il a été démontré qu’un ajout trop important de données pouvait augmenter la variabilité des modèles prédictifs c’est pourquoi ETIC DATA travaille actuellement sur la notion d’enrichissement intelligent (sujet à découvrir à l'occasion de notre participation au Salon AI). Cet enrichissement permet, suite à une phase de prétraitement des données, de sélectionner pour chaque modèle, parmi l’ensemble des variables disponibles, uniquement les plus pertinentes et de limiter ainsi la variabilité causée par l’utilisation d’un trop grand nombre de variables.

 ETIC DATA vous apporte des solutions concrètes
pour anticiper les mouvements de vos clients :

 
miniature-blog-serge-interview

Interview Serge LARA

La solution d’ETIC DATA est reconnue comme l’une des 7 innovations les plus prometteuses du salon e-marketing 2018. Lors de cet évènement, l’équipe d’ETIC DATA a en effet présenté sa nouvelle plateforme d’analyse prédictive en version bêta lors d’un atelier produit dédié à la connaissance client dont le thème était : « Comment prédire et prescrire l’appétence client sans être data scientist ? ».

Aujourd’hui Serge Lara, Président du Groupe ETIC, prend la parole pour revenir sur la technologie d’ETIC DATA et son partenariat avec l’IMAG ;

Pouvez-vous nous présenter ETIC DATA en quelques mots ? 

ETIC DATA est une start-up créée en 2016 à Montpellier. Elle appartient au Groupe ETIC. ETIC DATA se positionne comme le « pure player » de l’analyse prédictive des comportements clients utilisant l’IA et les Big Data.

Notre solution s’adresse à toutes les directions Marketing et Commerciales soucieuses de mettre en œuvre un dispositif client « data driven » grâce à une connaissance client enrichie et ayant pour objectif d’accélérer l’engagement client. Pour cela, ETIC DATA a conçu des algorithmes spécifiques de Machine Learning de type forêts d’arbres qui sont le fruit de 10 années de R&D. Depuis 4 ans maintenant, ce programme se trouve renforcé par un partenariat avec l’Institut Montpelliérain Alexander Grothendieck. L’IMAG est une unité de recherche commune au CNRS et à l’Université de Montpellier regroupant des chercheurs et des doctorants en Probabilités et Statistique (EPS). L’institut fédère l’essentiel des acteurs de la recherche en mathématiques de la région Occitanie.

Vous nous parlez d’IA et de Machine Learning, mais pouvez-vous nous dire quelles sont les 3 principales spécificités des algorithmes à l’origine des modèles d’ETIC DATA ?

La première spécificité de nos algorithmes réside dans notre processus d’enrichissement intelligent, qui nous distingue des enrichissements classiques. Grâce à cette nouvelle architecture de data-frame « évolutif », nous avons développé des algorithmes capables de gérer de la manière la plus pertinente possible ces nouveaux flux de données « vivantes », générés par l’enrichissement.
Au total, cette phase d’enrichissement permet d’ajouter à la base de données propriétaire, bien plus de variables que les solutions existantes. Ces variables reconstituent de manière très fine, le profil d’un individu selon son environnement, sa CSP, etc... Grâce à notre processus d’enrichissement, les données « First Party » nécessaires à la création d’un modèle sont minimes : 5000 lignes minimum avec 6 champs : nom, prénom, adresse, code postal, ville et adresse mail. Sans oublier la variable cible.

La seconde spécificité de nos algorithmes se situe dans la phase de prétraitement des données, permettant de sélectionner pour chaque modèle, parmi l’ensemble des variables disponibles, uniquement les plus pertinentes. Nous obtenons alors des modèles robustes dont la fiabilité se mesure au travers des résultats concrets obtenus par nos clients : en moyenne nos modèles ont des taux de bonne classification après apprentissage, supérieurs à 80%.

La troisième spécificité de nos algorithmes tient dans le fait qu’ils ne se contentent pas uniquement de prédire les comportements d’achats, mais vont bien plus loin grâce au processus d’inflexion du comportement, dans un contexte dynamique et en temps réel. Cette offre technologique unique crée de la valeur en proposant des recommandations automatisées ultra-personnalisées permettant ainsi d’augmenter l’attrait des individus à faibles appétences, ceux qui sont habituellement mis de côté par les services marketing.

Quels sont les grands projets d'ETIC DATA ?

A la rentrée prochaine, nous lançons officiellement la 1ère plateforme d’analyse prédictive en mode SaaS. Celle-ci permettra d’explorer et d’automatiser les modèles comportementaux les plus pertinents complétant ainsi la chaine de valeur des Directions Marketing « data driven ». L’un de ses points forts est son accessibilité prix qui permet de mesurer rapidement le ROI des actions marketing. Il faut savoir qu’un modèle prédictif est facturé uniquement s’il est validé, c’est-à-dire si ses prédictions sont bonnes à 70% minimum. Pour découvrir en avant-première notre plateforme, notre équipe organise des web démos.

Le deuxième grand projet c’est la création d’un laboratoire de R&D « ETIC DATA Search » pour le premier trimestre 2019. Il permettra de travailler sur les évolutions de la technologie utilisée par nos équipes, mais également de progresser sur les cas qui nécessite des approfondissements technologiques, pour garder un temps d’avance.

Comment l’entrée en vigueur de la réglementation RGPD impacte votre solution ?

Nous sommes « RGPD Compliant ». En effet toutes les données « First-Party » que nous utilisons pour nos modélisations peuvent être anonymisées sans répercussion sur la fiabilité de nos modèles. Pour ce qui est des données utilisées lors de la phase d’enrichissement, celles-ci sont collectées en accord avec les règlementations en vigueur.

Il est aussi important de souligner que les données clients ne font l’objet d’aucun traitement de notre côté, elles sont restituées en intégralité à la société propriétaire à la fin de la modélisation et cela est clairement spécifiée dans le contrat de confidentialité que nous signons avant tout démarrage de projet.

Où pouvons-nous rencontrer l'équipe d'ETIC DATA en 2018 ?

Elle sera présente les 11 et 12 Juin au Salon AI Paris 2018 et animera 2 ateliers sur le thème de « l’enrichissement intelligent » mis au service de la connaissance client. La présentation sera illustrée par des clients avec des résultats business concrets. Vous pourrez également nous retrouver les 7 et 8 Novembre au Salon Customer Relationship & Marketing à Cannes.

Vous souhaitez découvrir la plateforme ETIC DATA ?

 
image-interview-serge-wev

Serge Lara

Président Groupe ETIC

Demandez une web démo personnalisée avec nos experts Data

plateforme

Image-salon

Salon AI Paris 2018 – 11 & 12 juin 2018

Le salon AI Paris revient pour une 2ème édition : 

À travers 2 journées rythmées par des conférences, des ateliers produit, des rendez-vous d’affaires et des rencontres avec près de 70 exposants et 2 000 visiteurs, bénéficiez d’un panorama complet des opportunités, perspectives et technologies du marché. L'objectif de l'édition 2018 est de fédérer l’écosystème français autour de l’intelligence artificielle. Profitez de ces deux jours de salon pour :

• Trouver des réponses aux principaux enjeux technologiques, stratégiques et réglementaires de l’IA

• Découvrir les dernières approches et tendances méthodologiques en termes de déploiement des solutions en entreprise

• Rencontrer l’ensemble des acteurs de l’écosystème et de la filière : grands groupes, startups, entreprises utilisatrices…

plan-etic-dataok

Enrichissement intelligent & comportement client : comment la technologie prédictive d’ETIC DATA apporte un avantage décisif au Marketing client ?

Le Machine Learning et l’Intelligence Artificielle ont pris le pas sur la collecte massive de données. Les directions marketing veulent dorénavant comprendre en temps réel l’intention des clients, sur-sollicités et volatiles. Nous avons conçu une plateforme SaaS intégrant les dernières avancées technologiques en matière d’enrichissements de données, permettant aux directions marketing « data driven » d’anticiper facilement les intentions de leurs clients, même en l’absence de signaux explicites. Adossée à notre programme de R&D continu, notre technologie met en œuvre :

» Des algorithmes de Machine Learning utilisant les probabilités. Les mêmes que ceux que nous retrouvons dans les voitures autonomes.

» Un processus d’enrichissement massif permettant de qualifier massivement une base de données brutes propriétaires « First Party ».

Inscrivez-vous à l’un de nos ateliers solutions pour découvrir nos uses cases et assister à nos démonstrations. Retrouvez-nous également sur notre stand A6. Atelier produit avec Lolita Tornare, Data Scientist & Serge Lara, CEO ETIC DATA
imagesalon-landingpage

Téléchargez la présentation :

Contact - Demande Présentation SALON AI

Vous souhaitez en savoir plus sur la technologie ETIC DATA ?

 


miniature-blog-foret-web

Choix des forêts aléatoires

Sur quelle méthodologie sont basés nos algorithmes ? ETIC DATA vous parle des forêts, principal moteur de ses modèles.

Le choix du bon classifieur :

Le classifieur est le principal outil utilisé pour effectuer les tâches de l’analytique prédictive. Un classifieur est une fonction mathématique qui, au vu du profil d'un individu, va lui assigner la valeur d'une quantité d'intérêt appelée la "cible" (consommateur /non consommateur par exemple) et un score de certitude. Cette valeur cible et ce score vont permettre au décideur de déterminer et de planifier les actions optimales pour cet individu.

Il existe de nombreux classifieurs, plus d'une centaine si on tient compte de leurs variantes, chacun ayant ses forces et ses faiblesses. Parmi les plus connus, on peut citer les réseaux de neurones, les régressions logistiques, les arbres CART ou encore les forêts. La sélection du classifieur le mieux adapté aux objectifs d'une situation spécifique est donc un véritable problème. De nombreuses considérations sont à prendre en compte, allant du type de données disponibles aux objectifs du décideur, en passant par le coût des erreurs potentielles.

Chez ETIC DATA, les données sur lesquelles nous travaillons sont pour la plupart des données concernant des clients, et nous visons à fournir les meilleurs outils pour cerner et anticiper leurs comportements. L'une des caractéristiques dont nous devons tenir compte est la diversité des comportements humains. En effet, les femmes et les hommes changent, évoluent, réagissent et s’adaptent en fonction de leurs particularités. Il faut donc choisir un classifieur capable d'extraire de ces profils complexes les marqueurs spécifiques, les variations subtiles et les indices cachés qui permettent au mieux de prendre en compte ces particularités et d'anticiper ces évolutions.

Pour sélectionner le meilleur classifieur en regard de ces objectifs, ETIC DATA, en partenariat avec le laboratoire IMAG (UMR CMRS 5149) de l’Université de Montpellier, a voulu comparer la pertinence des classifieurs les plus populaires. Après avoir déterminé une liste de 13 critères que devraient rencontrer un « bon » classifieur, les chercheurs d'ETIC DATA et de l'IMAG leur ont attribué des notes.

Et le gagnant est ?

Avec une note de 4.5/5 les classifieurs de type forêt sont ressortis comme étant la meilleure classe d'algorithmes pour répondre aux problématiques clients rencontrées, devançant entre autres la régression logistique (3.88) et les réseaux de neurones (2.75). ETIC DATA a donc choisi d’orienter ses algorithmes vers les classifieurs de type forêt et leurs variantes.

Vous pouvez retrouver l’intégralité de l’étude sur la page suivante : Gille R. Ducharme - CRITÈRES DE QUALITÉ D’UN CLASSIFIEUR GÉNÉRALISTE.

Qu’est-ce qu’un classifieur de type forêt ?

Les premiers classifieurs de type forêt ont été les forêts aléatoires (Random Forest) introduites par Leo Breiman en 2001. Cet algorithme de machine learning est une version ensembliste des arbres CART et fait partie des méthodes les plus précises et les plus efficaces sur le marché. Un classifieur de type forêt présente de nombreux avantages qui ont fortement contribué à leur note élevée lors de notre étude comparative.

Principaux avantages des classifieurs de type forêt :

  • Gestion des données manquantes, massivement présentes dans les bases de données clients

  • Gestion des données de natures mixtes - quantitatives, qualitatives, ordinales … - également caractéristiques des bases de données rencontrées

  • Adaptation à des problématiques de classification, pour prédire une cible catégorielle (client/non-client par exemple) ou pour prédire une variable continue (un prix par exemple).

  • Inclusion d'informations contextuelles, comme les coûts d'erreurs de classification, la présence de niches à faible effectif, etc.

  • Production d'une mesure de l’importance des variables permettant d’avoir une visibilité sur les variables qui influent le plus dans la modélisation

  • Production d'un score qui, après calibration, permet de faire de l'analytique prescriptif, principal axe de développement d’ETIC DATA.

Vous souhaitez en savoir plus sur les forêts aléatoires ?

 

Un arbre de classification CART est un ensemble de règles exécutées en séquence qui permettent à un prospect de voyager depuis la racine de l'arbre au travers de nœuds vers une feuille qui lui assigne une valeur de la cible (client/non client) et un score de certitude. Les règles se logent dans les nœuds de l'arbre et sont de la forme : "si telle caractéristique du prospect est comme ceci, poursuivez dans la branche de gauche de l'arbre, sinon dans celle de droite". La figure ci-dessous représente un arbre permettant d’attribuer la variable cible (consommateur/non consommateur) d’un individu en fonction de diverses données de profil (estimation des revenus, âge, CSP, …).

image-arbre-classification

Limite des arbres de classification :

Les arbres ont de nombreux avantages, mais ont tendance à surajuster les données, ce qui nuit à leur précision quand on les utilise en mode production. Les classifieurs de type forêt sont constitués d'un ensemble d'arbres de tailles et de formes différentes, qui remédient à ce problème. De plus, ces algorithmes ont des capacités prédictives considérablement améliorées: ils donnent un taux d'erreur en général inférieur, et au pire comparable, à celui de la plupart des autres méthodes de classifications inventées à ce jour.

Utilisation d’un classifieur de type forêt en production :

Un prospect passe dans chacun des arbres de la forêt, depuis sa racine jusqu'à la feuille qui lui assigne une valeur temporaire de la cible. La prédiction finale de la forêt se fait par une procédure de vote : la valeur ayant l'effectif le plus élevé parmi les arbres d'une forêt devient la valeur définitivement assignée au prospect. Il existe de nombreuses variantes des forêts d'arbres permettant de les adapter aux spécificités de chaque situation. ETIC DATA a développé une version généraliste offrant d'excellents résultats dans la majorité des cas, avec en option la possibilité d'utiliser des variantes offrant un réglage plus fin selon les besoins.

 ETIC DATA vous apporte des solutions concrètes
pour anticiper les mouvements de vos clients :

 

Auteur

visuel-blog

Maximilien Dossa

Data Scientist

Demandez une web démo personnalisée avec nos experts Data

plateforme

miniature-blog-projet-data-web

Data Analytics : comment réussir son projet de modélisation prédictive ?

Vous souhaitez initier un projet en Analytics Predictif et Prescriptif et vous vous posez des questions sur les conditions de succès ? Il nous a semblé utile de vous partager quelques retours d’expérience.

Transformez vos "Big Data" en "Smart Data"

Comme vous le savez la donnée reste le pré-requis pour démarrer un projet de marketing prédictif. La problématique rencontrée par la plupart des professionnels du Marketing et de la Relation Client peut se résumer en une question :

Comment transformer la big data en smart data pour anticiper la demande et ainsi améliorer son ciblage et sa communication ?

Un conseil est de recourir aux outils du marché intégrant de l’IA qui permettent d’automatiser le processus d’analyse et d’enrichissement de la donnée brute permettant ainsi de faire gagner aux équipes un temps précieux dans la mise en œuvre de leur stratégie d’activation client.

Quand le choix est fait, il reste à définir un périmètre de cas d’utilisation pour démarrer plus rapidement et suivre les premiers résultats de manière ciblée et maitrisée.

Les périmètres peuvent se résumer en une ou plusieurs questions telles que :

  • Qui sont mes futurs « churners » ?
  • Qui dois-je contacter en priorité dans ma base prospects pour obtenir le meilleur ROI ?
  • A qui faut-il proposer une remise promotionnelle pour augmenter la conversion tout en maitrisant mes investissements ?

Démarrez votre projet avec ETIC DATA

Pour démarrer un projet avec ETIC DATA, l’initialisation du projet se fait avec une base de contacts de 5000 lignes (au minimum) et un minimum d’historique. En sachant que plus il y a d’historique meilleur sera l’apprentissage pour obtenir un modèle prédictif robuste.

Les prérequis à tous projets :

  • La quantité de données :

    • Ma base clients contient-elle une quantité de données suffisante : 5000 ligne est le strict minimum (pour les algorithmes ETIC DATA) .

  • La qualité de la donnée :

    • Mes données sont elle complètes ? correctes ? uniques ? et récentes ?

  • L'accessibilité de la donnée :

    • Ai-je la possibilité d’extraire simplement et facilement les données utiles pour la modélisation ?

  • La vérification des résultats :

    • Pour vérifier les prédictions lors de la phase d’apprentissage, ai-je les moyens d’accéder aux résultats obtenus lors des évènements passés ?

Si vous répondez par l’affirmative à ces 4 questions, vous êtes alors prêts pour démarrer un projet de modélisation prédictive utilisant les algorithmes d’ETIC DATA. Pour toute question, nos experts data scientists sont à votre disposition, n’hésitez pas à les solliciter.

Vous souhaitez en savoir plus sur la solution ETIC DATA ?

 
miniature-blog-churn-management

Churn Management | Glossaire

À l’ère du big data de nombreuses entreprises mettent en place leurs propres systèmes de collecte et de traitements de la donnée afin de comprendre le comportement de leurs clients, et ainsi opter pour de nouvelles stratégies marketing « data centric ». Seulement, si beaucoup de responsables marketing sont satisfaits d’observer le comportement de leurs clients, certains déclarent ne pas avoir les clefs pour agir sur le phénomène de churn. Alors qu’est-ce que le churn et comment les nouvelles technologies d’intelligence artificielle permettent de l’anticiper et de le réduire ? C’est ce que nous allons voir ensemble.

Qu'est-ce que le churn ?

Définition du churn :

Le terme « churn », très utilisé en marketing, désigne une tendance à la baisse de la clientèle. Cette notion, aussi connue en français sous le terme « d’attrition », permet d’analyser la fidélité d’une clientèle et l’impact d’actions marketing sur celle-ci.

Comment se calcule le taux de churn ?

L’une des principales préoccupations d’un responsable CRM ou responsable marketing, consiste à calculer et limiter le churn. À cet effet, nous avons aujourd’hui une formule simple pour calculer le taux d’attrition : elle consiste à diviser le nombre de clients perdus par le nombre total de clients.

(Nombre de clients perdus sur la période) X 100
________________________________________________

((Nombre de clients engagés sur la période) + (Nombre de clients à la fin de la période) / 2)

Qu'est-ce qu'un taux de churn "normal" ?

En sachant que sur tout marché concurrentiel, il existe une érosion naturelle de la clientèle, on arrive aujourd’hui à définir un seuil au-dessus duquel le churn est anormalement élevé. Pour comprendre cette notion, il convient de faire un détour par la notion de cycle de vie du client. En marketing, on considère qu’un client passe par 3 grandes phases (notion de cycle de vie du client ) : tout d’abord prospect, il devient ensuite client actif, avant d’être un client perdu. Le taux de churn, est associé à la part de clients perdus sur une période par rapport aux clients gagnés et actifs.
Un taux de churn dit "normal" ne doit généralement pas dépasser les 10% de votre clientèle ; on observe cependant des secteurs où le taux d’attrition s’élève à 20%. Au-delà de ce taux, on considère qu’il y a un problème dans la gestion de la relation client et notamment en ce qui concerne la fidélisation.

Vous souhaitez en savoir plus sur la technologie ETIC DATA ?

 

Comment anticiper et réduire le churn ?

Dans une stratégie marketing classique, pour anticiper et réduire le churn, on procède notamment à des enquêtes régulières de satisfaction client. L’idée consiste à comprendre pourquoi des clients tournent le dos à une marque ou une entreprise et à utiliser leurs réponses pour améliorer les process de relation client afin d’augmenter leur fidélisation. Cela peut se faire en ajoutant une « étape d’enquête » dans le processus de résiliation, mais aussi en analysant vers quel concurrent les clients « churneurs » se dirigent. En effet, le marketing mix n’est peut-être pas en adéquation avec une part de la clientèle et il conviendrait de modifier la proposition de l’entreprise ou de la marque, afin de retenir les clients avant qu’il ne soit trop tard.

Comment prédire l'attrition des clients avec ETIC DATA ?

Si les enquêtes de satisfaction et l’élaboration de stratégie marketing de fidélisation réclament un investissement important en temps et en ressources financières aux responsables marketing, les algorithmes prédictifs d’ETIC DATA permettent aujourd’hui d’anticiper et réduire le taux de churn des entreprises. Le process est simple : nous collectons et nettoyons des données brutes qui permettent d’identifier l’individu, contenues dans les 6 champs suivants : NOM, PRÉNOM, MAIL, CP, ADRESSE, VILLE et la variable cible telle que par exemple l’information CHURNER / NON CHURNER, avec un historique de temps suffisant. Vient ensuite la phase d’enrichissement qui permettra de compléter ces données brutes, dites « First Party ». 

Sur cette base de données enrichie, notre processus de modélisation utilise les algorithmes de machine learning et plus précisément l’algorithme des « forêts d’arbres aléatoires » (Random Forest) dont le principe est de prédire un phénomène à partir d’observations passées. Il cherche à découvrir des corrélations significatives dans un jeu de données dans le but de créer un modèle prédictif. Cette modélisation permettra de classifier et d’attribuer une note de probabilité appelée « score d’appétence ». Ce score d’appétence permettra de classer les individus qui composent une base de données, du plus appétant au moins appétant. Cette classification permettra de se concentrer sur le ciblage des individus les plus pertinents avec un temps d’avance.

L’intérêt de notre solution basée sur les technologies du Machine Learning et sur l’Intelligence Artificielle est double : d’une part, nous produisons un modèle prédictif permettant d’affiner la compréhension du comportement à venir de sa clientèle. Et d’autre part, nous produisons un modèle prescriptif automatisé, permettant de connaitre les meilleurs scenarios pour conquérir chaque individu identifié à risque ou à potentiel afin d‘endiguer l’attrition et ainsi accélérer l’engagement de vos clients !

Vous l’aurez compris, aujourd’hui toutes les entreprises se préoccupent d’agir sur leur churn. À l’ère du Data Marketing prescriptif, des solutions métiers dites « intelligentes » car intégrant de l’Intelligence Artificielle créent la rupture avec les méthodes de segmentation et de ciblage traditionnelles pour mieux conquérir, fidéliser et satisfaire les clients.

Comment réussir son projet de modélisation prédictive ?

 

Venez nous rencontrer :

Salon AI Paris 2018image-plateforme

Partagez sur :

miniature-blog-gilles-ducharme-web

Interview Gilles R. Ducharme Ph.D.

Bonjour Gilles, pouvez-vous vous présenter ? Qui êtes-vous ? 

Je suis professeur à l'Université de Montpellier et chercheur à l'IMAG depuis 1994. L’IMAG est l'Institut de mathématiques de Montpellier. AG, c'est pour Alexander Grothendieck, médaillé Fields de notre laboratoire.

Quels sont vos domaines de recherches en statistiques ?

Mes recherches portent principalement sur la méthode du bootstrap, l'adéquation et la sélection de modèle, la classification par arbre et par forêt d'arbres. Mais également les applications de la statistique et de la data  à la biostatistique, l'écologie, la sécurité numérique et le marketing.

Si vous deviez nous donner un chiffre sur votre carrière ?

Ce serait « 22» parce qu’au cours de ma carrière, j’ai dirigé 22 thèses en statistique, biostatistique et data science. Et j'ai l'immense chance de voir mes étudiants à leur tour faire pour d'autres ce que j'ai fait pour eux, et qu'auparavant, on avait fait pour moi. C'est la grande roue de la vie scientifique !

Quel est votre parcours ?

Après des études post-doctorales à l'Université Berkeley en Californie j’ai été nommé professeur adjoint de recherche opérationnelle à l'Université de Montréal. Ensuite j’ai été promu professeur agrégé de statistique en 1988, pour devenir par la suite, professeur titulaire en 1994.

Après les Etats-Unis et le Canada, vous êtes donc venu à la rencontre de Montpellier, quel est votre rôle au sein de l’Université de Montpellier et de l’IMAG ?

Outre mes activités de professeur et chercheur à l'IMAG, j’ai créé la formation doctorale en biostatistique. En 2007, constatant la montée en puissance du phénomène big data et de la data science, j'ai mis sur pied le master MIND qui vise à former des data-ingénieurs. J'ai été également le directeur du Laboratoire de Probabilité et Statistique de l'IMAG.

Quelle est la genèse de votre partenariat avec ETIC DATA ?

Dès 2012, une des sociétés du Groupe ETIC s'est rapprochée du master MIND pour y recruter des data-ingénieurs, puis des thésards-CIFRE et futurs data-scientists. De ce rapprochement a découlé des sujets de réflexion en lien avec certaines thématiques de recherche de l'IMAG sur des sujets qu’ ETIC DATA souhaitait investiguer pour ses clients et en rapport avec les données dont elle disposait.

 

Vous souhaitez en savoir plus sur Gilles Ducharme ?

 
Gilles Ducharme2

Gilles R. DUCHARME Ph.D.

Professeur chercheur

INSTITUT MONTPELLIÉRAIN ALEXANDER GROTHENDIECK
(IMAG-CNRS) - UNIVERSITÉ DE MONTPELLIER

Venez nous rencontrer :

Salon AI Paris 2018image-plateforme

miniature-blogV2

Salon e-marketing – 10, 11 & 12 avril 2018

Retrouvez-nous pour une conférence unique de 45 minutes
sur le thème de la "Data Intelligence et Fidélisation"

Salon e-marketing édition 2018

Les 10, 11 et 12 Avril prochains ne manquez pas le rendez-vous incontournable des Marketeur. Cette année, le fil rouge du salon e-marketing vous accompagnera autour de la thématique "Du Data Driven au people drive : ré-humaniser le e-marketing"

Le salon e-marketing 2018 offre une opportunité unique de vous informer et networker avec l’ensemble des acteurs du marché, à travers 3 jours de conférences, ateliers produit, rendez-vous d’affaires, rencontres avec +320 exposants et +16 000 visiteurs…

Aujourd’hui, les innovations transforment fondamentalement les pratiques du e-marketing. Les pouvoirs infinis de l’intelligence artificielle et du machine learning sont aujourd'hui au service du marketing. Les marketeurs profiteront de ce salon pour comprendre ces outils technologiques et mieux les utiliser voire même les transcender.

Salon e-marketing

16 000 visiteurs     27 workshops    320 exposants    + 100 ateliers produits & conférences

Data Intelligence & Fidélisation : "Comment prédire et prescrire l’appétence client sans être data scientist ?"

Conférence ETIC DATA Mardi 10 avril 2018 - 15H45 à 16H30 - SALLE 2

En pleine transformation numérique, les directions Marketing et Relation Client voient leur métier évoluer. Le défi actuel réside aujourd’hui pour l’entreprise dans sa capacité à analyser et à activer en temps réel la bonne information pour déployer une stratégie « user centric » réellement pertinente et génératrice de revenus.
Les avancées technologiques et scientifiques avec l’explosion des big data contribuent aujourd'hui à donner un avantage concurrentiel majeur pour les entreprises prêtes à tirer profit des nouvelles technologies prescriptives.

 

Au cours de cette conférence :

⟩⟩ Nous vous présenterons le retour d’expérience d’une entreprise connue dans l’univers du tourisme et ayant intégré une couche cognitive à son dispositif d’activation client pour accélérer sa croissance. Quels investissements ? pour quels résultats business ?

⟩⟩ Nous illustrerons notre propos par une démonstration en direct du processus de modélisation permettant de générer des recommandations ultra personnalisées vers les individus à fort potentiel d’évolution.

A l’issue de cette présentation vous aurez toutes les clés pour concevoir et déployer en toute autonomie un modèle prédictif robuste à partir de vos données brutes.

Téléchargez la présentation de la conférence 

Contact - Demande Présentation Emarketing

Conférence animée par :

président-groupe-etic

Serge Lara
Président Groupe ETIC

data-scientist

Maximilien Dossa
Data Scientist

chef-de-projet

Dominique Fourleignie
Chef de projet

 ETIC DATA vous apporte des solutions concrètes
pour anticiper les mouvements de vos clients :

 


miniature-blog-data-science

Zoom sur le concept de Data Science

Zoom sur le concept de Data Science

Data Science, « Science des données » en français, est une jeune discipline. En effet elle a moins de 25 ans. La Data Science consiste à générer de la valeur à partir de données brutes. L'arrivée de la Data Science en entreprise, avec le Big Data, l'IA et le Machine Learning, est un véritable enjeu pour les équipes.

 

Quel est le lien avec le Big Data, l’IA et le Machine Learning ?

L’essor de la Data Science est récente, avec l’apparition du Big Data – Big Data Analytics. Mais ce n’est pas tout, l’intérêt grandissant pour les techniques de Machine Learning (apprentissage automatique) et d’Artificial Intelligence (IA - Intelligence Artificielle) a permis la montée en puissance de la Data Science et l’ouverture de ses champs d’actions. Nous allons maintenant voir en quoi la Data Science est un enjeu majeur pour les entreprises.

 

Quel est l’enjeu pour les entreprises ?

Aujourd’hui le volume des Data explose et le phénomène Big data est à son apogée. L’enjeu pour les entreprises est de prendre un temps d’avance sur leurs concurrents en déployant une stratégie Data Centric. Ainsi, il s’agit d’activer en temps réel les informations utiles et pertinentes, appelées également « smart data », pour : augmenter la valeur client, améliorer l’expérience et optimiser la GRC (Gestion de la Relation Client), tout en optimisant les coûts et investissements. Ces enjeux concernent tous les services de l’entreprise.

 

Que se cache derrière le métier de Data Scientist ?

Le métier de Data Scientist est considéré comme "le meilleur métier du monde" selon Glassdoor. Aujourd'hui le poste de Data Scientist est central dans les entreprises engagées dans une stratégie "Data Centric". Selon le magazine « LeBigData.fr » un Data Scientist au niveau technique doit :

1 / Être diplômé d’une formation d’Analyste

2/ Avoir des connaissances en Statistiques

3/ Maîtriser les outils analytiques

4/ Connaître les langages de programmation

5/ Avoir des notions de Machine Learning

6/ Comprendre l'algèbre linéaire et les fonctions de plusieurs variables

7/ Savoir utiliser Hadoop

8/ Connaître la programmation SQL

9/ Gérer des données non structurées

10/ Avoir des compétences en ingénierie logicielle

 

[1] Références

Escoufier, Y. , Fichet, B., Diday, E., Lebart,L., Hayashi, C., Ohsumi, N., Baha, Y. (1995) : Preface to “Data science and its application - La science des données et ses applications”. Escoufier et al. ed. , Academic Press, Tokyo. 

Ohsumi, N. (2000) : From data analysis to data science. In Proceedings of the 7th conference of the International Federation of Classification Societies (IFCS-2000), Kiers et al. Ed. Springer. ISBN-13:978-3-540-67521-1.

La data science au service de la connaissance client

image-3-page-partenaire-

Demandez une web démo personnalisée avec nos experts Data

plateforme

Partagez sur :

Vous souhaitez en savoir plus sur la technologie ETIC DATA ?

 
miniature-blog-new-machine-learning

Le Machine Learning en 5 points

Pour les entreprises d’aujourd’hui, en pleine mutation et transformation digitale, prendre le tournant du Machine Learning, mais également du Big Data et de l’Intelligence Artificielle est primordial pour anticiper les évolutions de leur marché et prendre un temps d’avance sur leurs concurrents. Comme nous le rappelle "Les Echos", dans le domaine de l'IA aujourd'hui, il faut penser vite et voir grand pour créer l'écart avec ses concurrents.

Pour les équipes opérationnelles (marketing, commerciales...) l’analyse des données et les algorithmes de modélisation prédictive constituent un véritable outil d’aide à la prise de décision permettant ainsi d’intégrer une « brique » cognitive aux dispositifs existants.

Maximilien Dossa, Data Scientist au sein d'ETIC DATA nous éclaire sur la notion de Machine Learning, très souvent employée aujourd’hui mais parfois complexe à comprendre.

 

1/ Quelle est la tendance en matière de Machine Learning ?

En plein dans le phénomène du Big Data, on assiste à l’utilisation conjointe de quantités massives d’informations et d’algorithmes d’apprentissages. Ce duo rend possible la solution de problèmes considérés il y a peu comme inaccessibles.
Grâce au progrès récent du Machine Learning, des programmes sont aujourd’hui capables de réaliser de nombreuses tâches. Par exemple, il peuvent agir dans le domaine médical pour des diagnostics ou encore identifier des parcours d'achat.
L’approche par le Machine Learning fait le pari qu’il est possible de construire des systèmes autonomes. Ceux-ci sont « éduqués » sur la base d’un corpus d’exemples pertinents, permettant de caractériser toutes observations ou comportements humains.

2/ Les principes généraux du Machine Learning

Le principe du Machine Learning est de prédire un phénomène à partir d’observations passées. Il cherche à découvrir, de manière autonome, des corrélations significatives dans un jeu d’observations entre un fait (un acte d’achat par exemple) appelé la cible et diverses données (âge, sexe, profession…) appelées variables. Ces corrélations sont stockées dans un objet mathématique, un classifieur et l’ensemble forme un modèle prédictif.

 

3/ L’importance d’avoir un processus de Machine Learning « robuste »

La qualité du classifieur, ou du modèle prédictif, dépend de la robustesse des règles détectées. Pour extraire des règles robustes il faut d’une part avoir des données riches afin de pouvoir en observer le plus grand nombre. D’autre part il faut pouvoir analyser chacune d’entre elles pour stocker uniquement les plus pertinentes. La réussite d’un processus de Machine Learning réside donc à la fois dans la qualité et la richesse des données observées. Mais également dans les méthodologies statistiques utilisées pour analyser chacune de ces observations.

 

4/ Un facteur influençant : la richesse des bases de données

Caractéristiques des bases de données

Pour permettre la construction de modèles prédictifs robustes les bases de données doivent être « riches », c’est-à-dire être composées à la fois de variables de profils et de variables comportementales. Malheureusement ces bases de données sont coûteuses et sont de ce fait rares.

Contexte d'analyse de comportement humain

Dans le contexte d’analyse de comportement humain qui est le nôtre, il est courant d’avoir, dans une base de données un nom, un prénom ou une adresse postale mais très rare d’avoir des informations sur l’âge, la composition du foyer ou encore la profession d’un individu. Les données disponibles ont généralement un faible pouvoir discriminant et ne permettent pas aux algorithmes d’exprimer leur pleine puissance. Pour pallier cet inconvénient, il faut aller chercher des données ailleurs, dans des sources externes et utiliser des méthodologies d’enrichissement permettant de les exploiter au mieux.

 

5/ La stratégie d’ETIC DATA

Méthodologies du Machine Learning

En fonction des problématiques traitées il existe plusieurs méthodologies envisageables. Parmi les plus courantes, on peut mentionner les réseaux de neurones, les machines à vecteurs de support, les arbres de classification ou encore les forêts aléatoires.

Choix des forêts aléatoires

ETIC DATA a fait le choix des algorithmes d'apprentissage se basant sur le principe des forêts aléatoires. En effet, elles sont particulièrement bien adaptées dans le contexte marketing d’analyse de comportement. Ces méthodes se sont beaucoup développées ces dernières années et sont devenues très performantes au point que certains pensent maintenant qu’elles ont atteint un plateau en termes de résultats. Partant de ce constat, le principal levier pour augmenter la robustesse des analyses de Machine Learning réside dans les données utilisées.

Technologie-ETIC-DATA

Source : ETIC DATA

Auteur

visuel-blog

Maximilien Dossa

Data Scientist

La data science au service de la connaissance client

image-3-page-partenaire-

Demandez une web démo avec nos experts Data

plateforme

Partagez sur :

Vous souhaitez en savoir plus sur la technologie ETIC DATA ?

 
logo-etic-data-blc-200-100-web

Inscription à notre newsletter

Inscription à la newsletter

ETIC DATA
244 rue Claude François
34080 Montpellier

contact@etic-data.com

Copyright 2017 © Tous droits réservés