miniature-blog-projet-data-web

Data Analytics : comment réussir son projet de modélisation prédictive ?

Vous souhaitez initier un projet en Analytics Predictif et Prescriptif et vous vous posez des questions sur les conditions de succès ? Il nous a semblé utile de vous partager quelques retours d’expérience.

Transformez vos "Big Data" en "Smart Data"

Comme vous le savez la donnée reste le pré-requis pour démarrer un projet de marketing prédictif. La problématique rencontrée par la plupart des professionnels du Marketing et de la Relation Client peut se résumer en une question :

Comment transformer la big data en smart data pour anticiper la demande et ainsi améliorer son ciblage et sa communication ?

Un conseil est de recourir aux outils du marché intégrant de l’IA qui permettent d’automatiser le processus d’analyse et d’enrichissement de la donnée brute permettant ainsi de faire gagner aux équipes un temps précieux dans la mise en œuvre de leur stratégie d’activation client.

Quand le choix est fait, il reste à définir un périmètre de cas d’utilisation pour démarrer plus rapidement et suivre les premiers résultats de manière ciblée et maitrisée.

Les périmètres peuvent se résumer en une ou plusieurs questions telles que :

  • Qui sont mes futurs « churners » ?
  • Qui dois-je contacter en priorité dans ma base prospects pour obtenir le meilleur ROI ?
  • A qui faut-il proposer une remise promotionnelle pour augmenter la conversion tout en maitrisant mes investissements ?

Démarrez votre projet avec ETIC DATA

Pour démarrer un projet avec ETIC DATA, l’initialisation du projet se fait avec une base de contacts de 5000 lignes (au minimum) et un minimum d’historique. En sachant que plus il y a d’historique meilleur sera l’apprentissage pour obtenir un modèle prédictif robuste.

Les prérequis à tous projets :

  • La quantité de données :

    • Ma base clients contient-elle une quantité de données suffisante : 5000 ligne est le strict minimum (pour les algorithmes ETIC DATA) .

  • La qualité de la donnée :

    • Mes données sont elle complètes ? correctes ? uniques ? et récentes ?

  • L'accessibilité de la donnée :

    • Ai-je la possibilité d’extraire simplement et facilement les données utiles pour la modélisation ?

  • La vérification des résultats :

    • Pour vérifier les prédictions lors de la phase d’apprentissage, ai-je les moyens d’accéder aux résultats obtenus lors des évènements passés ?

Si vous répondez par l’affirmative à ces 4 questions, vous êtes alors prêts pour démarrer un projet de modélisation prédictive utilisant les algorithmes d’ETIC DATA. Pour toute question, nos experts data scientists sont à votre disposition, n’hésitez pas à les solliciter.

Vous souhaitez en savoir plus sur la solution ETIC DATA ?

 
miniature-blog-data-science

Zoom sur le concept de Data Science

Zoom sur le concept de Data Science

Data Science, « Science des données » en français, est une jeune discipline. En effet elle a moins de 25 ans. La Data Science consiste à générer de la valeur à partir de données brutes. L'arrivée de la Data Science en entreprise, avec le Big Data, l'IA et le Machine Learning, est un véritable enjeu pour les équipes.

 

Quel est le lien avec le Big Data, l’IA et le Machine Learning ?

L’essor de la Data Science est récente, avec l’apparition du Big Data – Big Data Analytics. Mais ce n’est pas tout, l’intérêt grandissant pour les techniques de Machine Learning (apprentissage automatique) et d’Artificial Intelligence (IA - Intelligence Artificielle) a permis la montée en puissance de la Data Science et l’ouverture de ses champs d’actions. Nous allons maintenant voir en quoi la Data Science est un enjeu majeur pour les entreprises.

 

Quel est l’enjeu pour les entreprises ?

Aujourd’hui le volume des Data explose et le phénomène Big data est à son apogée. L’enjeu pour les entreprises est de prendre un temps d’avance sur leurs concurrents en déployant une stratégie Data Centric. Ainsi, il s’agit d’activer en temps réel les informations utiles et pertinentes, appelées également « smart data », pour : augmenter la valeur client, améliorer l’expérience et optimiser la GRC (Gestion de la Relation Client), tout en optimisant les coûts et investissements. Ces enjeux concernent tous les services de l’entreprise.

 

Que se cache derrière le métier de Data Scientist ?

Le métier de Data Scientist est considéré comme "le meilleur métier du monde" selon Glassdoor. Aujourd'hui le poste de Data Scientist est central dans les entreprises engagées dans une stratégie "Data Centric". Selon le magazine « LeBigData.fr » un Data Scientist au niveau technique doit :

1 / Être diplômé d’une formation d’Analyste

2/ Avoir des connaissances en Statistiques

3/ Maîtriser les outils analytiques

4/ Connaître les langages de programmation

5/ Avoir des notions de Machine Learning

6/ Comprendre l'algèbre linéaire et les fonctions de plusieurs variables

7/ Savoir utiliser Hadoop

8/ Connaître la programmation SQL

9/ Gérer des données non structurées

10/ Avoir des compétences en ingénierie logicielle

 

[1] Références

Escoufier, Y. , Fichet, B., Diday, E., Lebart,L., Hayashi, C., Ohsumi, N., Baha, Y. (1995) : Preface to “Data science and its application - La science des données et ses applications”. Escoufier et al. ed. , Academic Press, Tokyo. 

Ohsumi, N. (2000) : From data analysis to data science. In Proceedings of the 7th conference of the International Federation of Classification Societies (IFCS-2000), Kiers et al. Ed. Springer. ISBN-13:978-3-540-67521-1.

La data science au service de la connaissance client

image-3-page-partenaire-

Demandez une web démo personnalisée avec nos experts Data

plateforme

Partagez sur :

Vous souhaitez en savoir plus sur la technologie ETIC DATA ?

 
miniature-blog-new-machine-learning

Le Machine Learning en 5 points

Pour les entreprises d’aujourd’hui, en pleine mutation et transformation digitale, prendre le tournant du Machine Learning, mais également du Big Data et de l’Intelligence Artificielle est primordial pour anticiper les évolutions de leur marché et prendre un temps d’avance sur leurs concurrents. Comme nous le rappelle "Les Echos", dans le domaine de l'IA aujourd'hui, il faut penser vite et voir grand pour créer l'écart avec ses concurrents.

Pour les équipes opérationnelles (marketing, commerciales...) l’analyse des données et les algorithmes de modélisation prédictive constituent un véritable outil d’aide à la prise de décision permettant ainsi d’intégrer une « brique » cognitive aux dispositifs existants.

Maximilien Dossa, Data Scientist au sein d'ETIC DATA nous éclaire sur la notion de Machine Learning, très souvent employée aujourd’hui mais parfois complexe à comprendre.

 

1/ Quelle est la tendance en matière de Machine Learning ?

En plein dans le phénomène du Big Data, on assiste à l’utilisation conjointe de quantités massives d’informations et d’algorithmes d’apprentissages. Ce duo rend possible la solution de problèmes considérés il y a peu comme inaccessibles.
Grâce au progrès récent du Machine Learning, des programmes sont aujourd’hui capables de réaliser de nombreuses tâches. Par exemple, il peuvent agir dans le domaine médical pour des diagnostics ou encore identifier des parcours d'achat.
L’approche par le Machine Learning fait le pari qu’il est possible de construire des systèmes autonomes. Ceux-ci sont « éduqués » sur la base d’un corpus d’exemples pertinents, permettant de caractériser toutes observations ou comportements humains.

2/ Les principes généraux du Machine Learning

Le principe du Machine Learning est de prédire un phénomène à partir d’observations passées. Il cherche à découvrir, de manière autonome, des corrélations significatives dans un jeu d’observations entre un fait (un acte d’achat par exemple) appelé la cible et diverses données (âge, sexe, profession…) appelées variables. Ces corrélations sont stockées dans un objet mathématique, un classifieur et l’ensemble forme un modèle prédictif.

 

3/ L’importance d’avoir un processus de Machine Learning « robuste »

La qualité du classifieur, ou du modèle prédictif, dépend de la robustesse des règles détectées. Pour extraire des règles robustes il faut d’une part avoir des données riches afin de pouvoir en observer le plus grand nombre. D’autre part il faut pouvoir analyser chacune d’entre elles pour stocker uniquement les plus pertinentes. La réussite d’un processus de Machine Learning réside donc à la fois dans la qualité et la richesse des données observées. Mais également dans les méthodologies statistiques utilisées pour analyser chacune de ces observations.

 

4/ Un facteur influençant : la richesse des bases de données

Caractéristiques des bases de données

Pour permettre la construction de modèles prédictifs robustes les bases de données doivent être « riches », c’est-à-dire être composées à la fois de variables de profils et de variables comportementales. Malheureusement ces bases de données sont coûteuses et sont de ce fait rares.

Contexte d'analyse de comportement humain

Dans le contexte d’analyse de comportement humain qui est le nôtre, il est courant d’avoir, dans une base de données un nom, un prénom ou une adresse postale mais très rare d’avoir des informations sur l’âge, la composition du foyer ou encore la profession d’un individu. Les données disponibles ont généralement un faible pouvoir discriminant et ne permettent pas aux algorithmes d’exprimer leur pleine puissance. Pour pallier cet inconvénient, il faut aller chercher des données ailleurs, dans des sources externes et utiliser des méthodologies d’enrichissement permettant de les exploiter au mieux.

 

5/ La stratégie d’ETIC DATA

Méthodologies du Machine Learning

En fonction des problématiques traitées il existe plusieurs méthodologies envisageables. Parmi les plus courantes, on peut mentionner les réseaux de neurones, les machines à vecteurs de support, les arbres de classification ou encore les forêts aléatoires.

Choix des forêts aléatoires

ETIC DATA a fait le choix des algorithmes d'apprentissage se basant sur le principe des forêts aléatoires. En effet, elles sont particulièrement bien adaptées dans le contexte marketing d’analyse de comportement. Ces méthodes se sont beaucoup développées ces dernières années et sont devenues très performantes au point que certains pensent maintenant qu’elles ont atteint un plateau en termes de résultats. Partant de ce constat, le principal levier pour augmenter la robustesse des analyses de Machine Learning réside dans les données utilisées.

Technologie-ETIC-DATA

Source : ETIC DATA

Auteur

visuel-blog

Maximilien Dossa

Data Scientist

La data science au service de la connaissance client

image-3-page-partenaire-

Demandez une web démo avec nos experts Data

plateforme

Partagez sur :

Vous souhaitez en savoir plus sur la technologie ETIC DATA ?

 
logo-etic-data-blc-200-100-web

Inscription à notre newsletter

Inscription à la newsletter

ETIC DATA
244 rue Claude François
34080 Montpellier

contact@etic-data.com

Copyright 2017 © Tous droits réservés