Data Mining : facteur de compétitivité des entreprises



Documents pareils
Groupe Eyrolles, 2004 ISBN :

Agenda de la présentation

Introduction au datamining

Atelier Symposium MicroStrategy

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

le mot des dirigeants

CHARTE DE GESTION DES COOKIES

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux

QU EST-CE QUE LE DECISIONNEL?

We make your. Data Smart. Data Smart

Analyse de grandes bases de données en santé

L information et la technologie de l informationl

Attention : Ce document est un travail d étudiant, il n a pas été relu et vérifié par Marketing-etudiant.fr.

Base de données clients outil de base du CRM

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.)

EXPERTISE SYSTÈME D INFORMATION GÉOGRAPHIQUE

Comment capitaliser sur votre audience pour activer intelligemment vos plans médias et marketing?

SI assurance démarche et principe de construction. Alger le 29 mai 2006

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

Les Français jugent leurs assureurs

Introduction au Data-Mining

Gestion des Donnés Métier de Référence

Cybermarché et analyse comportementale

Big Data et Marketing : les competences attendues

groupesolucom Devenez architecte d infrastructure

Spécificités, Applications et Outils

4.2 Unités d enseignement du M1

S84-1 LA GRC ET LE SI (Système d Information) Qualification des données clientèle La segmentation de la clientèle

AXIAD Conseil pour décider en toute intelligence

Qui sommes-nous? Expertises. Chiffres clé. Premier intégrateur mondial des technologies Microsoft. Références Avanade Inc. All Rights Reserved.

Les comportements d achats multicanaux des internautes 9 ème baromètre FEVAD-Médiamétrie//NetRatings. extraits

CONSULTANT EN MOA ET ORGANISATION ASSURANCE Compétences : Audit stratégique/organisationnel / Assurance (Prévoyance / Santé / IARD)

Travailler avec les télécommunications

DESCRIPTIF DE MODULE S5 GSI

Des données à la connaissance client. A la découverte de la plateforme de connaissance client knowlbox

Connaissance Client et Digital : quels enjeux pour quelles valeurs? Non à la personnalisation bidon! Vente Privée Orange Gan Assurances

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Intégrer le CRM : quelle utilité, quels profits pour ma PME?

Table des matières. Partie I Concevoir le commerce électronique 7. Liste des études de cas Introduction 1 Les auteurs 5

Note partielle sur le E-Commerce

Accélérer l agilité de votre site de e-commerce. Cas client

Le NOUVEAU PROGRAMME de BDD juxtaposée multicanal

Les contacts Opti-Décision en relation avec cette présentation sont: Johann Grennepois Gérant. Tél: +33 (0) Port: +33 (0)

LA TRIBUNE. Atelier BNP Paribas. 23 novembre 2011

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Données des SIM. Données signalétiques (nom, adresse), Historique d achat, Réactions passées aux actions de promotion

Le téléphone occupe une place croissante dans la stratégie relation client des sites Internet transactionnels

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

Oxybul éveil et jeux

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 27/01/2009 Stéphane Tufféry - Data Mining -

Apprentissage Automatique

Complet Intuitif Efficace. Références

LES ENTREPOTS DE DONNEES

" # $ % % & ' ( ) * +,! '()*+ *, + ' +' + ' ' /0 / * 0 4 * 0 6! "##$ % &!

e-crm Augmentez vos revenus grâce au e-crm

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives *************

La gestion de la relation client E-CRM

AGENCE COMMERCIALE ENTREPRISES AQUITAINE NORD

LE COMMERCE CONNECTÉ SHOW

8, 9 & 10 AVRIL 2014 RELATION CLIENTS EXPLOITATION DES DONNÉES E-RÉPUTATION AGENT VIRTUEL CRM

CGI Business Consulting

Améliorer les performances du site par l'utilisation de techniques de Web Mining

Fidélisation client : Nouvelles tactiques pour un site E- Commerce rentable

Les experts du changement comportemental

BIG DATA : comment étendre et gérer la connaissance client? François Nguyen SFR Directeur SI décisionnel & Mkt relationnel GP

Algèbre 40 Analyse Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS

Entrepôt de données 1. Introduction

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Partie I Stratégies relationnelles et principes d organisation... 23

La problématique. La philosophie ' ) * )

Gestion de la relation client : l expérience du Crédit du Nord

Solutions Décisionnelles SPAD. La maîtrise des données, l'art de la décision

données en connaissance et en actions?

RAMOS BELLO Laura Comment la culture de chaque agence PANALPINA va-t-elle influencer les enjeux de la mise en place du CRM?

Hardis Group Jeudi 28 mai 2015

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Le terme «ERP» provient du nom de la méthode MRP (Manufacturing Ressource Planning) utilisée dans les années 70 pour la gestion et la planification

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Le data mining et l assurance Mai Charles Dugas Président Marianne Lalonde Directrice, développement des affaires

INTELLIGENCE MARKETING ETUDES DE MARCHE - DATA MINING - CONSEIL EN MARKETING - SYSTEMES D INFORMATION MARKETING

1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

2014 fondation BVA Services marketing direct Allmedia.15

Bases de Données Avancées

L INTÉGRATION ENTRE BUSINESS INTELLIGENCE ET WEB ANALYTICS

37, rue d Amsterdam Paris Tél. : Fax :

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Illustrations concrètes : cross selling et up-selling. Illustrations concrètes : la relation client - le social et l ing

Conseil et Ingénierie des Systèmes d Information d Entreprise

Le Mot Des Dirigeants

Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie

2011

Mémo technique. LE CRM (Customer Relationship Management) Gestion de la Relation Client

LES INTERVENANTS. Technologie d'attribution marketing. Technologie d optimisation de campagnes SEM. Conseil Agence Intégrateur.

Comment enfin gagner de l argent avec son SAV? Laurent Mellah, Cepheus Group Alain Bellange, Keonys

overmind La solution précède le problème 2008 Overmind - All rights reserved

Coheris est agréé organisme de formation, n d agrément

L analyse de la gestion de la clientèle

Transcription:

Data Mining : facteur de compétitivité des entreprises Paris, le 18 Juin 2001. René Lefebure rlf@softcomputing.com Soft Computing 46, rue de la Tour 75116 Paris Tél : 01 73 00 55 00 Fax : 01 73 00 55 01 www.softcomputing.com

Sommaire 1. Présentation de Soft Computing 2. Positionnement du Data Mining 3. Les Apports des Techniques Nouvelles 4. Les apports dans l inter-activité 5. Les défis du Data Mining 6. Références 2

Soft Computing : une mission claire et précise Structurer les données disponibles surles clients etles marchés pour les rendre plus facilement accessibles et utilisables D ata warehouse Transformer ces données en informations puis en connaissances pour guider dans les décisions etles actions E xploiter cette connaissance pour personnaliser la relation et augm enterla valeur individuelle des clients e-com merce Valorisation du Capital Client Web mining Data mining Personnalisation Sales force automation (SFA) R eco m m a ndations en ligne Coordination multicanaux Gestion de campagnes (EMA) 3

Vue d ensemble de la cartographie des compétences x-crm : l entreprise relationnelle Compétences métiers Expertises sectorielles Maîtrise des technologies Stratégie Organisation Marketing Technologie Outsourcing Etudes d opportunités Diagnostic Analyse de la valeur Datamining et webmining Stratégie x-crm Diagnostic des process Définition des process Conception de systèmes Fiche de postes Change Management Stratégie marques Opérations de recrutements Marketing direct on&offline Systèmes de fidélisation Régie publicitaire Datawarehouse Décisionnel SFA et EMA Marketplace ecommerce EAI et ETL Sécurité & systèmes Gestion de bases Marketing Traitement adresses Géomarketing Datamining Services financiers Telecom & ISP Distribution, VPC Industries Tourisme & transport Santé & PGC Retail banking Private banking Brokers & ebrokers Assurances Opérateurs B2C Opérateurs B2B Providers Internet Hyper et super Distribution spécialisée VPC B2C VPC B2B ecommerce Automobile Chimie Utilities Tour opérateurs Parcs de loisirs Transporteurs Compagnies aérienne Pharma & cosméto Electronique Agro-alimentaire Edition musique & Presse Face to face ecommerce Call center Marketplace Database marketing Siebel Vantive Onyx Commerce Serv Websphere Broadvision epiphany Conso+ Point Webmethods Ariba Datastage Oracle Teradata Sqlserver Prime, marketic Sas, IBM, Spss 4

Une expertise formalisée! Un positionnement en expertise marketing Le Data Mining Eyrolles 2001 Prix du meilleur livre informatique, décerné par l'afisi Gestion de la Relation Client Eyrolles 2000 5

Sommaire 1. Présentation de Soft Computing 2. Positionnement du Data Mining 3. Les Apports des Techniques Nouvelles 4. Les apports dans l inter-activité 5. Les défis du Data Mining 6. Références 6

L opposition exploratoire et confirmatoire! Approche confirmatoire " Poser une hypothèse : H1/H0 " Valider l hypothèse avec les tests statistiques " Techniques statistiques " Problème : avoir du temps. et de l imagination!! Approche exploratoire " Collecter des données " Explorer l espace des dimensions " Techniques inductives " Problème : savoir naviguer dans les données et les techniques! 7

Le positionnement entre les statistiques et les outils d analyse automatique Modèle Modèle d équations d équations Réseau Réseau de de neurones neurones Techniques Techniques de de régression régression Rétropopagation Rétropopagation Logistique Logistique Discriminante Discriminante Ensembles Ensembles flous flous Données Données Analysées Analysées Analyse Analyse logique logique Règles Règles Arbres Arbres de de décision décision Analyse Analyse de de panier panier Algorithme Algorithme Génétique Génétique Moteur Moteur d induction d induction Moteur Moteur bayesien bayesien Techniques Techniques statistiques statistiques Techniques Techniques de de projection projection Analyses Analyses factorielles factorielles Analyses Analyses de de typologie typologie Classif. Classif. hiérarchique hiérarchique Nuées Nuées dynamiques dynamiques Carte Carte de de Kohonen Kohonen Il est toujours possible de répondre à une même problématique par plusieurs techniques! 8

Le choix des techniques ne dépend pas que des critères de performance Etudier prédire Pouvoir de prédiction Faible Elevé Faible Réseaux de neurones Algorithmes génétiques Réseaux bayesiens Scores Régression Cluster Lisibilité des résultats Arbres de décision Systèmes experts Analyse d'association Raisonnement à base de cas Elevé Voir et résoudre Il est souvent plus efficace d avoir un modèle sous-optimal dans certains cas! 9

Un constat : une explosion des données client Source Soft Computing La multiplicité des moyens de collecte de l information (Internet, call center, contact direct, mailing, enquête ) et les capacités de stockage favorisent la croissance du volume de données qui se rapporte à chaque client. 10

Qui concerne l ensemble des secteurs d activités L info déluge 11 VPC Santé Compagnies aériennes Telecommunications Grande distribution Banque/Assurance Le volume des données est doublé tous les 18 à 24 mois.

Échapper à l'utopie Données disponibles : +150 % / an Productivité actuelle : 2j / ciblage 8j / analyse factorielle... En 2015, les statisticiens représenteraient plus de 50% de la population active!! Besoins d'études : +45 % / an Les algorithmes de data mining sont une réponse au besoin croissant d'industrialisation des études de données 12

Spécificités du data mining " Non limitées aux données numériques : les nouvelles techniques permettent de traiter des types de données différents : son, texte, image, objet. " Capacité d'auto-organisation : les nouveaux algorithmes sont des processus auto-organisateurs guidés par les données, alors que les statistiques s appuient sur un processus de vérification d hypothèses guidé par un utilisateur. " Facilité d'utilisation : une partie des nouveaux algorithmes peut être utilisée par des utilisateurs métiers dans la résolution de problèmes et l aide à la décision. " Puissance de recherche : les nouveaux algorithmes parcourent de manière automatique l ensemble des combinaisons possibles. " Scalabilité : les nouveaux algorithmes sont optimisés pour traiter des volumes importants de données (enregistrements et variables) en phase d analyse. 13

Sommaire 1. Présentation de Soft Computing 2. Positionnement du Data Mining 3. Les Apports des Techniques Nouvelles 4. Les apports dans l inter-activité 5. Les défis du Data Mining 6. Références 14

Les analyses d association Identification des opportunités de ventes croisées 15

Les «toiles» d association Produits bois Contre marque Papier peint Droguerie Vivaces Peinture et Crépis Conifères Fruit Travaux entretiens intérieurs Engrais Potager Rosiers Climatisation Préparation des fonds Beaux arts Pinceaux- Rouleaux Moteurs de rechange Accessoires et consommables Cave Fournitures Location Sangles Fixation Création articles magasin Piétements roulements Papier peint Plafonds Tronçonneuses Pièces commandées Pièces détachées Typique d un rayon rayonnant 16

Les réseaux bayesiens Objet Montant Durée Sain Contentieux 17

Les recherches de causalité en étude de satisfaction La qualité des produits et services La qualité des produits et services Le niveau des tarifs Le niveau des tarifs Satisfaction Globale La clarté de facturation L'information sur les produits et services Le conseil La simplicité des démarches La compétence des interlocuteurs La disponibilité des interlocuteurs Satisfaction Globale La clarté de facturation L'information sur les produits et services Le conseil La simplicité des démarches La compétence des interlocuteurs La disponibilité des interlocuteurs Le temps d'attente Le temps d'attente L'orientation vers le bon interlocuteur L'orientation vers le bon interlocuteur L'amabilité des interlocuteurs L'amabilité des interlocuteurs L'accueil L'accueil Document IPSOS-Satisfaction 18

Les réseaux de neurones Couche : liens cachés Couche : Entrées Couche : sortie Unité cachée 19

La détermination de la Life Time Value 2 Marge des ventes croisées 3 Valeur Nette Client 1 4 Cycle de la relation 20

La validation de la durée sur l historique Exemple DUREE 1 DUREE 2 DUREE 3 DUREE 4 DUREE 5 DUREE 6 DUREE 7 DUREE 8 DUREE 9 DUREE 10 Fonction de survie suivant la durée de vie prévue 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 28% 41% 47% 53% 14% 57% 29% 62% 36% 66% 41% 13% 69% 45% 28% 0 3 6 9 12 15 18 21 24 27 30 33 36 39 42 Nombre de mois 77% 74% 51% 35% 55% 40% 60% 66% 64% 45% 50% 54% 59% 65% 63% 65% des cartes créées en 1997 pour lesquelles nous avons prévu une durée de vie très longue, sont encore en activité au début de leur 3ème année de vie 13% des cartes créées en 1997 pour lesquelles nous avons prévu une durée de vie très courte, sont encore en activité au début de leur 3ème année de vie (72% sont mortes après 12 mois d activité, 86% après 24 mois) 21

La détermination du potentiel Exemple Reclassement des porteurs par rapport aux tranches de CA observées : CA nul CA Observé CA moyen CA élevé CA nul CA moyen CA élevé CA Prédit On distingue bien la diagonale, signe que le reclassement des clients dans leur tranche d origine est fiable. 22

A la poursuite de la valeur client Valeur Économique entrepôt comptabilité ana Valeur Compétitive Valeur Potentielle valeur économique multipliée valeur compétitive critères de perception modélisation Applications du Data Mining 23

L optimisation de la valeur client Comment augmenter les revenus? Comment diminuer les coûts? La multiplication des canaux et des moyens d interactions avec le client posera de manière de plus en plus forte la pertinence du contenu et la justification économique des investissements marketing Document Unisys 24

Sommaire 1. Présentation de Soft Computing 2. Positionnement du Data Mining 3. Les Apports des Techniques Nouvelles 4. Les apports dans l inter-activité 5. Les défis du Data Mining 6. Références 25

La constitution des fichiers logs Chaque action sur le site correspond à une requête HTTP (click, bandeau de publicité, ) qui est envoyée au serveur Web Serveur WEB Look 2000-05-19 20:28:31 195.127.1.190 - W3SVC1 JCH 195.127.1.199 80 GET /images/logosc.gif - 304 0 140 439 0 HTTP/1.1 jch Mozilla/4.0+(compatible;+MSIE+5.01;+Windows+NT+5.0) time=10%3a58%3a32;+date=18%2f05%2f2000;+vote=195%2e127%2e1%2e199;+nom=jc;+aspsessionidqqqggrdc=paahpbncap GAEBGPCDGLHJKK http://jch/ Ces actions sont stockées sur un fichier texte dont l extension est.log d où le nom de fichiers log 2000-05-19 21:15:27 195.127.1.190 - W3SVC1 JCH 195.127.1.199 80 POST /chercher.asp - 200 0 89 597 151 HTTP/1.1 jch Mozilla/4.0+(compatible;+MSIE+5.01;+Windows+NT+5.0) time=10%3a58%3a32;+date=18%2f05%2f2000;+vote=195%2e127%2e1%2e199;+nom=jc;+aspsessionidqqqggrdc=bbahpbncnh EDPGIIGLLDGGIA http://jch/ #Fields: date time c-ip cs-username s-sitename s-computername s-ip s-port cs-method cs-uri-stem cs-uri-query sc-status sc-win32-status scbytes cs-bytes time-taken cs-version cs-host cs(user-agent) cs(cookie) cs(referer) 26

L architecture du système de recommandations ON-LINE Clicks sur fiche produit Extraction OFF-LINE Fichier des clicks produits Id client ; Id Session ; Id produit Id client ; Id Session ; Id produit Id client ; Id Session ; Id produit Id client ; Id Session ; Id produit Serveur WEB Chargement dans l outil Recommandations Moteur Moteur Association Association SC SC Fichier des recommandations Constitution du fichier Identifiant produit1 ; Reco 1 ; Reco 2; Reco 3 Identifiant produit2 ; Reco 1 ; Reco 2; Reco 3 Identifiant produit3 ; Reco 1 ; Reco 2; Reco 3 27

Les associations sur Amazon.com La capacité d associer dynamiquement des produits complémentaires : cross selling La capacité de proposer des produits adaptés aux centres d intérêts du client dès la première page. 28

Les campagnes Email sur des associations 29

Sommaire 1. Présentation de Soft Computing 2. Positionnement du Data Mining 3. Les Apports des Techniques Nouvelles 4. Les apports dans l inter-activité 5. Les défis du Data Mining 6. Références 30

La réduction de la phase de préparation des données 31

L intégration des données textuelles 32

La création dynamique des agrégats Variables d entrée Cible Variables explicatives Individus.............................. Variable à expliquer.............. 33

L intégration et la diffusion des informations 34

Sommaire 1. Présentation de Soft Computing 2. Positionnement du Data Mining 3. Les Apports des Techniques Nouvelles 4. Les apports dans l inter-activité 5. Les défis du Data Mining 6. Références 35

Références pertinentes Informations commerciales : efr@sotcomputing.com 46, rue de la Tour 75116 Paris - France Phone: 01 73 00 55 00 Fax: 01 73 00 55 01 www.softcomputing.com

Des expertises verticales pointues dans tous les secteurs pour lesquels le client compte Industrie 13% Services 4% Telco 3% Santé 1% Edition média 1% Banque assurance 41% Tourisme transport 14% Disitribution VPC 23% 37

Extrait de références : avec tous ceux pour qui le Client compte... Banque Assurance Distribution VPC Télécom Banque Worms, BBL, BNP, Caisse d Epargne, CCF, CPR Online, Crédit Agricole, Crédit du Nord, Cofinoga, Comdirect, JP-Morgan, Oddo- Pinatton, Selftrade, Société Générale,UBP AGF, AXA, Autofirst, Azur, DAS, Fortis, Groupama, Lloyd s, La Mondiale, MMA, Eurofil, Okassurance Agrigel, Casino, Castorama, Club Avantages, Fnac, Match, Mistergoodeal, Printemps, Système U, Promocash, Surcouf, Totalfinaelf, Yves Rocher 3 Suisses, Aucland, Daxon, Eveil et Jeux, Fnac.com, Guilbert, JPG, France Loisirs, Grand Livre du Mois, IMP, Radiospares, La Redoute, Yves Rocher 9 Telecom, Bouygues Telecom, Debitel, France Telecom, PPR Interactive, Mageos, UUNet Transport/tourism e Air France, Club Med, DHL, Eurodisney, Nouvelles Frontières, Pierre et Vacances, SNCF, UCPA Industrie Alcatel, EDF, Fenwick Linde, GDF, Lex Manutan, Michelin, Provimi Renault, PSA PGC Petit Bateau, L oréal, Orcanta, Yves Saint Laurent Parfums, Sony Santé Smithkline Beecham, Glaxo Welcome, Ratiopharm Média L alsace, Bertelsmann, EMI Music, Havas Interactive, RTL, TF1, Noos, Europe Régie 38