Industrialiser le data mining Enjeux et perspectives
|
|
|
- Marie-Jeanne Angèle Gilbert
- il y a 10 ans
- Total affichages :
Transcription
1 Industrialiser le data mining Enjeux et perspectives Françoise Fogelman Soulié 8èmes journées francophones Extraction et Gestion des Connaissances INRIA Sophia Antipolis Méditerranée 29 janvier - 1er février 2008
2 Agenda Le Data Mining industriel Un peu d histoire Les données Les défis Quelques exemples 2
3 Un peu d histoire En 1991, nous bataillions sur les MLP Early stopping, Optimal Brain Damage, Weight Decay Avril 1991 Snowbird Learning Workshop Un nouveau nom & un titre bizarre Pour moi, Vapnik a apporté une révolution Un beau cadre mathématique 3
4 Un peu d histoire En 1991, nous bataillions sur les MLP Early stopping, Optimal Brain Damage, Weight Decay Avril 1991 Snowbird Learning Workshop Un nouveau nom & un titre bizarre Pour moi, Vapnik a apporté une révolution Un beau cadre mathématique Mais aussi Un cadre opérationnel Expliquant beaucoup des «trucs» réseaux de neurones Les SVM ont suivi Un mécanisme puissant pour contrôler la production de modèles (SRM) Nous avons construit notre software data mining KXEN sur la SRM Il a fallu bien sûr beaucoup d astuces dans la mise en œuvre informatique! 4
5 Un peu d histoire Qu est ce qui s est passé d autre? Andrew Moore, KDD 06 5
6 Données Le volume des données a explosé Dans les années 90 A l Ecole Modulad 1992 Aujourd hui Transactions Web Fayyad, KDD 2007 Yahoo! 16 B événements / jour 425 M visiteurs / mois 10 TO données data / jour RFID Jiawei,Adma 2006 Un distributeur avec magasins, vendant items / jour / magasin 300 M événements / jour Réseau social Kleinberg, KDD 07 Labo de recherche (entreprise) : réseau de 436 nœuds sur 3 mois Grande université : réseau de nœuds sur 2 ans Communauté blog LiveJournal : réseau d «amitié» de 4,4 M nœuds Microsoft Instant Messenger : réseau de communications IM de 240 M nœuds sur 1 mois Réseaux télécom mobiles Un opérateur telco génère des 100 M de Call data (CDR) / jour Données techniques générées : 40 M événements / jour dans une grande ville 6
7 Données Qu est ce qu un «grand» ensemble de données? Profondeur Jusqu à 100 Millions de lignes Ou quelques milliards? Largeur Des milliers d attributs Ou quelques Millions? Grand aujourd hui, et demain? 100 Taille des bases de données X2-3 tous les 2 ans 80 DataBase Size (TB) Part des données hors base X 10? X 100? Les «masses de données» Top Ten DB 7
8 Données Beaucoup de Sources Types Structuré Non structuré Volumes Texte Image Video Audio Le Web domine! Russom, TDWI
9 Le contexte industriel D après le Cabinet d analyse Gartner Le data mining fournit des moyens de définir des actions Un modèle non utilisé pour une action n est qu un coût inutile Le volume de données croît exponentiellement Le nombre de modèles doit suivre Herschel, Gartner
10 Le contexte industriel Le Data mining est utilisé surtout dans des applications CRM Les utilisateurs ne sont pas des data miners Pour être productif, il faut être simple Les utilisateurs doivent pouvoir comprendre les modèles voire les produire? Ce n est pas le cas aujourd hui Eckerson, TDWI,
11 Le contexte industriel Aujourd hui, le processus data mining n est pas efficace Nombre de variables utilisées On n utilise pas toutes les variables La manipulation des données est très lourde La construction d un modèle prend très longtemps Des semaines, voire des mois Temps de construction d un modèle Tâches projet Eckerson, TDWI,
12 Le contexte industriel Les défis Productivité 40% du temps de production du modèle est passé à la préparation des données Peut-on réduire? Peut-on utiliser toutes les données? Scalabilité Volumes? Structuré / non structuré? Les volumes sont caractérisés par (largeur, profondeur) La modélisation a 2 phases : construire & appliquer Comment le temps varie avec le volume? Le temps réel est-il possible? À l application (intégration, scalabilité) Automatisation Le modèle peut-il être construit par Des non experts? Une machine? Un modèle peut-il être appliqué et contrôlé par une machine? Russom, TDWI, 2007 Structuré Non Structuré 12
13 Le contexte industriel Les défis 1. Défi n 1 : Intégration Le Data mining n est jamais LA solution : mais une petite partie de la solution L application data mining doit être intégrée dans un système global L application data mining prend des inputs de & génère des outputs vers le reste du système Mots clés : ouverture, standards 2. Défi n 2 : Productivité Le Data mining doit apporter de la valeur (= ) Exploiter toutes les données Produire des résultats «actionnables» À coût minimum Simple à utiliser pour des non experts Mots clés : Retour Sur Investissement 3. Défi n 3 : Scalabilité Le Data mining doit tenir les volumes (données & nombre de modèles) Exploiter dee ensembles de données MASSIFS Produire AUTANT de modèles que nécessaire Mots clés : temps pour produire un modèle en fonction de (largeur, profondeur) des données 4. Défi n 4 : Automatisation Le Data mining doit faire tout ce qui précède automatiquement (?) Produire les modèles Détecter les problèmes Mots clés : automatisation, contrôle 13
14 Le contexte industriel Les défis Ce qu on voit déjà Masses de données : Milliers de variables, millions de lignes Beaucoup de modèles : modèles / an / semaine / jour Ressources limitées : Quelques utilisateurs (10 30?) généralement dans un secteur de l entreprise ( Marketing, Risque ) Ce qu on commence à voir Des initiatives à l échelle de l entreprise Conception, production, vente, maintenance, service client, marketing Des ressources à l échelle de l entreprise Beaucoup d utilisateurs ( ) ce qui va donner une nouvelle dimension au data mining Je vais illustrer quelques uns des défis précédents en montrant la solution apportée par KXEN 14
15 Implémentation KXEN KXEN a été conçu pour les applications industrielles du data mining KXEN est basé sur la SRM Structural Risk Minimization de Vapnik Stratégie pour contrôler le compromis précision / robustesse KXEN réalise Un codage automatique Non linéaire Puis une régression / classification Polynomiale Ce qui permet Intégration Productivité Scalabilité Automatisation R emp Φ Φ θ 1 θ h * h 1 θ 1 Φ < h Φ 2 θ 2... Φ <... < R Gen h k Φ θ n θ k... <... ε Polynômes Ridge regression KI (indexgini ) h 15
16 Implémentation KXEN En pratique, pour un modèle final, KXEN en produit beaucoup (SRM) Selon la complexité de la variable, le codage nécessite de 10 à 30 modèles Ensuite environ 100 modèles (pour la régression) KXEN utilise des techniques de «data streams» On ne duplique pas les données en mémoire mais on ne fait que les lire Très peu de passes sont nécessaires Temps de construction d un modèle Pratiquement linéaire en largeur & profondeur Pour plus de détails, voir Fogelman
17 Agenda Le Data Mining industriel Un peu d histoire Les données Les défis Quelques exemples Le nombre de variables Le nombre de modèles 17
18 Le nombre de variables Nombre de variables utilisées On a vu que les modèles utilisent peu de variables Y a-t-il un intérêt à en utiliser beaucoup? En exploitant toutes les variables disponibles 3 000, 5 000, ? En créant de nouvelles variables Agrégats Variables comportementales Variables textuelles Variables «réseaux sociaux» Le but Améliorer la performance des modèles Le défi Faire des modèles avec des milliers de variables Nombre de variables Sears 900 Grande banque Vodafone D Barclays Rogers Wireless HSBC Credit card
19 Le nombre de variables Utiliser des données très détaillées Produire des agrégats Produire des variables calculées peut apporter de la valeur Mais le nombre de variables croît exponentiellement Ex : 45 M transactions / jour Comment «choisir» les variables? Il existe beaucoup de méthodes Pas automatique! Les experts se trompent toujours quand il y a des milliers de variables à analyser avec un modèle data mining D après 19
20 Exploiter toutes les variables Le processus d analyse Construire l ADS (Analytic Data Set) Extraire les données Les transformer, agréger, Créer l ADS Construire le modèle Produire le modèle initial Affiner, sélectionner les variables Produire le modèle final Appliquer le modèle Extraire les données Les transformer, agréger, Créer l ADS Appliquer le modèle Exporter les résultats vers la base de données Analytic Data Set Initial Model including new variables Validated Model Scoring Code SQL PMML D après 20
21 Exploiter toutes les variables L ADS contient toutes les variables HH-ID Exemple de Teradata : c est une vue. Il n y a pas de mouvement de données CUST-ID NAME VALUE_SEG BEHAV_SEG LIFESTY_SEG LIFESTG_SEG EQUITY_12 EQUITY_24 ID FIELDS BEHAVIOR FIELDS DEMOGRAPHIC FIELDS MODEL SCORES CONTACT HISTORY LTV AGE INCOME_CD EDUCATION Gustavo Susan Andre Contact History Summary Individual ID (FK) Number of Mail Contacts Number of Contacts Number of Telephone Contacts Contact History Detail Campaign ID (FK) Individual ID (FK) Promotion Code Treatment Code Contact Date Campaign Type Ref Campaign ID Description Start Date Household Household ID Street Address City State Zip Phone Transactions Transaction ID Individual ID (FK) Account No (FK) Individuals in Household Individual ID Household ID (FK) Individual attribute fields Primary Householder Flag Transaction Details Transaction Timestamp Purchases Transaction ID Individual ID (FK) Product ID (FK) Purchase Details Model Scores Model ID (FK) Individual ID (FK) Score Model Description Model ID Model Name Model Date Demographics Lifestage Lifestage Individual ID (FK) Demographic Data Fields Products Product ID Product Details Accounts Account No Account Information Customer Data Warehouse D après 21
22 Exploiter toutes les variables Le processus d analyse < 1 semaine Construire l ADS (Analytic Data Set) Extraire les données Les transformer, agréger, Créer l ADS Construire le modèle < 1 jour Produire le modèle initial Affiner, sélectionner les variables Produire le modèle final Appliquer le modèle Extraire les données Les transformer, agréger, Créer l ADS Appliquer le modèle < 1 jour 3 jours Exporter les résultats vers la base de données «In-database Mining» Analytic Data Set Initial Model including new variables Validated Model Scoring Code SQL PMML 22
23 Créer des variables Agrégats En informatique décisionnelle Données de détail Granularité «fine» Données agrégées Selon les différents «axes» À quel niveau d agrégation? Indicateurs KPI (Key Performance Indicators) Solution Produire «tous» les agrégats Le nombre d agrégats possibles est très grand Des dizaines de milliers Construire un modèle / KPI Retenir les agrégats les plus significatifs Le modèle data mining permet ainsi de produire de meilleurs tableaux de bord 23
24 Créer des variables Agrégats 24
25 Créer des variables Variables comportementales Beaucoup d applications comportent des données transactionnelles Achats de produits (tickets de caisse ou achats en ligne) Transactions carte bancaire On crée des «variables comportementales» Transition de transaction A vers transaction B On obtient un meilleur modèle Le volume généré est énorme! Des milliers de variables supplémentaires Prix C C B B Client 2 A A Jan Fev Mar Avr Mai Jun Temps 25
26 Créer des variables Variables textuelles On extraie les «variables textuelles» des champs texte Des milliers de variables supplémentaires 26
27 Créer des variables Variables textuelles ebay Germany (Data Mining Cup 2006) 8000 enchères sur des produits en vente sur ebay Déterminer un modèle pour prévoir, pour chaque nouvelle enchère, si le prix de vente final sera plus grand que le prix moyen de la catégorie du produit proposé On ajoute 1000 variables textuelles 6 secondes -> 43 secondes Sans texte Avec texte 27
28 Créer des variables Variables «réseaux sociaux» Un exemple dans les telecom Construire le réseau social Extraire les variables «réseaux sociaux» Quelques dizaines de variables supplémentaires 28
29 Créer des variables Variables «réseaux sociaux» 39 variables Circle analysis Count the number of contacts Rank best contacts Connection analysis Profile contacts Describe customer by his contacts Social boundaries Community analysis Identify communities Add each customer to his community Social leader analysis Identify social leader Analyze the impact of a social leader 29
30 Créer des variables Variables «réseaux sociaux» Qui churne? Les clients peu connectés! sn_deg Offnet sn_voi_outd 30
31 Créer des variables Variables «réseaux sociaux» Les variables «réseaux sociaux» augmentent le lift Globalement : 40% Premier décile : 67% Second décile : 47% The rest 0 31
32 Agenda Le Data Mining industriel Un peu d histoire Les données Les défis Quelques exemples Le nombre de variables Le nombre de modèles 32
33 Le nombre de modèles Les entreprises produisent peu de modèles Y a-t-il un intérêt à en produire beaucoup? TDWI Beaucoup de produits / actions Il faut faire au moins un modèle par produit par campagne Vente sur le Web & Longue Traîne Modèles refaits fréquemment La distribution des données change vite (Web) Modèles «fins» La performance sur une population homogène est meilleure Produits /marchés, segments clients, canaux, géographie Le but Améliorer la performance des modèles Le défi Faire des milliers de modèles Nombre de Modèles /an Vodafone D2 760 Market research Cox Comm Real estate Lower My Bills
34 Le nombre de modèles Beaucoup de produits Un exemple films 34
35 Le nombre de modèles Beaucoup de produits CADI Composants Avancés pour la Distribution» (ANR) 35
36 Le nombre de modèles Beaucoup de campagnes Les entreprises utilisent des modèles data mining pour cibler leurs campagnes La tendance est à des campagnes de plus en plus nombreuses Exemple Vodafone : 716 campagnes / an 36
37 Le nombre de modèles Modèles fins Construire un modèle sur une population homogène Géographie Détention produits Segment clients fournit un modèle plus précis (meillerus résultats opérationnels) Mais Le nombre de modèles produits devient vite très grand De 7 en moyenne / an, on passe à quelques centaines / milliers par an 37
38 Le nombre de modèles Modèles fins Exemple : Cox Communications 28 régions * 5 produits * 12 mois = modèles cross-sell en production / an Taux de réponse des campagnes de 1.5% à 5.5%, (+ 260%) Cable TV January April July October Timely Digital Cable High-speed Internet Digital Telephone Pay-Per-View Deep 38
39 Conclusion Le data mining peut être utilisé de façon industrielle dans les entreprises Il doit pour cela répondre à 4 défis majeurs Intégration Productivité Scalabilité Automatisation Gain en productivité Rogers Wireless Vodafone D2 Sears Belgacom 7x 10x 8x 12x Manipuler des masses de données, & produire des masses de modèles impose des contraintes Manipulation & codage automatisés des données Algorithmes simples & robustes Modules ouverts & obéissant aux standards du marché 39
40 Conclusion In fine, le critère de réussite sera toujours le bilan économique $ Grande Banque : time-to-market 66%, 100% ROI en 1 modèle Bank of Austria : $ 67m new business en 1 trimestre, taux de réponse % Bell Canada : 100% ROI en 1 modèle Sears : coûts opérationnels 50%, temps de développement 90%, Barclays : courriers 70%, 15% taux de conversion, ventes 35%, coûts 30%, profit 35% Grand opérateur telco : appels sortants 70%, profit 20% E.ON : ventes 20%, $5.8M / an ventes supplémentaires en 1 modèle Cox : taux de réponse 260%, produits par foyer 14%, ROI en 2 mois Live Person : ventes en ligne % 40
41 Références Wayne W. Eckerson, Predictive Analytics. Extending the Value of Your Data Warehousing Investment. TDWI Best Practices Report. Q Françoise Fogelman-Soulié, Erik Marcadé : Mining Massive Data Sets. A paraître dans NATO Workshop, Gareth Herschel, Gartner Customer Relationship Management Summit Andrew Moore, New Cached-Sufficient Statistics Algorithms for quickly answering statistical questions, KDD 07, Philip Russom, BI Search & Text Analytics. TDWI Best Practices Report. Q J.A.K. Suykens, G. Horvath, S. Basu, C. Micchelli and J. Vandewalle eds : Advances in Learning Theory: Methods, Models and Applications. NATO Science Series, vol
42 KDD KDD aux US KDD 09 à Paris 29 juin-1 er juillet Paris Marriott Contact Chairman KDD 09 Françoise Fogelman Soulié Participez! 42
Le Web, l'entreprise et le consommateur. Françoise Soulié Fogelman [email protected]
Le Web, l'entreprise et le consommateur Françoise Soulié Fogelman [email protected] Forum "Quel futur pour le Web" Lyon, mardi 21 septembre 2010 THE DATA MINING AUTOMATION COMPANY TM Agenda Le Web un
Data Mining, Data Scien-st, Data Analy-cs, CRM, Modélisa-on et ou-ls mathéma-ques Eclairages et principes
Data Mining, Data Scien-st, Data Analy-cs, CRM, Modélisa-on et ou-ls mathéma-ques Eclairages et principes Michel Béra Professeur du Cnam (Chaire de Modélisa-on sta-s-que du risque) Cours STA201 Comment
Qu est ce qu un réseau social. CNAM Séminaire de Statistiques Appliquées 13/11/2013. F.Soulié Fogelman 1. Utilisation des réseaux sociaux pour le
Qui je suis Innovation Utilisation des réseaux sociaux pour le data mining Business & Decision Françoise Soulié Fogelman [email protected] Atos KDD_US CNAM Séminaire de Statistique appliquée
Accélérer l agilité de votre site de e-commerce. Cas client
Accélérer l agilité de votre site de e-commerce Cas client L agilité «outillée» devient nécessaire au delà d un certain facteur de complexité (clients x produits) Elevé Nombre de produits vendus Faible
La fraude à la carte bancaire
Agenda Utilisation des réseaux sociaux dans la lutte contre la fraude Françoise Soulié Fogelman VP Innovation [email protected] 1. La fraude à la carte bancaire 2. La question des volumes 3. La création
" # $ % % & ' ( ) * +,! '()*+ *, + ' +' + ' ' -+ - +.+. /0 / 1 0 12 1 1 2 34+ 4 1 +. 50 5 * 0 4 * 0 6! "##$ % &!
"# $ %%& ' ( )*+, '()*+,'+''-++.+/0112134+1.50*406 "##$ %& 8CC "#$%& ' ( )* +,-./ 0 123 456+7 3 7-55-89.*/ 0 +3 *+:3 ;< =3 3-3 8 0 23 >-8-3 >5? //*/*0;* @A: *53,,3 / * $/ >B+? - 5, 2 34*56 7 /+#** //8
CRM. Agenda. CRM Customer Relationship Management. Le CRM c est. Les bénéfices attendus du CRM. Décrire. Comprendre. Agir. Agenda
Agenda CRM Customer Relationship Management Qu est ce que le CRM Les composants du CRM Le CRM analytique Le CRM opérationnel Quelques exemples de projets Applications au Marketing Applications au Risque
Evry - M2 MIAGE Entrepôt de données
Evry - M2 MIAGE Entrepôt de données Introduction D. Ploix - M2 Miage - EDD - Introduction 1 Plan Positionnement du BI dans l entreprise Déclinaison fonctionnelle du décisionnel dans l entreprise Intégration
LE DISPLAY RÉVOLUTION. De l achat d espace publicitaire classique à la gestion d audience ciblée. Janvier 2012 LIVRE BLANC ACXIOM.
LIVRE BLANC ACXIOM LE DISPLAY EN PLEINE RÉVOLUTION De l achat d espace publicitaire classique à la gestion d audience ciblée Janvier 2012 Frédéric GRELIER Directeur Europe développement produits Acxiom
INTRODUCTION AU DATA MINING
INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre
Introduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
LIVRE BLANC. Smart data, scoring et CRM automatisé : Comment acquérir, qualifier et convertir ses prospects en clients
messaging LIVRE BLANC Smart data, scoring et CRM automatisé : Comment acquérir, qualifier et convertir ses prospects en clients SOMMAIRE Smart data, scoring et CRM automatisé : Comment acquérir, qualifier
Optimisez les profits de vos sites web. Intégrez la performance à votre projet de création
Optimisez les profits de vos sites web Intégrez la performance à votre projet de création Consultant web spécialisée dans le référencement, mon objectif est d augmenter les profits de vos sites web par
PETIT LEXIQUE L INBOUND MARKETING
PETIT LEXIQUE DE L INBOUND MARKETING «Pratiquez le marketing que les gens recherchent» Voici de quoi vous apprendre à parler inbound marketing! Ce lexique n a pas vocation à être exhaustif, mais présente
Master Exploration Informatique des données Data Mining & Business Intelligence. Evelyne CHARIFOU Priscillia CASSANDRA
Master Exploration Informatique des données Data Mining & Business Intelligence Groupe 5 Piotr BENSALEM Ahmed BENSI Evelyne CHARIFOU Priscillia CASSANDRA Enseignant Françoise FOGELMAN Nicolas DULIAN SOMMAIRE
Web Analytics. des Visiteurs en Ligne? Raquel de los Santos, Business Consultant Forum emarketing 2012
Web Analytics Comment Valoriser la Connaissance des Visiteurs en Ligne? Raquel de los Santos, Business Consultant Forum emarketing 2012 Agenda comscore en Quelques Chiffres Réseaux Sociaux : Etat des lieux
Le Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Petit déjeuner PME & Start-up: "Créer et optimiser sa force de vente"
Petit déjeuner PME & Start-up: "Créer et optimiser sa force de vente" Comment gérer optimalement une force de vente directe et indirecte internationale au sein d'une entreprise déjà structurée? Stefan
Cybermarché et analyse comportementale
Cybermarché et analyse comportementale Antoine-Eric Sammartino [email protected] Séminaire Data Mining - Educasoft Formations 18 juin 2001-1- MENU Le Groupe LaSer Le processus Data Mining L industrialisation
Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group
1 Catherine Chochoy I/T Specialist, IBM Information Management on System z, Software Group Alain Maneville Executive I/T specialist, zchampion, IBM Systems and Technology Group 2 Le défi du Big Data (et
L'intelligence d'affaires: la statistique dans nos vies de consommateurs
L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires
Il y a tellement de hype autour du big data que Gartner étudie un nouveau modèle ;-) Talend 2012 2
Big Data: au delà du Buzz Yves de Montcheuil @ydemontcheuil Il y a tellement de hype autour du big data que Gartner étudie un nouveau modèle ;-) Talend 2012 2 Hype Cycle Gartner Talend 2012 3 Big Data
We make your. Data Smart. Data Smart
We make your We make your Data Smart Data Smart Une société Une société du du groupe Le groupe NP6 SPECIALISTE LEADER SECTEURS EFFECTIFS SaaS Marketing : 50% Data intelligence : 50% 15 sociétés du CAC
APP TECHNOLOGY. Tracking du ROI & Engagement sur Mobile
APP TECHNOLOGY Tracking du ROI & Engagement sur Mobile À PROPOS D ACCENGAGE Accélérateur de Performance Mobile. Mondialement. Mois de R&D Experts du Mobile Clients Grands Comptes Pays Millions d Apps Installées
NF26 Data warehouse et Outils Décisionnels Printemps 2010
NF26 Data warehouse et Outils Décisionnels Printemps 2010 Rapport Modélisation Datamart VU Xuan Truong LAURENS Francis Analyse des données Avant de proposer un modèle dimensionnel, une analyse exhaustive
Stratégie et Vision de SAP pour le secteur Banque- Assurance: Data-Management, BI, Mobilité
Stratégie et Vision de SAP pour le secteur Banque- Assurance: Data-Management, BI, Mobilité Patrice Vatin Business Development SAP FSI Andrew de Rozairo Business Development Sybase EMEA Septembre 2011
Surmonter les 5 défis opérationnels du Big Data
Surmonter les 5 défis opérationnels du Big Data Jean-Michel Franco Talend Connect 9 octobre 2014 Talend 2014 1 Agenda Agenda Le Big Data depuis la découverte jusqu au temps réel en passant par les applications
RSA ADVANCED SECURITY OPERATIONS CENTER SOLUTION
RSA ADVANCED SECURITY OPERATIONS CENTER SOLUTION Augmenter la visibilité et l analyse des événements de sécurité dans le système d information Jérôme Asseray Senior PreSales Engineer 1 Agenda Sécurité,
Le data mining et l assurance Mai 2004. Charles Dugas Président Marianne Lalonde Directrice, développement des affaires
Le data mining et l assurance Mai 2004 Charles Dugas Président Marianne Lalonde Directrice, développement des affaires AGENDA Qu est-ce que le data mining? Le projet et les facteurs de réussite Les technologies
Agenda de la présentation
Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining
SAN07 IBM Social Media Analytics:
SAN07 IBM Social Media Analytics: Vos clients partagent leurs connaissances Déployez une stratégie gagnante! Eric Martin Social Media Analytics Leader Europe IBM SWG, Business Analytics @Eric_SMA 1 Le
La Business Intelligence & le monde des assurances
Conseil National des Assurances Séminaire - Atelier L information au service de tous Le 09 Novembre 2005 La Business Intelligence & le monde des assurances Karim NAFIE Regional Presales Manager EEMEA Operations
Comarch EMM Solution flexible de fidélisation client
Comarch EMM Solution flexible de fidélisation client www.fidelisation.comarch.fr COMARCH ENTREPRISE MARKETING MANAGEMENT Une solution flexible adaptée aux différents secteurs : La recherche d informations
Xerox Au service du marketing d entreprise
Xerox Au service du marketing d entreprise Marketing Direct, 1 To 1, Transpromo Christophe Montané Xerox Global Services Page 1 ESC Lille 22 Octobre Seminaire Marketing Direct - Le Groupe Xerox en quelques
Spécificités, Applications et Outils
Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala [email protected] http://chirouble.univ-lyon2.fr/~ricco/data-mining
KPI (Key Performance Indicator) dans MOSS
KPI (Key Performance Indicator) dans MOSS Introduction Un KPI (Key Performance Indicator), Indicateur de Performance ou Indicateur Clé est un concept permettant de présenter à un utilisateur une information
Le MDM (Master Data Management) Pierre angulaire d'une bonne stratégie de management de l'information
Darren Cooper Information Management Consultant, IBM Software Group 1st December, 2011 Le MDM (Master Data Management) Pierre angulaire d'une bonne stratégie de management de l'information Information
INTELLIGENCE MARKETING ETUDES DE MARCHE - DATA MINING - CONSEIL EN MARKETING - SYSTEMES D INFORMATION MARKETING
ETUDES DE MARCHE - DATA MINING - CONSEIL EN - SYSTEMES D INFORMATION Notre mission Des études de marché au data mining Cinq sur Cinq est un institut d intelligence marketing. Notre métier : collecter,
Introduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
La Performance Digitale en Business to Business
La Performance Digitale en Business to Business En quoi la performance digitale B2B et son optimisation, est-elle différente d une stratégie digitale B2C? Florent Bourc his - Marketing Stratégique - 2015
SOCIAL INTELLIGENCE BUSINESS RESULTS
SOCIAL INTELLIGENCE BUSINESS RESULTS Faire de l écoute et de l analyse des réseaux sociaux un outil stratégique pour une marque Intervention 28/11/2014 Les marques et Internet Perspective sur 20 ans 1995
Sage CRM. La solution complète de Gestion des Relations Clients pour PME. Précision et efficacité à portée de mains!
Sage CRM Précision et efficacité à portée de mains! La solution complète de Gestion des Relations Clients pour PME Alliant l innovation pragmatique, la souplesse d utilisation et l efficacité Le CRM Simplicité
Ne cherchez plus, soyez informés! Robert van Kommer
Ne cherchez plus, soyez informés! Robert van Kommer Le sommaire La présentation du contexte applicatif Le mariage: Big Data et apprentissage automatique Dialogues - interactions - apprentissages 2 Le contexte
Comprendre le web analytics, et réussir son projet web!
Comprendre le web analytics, et réussir son projet web! Daniel TANON Président de Ebusiness Consulting Inc BP : S/C 2008 Yaoundé Cameroun Tél. : 99 76 63 27 http://site-rentable.com 1 Bonjour, Je m appelle
Apprentissage Statistique
Apprentissage Statistique Master DAC - Université Paris 6, [email protected], http://www-connex.lip6.fr/~gallinar/ Année 2014-2015 Partie 1 Introduction Apprentissage Automatique Problématique
Malgré la crise, Le décisionnel en croissance en France
Malgré la crise, Le décisionnel en croissance en France 11 juin 2009 www.idc.com Cyril Meunier IDC France Consulting Manager Copyright 2009 IDC. Reproduction is forbidden unless authorized. All rights
L affiliation dans Le mix digital
L affiliation dans Le mix digital Les évolutions attendues pour L affiliation 1. Le rôle d une agence média 2. Les enjeux globaux pour le digital 3. Le mobile et L affiliation 4. Le pilotage à la performance
Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.
des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le
Londres 1854 Des problèmes (re)connus Faire plus avec moins Tendances et défis «BYOD» WIN INTUNE «Nouveaux paradigmes» «Big Data» «Cloud» Windows Server Gestion Sys. Center Identité & Virt CLOUD OS Microsoft
DATA QUERY : MODÉLISATION AVANCÉE DE VOS DONNÉES
Online Intelligence Solutions DATA QUERY : MODÉLISATION AVANCÉE DE VOS DONNÉES Marion JOFFRE, Chef de produit marketing WHITE PAPER Table des matières CONTEXTE 3 Un suivi précis et détaillé de l ensemble
Systèmes de recommandation de produits Projet CADI Composants Avancés pour la DIstribution
Journée DAPA du 26 mars 2009 Systèmes de recommandation de produits Projet CADI Composants Avancés pour la DIstribution Michel de Bollivier [email protected] Agenda Projet CADI La recommandation
Le marketing suisse à l'heure du Big Data. 19 Février 2015
Le marketing suisse à l'heure du Big Data 19 Février 2015 AGENDA 1.Eco système : Gamned! / 1.618 2.Etude «Big Data et Marketing en Suisse romande» 3. Data Digital 4.La connexion des mondes : CRM + digital
La Business Intelligence pour les Institutions Financières. Jean-Michel JURBERT Resp Marketing Produit
La Business Intelligence pour les Institutions Financières Jean-Michel JURBERT Resp Marketing Produit Agenda Enjeux des Projets Financiers Valeur de Business Objects Références Clients Slide 2 Des Projets
Marketing comportemental. Guide méthodologique de mise en œuvre
Marketing comportemental Guide méthodologique de mise en œuvre Sommaire Présentation...3 Les limites du marketing de masse ou du marketing «produit»...5 L idéal marketing : délivrer le bon message au bon
«Outils de gestion pour TPE CRM / ERP» Club
Réunion des membres du 7 juin 2011 «Outils de gestion pour TPE CRM / ERP» Comment faciliter la gestion journalière d un commerce ou d une TPE par l utilisation d outils TIC? L adoption d outils TIC mais
Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication
Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication R. Carlos Nana Mbinkeu 1,3, C. Tangha 1, A. Chomnoue 1, A. Kuete
BIRT (Business Intelligence and Reporting Tools)
BIRT (Business Intelligence and Reporting Tools) Introduction Cette publication a pour objectif de présenter l outil de reporting BIRT, dans le cadre de l unité de valeur «Data Warehouse et Outils Décisionnels»
Jeudi 30 avril 2009. L art de bien référencer son site Internet
Jeudi 30 avril 2009 L art de bien référencer son site Internet Quelques chiffres 1.2 milliard d internautes dans le monde. 343 millions d internautes en Europe. (InternetworldStats, November 2007) 250
BIG DATA Comment exploiter les données pour maximiser vos investissements en ligne
@comscorefr BIG DATA Comment exploiter les données pour maximiser vos investissements en ligne One-to-One ecommerce Monaco 11 mars 2013 Delphine Gatignol, comscore avec la participation de Julie Wengler
LA VISION UNIQUE DU CLIENT, PASSAGE OBLIGÉ DE LA MODERNISATION DU CRM VERS LA TRANSFORMATION DIGITALE?
LA VISION UNIQUE DU CLIENT, PASSAGE OBLIGÉ DE LA MODERNISATION DU CRM VERS LA TRANSFORMATION DIGITALE? Sommaire 1. La vision 360 dans l entreprise non digitale 2. L arrivée du digital 3. La transformation
Sage CRM. Customer Relationship Management (CRM) pour petites et moyennes entreprises
Sage CRM Customer Relationship Management (CRM) pour petites et moyennes entreprises La clé de votre succès. Sage CRM, en tant que solution CRM primée, livre aux petites et moyennes entreprises dans le
Guide de référence pour l achat de Business Analytics
Guide de référence pour l achat de Business Analytics Comment évaluer une solution de décisionnel pour votre petite ou moyenne entreprise : Quelles sont les questions à se poser et que faut-il rechercher?
Approche pratique dans une stratégie marketing de PME
Approche pratique dans une stratégie marketing de PME Bernard Dehertog Membre I.A.B. [email protected] Cyberwork s.a. Forum Telecom Le Site Web (1) adapté aux objectifs de communication? message, image,
«L impression à données potentiel de croissance?»
«L impression à données variables, un marché à fort potentiel de croissance?» «Francois Gouverneur Directeur Marketing Xerox France» Page 1 2 2 Des Français attachés au media papierp Si l équipement et
Objectif et contexte business : piliers du traitement efficace des données -l exemple de RANK- Khalid MEHL Jean-François WASSONG 10 mars 2015
Objectif et contexte business : piliers du traitement efficace des données -l exemple de RANK- Khalid MEHL Jean-François WASSONG 10 mars 2015 1. fifty-five : présentation 2. Objectifs de Rank 3. Une approche
1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données
1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données Votre interlocuteur Didier Gaultier Directeur Data Science Business & Decision Professeur de Statistique à l
Panorama des solutions analytiques existantes
Arnaud LAROCHE Julien DAMON Panorama des solutions analytiques existantes SFdS Méthodes et Logiciels - 16 janvier 2014 - Données Massives Ne sont ici considérés que les solutions autour de l environnement
Extension fonctionnelle d un CRM. CRM étendu >> Conférence-débat 15 April 2015. Club Management des Systèmes d Information de l'iae de Paris Alumni
Extension fonctionnelle d un CRM Conférence-débat 15 April 2015 Club Management des Systèmes d Information de l'iae de Paris Alumni CRM étendu >> Programme // CRM étendu Vision 360 et Plateforme Cloud
IBM SPSS Direct Marketing
IBM SPSS Statistics 19 IBM SPSS Direct Marketing Comprenez vos clients et renforcez vos campagnes marketing Points clés Avec IBM SPSS Direct Marketing, vous pouvez : Comprendre vos clients de manière plus
Dossier de Presse 2014
Test UX to increase Conversion Rate ANALYSER COMPRENDRE TESTER PREDIRE Dossier de Presse 2014 www.contentsquare.com Les algorithmes savent mieux que nous, avant nous et pour nous ce que nous désirons.
Londres 1854 Des problèmes (re)connus Faire plus avec moins Tendances et défis «BYOD» WIN INTUNE «Nouveaux paradigmes» «Big Data» «Cloud» Windows Server Gestion Sys. Center Identité & Virt CLOUD OS Microsoft
Les compétences clés en 2015 La révolution du Big Data souffle sur les métiers du commerce et du marketing
Communiqué de presse Les compétences clés en 2015 La révolution du Big Data souffle sur les métiers du commerce et du marketing Paris, le 7 avril 2015 A la recherche de leviers permettant de soutenir le
Entreprise et Big Data
Entreprise et Big Data Christophe Favart Chef Architecte, SAP Advanced Development, Business Information Technology Public Juin 2013 Agenda SAP Données d Entreprise Big Data en entreprise Solutions SAP
Chap 3 : La connaissance du client. I. Les fondements de la connaissance du client. Les principales évolutions sont résumées dans le tableau suivant :
Chap 3 : La connaissance du client I. Les fondements de la connaissance du client A. D une société de consommation à une société de consommateurs Depuis les années 1980, les mutations sociales ont eu d
Atelier BNP le 28 Mars 2013 Assurances, mutuelles : Les nouveaux défis de la communication multicanal
Atelier BNP le 28 Mars 2013 Assurances, mutuelles : Les nouveaux défis de la communication multicanal Solution HP Exstream Philippe Bessis Business Development Manager HP Exstream HP Exstream est une solution
Les datas = le fuel du 21ième sicècle
Les datas = le fuel du 21ième sicècle D énormes gisements de création de valeurs http://www.your networkmarketin g.com/facebooktwitter-youtubestats-in-realtime-simulation/ Xavier Dalloz Le Plan Définition
Microsoft Advertiser Suite pour ebookers.ch. Mesure et optimise leurs campagnes de marketing en ligne
Microsoft Advertiser Suite pour ebookers.ch Mesure et optimise leurs campagnes de marketing en ligne Microsoft Advertiser Suite Une solution complète pour les annonceurs désirant contrôler tous leurs canaux
Guide d exploration de base de données de IBM SPSS Modeler 15
Guide d exploration de base de données de IBM SPSS Modeler 15 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p.. Cette
20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars 2013. 20 ans du SIAD -"Big Data par l'exemple" -Julien DULOUT
20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars 2013 20 ans du SIAD -"BigData par l'exemple" -Julien DULOUT Qui a déjà entendu parler du phénomène BigData? Qui a déjà
et les Systèmes Multidimensionnels
Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées
données en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
To PIM or not to PIM? Managing your Product Catalog
To PIM or not to PIM? Managing your Product Catalog Sébastien LIEUTAUD VP Sales & Marketing Programme Le marché du PIM en pleine (r)évolution! To PIM or not to PIM: Objectifs, réalisation et bénéfices
Recommandation prédictive
Recommandation prédictive La promesse originelle du web : la relation one to one Le futur du web : la recommandation prédictive La data : Le pétrole brut des éditeurs et des marques Mais Au mieux
vous? Publics concernés Dirigeants Décideurs Professionnels Le saviez -
MARKETING D I G I T A L Pour répondre aux nouveaux enjeux numériques, l Université Paris-Dauphine vous offre une formation adaptée en marketing digital. Grâce à cet outil, vous pouvez atteindre votre cible
Introduction à l Informatique Décisionnelle - Business Intelligence (7)
Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence
WEB ANALYSE: Outils de mesure des performances
WEB ANALYSE: Outils de mesure des performances VOS CONFÉRENCIERS 2014 WSI. All rights reserved. Agenda 1. A propos de WSI 2. Que doit-on mesurer et pourquoi? 3. Comment s y prendre devant la multiplicité
EXPERIAN FOOTFALL: COMPTEZ-LES. ATTIREZ-LES. CONVERTISSEZ-LES.
www.footfall.com + 33 1 55 12 10 00 EXPERIAN FOOTFALL: COMPTEZ-LES. ATTIREZ-LES. CONVERTISSEZ-LES. Vous ne pouvez pas augmenter votre rentabilité sans connaîtrevos clients sur le bout des doigts Comptez-les
Intégrer le CRM : quelle utilité, quels profits pour ma PME?
Conférence Applica - 22 avril 2002 Intégrer le CRM : quelle utilité, quels profits pour ma PME? Stéphanie WAILLIEZ Analyste CRM, CXP [email protected] CXP en quelques mots et quelques chiffres
Atelier Symposium MicroStrategy
Atelier Symposium MicroStrategy Présentation de Soft Computing «De l'usage de MicroStrategy pour la Connaissance Client dans le secteur de la Distribution» G.MANGEON Soft Computing 16 Juin 2016 Soft Computing
Introduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
La mesure de l audience des Médias Numériques, «who s who» : acteurs, indicateurs, enjeux.
La mesure de l audience des Médias Numériques, «who s who» : acteurs, indicateurs, enjeux. 9 ATELIERS POUR COMPRENDRE LES ENJEUX DU NET // 27 MAI 2010 Digital Day 27 mai 2010 Mathieu Llorens Directeur
Social Media. Chiffres et Tendances sur le Marché. Delphine Gatignol. VP Sales, comscore
Social Media Chiffres et Tendances sur le Marché Delphine Gatignol VP Sales, comscore Transformation to a Digital Business Analytics Company AUDIENCE ANALYTICS Audience Measurement: Web, Mobile, 4 Screen
E-Guide COMMENT PRENDRE LA MAIN SUR LES PROJETS BIG DATA
E-Guide COMMENT PRENDRE LA MAIN SUR LES PROJETS BIG DATA M aintenant que vos projets analytiques sont en place, comment vous assurer que votre entreprise tire une réelle valeur métier de ces initiatives?
E-mail marketing, scoring comportemental & analyse prédictive
E-mail marketing, scoring comportemental & analyse prédictive Formation Dolist - Score MD Les 25 & 26 juin 2013 Dolist.net - Tous droits réservés 26/04/2013 Formation E-mail Marketing, scoring & analyse
Atelier du 25 juin 2012. «Les bonnes pratiques dans l e-mailing» Club
Atelier du 25 juin 2012 «Les bonnes pratiques dans l e-mailing» Agenda de l atelier Introduction et rappel des bonnes pratiques Exemple et retour d expérience Maison Tasset Partage d expérience entre les
4. Utilisation d un SGBD : le langage SQL. 5. Normalisation
Base de données S. Lèbre [email protected] Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :
Les tendances, la sécurité, le BYOD et le ROI de la mobilité. July 12
Les tendances, la sécurité, le BYOD et le ROI de la mobilité July 12 1 Agenda Une stratégie mobile? Pourquoi, quand et comment. 1 La sécurité et la mobilité. 2 La gestion des mobiles, Bring Your Own Device
