ANALYSE STATISTIQUE PRÉDICTIVE

Dimension: px
Commencer à balayer dès la page:

Download "ANALYSE STATISTIQUE PRÉDICTIVE"

Transcription

1 Yoshua Bengio Chaire de Recherche du Canada sur les Algorithmes d Apprentissage Statistique, Université de Montréal Charles Dugas ApSTAT Technologies Inc. Et Aviva Canada SALON INTELLIGENCE D AFFAIRE 8 Novembre 2011, Montréal ANALYSE STATISTIQUE PRÉDICTIVE

2 Plan de travail Exemple pratique #1 (Charles Dugas, 9 min) Introduction à l analyse statistique prédictive (Yoshua Bengio, 30 min) Exemple pratique #2(Charles Dugas, 9 min) Pause et discussions individuelles (Yoshua Bengio & Charles Dugas, 30 min) Plénière (Charles Dugas & Yoshua Bengio, 40 min) Conclusion (Charles Dugas, 10 min)

3 La Valeur Économique du Client (VÉC)

4 Changement de philosophie Focus: produit " Focus: client " Attirer le consommateur" Rétention du consomm. " Transactions" Biens" Profitabilité du produit" Relations" Services" Gestion des clients" Élément essentiel: frais d acquisition (attirer) vs frais de maintien (conserver).! Un impact sur l intelligence d affaires: Intérêt pour la VÉC.!

5 Définition de la VÉC Aujourd hui Dans 1 mois Dans 2 mois Valeur, en date d aujourd hui, des profits tirés des achats futurs du client.

6 Définition de la VÉC Tient compte de 3 éléments: 1. Profits (marges) sur les achats (volume) futurs d un client 2. Rétention du client 3. Facteur de valeur présente (1$ aujourd hui vaut plus que 1$ l an prochain) VÉC Profit Réten- tion Valeur présente

7 Trois véhicules assurés André, 65 ans Bianka, 35 ans Colin, 21 ans Retraité Conduit peu et prudemment Aucun accident en 5 ans Bianka et sa famille. Conducteurs responsables Aucun accident en 5 ans Aime la vitesse 2 accidents à son actif Prime annuelle: 400$ Prime annuelle: 550$ Prime annuelle: 1300$

8 Calcul du profit Réclamations prédites! André Bianka Colin Prime 400$ 550$ 1300$ Réclamations 250$ 325$ 1000$ Autres frais 100$ 150$ 200$ Profit 50$ 75$ 100$ Profit (5 ans) 250$ 375$ 500$

9 VÉC: profit x rétention Rétention prédite! André (96%) Bianka (80%) Colin (69%) VÉC an1 50$ 75$ 100$ VÉC an2 48$ 60$ 69$ VÉC an3 46$ 48$ 48$ VÉC an4 44$ 38$ 33$ VÉC an5 42$ 31$ 23$ VÉC Tot. 231$ 252$ 272$

10 Impact des frais d acquisition Sans frais d acquisition Avec frais d acquisition VÉC André Bianka Colin Années Années

11 VÉC: récapitulation André Bianka Colin Profit 5 ans 250$ 375$ 500$ VÉC (incl. rétention) 231$ 252$ 272$ VÉC (incl. rétention et frais d acquisition) 212$ 170$ 158$ L analyse prédictive nous donne un portrait différent!

12 Utilisations Solliciter les segments à forte VÉC Meilleure valorisation des segments de marché Identifier les actions qui augmentent la rétention (donc la VÉC) Réagir aux changements (p.ex. suite à un accident, un déménagement, etc.)

13

14 Objectifs de l analyse statistique prédictive Outils pour prédire Données pour construire un prédicteur Utiliser le prédicteur sur de nouveaux cas Généraliser le mieux possible sur les nouveaux cas Évaluer et comparer les prédicteurs

15 Notions Discutées Données, variables: entrées vs cibles Étapes de l analyse prédictive Probabilité et espérance Classification, régression, prédiction de proba Exemples d algorithmes prédictifs Prétraitement des données data plumbing Généralisation à de nouveau cas: erreur de test Sélection de modèles, hyper-paramètres Split des données

16 Exemple: achat en ligne e.g. t=montant que le client dépensera dans ceee session On commence avec des données e.g. x 1 =temps passé depuis dernier achat (normalisé) x 2 =montant des achats passés (normalisé) x 3 =a déjà visité le site x 4 =vient de Montréal, etc.

17 Etapes pratiques d un projet d analyse prédictive

18 Probabilité et Espérance Aléas: achète ou n achète pas? Proba: proportion de succès attendue si on répétait l expérience Variable aléatoire: chaque valeur à probabilité o v.a. discrète: achète (oui) ou pas (non)? o v.a. continue: montant de l achat? Espérance d une v.a.: moyenne des valeurs, pondérée par la probabilité des évènements possibles

19 Entrées et sorties d un prédicteur Entrée X Sortie f(x) six Cible Y deux!

20 Apprendre à partir d exemples Image en entrée surprise joie peur Catégorie cible Associe deux types de variables aléatoires, e.g., Entrée = Image (e.g. intensités des pixels) Cible = Catégorie (e.g., émotions à détecter)

21 Prédire une catégorie Un prédicteur est entraîné à produire à partir d une entrée une sortie qui est une prédiction pour une cible associée à cette entrée Entrée: image predicteur Sortie: Émotion fear prédite = triste anger Cible: Émotion à prédire = colère Erreur=1=1 La sortie (prédiction) est comparée avec la cible pour calculer une erreur (0 ou 1). Le but de l entraînement est de réduire l espérance des erreurs futures.

22 Prédire une quantité: régression (ici: non linéaire, avec bruit) bruit e.g.: x=montant passé, y = montant futur (ventes)

23 L algorithme des plus- proches- voisins (k- NN) Pour un point test x: x" [2]" On trouve les k plus proches voisins de x parmi l ensemble d apprentissage (typiquement selon la distance Euclidienne). On associe à x la classe majoritaire parmi ses k voisins Âge du client x? Client n achète pas# k=3 Client achète# k est un hyper-paramètre Montant achats passés x" [1]"

24 Régression Linéaire Régularisée Régression linéaire: prédiction = combinaison linéaire des entrées. Prédic tion W 0 W 1 âge W 2 achats Apprentissage = trouver les coefficients w Régression linéaire classique: il faut que les entrées ne soient pas corrélées, il faut éviter d avoir trop de variables d entrée Régression linéaire régularisée (pénalité L2): règle ces problèmes (on peut avoir autant d entrées qu on veut mais leurs poids seront forcés à être plus petits par la régularisation). On mesure l erreur quadratique: (prédiction cible) 2

25 Modèles non- linéaires Algorithmes Tâches Commentaires Réseaux de neurones Classification, régression peut soutenir des millions d exemples (premier choix dans ce cas) Arbres de décision Classification prédiction très rapide Support Vector Machine (SVM) Classification ok jusqu à 100k exemples; linéaire si nombre de variables est immense Boosting Classification peu d hyperparamètres (boutons ajustables) Gaussian Process Regression Régression Premier choix quand moins de 1000 exemples

26 Prétraitement des données 1. Nettoyage des données (détecter semi-automatiquement et corriger les valeurs bizarres) 2. Imputation de valeurs manquantes 3. Encodage des données (selon l algo d apprentissage) Normalisation des variables réelles (soustraire moyenne, diviser par écart type) Optionellement discrétisation de variables numériques choisies. Représentation one-hot des variables catégoriques onehot5(3) = (0,0,1,0,0)

27 Généralisation à de nouveaux cas On peut facilement mettre au point un prédicteur qui donne exactement les bonnes réponses sur les données d apprentissage. Pas garanti de bonnes prédictions sur de nouveaux cas, et c est seulement ça qui nous intéresse. L erreur d apprentissage (sur l ensemble de données d apprentissage) est toujours optimiste On veut estimer l erreur de généralisation: ensemble de test (non utilisé pour apprendre). On veut choisir le modèle qui généralise le mieux.

28 Modélisation: sélection de modèles Plusieurs algos d apprentissage. Pour chaque algo, plusieurs choix de valeurs de ses hyper-paramètres (ex. nb de voisins k dans k-nn, nb de neurones dans un réseau de neurones,...) Pour chaque cas, on va entraîner un modèle puis évaluer sa performance de généralisation (en test).

29 Sélection de modèle: contrôle de la capacité Les hyper-paramètres des algorithmes permettent de contrôler la capacité du modèle. C est indispensable pour avoir une bonne généralisation. capacité trop faible sous-apprentissage capacité trop élevée sur-apprentissage capacité optimale bonne généralisation La performance sur l ensemble d entraînement n est pas un bon estimé de la généralisation

30 Split des données Diviser les gros ensembles de données en 3: 1. Données d entraînement pour estimer les paramètres des modèles 2. Données de validation pour évaluer l impact de divers choix de modèles et hyper-paramètres 3. Données de test (jamais utilisées pour autre chose) pour évaluer la généralisation comme sur le terrain Train: 70% Valid: 15% Test: 15%

31 Sélection de modèle et hyper- paramètres L évaluation de performance finale s effectue sur des données qui n ont servi ni pour l entrainement ni pour la sélection de modèles ou de capacité.

32 Optimisation de l allocation d effectifs en fonction de la profitabilité

33 Contexte Chaîne de commerce au détail o Vêtements et/ou accessoires o Plusieurs centaines de boutiques mondialement o Généralement, 5 15 employés en boutique

34 Plan général Prévision de la courbe de demande Nb optimal d employé/15 min. (fractionnaire) Création des horaires Contraintes ergonomiques Normes du travail Création des quarts de travail Employés spécifiques Préférences des employés 34

35 Types de données Nb de clients en magasin à chaque moment (compte-personnes)" Nb d employés sur le plancher à chaque moment (données de paye)" Historique des Transactions réalisées" Autres variables: événements spéciaux (boxing day, ventes, grèves), météo (tempêtes, 1 er beau week-end de l année) " 35

36 Équation du profit Profit Ventes x Marge Salaires 36

37 Décomposition des ventes (période) Ventes Trafic Nb de clients qui entrent en magasin" 37 Taux de conversion Proportion des clients qui achètent quelque chose" Panier moyen Quantité achetée, sachant qu il y a un achat"

38 Architecture de modélisation Ventes Profit Employés Trafic Variables Conversion et Panier moyen QoS

39 Modèles possibles Trafic et panier moyen: problèmes de régression o Réponses approximativement continues pour trafic o Modèles possibles (par ex.): Linéaire, Linéaire généralisé (GLM) Réseau de neurones (non-linéaire) Taux de conversion: estimation de probabilité conditionnelle o Réponse: fraction entre 0 et 1 o Modèles possibles: Régression logistique Réseau de neurones

40 Optimisation: courbe de demande Profit espéré ($)" Meilleur compromis entre qualité de service et masse salariale" Personne-heures travaillées" 40

41 Défi: Météo Impact quasi universel sur le commerce au détail Les historiques de météo sont relativement faciles à trouver (et gratuit en général, p.e. Environnement Canada) Plus difficile à trouver: historique des prévisions

42 Conclusions Ø La conception de l architecture de modélisation dépend des données disponibles Ø On doit s assurer que l analyse prédictive colle au processus opérationnel

43 Etapes pratiques d un projet d analyse prédictive Vision haut- niveau d un projet complet

44 Ce qu on peut prédire Probabilité d un évènement oui/non (le client clique, achète, quitte, etc) Probabilité d appartenir à une catégorie (groupe démographique, type de produit acheté) Espérance d une variable continue (temps entre deux évènements, valeur du client, montant payé, montant perdu, ) Densité de probabilité d une variable continue Proportionnelle à la probabilité de trouver environ une certaine valeur, e.g. on peut calculer la probabilité qu une variable continue soit dans un intervalle choisi

45 QUESTIONNAIRE 1. Secteur de votre organisation pouvant bénéficier? 2. Organisation et accès aux données? 3. Variables d entrée et cible à prédire? 4. Type des variables cible? 5. Utilisation des prédictions? 6. Décisions directes ou prédictions de probabilités? 7. Combien de données? 8. Les données changent dans le temps? 9. Contraintes de temps de calcul? 10. Comment mesurer l utilité économique?

46 BACKUP

47 Sous- problèmes Données historiques" Données temps réel" Contraintes de qualité de service Prévision des besoins: Achalandage Temps requis/client Dimensionnement Nb d employés pour répondre au besoin Courbe de demande d effectifs 47

48 Assurances générales Ratio Sinistres/primes Sinistres / Primes Volume d affaires Total des primes Rétention - pour une fenêtre de temps donnée - pourcentage de renouvellement (env. 90%) - mesure indépendante du client Dépenses, 20% Profits, 5% Sinistres, 75% Mesures rétrospectives vs prédictives. Buts: - identifier les profils des consommateurs fidèles - identifier les actions qui impactent la rétention

49 Steps towards a CLV model 1 Choose definition - upselling: can you trace a customer s business? - cross selling:is there a unique key across products? - switchers: can you match profiles through time? - new entrants: what do you know of your prospects? 2 Make assumptions - for each client, project - profits or - revenues and expenses important: recognize acquisition expenses - discounting factor based on cost of capital - retention models can be based on survival analysis - horizon, e.g. 5 years

50 Steps towards a CLV model 3 Build database for survival analysis - initial profile with length of stay (SAS procs: lifetest, lifereg, phreg) - data plumbing : cleaning and encoding unobserved truncated fully observed censored unobserved start end

51 Steps towards a CLV model 4 Modelling - design modelling experiment - train models - select best performing models 5 Enjoy! - CLV-based comparison of market segments - CLV-based valuation of retention increases - Prioritization of outgoing agent calls - Prioritization of marketing offers

52 Rétention: analyse prédictive André: 96% Bianka: 80% Colin: 69% Rétention 1 100,0% 100,0% 100,0% Rétention 2 96,0% 80,0% 69,0% Rétention 3 Rétention 4 Rétention 5 92,2% (96%*96% ) 88,5% (92,2%*96%) 84,9% (88,5%*96%) 64,0% 47,6% 51,2% 32,9% 41,0% 22,7%

53 Frais d acquisition de 250$ André (100$) Bianka (150$) Colin (200$) Frais 1 300$ 350$ 400$ Frais 2 50$ 100$ 150$ Frais 3 50$ 100$ 150$ Frais 4 50$ 100$ 150$ Frais 5 50$ 100$ 150$

54 Profits André (50$) Bianka (75$) Colin (100$) Frais 1 (150$) (125$) (100$) Frais 2 100$ 125$ 150$ Frais 3 100$ 125$ 150$ Frais 4 100$ 125$ 150$ Frais 5 100$ 125$ 150$

55 Focus «client»? 1. Autres véhicules du même client p.ex.: le 2e véhicule d André 2. Autres produits d assurance du même client p.ex.: les biens de Colin (assurance habitation) 3. Autres produits financiers: p.ex.: le prêt hypothécaire de Bianka 4. Autres clients du ménage: p.ex.: la voiture du conjoint de Bianka

56 Avantages du focus client 1. Définir la croissance potentielle de la relation en fonction De notre wallet share actuel Des besoins futurs (Colin vs André) 2. Tenir compte des interactions entre les différents produits La rétention pour un produit est supérieure si d autres produits sont présents. Les consommateurs bougent plusieurs produits en même temps

57 Défis au niveau des données 1. Bases de données historiques de la clientèle pour estimer la rétention (arrivées et départs des clients). 2. Estimation précise des frais dans le temps et par segment. 3. Croiser les bases de données de différents produits (p.ex.: assurance habitation et automobile). 4. Données externes socio-démo avec Statistique Canada, cotes de crédit FICO, météo avec environnement Canada. social: Facebook, Twitter, Linkedin, etc.

58 Conclusions 1. La VÉC permet d analyser l ensemble de la relation avec un client, à plus long terme. 2. Deux éléments importants interagissent: Frais d acquisition Rétention 3. La définition du client joue un rôle majeur. 4. L intelligence d affaires devra permettre l intégration efficace d un nombre croissant de sources de données externes.

59 VÉC: profit x rétention André Bianka Colin VÉC 1 (150$) 50$ (125$) 75$ (100$) 100$ VÉC 2 96$ 48$ 100$ 60$ 104$ 69$ VÉC 3 92$ 46$ 80$ 48$ 71$ 48$ VÉC 4 88$ 44$ 64$ 38$ 49$ 33$ VÉC 5 85$ 42$ 51$ 31$ 34$ 23$ VÉC Tot. 212$ 231$ 170$ 252$ 158$ 272$

60 Pour la prédiction de séries temporelles: validation séquentielle

61 Défi: Données de trafic Les données de trafic sont habituellement captées avec des compte-personnes («people counter») Servent aussi à la prévention des vols Fréquent: compteurs unidirectionnels o Impossible de dire si la personne entre ou sort Difficile de déterminer le nombre total de personnes en magasin à chaque moment

62 Nombre d horaires possibles Le nombre d horaires possibles croît extrêmement rapidement en fonction du nombre d employés" " On ne peut vérifier chaque horaire individuellement." 62

Des solutions de data mining pour résoudre des problèmes d estimation du risque 12 juin 2009 Association des Statisticiennes et Statisticiens du

Des solutions de data mining pour résoudre des problèmes d estimation du risque 12 juin 2009 Association des Statisticiennes et Statisticiens du Des solutions de data mining pour résoudre des problèmes d estimation du risque 12 juin 2009 Association des Statisticiennes et Statisticiens du Québec 1 - Data mining vs Statistique Pourquoi les statisticiens

Plus en détail

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

L'intelligence d'affaires: la statistique dans nos vies de consommateurs L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Le data mining et l assurance Mai 2004. Charles Dugas Président Marianne Lalonde Directrice, développement des affaires

Le data mining et l assurance Mai 2004. Charles Dugas Président Marianne Lalonde Directrice, développement des affaires Le data mining et l assurance Mai 2004 Charles Dugas Président Marianne Lalonde Directrice, développement des affaires AGENDA Qu est-ce que le data mining? Le projet et les facteurs de réussite Les technologies

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Mercredi 24 Juin 2015

Mercredi 24 Juin 2015 BACCALAURÉAT GÉNÉRAL Session 2015 MATHÉMATIQUES Série ES ENSEIGNEMENT OBLIGATOIRE Durée de l épreuve : 3 heures coefficient : 5 MATHÉMATIQUES Série L ENSEIGNEMENT DE SPÉCIALITÉ Durée de l épreuve : 3 heures

Plus en détail

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. 2 jours : Mardi 15 et mercredi 16 novembre 2005 de 9 heures 30 à 17 heures 30 Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. Madame, Monsieur, On parle

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Précision. Rigueur. Estimation du risque

Précision. Rigueur. Estimation du risque Savez-vous lesquels de ces conducteurs représentent le plus grand risque pour votre entreprise? Nous le savons. Estimation du risque ApSTAT Technologies offre une gamme complète de solutions robustes de

Plus en détail

Marketing quantitatif M2-MASS

Marketing quantitatif M2-MASS Marketing quantitatif M2-MASS Francois.Kauffmann@unicaen.fr UCBN 2 décembre 2012 Francois.Kauffmann@unicaen.fr UCBN Marketing quantitatif M2-MASS 2 décembre 2012 1 / 61 Première partie I Analyse Analyse

Plus en détail

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU $SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le

Plus en détail

Agenda de la présentation

Agenda de la présentation Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining

Plus en détail

5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: 514.592.9301 F: 514.340.6850 info@apstat.com www.apstat.com

5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: 514.592.9301 F: 514.340.6850 info@apstat.com www.apstat.com Application des réseaux de neurones au plan de répartition des risques 5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: 514.592.9301 F: 514.340.6850 info@apstat.com www.apstat.com Copyright c

Plus en détail

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Gilbert Saporta Chaire de Statistique Appliquée, CNAM ActuariaCnam, 31 mai 2012 1 L approche statistique

Plus en détail

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Une comparaison de méthodes de discrimination des masses de véhicules automobiles p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans

Plus en détail

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des

Plus en détail

Mesures de Valeur-Client. Étienne Plante-Dubé Modélisation & Recherche Desjardins Groupe d assurances générales etienne.plante.dube@dgag.

Mesures de Valeur-Client. Étienne Plante-Dubé Modélisation & Recherche Desjardins Groupe d assurances générales etienne.plante.dube@dgag. Mesures de Valeur-Client Étienne Plante-Dubé Modélisation & Recherche Desjardins Groupe d assurances générales etienne.plante.dube@dgag.ca Plan de la présentation 2 Différents points de vue de valeur Valeur

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

FOUILLE DE DONNEES. Anne LAURENT ECD. laurent@lirmm.fr

FOUILLE DE DONNEES. Anne LAURENT ECD. laurent@lirmm.fr FOUILLE DE DONNEES Anne LAURENT laurent@lirmm.fr ECD Pourquoi la fouille de données? Données disponibles Limites de l approche humaine Nombreux besoins : Industriels, Médicaux, Marketing, Qu est-ce que

Plus en détail

Accélérer l agilité de votre site de e-commerce. Cas client

Accélérer l agilité de votre site de e-commerce. Cas client Accélérer l agilité de votre site de e-commerce Cas client L agilité «outillée» devient nécessaire au delà d un certain facteur de complexité (clients x produits) Elevé Nombre de produits vendus Faible

Plus en détail

Coup de Projecteur sur les Réseaux de Neurones

Coup de Projecteur sur les Réseaux de Neurones Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche

Plus en détail

JSIam Introduction talk. Philippe Gradt. Grenoble, March 6th 2015

JSIam Introduction talk. Philippe Gradt. Grenoble, March 6th 2015 Introduction talk Philippe Gradt Grenoble, March 6th 2015 Introduction Invention Innovation Market validation is key. 1 Introduction Invention Innovation Market validation is key How to turn a product

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free. Actuariat I ACT2121 septième séance Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement

Plus en détail

Discrétisation et génération de hiérarchies de concepts

Discrétisation et génération de hiérarchies de concepts Prétraitement des données 1 Pourquoi prétraiter les données? Nettoyage des données Intégration et transformation Réduction des données Discrétisation et génération de hiérarchies de g concepts Pourquoi

Plus en détail

Université de Montréal. par Sylvain Pannetier Lebeuf

Université de Montréal. par Sylvain Pannetier Lebeuf Université de Montréal Prédiction de l attrition en date de renouvellement en assurance automobile avec l aide de processus gaussiens par Sylvain Pannetier Lebeuf Département de mathématiques et statistiques

Plus en détail

LDS : un modèle de projection de population à l échelle locale par microsimulation intégrant des paramètres écologiques et contextuels

LDS : un modèle de projection de population à l échelle locale par microsimulation intégrant des paramètres écologiques et contextuels LDS : un modèle de projection de population à l échelle locale par microsimulation intégrant des paramètres écologiques et contextuels Guillaume Marois Alain Bélanger Institut national de la recherche

Plus en détail

La stratégie de contenu. en pratique 30 OUTILS PASSÉS AU CRIBLE. Isabelle Canivet & Jean-Marc Hardy DESIGN

La stratégie de contenu. en pratique 30 OUTILS PASSÉS AU CRIBLE. Isabelle Canivet & Jean-Marc Hardy DESIGN DESIGN Isabelle Canivet & Jean-Marc Hardy La stratégie de contenu en pratique 30 OUTILS PASSÉS AU CRIBLE Groupe Eyrolles, 2012 ISBN : 978-2-212-13510-7 1 Les indicateurs de performance De nombreuses entreprises

Plus en détail

Baccalauréat CGRH Antilles Guyane 13 septembre 2013 Correction

Baccalauréat CGRH Antilles Guyane 13 septembre 2013 Correction Durée : 2 heures Baccalauréat CRH Antilles uyane 3 septembre 203 Correction EXERCICE 7 points Un concessionnaire automobile s est spécialisé dans la vente de deux types de véhicules uniquement : les coupés

Plus en détail

Les Best Practices du Marketing Comportemental en Temps Réel

Les Best Practices du Marketing Comportemental en Temps Réel REAL-TIME MARKETING Les Best Practices du Marketing Comportemental en Temps Réel Comment booster rapidement vos taux de conversion? Adrien de Turckheim, Sebastien Etter, BEAMPULSE 16 05 2013 Benoît Liebenguth,

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

GUIDE DU DATA MINER. Scoring - Modélisation. Data Management, Data Mining, Text Mining

GUIDE DU DATA MINER. Scoring - Modélisation. Data Management, Data Mining, Text Mining GUIDE DU DATA MINER Scoring - Modélisation Data Management, Data Mining, Text Mining 1 Guide du Data Miner Scoring - Modélisation Le logiciel décrit dans le manuel est diffusé dans le cadre d un accord

Plus en détail

Séminaire CRM Les directions de recherche et les perspectives du Customer Relationship Management 1

Séminaire CRM Les directions de recherche et les perspectives du Customer Relationship Management 1 Faculté des Sciences économiques et sociales de l Université de Fribourg Séminaire CRM Les directions de recherche et les perspectives du Customer Relationship Management 1 Séminaire présenté auprès de

Plus en détail

Présentation à l Institut canadien de la retraite et des avantages sociaux. Selon Wikipédia

Présentation à l Institut canadien de la retraite et des avantages sociaux. Selon Wikipédia Évaluation actuarielle du Régime de rentes du Québec au 31 décembre 2012, une œuvre de science-fiction? Présentation à l Institut canadien de la retraite et des avantages sociaux Georges Langis Actuaire

Plus en détail

Les RH à l ère du Big Data: faites parler vos données! Mesurez et optimisez la performance de vos programmes RH 18 septembre 2013

Les RH à l ère du Big Data: faites parler vos données! Mesurez et optimisez la performance de vos programmes RH 18 septembre 2013 Les RH à l ère du Big Data: faites parler vos données! Mesurez et optimisez la performance de vos programmes RH 18 septembre 2013 Qui nous sommes Firme québécoise (bureaux à Québec et Montréal) Spécialisée

Plus en détail

Techniques de DM pour la GRC dans les banques Page 11

Techniques de DM pour la GRC dans les banques Page 11 Techniques de DM pour la GRC dans les banques Page 11 II.1 Introduction Les techniques de data mining sont utilisé de façon augmentaté dans le domaine économique. Tels que la prédiction de certains indicateurs

Plus en détail

ACT3284 Modèles en assurance IARD Examen Final - 14 décembre 2011

ACT3284 Modèles en assurance IARD Examen Final - 14 décembre 2011 #1 À partir de l'information ci-dessous : Sinistres payés cumulatifs Réserves aux dossiers 12 mois 24 mois 36 mois 12 mois 24 mois 36 mois 2008 240,000 393,600 499,200 2008 160,000 120,000 79,200 2009

Plus en détail

Christelle REYNES EA 2415 Epidémiologie, Biostatistique et Santé Publique Université Montpellier 1. 8 Juin 2012

Christelle REYNES EA 2415 Epidémiologie, Biostatistique et Santé Publique Université Montpellier 1. 8 Juin 2012 Extraction et analyse des mesures haut-débit pour l identification de biomarqueurs : problèmes méthodologiques liés à la dimension et solutions envisagées EA 2415 Epidémiologie, Biostatistique et Santé

Plus en détail

Où investir en 2014? Grand colloque sur la gestion des actifs des caisses de retraite

Où investir en 2014? Grand colloque sur la gestion des actifs des caisses de retraite Où investir en 2014? Grand colloque sur la gestion des actifs des caisses de retraite Optimisation de la politique de placement : vers quelles classes d actifs se tourner? Stéphan Lazure Conseiller principal

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Utilisations des mathématiques à des fins opérationnelles

Utilisations des mathématiques à des fins opérationnelles Utilisations des mathématiques à des fins opérationnelles Michael Vandenbossche mvn@softcomputing.com Soft Computing 165 avenue de Bretagne 59000 Lille 1. Présentation 2. Indicateurs statistiques de base

Plus en détail

Table des matières: Guidelines Fonds de Pensions

Table des matières: Guidelines Fonds de Pensions Table des matières: Guidelines Fonds de Pensions TABLE DES MATIERES... 1 INTRODUCTION... 2 1 FINANCEMENT ET FINANCEMENT MINIMUM... 3 1.1 FINANCEMENT... 3 1.2 FINANCEMENT DE PLAN... 3 1.3 FINANCEMENT MÉTHODE

Plus en détail

IFT 6261: L Analytique Web. Fares Aldik, Consultant principal, Analytique Web et optimisation Bell Marchés Affaires services d expérience client

IFT 6261: L Analytique Web. Fares Aldik, Consultant principal, Analytique Web et optimisation Bell Marchés Affaires services d expérience client IFT 6261: L Analytique Web Fares Aldik, Consultant principal, Analytique Web et optimisation Bell Marchés Affaires services d expérience client 2012 01 04 Analytique Web : une pratique multidisciplinaire

Plus en détail

Introduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS)

Introduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS) MIT820: Entrepôts de données et intelligence artificielle Introduction aux outils BI de SQL Server 2014 Fouille de données avec SQL Server Analysis Services (SSAS) Description générale Ce tutoriel a pour

Plus en détail

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12 ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12 ARTHUR CHARPENTIER 1 Une compagnie d assurance modélise le montant de la perte lors d un accident par la variable aléatoire continue X uniforme sur l intervalle

Plus en détail

SOCIAL CRM pour le E-commerce

SOCIAL CRM pour le E-commerce SOCIAL CRM pour le E-commerce Spreadbutton, solution en mode Saas, permet aux e-commerçants de gérer leur communauté client avec Facebook. La solution intègre des modules marketing spécifiques à la vente

Plus en détail

Le bootstrap expliqué par l exemple

Le bootstrap expliqué par l exemple Le bootstrap expliqué par l exemple 1 Le bootstrap expliqué par l exemple 1. Les concepts du bootstrap 2. Des variantes adaptées au contexte 3. Comparaison des différentes méthodes 4. Les cas sensibles

Plus en détail

assurance Février 2012

assurance Février 2012 Modèles fréquence coût : Construire un générateur de scénarios Quelles perspectives économiques d évolution en? assurance Version 0.7 Version 1.2 Mars 2014 Février 2012 Frédéric PLANCHET frederic@planchet.net

Plus en détail

ecrm : Multiplicité des données clients D où proviennent les informations et quelles sont-elles?

ecrm : Multiplicité des données clients D où proviennent les informations et quelles sont-elles? ecrm : Multiplicité des données clients D où proviennent les informations et quelles sont-elles? Livre Blanc Cabestan Des sources de données disparates Il existe autant d'approches pour reconnaître un

Plus en détail

Application du data mining pour l évaluation de risque en assurance automobile

Application du data mining pour l évaluation de risque en assurance automobile Application du data mining pour l évaluation de risque en assurance automobile 4 Septembre 2012 Sylvain Pannetier Lebeuf Recherche & Analytique Contenu Qui on est: La compagnie L équipe de recherche et

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Illustrations concrètes : cross selling et up-selling. Illustrations concrètes : la relation client - le social et l emailing

Illustrations concrètes : cross selling et up-selling. Illustrations concrètes : la relation client - le social et l emailing Définition et Enjeux du e-merchandising Illustrations concrètes : les interfaces Illustrations concrètes : cross selling et up-selling Illustrations concrètes : la relation client - le social et l emailing

Plus en détail

Les dessous des moteurs de recommandation

Les dessous des moteurs de recommandation Les dessous des moteurs de recommandation La personnalisation est un enjeu majeur du e-commerce aujourd hui. Elle réveille l esprit commerçant dans les boutiques en ligne en remettant le visiteur au cœur

Plus en détail

Eléments de statistique

Eléments de statistique Eléments de statistique L. Wehenkel Cours du 9/12/2014 Méthodes multivariées; applications & recherche Quelques méthodes d analyse multivariée NB: illustration sur base de la BD résultats de probas en

Plus en détail

L olivier Assurances Licence 3 Econométrie Lyon II

L olivier Assurances Licence 3 Econométrie Lyon II 15 novembre 2013 L olivier Assurances Licence 3 Econométrie Lyon II Pascal Gonzalvez 1 L olivier Assurances et le Groupe Admiral Segmentation et tarification en assurance auto Autres applications de la

Plus en détail

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes. Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de

Plus en détail

CALENDRIER 2015-2016 Ateliers et conférences

CALENDRIER 2015-2016 Ateliers et conférences ACTIVITÉS À VENIR Dernière mise à jour : le 1 er juin 2015 Atelier Date Région Positionnement d une entreprise : Comment se démarquer de ses concurrents Gestion du temps et des priorités : Comment faire

Plus en détail

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives *************

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives ************* ************* Cours de niveau gradué en méthodes quantitatives ************* SOL 6210 - Analyse quantitative avancée Le séminaire d analyse quantitative avancée se donne en classe une fois par année. Chaque

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET Phase 4 : Modélisation non-supervisée - 5 : Règles d association

Plus en détail

Optimisation des ressources des produits automobile première

Optimisation des ressources des produits automobile première EURIA EURo Optimisation produits automobile première Pauline PERROT promotion 2011 EURIA EURo 1 ère partie : contexte MMA (FFSA) MAAF (GEMA) SGAM : COVEA (AFA) GMF (GEMA) MMA : Plus 3 millions clients

Plus en détail

Quelles sont les principales formules utiles pour l étude de cas de vente?

Quelles sont les principales formules utiles pour l étude de cas de vente? Quelles sont les principales formules utiles pour l étude de cas de vente? Approvisionnement et gestion des stocks : des quantités vendues dans un Du stock initial, final et des livraisons, des commandes

Plus en détail

Fouille de données et aide à la décision.

Fouille de données et aide à la décision. Fouille de données et aide à la décision. Introduction au datamining. Anne-Claire Haury M2 Informatique Université Denis Diderot Second semestre 2014-2015 1 Introduction 2 Outline 1 Peut-on faire dire

Plus en détail

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation Programme des épreuves des concours externes de recrutement des personnels E1 RECRUTEMENT DES ASSISTANTS INGENIEURS DE RECHERCHE ET DE FORMATION...2 E1.1 Gestionnaire de base de données...2 E1.2 Développeur

Plus en détail

Chapitre 3 : INFERENCE

Chapitre 3 : INFERENCE Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage

Plus en détail

LES e-donateurs en france

LES e-donateurs en france LES e-donateurs en france Baromètre 2014 4 e édition Étude réalisée par et 1. BENCHMARK Présence digitale de 103 associations françaises membres de France Générosités. SOMMAIRE 2. QUESTIONNAIRE AUX associations

Plus en détail

PLAN. Les systèmes d'information analytiques. Exemples de décisions

PLAN. Les systèmes d'information analytiques. Exemples de décisions Les systèmes d'information analytiques Dr A.R. Baba-ali Maitre de conferences USTHB PLAN Le cycle de decision Les composants analytiques ETL (Extract, Transform and Load) Entrepot de (Data warehouse) Traitement

Plus en détail

Arbres de décision. Intelligence Artificielle et Systèmes Formels Master 1 I2L

Arbres de décision. Intelligence Artificielle et Systèmes Formels Master 1 I2L Arbres de décision Intelligence Artificielle et Systèmes Formels Master 1 I2L Sébastien Verel verel@lisic.univ-littoral.fr http://www-lisic.univ-littoral.fr/ verel Université du Littoral Côte d Opale Laboratoire

Plus en détail

PRÉPARATION DU BACCALAURÉAT MATHÉMATIQUES. SÉRIE ES Obligatoire et Spécialité

PRÉPARATION DU BACCALAURÉAT MATHÉMATIQUES. SÉRIE ES Obligatoire et Spécialité PRÉPARATIN DU BACCALAURÉAT MATHÉMATIQUES SÉRIE ES bligatoire et Spécialité Décembre 0 Durée de l épreuve : heures Coefficient : ou L usage d une calculatrice électronique de poche à alimentation autonome,

Plus en détail

Chapitre 2/ La fonction de consommation et la fonction d épargne

Chapitre 2/ La fonction de consommation et la fonction d épargne hapitre 2/ La fonction de consommation et la fonction d épargne I : La fonction de consommation keynésienne II : Validations et limites de la fonction de consommation keynésienne III : Le choix de consommation

Plus en détail

SAS ENTERPRISE MINER POUR L'ACTUAIRE

SAS ENTERPRISE MINER POUR L'ACTUAIRE SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada AGENDA Survol d Enterprise Miner de

Plus en détail

BTS Groupement A. Mathématiques Session 2011. Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

BTS Groupement A. Mathématiques Session 2011. Spécialités CIRA, IRIS, Systèmes électroniques, TPIL BTS Groupement A Mathématiques Session 11 Exercice 1 : 1 points Spécialités CIRA, IRIS, Systèmes électroniques, TPIL On considère un circuit composé d une résistance et d un condensateur représenté par

Plus en détail

études Le travailleur à temps partiel volontaire au chômage: un profil

études Le travailleur à temps partiel volontaire au chômage: un profil études Le travailleur à temps partiel volontaire au chômage: un profil Sommaire Introduction... 3 1. Evolution du nombre de travailleurs à temps partiel volontaire au chômage selon le sexe... 5. Evolution

Plus en détail

DISCOUNTED CASH-FLOW

DISCOUNTED CASH-FLOW DISCOUNTED CASH-FLOW Principes généraux La méthode des flux futurs de trésorerie, également désignée sous le terme de Discounted Cash Flow (DCF), est très largement admise en matière d évaluation d actif

Plus en détail

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING SÉLECTION DES RISQUES PRÉVISION DES DÉFAUTS SUIVI ET CONTRÔLE Pierre-Louis GONZALEZ Différents types de

Plus en détail

Pôle de Dakar S IMUL ATIONS. 1 Utiliser un taux d accroissement pour une simulation

Pôle de Dakar S IMUL ATIONS. 1 Utiliser un taux d accroissement pour une simulation FORMULAIRE ATELIER S IMUL ATIONS 1 Utiliser un taux d accroissement pour une simulation La projection de certaines variables se base sur une hypothèse de taux de croissance annuelle régulier et constant.

Plus en détail

Projet de Traitement du Signal Segmentation d images SAR

Projet de Traitement du Signal Segmentation d images SAR Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,

Plus en détail

IFT6561. Simulation: aspects stochastiques

IFT6561. Simulation: aspects stochastiques IFT 6561 Simulation: aspects stochastiques DIRO Université de Montréal Automne 2013 Détails pratiques Professeur:, bureau 3367, Pav. A.-Aisenstadt. Courriel: bastin@iro.umontreal.ca Page web: http://www.iro.umontreal.ca/~bastin

Plus en détail

Sommaire. Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos»)

Sommaire. Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos») Sommaire Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos») Novembre 2013 Table des matières 1. CONTEXTE ET OBJECTIFS... 3 2. MÉTHODES DE RECHERCHE...

Plus en détail

Travailler avec les télécommunications

Travailler avec les télécommunications Travailler avec les télécommunications Minimiser l attrition dans le secteur des télécommunications Table des matières : 1 Analyse de l attrition à l aide du data mining 2 Analyse de l attrition de la

Plus en détail

deux tâches dans le tableau et à cliquer sur l icône représentant une chaîne dans la barre d outils. 14- Délier les tâches : double cliquer sur la

deux tâches dans le tableau et à cliquer sur l icône représentant une chaîne dans la barre d outils. 14- Délier les tâches : double cliquer sur la MS Project 1- Créer un nouveau projet définir la date du déclenchement (début) ou de la fin : File New 2- Définir les détails du projet : File Properties (permet aussi de voir les détails : coûts, suivi,

Plus en détail

TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE

TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE Les résultats donnés par R et SAS donnent les valeurs des tests, la valeur-p ainsi que les intervalles de confiance. TEST DE COMPARAISON

Plus en détail

Le ROI du marketing digital

Le ROI du marketing digital Online Intelligence Solutions Le ROI du marketing digital et les Web Analytics Par Jacques Warren WHITE PAPER A propos de Jacques warren Jacques Warren évolue en marketing digital depuis 1996, se concentrant

Plus en détail

CALENDRIER 2015-2016 Ateliers et conférences

CALENDRIER 2015-2016 Ateliers et conférences ACTIVITÉS À VENIR Dernière mise à jour : le 2 juillet 2015 Atelier Date Région Positionnement d une entreprise : Comment se démarquer de ses concurrents Gestion du temps et des priorités : Comment faire

Plus en détail

Principales caractéristiques de Mixmod

Principales caractéristiques de Mixmod Modèle de mélanges Principales caractéristiques de Mixmod Gérard Govaert et Gilles Celeux 24 octobre 2006 1 Plan Le modèledemélange Utilisations du modèle de mélange Les algorithmes de Mixmod Modèle de

Plus en détail

BACCALAUREAT GENERAL

BACCALAUREAT GENERAL ACCALAUREAT GENERAL Session 2009 MATHÉMATIQUES - Série ES - Enseignement de Spécialité Liban EXERCICE 1 1) 2) C 3) C 4) A Explication 1. Chacun des logarithmes existe si et seulement si x > 4 et x > 2

Plus en détail

Les datas = le fuel du 21ième sicècle

Les datas = le fuel du 21ième sicècle Les datas = le fuel du 21ième sicècle D énormes gisements de création de valeurs http://www.your networkmarketin g.com/facebooktwitter-youtubestats-in-realtime-simulation/ Xavier Dalloz Le Plan Définition

Plus en détail

Méthodes d apprentissage statistique «Machine Learning»

Méthodes d apprentissage statistique «Machine Learning» Méthodes d apprentissage statistique «Machine Learning» Fabrice TAILLIEU, Sébastien DELUCINGE, Rémi BELLINA Le marché de l assurance a rarement été marqué par un environnement aussi difficile qu au cours

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions :

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions : Probabilités I- Expérience aléatoire, espace probabilisé : 1- Définitions : Ω : Ensemble dont les points w sont les résultats possibles de l expérience Des évènements A parties de Ω appartiennent à A une

Plus en détail

S e r v i r l e s clients actuels de maniè r e e f f ic a ce grâce a u «Co n s u m er Insight»

S e r v i r l e s clients actuels de maniè r e e f f ic a ce grâce a u «Co n s u m er Insight» Siège mondial : 5 Speen Street Framingham, MA 01701 États-Unis P.508.935.4400 F.508.988.7881 www.idc-ri.com S e r v i r l e s clients actuels de maniè r e e f f ic a ce grâce a u «Co n s u m er Insight»

Plus en détail

Examen d accès - 1 Octobre 2009

Examen d accès - 1 Octobre 2009 Examen d accès - 1 Octobre 2009 Aucun document autorisé - Calculatrice fournie par le centre d examen Ce examen est un questionnaire à choix multiples constitué de 50 questions. Plusieurs réponses sont

Plus en détail

LE CONTRÔLE DES CHARGES DE PERSONNEL Ce diaporama est consacré à l étude des moyens de contrôle de gestion dont on dispose pour la deuxième

LE CONTRÔLE DES CHARGES DE PERSONNEL Ce diaporama est consacré à l étude des moyens de contrôle de gestion dont on dispose pour la deuxième LE CONTRÔLE DES CHARGES DE PERSONNEL Ce diaporama est consacré à l étude des moyens de contrôle de gestion dont on dispose pour la deuxième composante du «prime cost» (coût principal), les charges de personnel.

Plus en détail

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto. des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le

Plus en détail

S84-1 LA GRC ET LE SI (Système d Information) 841 - Qualification des données clientèle. 842 - La segmentation de la clientèle

S84-1 LA GRC ET LE SI (Système d Information) 841 - Qualification des données clientèle. 842 - La segmentation de la clientèle S84-1 LA GRC ET LE SI (Système d Information) 841 - Qualification des données clientèle 842 - La segmentation de la clientèle 843 - Les actions personnalisées utilisation des procédures de consultation

Plus en détail

L apprentissage automatique

L apprentissage automatique L apprentissage automatique L apprentissage automatique L'apprentissage automatique fait référence au développement, à l analyse et à l implémentation de méthodes qui permettent à une machine d évoluer

Plus en détail

SYNERGIE Associés Confidentiel Reproduction interdite sans autorisation préalable Page 1 de 44

SYNERGIE Associés Confidentiel Reproduction interdite sans autorisation préalable Page 1 de 44 SYNERGIE Associés Confidentiel Reproduction interdite sans autorisation préalable Page 1 de 44 Le CRM (GRC) est la clef de votre succès Les Principes généraux de la Gestion de la Relation Clients Confidentiel

Plus en détail

Le métier de Chargé(e) d Etudes Statistiques

Le métier de Chargé(e) d Etudes Statistiques Le métier de Chargé(e) d Etudes Statistiques Nicolas Cabaj Sommaire Présentation du chargé d études statistiques 3 exemples de missions réalisées: Le scoring, illustré par un outil de détection des fraudes

Plus en détail