ANALYSE STATISTIQUE PRÉDICTIVE
|
|
- Ghislaine St-Hilaire
- il y a 8 ans
- Total affichages :
Transcription
1 Yoshua Bengio Chaire de Recherche du Canada sur les Algorithmes d Apprentissage Statistique, Université de Montréal Charles Dugas ApSTAT Technologies Inc. Et Aviva Canada SALON INTELLIGENCE D AFFAIRE 8 Novembre 2011, Montréal ANALYSE STATISTIQUE PRÉDICTIVE
2 Plan de travail Exemple pratique #1 (Charles Dugas, 9 min) Introduction à l analyse statistique prédictive (Yoshua Bengio, 30 min) Exemple pratique #2(Charles Dugas, 9 min) Pause et discussions individuelles (Yoshua Bengio & Charles Dugas, 30 min) Plénière (Charles Dugas & Yoshua Bengio, 40 min) Conclusion (Charles Dugas, 10 min)
3 La Valeur Économique du Client (VÉC)
4 Changement de philosophie Focus: produit " Focus: client " Attirer le consommateur" Rétention du consomm. " Transactions" Biens" Profitabilité du produit" Relations" Services" Gestion des clients" Élément essentiel: frais d acquisition (attirer) vs frais de maintien (conserver).! Un impact sur l intelligence d affaires: Intérêt pour la VÉC.!
5 Définition de la VÉC Aujourd hui Dans 1 mois Dans 2 mois Valeur, en date d aujourd hui, des profits tirés des achats futurs du client.
6 Définition de la VÉC Tient compte de 3 éléments: 1. Profits (marges) sur les achats (volume) futurs d un client 2. Rétention du client 3. Facteur de valeur présente (1$ aujourd hui vaut plus que 1$ l an prochain) VÉC Profit Réten- tion Valeur présente
7 Trois véhicules assurés André, 65 ans Bianka, 35 ans Colin, 21 ans Retraité Conduit peu et prudemment Aucun accident en 5 ans Bianka et sa famille. Conducteurs responsables Aucun accident en 5 ans Aime la vitesse 2 accidents à son actif Prime annuelle: 400$ Prime annuelle: 550$ Prime annuelle: 1300$
8 Calcul du profit Réclamations prédites! André Bianka Colin Prime 400$ 550$ 1300$ Réclamations 250$ 325$ 1000$ Autres frais 100$ 150$ 200$ Profit 50$ 75$ 100$ Profit (5 ans) 250$ 375$ 500$
9 VÉC: profit x rétention Rétention prédite! André (96%) Bianka (80%) Colin (69%) VÉC an1 50$ 75$ 100$ VÉC an2 48$ 60$ 69$ VÉC an3 46$ 48$ 48$ VÉC an4 44$ 38$ 33$ VÉC an5 42$ 31$ 23$ VÉC Tot. 231$ 252$ 272$
10 Impact des frais d acquisition Sans frais d acquisition Avec frais d acquisition VÉC André Bianka Colin Années Années
11 VÉC: récapitulation André Bianka Colin Profit 5 ans 250$ 375$ 500$ VÉC (incl. rétention) 231$ 252$ 272$ VÉC (incl. rétention et frais d acquisition) 212$ 170$ 158$ L analyse prédictive nous donne un portrait différent!
12 Utilisations Solliciter les segments à forte VÉC Meilleure valorisation des segments de marché Identifier les actions qui augmentent la rétention (donc la VÉC) Réagir aux changements (p.ex. suite à un accident, un déménagement, etc.)
13
14 Objectifs de l analyse statistique prédictive Outils pour prédire Données pour construire un prédicteur Utiliser le prédicteur sur de nouveaux cas Généraliser le mieux possible sur les nouveaux cas Évaluer et comparer les prédicteurs
15 Notions Discutées Données, variables: entrées vs cibles Étapes de l analyse prédictive Probabilité et espérance Classification, régression, prédiction de proba Exemples d algorithmes prédictifs Prétraitement des données data plumbing Généralisation à de nouveau cas: erreur de test Sélection de modèles, hyper-paramètres Split des données
16 Exemple: achat en ligne e.g. t=montant que le client dépensera dans ceee session On commence avec des données e.g. x 1 =temps passé depuis dernier achat (normalisé) x 2 =montant des achats passés (normalisé) x 3 =a déjà visité le site x 4 =vient de Montréal, etc.
17 Etapes pratiques d un projet d analyse prédictive
18 Probabilité et Espérance Aléas: achète ou n achète pas? Proba: proportion de succès attendue si on répétait l expérience Variable aléatoire: chaque valeur à probabilité o v.a. discrète: achète (oui) ou pas (non)? o v.a. continue: montant de l achat? Espérance d une v.a.: moyenne des valeurs, pondérée par la probabilité des évènements possibles
19 Entrées et sorties d un prédicteur Entrée X Sortie f(x) six Cible Y deux!
20 Apprendre à partir d exemples Image en entrée surprise joie peur Catégorie cible Associe deux types de variables aléatoires, e.g., Entrée = Image (e.g. intensités des pixels) Cible = Catégorie (e.g., émotions à détecter)
21 Prédire une catégorie Un prédicteur est entraîné à produire à partir d une entrée une sortie qui est une prédiction pour une cible associée à cette entrée Entrée: image predicteur Sortie: Émotion fear prédite = triste anger Cible: Émotion à prédire = colère Erreur=1=1 La sortie (prédiction) est comparée avec la cible pour calculer une erreur (0 ou 1). Le but de l entraînement est de réduire l espérance des erreurs futures.
22 Prédire une quantité: régression (ici: non linéaire, avec bruit) bruit e.g.: x=montant passé, y = montant futur (ventes)
23 L algorithme des plus- proches- voisins (k- NN) Pour un point test x: x" [2]" On trouve les k plus proches voisins de x parmi l ensemble d apprentissage (typiquement selon la distance Euclidienne). On associe à x la classe majoritaire parmi ses k voisins Âge du client x? Client n achète pas# k=3 Client achète# k est un hyper-paramètre Montant achats passés x" [1]"
24 Régression Linéaire Régularisée Régression linéaire: prédiction = combinaison linéaire des entrées. Prédic tion W 0 W 1 âge W 2 achats Apprentissage = trouver les coefficients w Régression linéaire classique: il faut que les entrées ne soient pas corrélées, il faut éviter d avoir trop de variables d entrée Régression linéaire régularisée (pénalité L2): règle ces problèmes (on peut avoir autant d entrées qu on veut mais leurs poids seront forcés à être plus petits par la régularisation). On mesure l erreur quadratique: (prédiction cible) 2
25 Modèles non- linéaires Algorithmes Tâches Commentaires Réseaux de neurones Classification, régression peut soutenir des millions d exemples (premier choix dans ce cas) Arbres de décision Classification prédiction très rapide Support Vector Machine (SVM) Classification ok jusqu à 100k exemples; linéaire si nombre de variables est immense Boosting Classification peu d hyperparamètres (boutons ajustables) Gaussian Process Regression Régression Premier choix quand moins de 1000 exemples
26 Prétraitement des données 1. Nettoyage des données (détecter semi-automatiquement et corriger les valeurs bizarres) 2. Imputation de valeurs manquantes 3. Encodage des données (selon l algo d apprentissage) Normalisation des variables réelles (soustraire moyenne, diviser par écart type) Optionellement discrétisation de variables numériques choisies. Représentation one-hot des variables catégoriques onehot5(3) = (0,0,1,0,0)
27 Généralisation à de nouveaux cas On peut facilement mettre au point un prédicteur qui donne exactement les bonnes réponses sur les données d apprentissage. Pas garanti de bonnes prédictions sur de nouveaux cas, et c est seulement ça qui nous intéresse. L erreur d apprentissage (sur l ensemble de données d apprentissage) est toujours optimiste On veut estimer l erreur de généralisation: ensemble de test (non utilisé pour apprendre). On veut choisir le modèle qui généralise le mieux.
28 Modélisation: sélection de modèles Plusieurs algos d apprentissage. Pour chaque algo, plusieurs choix de valeurs de ses hyper-paramètres (ex. nb de voisins k dans k-nn, nb de neurones dans un réseau de neurones,...) Pour chaque cas, on va entraîner un modèle puis évaluer sa performance de généralisation (en test).
29 Sélection de modèle: contrôle de la capacité Les hyper-paramètres des algorithmes permettent de contrôler la capacité du modèle. C est indispensable pour avoir une bonne généralisation. capacité trop faible sous-apprentissage capacité trop élevée sur-apprentissage capacité optimale bonne généralisation La performance sur l ensemble d entraînement n est pas un bon estimé de la généralisation
30 Split des données Diviser les gros ensembles de données en 3: 1. Données d entraînement pour estimer les paramètres des modèles 2. Données de validation pour évaluer l impact de divers choix de modèles et hyper-paramètres 3. Données de test (jamais utilisées pour autre chose) pour évaluer la généralisation comme sur le terrain Train: 70% Valid: 15% Test: 15%
31 Sélection de modèle et hyper- paramètres L évaluation de performance finale s effectue sur des données qui n ont servi ni pour l entrainement ni pour la sélection de modèles ou de capacité.
32 Optimisation de l allocation d effectifs en fonction de la profitabilité
33 Contexte Chaîne de commerce au détail o Vêtements et/ou accessoires o Plusieurs centaines de boutiques mondialement o Généralement, 5 15 employés en boutique
34 Plan général Prévision de la courbe de demande Nb optimal d employé/15 min. (fractionnaire) Création des horaires Contraintes ergonomiques Normes du travail Création des quarts de travail Employés spécifiques Préférences des employés 34
35 Types de données Nb de clients en magasin à chaque moment (compte-personnes)" Nb d employés sur le plancher à chaque moment (données de paye)" Historique des Transactions réalisées" Autres variables: événements spéciaux (boxing day, ventes, grèves), météo (tempêtes, 1 er beau week-end de l année) " 35
36 Équation du profit Profit Ventes x Marge Salaires 36
37 Décomposition des ventes (période) Ventes Trafic Nb de clients qui entrent en magasin" 37 Taux de conversion Proportion des clients qui achètent quelque chose" Panier moyen Quantité achetée, sachant qu il y a un achat"
38 Architecture de modélisation Ventes Profit Employés Trafic Variables Conversion et Panier moyen QoS
39 Modèles possibles Trafic et panier moyen: problèmes de régression o Réponses approximativement continues pour trafic o Modèles possibles (par ex.): Linéaire, Linéaire généralisé (GLM) Réseau de neurones (non-linéaire) Taux de conversion: estimation de probabilité conditionnelle o Réponse: fraction entre 0 et 1 o Modèles possibles: Régression logistique Réseau de neurones
40 Optimisation: courbe de demande Profit espéré ($)" Meilleur compromis entre qualité de service et masse salariale" Personne-heures travaillées" 40
41 Défi: Météo Impact quasi universel sur le commerce au détail Les historiques de météo sont relativement faciles à trouver (et gratuit en général, p.e. Environnement Canada) Plus difficile à trouver: historique des prévisions
42 Conclusions Ø La conception de l architecture de modélisation dépend des données disponibles Ø On doit s assurer que l analyse prédictive colle au processus opérationnel
43 Etapes pratiques d un projet d analyse prédictive Vision haut- niveau d un projet complet
44 Ce qu on peut prédire Probabilité d un évènement oui/non (le client clique, achète, quitte, etc) Probabilité d appartenir à une catégorie (groupe démographique, type de produit acheté) Espérance d une variable continue (temps entre deux évènements, valeur du client, montant payé, montant perdu, ) Densité de probabilité d une variable continue Proportionnelle à la probabilité de trouver environ une certaine valeur, e.g. on peut calculer la probabilité qu une variable continue soit dans un intervalle choisi
45 QUESTIONNAIRE 1. Secteur de votre organisation pouvant bénéficier? 2. Organisation et accès aux données? 3. Variables d entrée et cible à prédire? 4. Type des variables cible? 5. Utilisation des prédictions? 6. Décisions directes ou prédictions de probabilités? 7. Combien de données? 8. Les données changent dans le temps? 9. Contraintes de temps de calcul? 10. Comment mesurer l utilité économique?
46 BACKUP
47 Sous- problèmes Données historiques" Données temps réel" Contraintes de qualité de service Prévision des besoins: Achalandage Temps requis/client Dimensionnement Nb d employés pour répondre au besoin Courbe de demande d effectifs 47
48 Assurances générales Ratio Sinistres/primes Sinistres / Primes Volume d affaires Total des primes Rétention - pour une fenêtre de temps donnée - pourcentage de renouvellement (env. 90%) - mesure indépendante du client Dépenses, 20% Profits, 5% Sinistres, 75% Mesures rétrospectives vs prédictives. Buts: - identifier les profils des consommateurs fidèles - identifier les actions qui impactent la rétention
49 Steps towards a CLV model 1 Choose definition - upselling: can you trace a customer s business? - cross selling:is there a unique key across products? - switchers: can you match profiles through time? - new entrants: what do you know of your prospects? 2 Make assumptions - for each client, project - profits or - revenues and expenses important: recognize acquisition expenses - discounting factor based on cost of capital - retention models can be based on survival analysis - horizon, e.g. 5 years
50 Steps towards a CLV model 3 Build database for survival analysis - initial profile with length of stay (SAS procs: lifetest, lifereg, phreg) - data plumbing : cleaning and encoding unobserved truncated fully observed censored unobserved start end
51 Steps towards a CLV model 4 Modelling - design modelling experiment - train models - select best performing models 5 Enjoy! - CLV-based comparison of market segments - CLV-based valuation of retention increases - Prioritization of outgoing agent calls - Prioritization of marketing offers
52 Rétention: analyse prédictive André: 96% Bianka: 80% Colin: 69% Rétention 1 100,0% 100,0% 100,0% Rétention 2 96,0% 80,0% 69,0% Rétention 3 Rétention 4 Rétention 5 92,2% (96%*96% ) 88,5% (92,2%*96%) 84,9% (88,5%*96%) 64,0% 47,6% 51,2% 32,9% 41,0% 22,7%
53 Frais d acquisition de 250$ André (100$) Bianka (150$) Colin (200$) Frais 1 300$ 350$ 400$ Frais 2 50$ 100$ 150$ Frais 3 50$ 100$ 150$ Frais 4 50$ 100$ 150$ Frais 5 50$ 100$ 150$
54 Profits André (50$) Bianka (75$) Colin (100$) Frais 1 (150$) (125$) (100$) Frais 2 100$ 125$ 150$ Frais 3 100$ 125$ 150$ Frais 4 100$ 125$ 150$ Frais 5 100$ 125$ 150$
55 Focus «client»? 1. Autres véhicules du même client p.ex.: le 2e véhicule d André 2. Autres produits d assurance du même client p.ex.: les biens de Colin (assurance habitation) 3. Autres produits financiers: p.ex.: le prêt hypothécaire de Bianka 4. Autres clients du ménage: p.ex.: la voiture du conjoint de Bianka
56 Avantages du focus client 1. Définir la croissance potentielle de la relation en fonction De notre wallet share actuel Des besoins futurs (Colin vs André) 2. Tenir compte des interactions entre les différents produits La rétention pour un produit est supérieure si d autres produits sont présents. Les consommateurs bougent plusieurs produits en même temps
57 Défis au niveau des données 1. Bases de données historiques de la clientèle pour estimer la rétention (arrivées et départs des clients). 2. Estimation précise des frais dans le temps et par segment. 3. Croiser les bases de données de différents produits (p.ex.: assurance habitation et automobile). 4. Données externes socio-démo avec Statistique Canada, cotes de crédit FICO, météo avec environnement Canada. social: Facebook, Twitter, Linkedin, etc.
58 Conclusions 1. La VÉC permet d analyser l ensemble de la relation avec un client, à plus long terme. 2. Deux éléments importants interagissent: Frais d acquisition Rétention 3. La définition du client joue un rôle majeur. 4. L intelligence d affaires devra permettre l intégration efficace d un nombre croissant de sources de données externes.
59 VÉC: profit x rétention André Bianka Colin VÉC 1 (150$) 50$ (125$) 75$ (100$) 100$ VÉC 2 96$ 48$ 100$ 60$ 104$ 69$ VÉC 3 92$ 46$ 80$ 48$ 71$ 48$ VÉC 4 88$ 44$ 64$ 38$ 49$ 33$ VÉC 5 85$ 42$ 51$ 31$ 34$ 23$ VÉC Tot. 212$ 231$ 170$ 252$ 158$ 272$
60 Pour la prédiction de séries temporelles: validation séquentielle
61 Défi: Données de trafic Les données de trafic sont habituellement captées avec des compte-personnes («people counter») Servent aussi à la prévention des vols Fréquent: compteurs unidirectionnels o Impossible de dire si la personne entre ou sort Difficile de déterminer le nombre total de personnes en magasin à chaque moment
62 Nombre d horaires possibles Le nombre d horaires possibles croît extrêmement rapidement en fonction du nombre d employés" " On ne peut vérifier chaque horaire individuellement." 62
Des solutions de data mining pour résoudre des problèmes d estimation du risque 12 juin 2009 Association des Statisticiennes et Statisticiens du
Des solutions de data mining pour résoudre des problèmes d estimation du risque 12 juin 2009 Association des Statisticiennes et Statisticiens du Québec 1 - Data mining vs Statistique Pourquoi les statisticiens
Plus en détailL'intelligence d'affaires: la statistique dans nos vies de consommateurs
L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailLe data mining et l assurance Mai 2004. Charles Dugas Président Marianne Lalonde Directrice, développement des affaires
Le data mining et l assurance Mai 2004 Charles Dugas Président Marianne Lalonde Directrice, développement des affaires AGENDA Qu est-ce que le data mining? Le projet et les facteurs de réussite Les technologies
Plus en détailLe Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailOrganisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.
2 jours : Mardi 15 et mercredi 16 novembre 2005 de 9 heures 30 à 17 heures 30 Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. Madame, Monsieur, On parle
Plus en détailIntroduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Plus en détailAgenda de la présentation
Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining
Plus en détail$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU
$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le
Plus en détail5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: 514.592.9301 F: 514.340.6850 info@apstat.com www.apstat.com
Application des réseaux de neurones au plan de répartition des risques 5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: 514.592.9301 F: 514.340.6850 info@apstat.com www.apstat.com Copyright c
Plus en détailUne comparaison de méthodes de discrimination des masses de véhicules automobiles
p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Plus en détailMesures de Valeur-Client. Étienne Plante-Dubé Modélisation & Recherche Desjardins Groupe d assurances générales etienne.plante.dube@dgag.
Mesures de Valeur-Client Étienne Plante-Dubé Modélisation & Recherche Desjardins Groupe d assurances générales etienne.plante.dube@dgag.ca Plan de la présentation 2 Différents points de vue de valeur Valeur
Plus en détailAccélérer l agilité de votre site de e-commerce. Cas client
Accélérer l agilité de votre site de e-commerce Cas client L agilité «outillée» devient nécessaire au delà d un certain facteur de complexité (clients x produits) Elevé Nombre de produits vendus Faible
Plus en détailESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring
ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des
Plus en détailCoup de Projecteur sur les Réseaux de Neurones
Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche
Plus en détailJSIam Introduction talk. Philippe Gradt. Grenoble, March 6th 2015
Introduction talk Philippe Gradt Grenoble, March 6th 2015 Introduction Invention Innovation Market validation is key. 1 Introduction Invention Innovation Market validation is key How to turn a product
Plus en détailUniversité de Montréal. par Sylvain Pannetier Lebeuf
Université de Montréal Prédiction de l attrition en date de renouvellement en assurance automobile avec l aide de processus gaussiens par Sylvain Pannetier Lebeuf Département de mathématiques et statistiques
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailActuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.
Actuariat I ACT2121 septième séance Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement
Plus en détailLa stratégie de contenu. en pratique 30 OUTILS PASSÉS AU CRIBLE. Isabelle Canivet & Jean-Marc Hardy DESIGN
DESIGN Isabelle Canivet & Jean-Marc Hardy La stratégie de contenu en pratique 30 OUTILS PASSÉS AU CRIBLE Groupe Eyrolles, 2012 ISBN : 978-2-212-13510-7 1 Les indicateurs de performance De nombreuses entreprises
Plus en détailLes Best Practices du Marketing Comportemental en Temps Réel
REAL-TIME MARKETING Les Best Practices du Marketing Comportemental en Temps Réel Comment booster rapidement vos taux de conversion? Adrien de Turckheim, Sebastien Etter, BEAMPULSE 16 05 2013 Benoît Liebenguth,
Plus en détailSéminaire CRM Les directions de recherche et les perspectives du Customer Relationship Management 1
Faculté des Sciences économiques et sociales de l Université de Fribourg Séminaire CRM Les directions de recherche et les perspectives du Customer Relationship Management 1 Séminaire présenté auprès de
Plus en détailPrésentation à l Institut canadien de la retraite et des avantages sociaux. Selon Wikipédia
Évaluation actuarielle du Régime de rentes du Québec au 31 décembre 2012, une œuvre de science-fiction? Présentation à l Institut canadien de la retraite et des avantages sociaux Georges Langis Actuaire
Plus en détailOù investir en 2014? Grand colloque sur la gestion des actifs des caisses de retraite
Où investir en 2014? Grand colloque sur la gestion des actifs des caisses de retraite Optimisation de la politique de placement : vers quelles classes d actifs se tourner? Stéphan Lazure Conseiller principal
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailTSTI 2D CH X : Exemples de lois à densité 1
TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun
Plus en détailIntroduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS)
MIT820: Entrepôts de données et intelligence artificielle Introduction aux outils BI de SQL Server 2014 Fouille de données avec SQL Server Analysis Services (SSAS) Description générale Ce tutoriel a pour
Plus en détailLes RH à l ère du Big Data: faites parler vos données! Mesurez et optimisez la performance de vos programmes RH 18 septembre 2013
Les RH à l ère du Big Data: faites parler vos données! Mesurez et optimisez la performance de vos programmes RH 18 septembre 2013 Qui nous sommes Firme québécoise (bureaux à Québec et Montréal) Spécialisée
Plus en détailACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12
ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12 ARTHUR CHARPENTIER 1 Une compagnie d assurance modélise le montant de la perte lors d un accident par la variable aléatoire continue X uniforme sur l intervalle
Plus en détailApplication du data mining pour l évaluation de risque en assurance automobile
Application du data mining pour l évaluation de risque en assurance automobile 4 Septembre 2012 Sylvain Pannetier Lebeuf Recherche & Analytique Contenu Qui on est: La compagnie L équipe de recherche et
Plus en détailSOCIAL CRM pour le E-commerce
SOCIAL CRM pour le E-commerce Spreadbutton, solution en mode Saas, permet aux e-commerçants de gérer leur communauté client avec Facebook. La solution intègre des modules marketing spécifiques à la vente
Plus en détailIllustrations concrètes : cross selling et up-selling. Illustrations concrètes : la relation client - le social et l emailing
Définition et Enjeux du e-merchandising Illustrations concrètes : les interfaces Illustrations concrètes : cross selling et up-selling Illustrations concrètes : la relation client - le social et l emailing
Plus en détailLes dessous des moteurs de recommandation
Les dessous des moteurs de recommandation La personnalisation est un enjeu majeur du e-commerce aujourd hui. Elle réveille l esprit commerçant dans les boutiques en ligne en remettant le visiteur au cœur
Plus en détailEléments de statistique
Eléments de statistique L. Wehenkel Cours du 9/12/2014 Méthodes multivariées; applications & recherche Quelques méthodes d analyse multivariée NB: illustration sur base de la BD résultats de probas en
Plus en détailACT3284 Modèles en assurance IARD Examen Final - 14 décembre 2011
#1 À partir de l'information ci-dessous : Sinistres payés cumulatifs Réserves aux dossiers 12 mois 24 mois 36 mois 12 mois 24 mois 36 mois 2008 240,000 393,600 499,200 2008 160,000 120,000 79,200 2009
Plus en détailUNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives *************
************* Cours de niveau gradué en méthodes quantitatives ************* SOL 6210 - Analyse quantitative avancée Le séminaire d analyse quantitative avancée se donne en classe une fois par année. Chaque
Plus en détailIFT 6261: L Analytique Web. Fares Aldik, Consultant principal, Analytique Web et optimisation Bell Marchés Affaires services d expérience client
IFT 6261: L Analytique Web Fares Aldik, Consultant principal, Analytique Web et optimisation Bell Marchés Affaires services d expérience client 2012 01 04 Analytique Web : une pratique multidisciplinaire
Plus en détailOptimisation des ressources des produits automobile première
EURIA EURo Optimisation produits automobile première Pauline PERROT promotion 2011 EURIA EURo 1 ère partie : contexte MMA (FFSA) MAAF (GEMA) SGAM : COVEA (AFA) GMF (GEMA) MMA : Plus 3 millions clients
Plus en détailTable des matières: Guidelines Fonds de Pensions
Table des matières: Guidelines Fonds de Pensions TABLE DES MATIERES... 1 INTRODUCTION... 2 1 FINANCEMENT ET FINANCEMENT MINIMUM... 3 1.1 FINANCEMENT... 3 1.2 FINANCEMENT DE PLAN... 3 1.3 FINANCEMENT MÉTHODE
Plus en détailQuelles sont les principales formules utiles pour l étude de cas de vente?
Quelles sont les principales formules utiles pour l étude de cas de vente? Approvisionnement et gestion des stocks : des quantités vendues dans un Du stock initial, final et des livraisons, des commandes
Plus en détailL olivier Assurances Licence 3 Econométrie Lyon II
15 novembre 2013 L olivier Assurances Licence 3 Econométrie Lyon II Pascal Gonzalvez 1 L olivier Assurances et le Groupe Admiral Segmentation et tarification en assurance auto Autres applications de la
Plus en détailSujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.
Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de
Plus en détailChapitre 2/ La fonction de consommation et la fonction d épargne
hapitre 2/ La fonction de consommation et la fonction d épargne I : La fonction de consommation keynésienne II : Validations et limites de la fonction de consommation keynésienne III : Le choix de consommation
Plus en détailSAS ENTERPRISE MINER POUR L'ACTUAIRE
SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada AGENDA Survol d Enterprise Miner de
Plus en détailCALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING
CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING SÉLECTION DES RISQUES PRÉVISION DES DÉFAUTS SUIVI ET CONTRÔLE Pierre-Louis GONZALEZ Différents types de
Plus en détailSAN07 IBM Social Media Analytics:
SAN07 IBM Social Media Analytics: Vos clients partagent leurs connaissances Déployez une stratégie gagnante! Eric Martin Social Media Analytics Leader Europe IBM SWG, Business Analytics @Eric_SMA 1 Le
Plus en détailPôle de Dakar S IMUL ATIONS. 1 Utiliser un taux d accroissement pour une simulation
FORMULAIRE ATELIER S IMUL ATIONS 1 Utiliser un taux d accroissement pour une simulation La projection de certaines variables se base sur une hypothèse de taux de croissance annuelle régulier et constant.
Plus en détailDISCOUNTED CASH-FLOW
DISCOUNTED CASH-FLOW Principes généraux La méthode des flux futurs de trésorerie, également désignée sous le terme de Discounted Cash Flow (DCF), est très largement admise en matière d évaluation d actif
Plus en détailLe ROI du marketing digital
Online Intelligence Solutions Le ROI du marketing digital et les Web Analytics Par Jacques Warren WHITE PAPER A propos de Jacques warren Jacques Warren évolue en marketing digital depuis 1996, se concentrant
Plus en détailTravailler avec les télécommunications
Travailler avec les télécommunications Minimiser l attrition dans le secteur des télécommunications Table des matières : 1 Analyse de l attrition à l aide du data mining 2 Analyse de l attrition de la
Plus en détailMéthodes d apprentissage statistique «Machine Learning»
Méthodes d apprentissage statistique «Machine Learning» Fabrice TAILLIEU, Sébastien DELUCINGE, Rémi BELLINA Le marché de l assurance a rarement été marqué par un environnement aussi difficile qu au cours
Plus en détailSommaire. Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos»)
Sommaire Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos») Novembre 2013 Table des matières 1. CONTEXTE ET OBJECTIFS... 3 2. MÉTHODES DE RECHERCHE...
Plus en détailLes datas = le fuel du 21ième sicècle
Les datas = le fuel du 21ième sicècle D énormes gisements de création de valeurs http://www.your networkmarketin g.com/facebooktwitter-youtubestats-in-realtime-simulation/ Xavier Dalloz Le Plan Définition
Plus en détailSYNERGIE Associés Confidentiel Reproduction interdite sans autorisation préalable Page 1 de 44
SYNERGIE Associés Confidentiel Reproduction interdite sans autorisation préalable Page 1 de 44 Le CRM (GRC) est la clef de votre succès Les Principes généraux de la Gestion de la Relation Clients Confidentiel
Plus en détailS e r v i r l e s clients actuels de maniè r e e f f ic a ce grâce a u «Co n s u m er Insight»
Siège mondial : 5 Speen Street Framingham, MA 01701 États-Unis P.508.935.4400 F.508.988.7881 www.idc-ri.com S e r v i r l e s clients actuels de maniè r e e f f ic a ce grâce a u «Co n s u m er Insight»
Plus en détailL apprentissage automatique
L apprentissage automatique L apprentissage automatique L'apprentissage automatique fait référence au développement, à l analyse et à l implémentation de méthodes qui permettent à une machine d évoluer
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailData Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.
des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le
Plus en détailLES e-donateurs en france
LES e-donateurs en france Baromètre 2014 4 e édition Étude réalisée par et 1. BENCHMARK Présence digitale de 103 associations françaises membres de France Générosités. SOMMAIRE 2. QUESTIONNAIRE AUX associations
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailLivre blanc. CRM: Quels sont les bénéfices pour votre entreprise?
Livre blanc CRM: Quels sont les bénéfices pour votre entreprise? Longtemps considéré comme un outil de luxe exclusivement réservé aux grands groupes, le CRM a su démontrer au fil du temps, que son efficacité
Plus en détailS84-1 LA GRC ET LE SI (Système d Information) 841 - Qualification des données clientèle. 842 - La segmentation de la clientèle
S84-1 LA GRC ET LE SI (Système d Information) 841 - Qualification des données clientèle 842 - La segmentation de la clientèle 843 - Les actions personnalisées utilisation des procédures de consultation
Plus en détailI- Définitions des signaux.
101011011100 010110101010 101110101101 100101010101 Du compact-disc, au DVD, en passant par l appareil photo numérique, le scanner, et télévision numérique, le numérique a fait une entrée progressive mais
Plus en détailL analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :
La vision nous permet de percevoir et d interpreter le monde qui nous entoure. La vision artificielle a pour but de reproduire certaines fonctionnalités de la vision humaine au travers de l analyse d images.
Plus en détailLe risque Idiosyncrasique
Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes
Plus en détailTechniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit
Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit Adil Belhouari HEC - Montréal - Journées de l Optimisation 2005-09 Mai 2005 PLAN DE LA PRÉSENTATION
Plus en détailL ATTRIBUTION EN MARKETING DIGITAL
Online Intelligence Solutions L ATTRIBUTION EN MARKETING DIGITAL Par Jacques Warren WHITE PAPER WHITE PAPER A Propos de Jacques Warren Jacques Warren évolue en marketing digital depuis 1996, se concentrant
Plus en détailProjet de Traitement du Signal Segmentation d images SAR
Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,
Plus en détail1 Modélisation d être mauvais payeur
1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage
Plus en détailOptimiser l impact de son site avec. Nantes, le 23-09-2009
Optimiser l impact de son site avec Nantes, le 23-09-2009 1 Préambule 14/11/2008 = Nouvelle version de Google Analytics nouvelle interface (accès + rapide à l info), création de rapports personnalisés
Plus en détailMarketing et CRM: Comment définir une stratégie informatique en fonction de la stratégie commerciale?
Marketing et CRM: Comment définir une stratégie informatique en fonction de la stratégie commerciale? Jean - Charles Neau Juin 2008 La croissance requiert du soin et de l attention 2 Le CRM n est jamais
Plus en détailBTS Groupement A. Mathématiques Session 2011. Spécialités CIRA, IRIS, Systèmes électroniques, TPIL
BTS Groupement A Mathématiques Session 11 Exercice 1 : 1 points Spécialités CIRA, IRIS, Systèmes électroniques, TPIL On considère un circuit composé d une résistance et d un condensateur représenté par
Plus en détailPlan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation
Complex Event Processing Traitement de flux de données en temps réel Romain Colle R&D Project Manager Quartet FS Plan Génération et exploitation de données CEP et applications Flux de données et notifications
Plus en détailTable des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Plus en détailVision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007
Vision industrielle et télédétection - Détection d ellipses Guillaume Martinez 17 décembre 2007 1 Table des matières 1 Le projet 3 1.1 Objectif................................ 3 1.2 Les choix techniques.........................
Plus en détailSMARC La révolution des usages et des technologies : Quels impacts sur votre Stratégie Digitale. Mardi, le 21 avril 2015 SMARC G16
SMARC La révolution des usages et des technologies : Quels impacts sur votre Stratégie Digitale Mardi, le 21 avril 2015 SMARC G16 Avant, la relation entre le Client et la Marque était simple Depuis, les
Plus en détailQUELLE DOIT ÊTRE L AMPLEUR DE LA CONSOLIDATION BUDGÉTAIRE POUR RAMENER LA DETTE À UN NIVEAU PRUDENT?
Pour citer ce document, merci d utiliser la référence suivante : OCDE (2012), «Quelle doit être l ampleur de la consolidation budgétaire pour ramener la dette à un niveau prudent?», Note de politique économique
Plus en détailMesurer son ROI Partie 2
Mesurer son ROI Partie 2 Optimisation et Fidélisation Emmanuelle DAHAN - Trafic Manager Oxatis Denis FAGES - Directeur du site www.chacunsoncafe.fr Journées Oxygène 13 et 14 mai 2011 Sommaire Rappel des
Plus en détailQU EST-CE QUE LE DECISIONNEL?
La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce
Plus en détailComment évaluer une banque?
Comment évaluer une banque? L évaluation d une banque est basée sur les mêmes principes généraux que n importe quelle autre entreprise : une banque vaut les flux qu elle est susceptible de rapporter dans
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailPortrait statistique de la population de représentant en épargne collective au Québec
Portrait statistique de la population de représentant en épargne collective au Québec Par Alexandre Moïse 1 Marie Hélène Noiseux 2 1-Alexandre Moïse, B.Gest., M.Sc.A., Chercheur à l'université du Québec
Plus en détailCompte rendu de l examen par le BSIF des coefficients du risque d assurance
Compte rendu de l examen par le BSIF des coefficients du risque d assurance Le présent document précise encore davantage les données et la méthodologie utilisées par le BSIF pour calculer les marges pour
Plus en détailK. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau
Apport des modèles de krigeage à la simulation numérique K Ammar, F Bachoc, JM Martinez CEA-Saclay, DEN, DM2S, F-91191 Gif-sur-Yvette, France Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau Apport des
Plus en détailPrésentation du sujet de thèse Schémas temporels hybrides fondés sur les SVMs pour l analyse du comportement du conducteur
Présentation du sujet de thèse Schémas temporels hybrides fondés sur les SVMs pour l analyse du comportement du conducteur Réalisé par : Bassem Besbes Laboratoire d Informatique, Traitement de l Information
Plus en détailTMS Enterprise Description des rapports
TMS Enterprise Description des rapports Dernière modification: 22/08/2011 Version 1.2 St. Michael Strategies #201 701 Salaberry Chambly Québec Canada J3L 1R2 (450) 658-5148 www.storetraffic.com Contents
Plus en détailComportement client et promesse des marques sur les réseaux sociaux
Comportement client et promesse des marques sur les réseaux sociaux secteurs d activité multiculturels. Le Customer Experience Lab -«CX Lab»- de Teleperformance ouvert en 2013 à Lisbonne, mène des recherches
Plus en détailSOCIAL CRM: DE LA PAROLE À L ACTION
LIVRE BLANC SOCIAL CRM: DE LA PAROLE À L ACTION Découvrez comment le Social CRM peut travailler pour vous LIVRE BLANC SOCIAL CRM: DE LA PAROLE À L ACTION 2 À PROPOS Au cours des dernières années, vous
Plus en détailTraitement des données avec Microsoft EXCEL 2010
Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation
Plus en détailModèle d ajustement aux groupes de véhicules CLEAR. Université Laval 16 janvier 2015
Modèle d ajustement aux groupes de véhicules CLEAR Université Laval 16 janvier 2015 Agenda Présentation des compagnies Promutuel Assurance Groupe Co-operators Présentation de la problématique Groupes CLEAR
Plus en détailFormation e-commerce : Webmarketing
Page 1 sur 6 28 bd Poissonnière 75009 Paris T. +33 (0) 1 45 63 19 89 contact@ecommerce-academy.fr http://www.ecommerce-academy.fr/ Formation e-commerce : Webmarketing Votre boutique e-commerce est lancée
Plus en détailChapitre 3 : INFERENCE
Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage
Plus en détailModèles à Événements Discrets. Réseaux de Petri Stochastiques
Modèles à Événements Discrets Réseaux de Petri Stochastiques Table des matières 1 Chaînes de Markov Définition formelle Idée générale Discrete Time Markov Chains Continuous Time Markov Chains Propriétés
Plus en détailL analyse de la gestion de la clientèle
chapitre 1 - La connaissance du client * Techniques utilisées : observation, recherche documentaire, études de cas, études qualitatives (entretiens de groupes ou individuels, tests projectifs, analyses
Plus en détailConnaissance Client et Digital : quels enjeux pour quelles valeurs? Non à la personnalisation bidon! Vente Privée Orange Gan Assurances
Connaissance Client et Digital : quels enjeux pour quelles valeurs? Non à la personnalisation bidon! WIDE COFFEE Vente Privée Orange Gan Assurances 1 Serge Hauser Nathalie Patrat Chrystel Galissié A G
Plus en détail1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données
1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données Votre interlocuteur Didier Gaultier Directeur Data Science Business & Decision Professeur de Statistique à l
Plus en détail