Méthodes d apprentissage statistique («Machine Learning»)
|
|
- Philippe Mongrain
- il y a 8 ans
- Total affichages :
Transcription
1 Méthodes d apprentissage statistique («Machine Learning») Journées d Etudes IARD Niort, 21 Mars 2014 Fabrice TAILLIEU Sébastien DELUCINGE Rémi BELLINA 2014 Milliman. All rights reserved
2 Sommaire Introduction Les méthodes d apprentissage statistique Illustration 2
3 Introduction L environnement du marché de l assurance Le marché de l assurance non-vie est extrêmement compétitif en France, ce qui fait peser une incertitude importante sur les marges des compagnies. Plusieurs facteurs accentuent ce phénomène, notamment : L aggravation des charges sinistres sur certaines branches (accidents corporels lourds, assurance santé, événements climatiques, ) L environnement économique et financier Les changements législatifs (réforme FGAO, fin de la différenciation liée au critère de genre, loi Hamon, entrée en vigueur de Solvabilité II, ) L incertitude liée à de nouveaux risques (risques technologiques, risques climatiques, ) 3
4 Introduction L environnement du marché de l assurance Les résultats des compagnies s en ressortent fortement : Cotisations acquises (Mds ) Résultat technique (Mds ) Résultat net comptable (Mds ) Source : Rapport annuel FFSA 2012, Sociétés dommages 4
5 Introduction Les enjeux pour une compagnie d assurance Dans ce contexte, il est primordial pour toute compagnie : D identifier les segments de clientèle fragilisant ses résultats, ou à l inverse ceux qui peuvent êtres créateurs de richesse De suivre les résultats des affaires en portefeuille de manière objective, indépendamment de la structure tarifaire utilisée lors de la souscription de ces affaires D être capable d identifier les actions à mettre en œuvre, et dans la mesure du possible avant ses concurrents De mettre en œuvre les actions nécessaires pendant les périodes de renouvellement (résiliations, augmentations/baisses tarifaires) et tout au long de l année (suivi de la performance d un réseau de distribution, actions marketing vis-àvis des clients à conserver en portefeuille, efforts commerciaux sur les affaires nouvelles, etc) Dans la plupart des compagnies d assurance, ces travaux sont aujourd hui menés en utilisant des techniques et des indicateurs relativement standardisés. 5
6 Introduction Les dimensions de modélisation De nouvelles dimensions à prendre en compte : Temps nécessaire à l implémentation des modèles Choix du type de modélisation (GLM, Apprentissage statistique, Mix des 2, etc) Les contraintes des Systèmes d Informations existants La distribution des données Les variables candidates à la modélisation (leur nombre et leur connaissance par l actuaire) et leurs interactions Le diagnostic recherché par le modèle (tarif, revue, scoring, valeur client, ) Pour un grand nombre de ces dimensions, le choix des méthodes d apprentissage statistique sera le plus à même de répondre aux besoins croissants en termes de modélisations. 6
7 Introduction Les enjeux pour une compagnie d assurance Pour répondre aux problématiques nouvelles soulevées par le management, les actuaires ont besoin d outils adaptés au nouvel environnement dans lequel leur compagnie exerce. Quelles solutions apportent les méthodes d apprentissage statistique pour effectuer les bons diagnostics? Est-ce pour autant la fin des GLM en tarification? 7
8 Sommaire Introduction Les méthodes d apprentissage statistique Illustration 8
9 Les méthodes d apprentissage statistique Machine learning Définition : on parle de machine learning ou d apprentissage lorsqu un algorithme est mis en œuvre pour apprendre et extraire des informations d une base de données. Une fois la phase d apprentissage terminée, on peut utiliser les résultats pour réaliser des prédictions. Cela couvre un domaine très vaste, tant par les méthodes (réseaux de neurones, arbres, méthodes ensemblistes, etc.) que par les applications (filtre anti-spam, marketing, etc.). Nous nous concentrons sur l algorithme CART (Classification And Regression Tree) et ses méthodes d agrégation. Source : Michie D., Spiegelhalter D.J., Taylor C.C. (1984) Machine Learning, Neural and Statistical Classification 9
10 Les méthodes d apprentissage statistique Base de données pour illustration BASE DE DONNÉES X 1 X 2 X 3 X 4 X 5 Y LUXE CITADINE CYLINDRE USAGE AGE_COND NOMBRE_SIN 1 N N 4 PRIVE N N 6 PRIVE N Y 4 COMMERCIAL N Y 4 PRIVE N N 4 PRIVE Y Y 4 COMMERCIAL N N 4 BUSINESS N N 6 PRIVE Y Y 4 PRIVE N N 6 PRIVE N N 8 PRIVE N Y 4 BUSINESS Y N 6 PRIVE N N 6 PRIVE N N 4 BUSINESS N Y 4 PRIVE N N 4 COMMERCIAL 40 1 Apprentissage Validation Test 70% 20% 10% 10
11 Les méthodes d apprentissage statistique Cadre mathématique (1/4) Variables explicatives : X 1,, X p. Variable à expliquer : Y. On cherche parmi un ensemble de fonctions admissibles F : φ R p R, x = x 1,, x p φ x = y Comment trouver une «bonne» fonction φ? Selon un critère quadratique et sans restriction sur F, la meilleure fonction φ est l espérance conditionnelle : φ = arg min φ F Y φ X 2 = arg min W L 2 σ X Y W 2 = E Y X La meilleure représentation φ X de Y sachant que l on dispose de l échantillon X est E Y X. On souhaite obtenir un bon estimateur de l espérance conditionnelle. L erreur d un modèle sur une base est donnée par R base φ = y i φ x 2 base i. 11
12 Les méthodes d apprentissage statistique Cadre mathématique (2/4) Problème : E Y X = x traduit un sur-apprentissage. Solution : garder une certaine généralité/distance par rapport aux données d apprentissage. Erreur de prédiction Meilleur modèle R validation φ R apprentissage φ Estimateur trivial φ x = y Estimateur sur-appris φ x = E Y X = x Complexité du modèle φ «Taille» de F 12
13 Les méthodes d apprentissage statistique Cadre mathématique (3/4) Plus formellement, écrivons : Y = φ X + ε E ε = 0 et V ε = σ 2 φ X est une fonction déterministe certaine mais inconnue Dans l absolu, on souhaite estimer φ mais on ne dispose que des observations bruitées Y. Le sur-apprentissage consiste à apprendre Y (et ε) en s éloignant de φ. Les méthodes d apprentissage permettent d obtenir un modèle estimé φ X. On peut montrer : 2 Y φ 2 = E Y φ 2 = σ 2 + E φ φ à minimiser biais 2 + V φ variance Le meilleur modèle traduit un compromis entre le biais et la variance. 13
14 Valeurs de Y Les méthodes d apprentissage statistique Cadre mathématique (4/4) Comparaison des méthodes Observés Vrai Modèle GLM Modèle Simple Modèle Optimal Modèle Complexe Valeurs de X 14
15 Les méthodes d apprentissage statistique CART - Généralités Les arbres CART sont une représentation graphique d une analyse récursive d une base de données, permettant d en extraire de l information servant à la décision/prédiction. On retrouve deux types distincts : Les arbres de classification (variable de sortie qualitative ou discrète) Les arbres de régression (variable de sortie quantitative continue). BASE DE DONNÉES X 1 X 2 X 3 X 4 X 5 Y LUXE CITADINE CYLINDRE USAGE AGE_COND NOMBRE_SIN 1 N N 4 PRIVE N N 6 PRIVE N Y 4 COMMERCIAL Y Y 4 COMMERCIAL N N 6 PRIVE N N 6 PRIVE N N 8 PRIVE N Y 4 BUSINESS N N 6 PRIVE N Y 4 PRIVE N N 4 COMMERCIAL 40 1 Racine 0.15 CITADINE=Y N Feuille 1 CYLINDRE>=5 < Feuille 2 Feuille 3 15
16 Les méthodes d apprentissage statistique CART - Construction Idée : Utiliser les p variables explicatives pour subdiviser les individus en classes homogènes. Moyen : Fonction d hétérogénéité basée sur la variance intra-nœud. n N Δ = y i y N 2 n NG n ND 2 2 y i y N G + y i y N D i=1,i N noeud mère i=1,i N G noeud fils gauche i=1,i N D noeud fils droit Algorithme Étape 4 : Division Division effective du nœud mère en deux nœuds fils Étape 1 : Disjonction Déterminer les partitions binaires des p variables Étape 3 : Optimisation Choix de la division qui maximise Δ Étape 2 : Calcul Calcul de Δ pour chaque division Condition d arrêt Naturelle Un seul profil par feuille. Imposée Nombre maximum de feuilles atteint, Nombre minimum d individus par feuille atteint, Qualité de l arbre jugée suffisante, Etc. Si l algorithme est mené jusqu à son terme : l arbre obtenu est appelé l arbre saturé. Élagage Sur l arbre saturé φ K, on isole les arbres φ k à k feuilles pour k = K 1,, 1. On obtient alors la courbe R validation φ k. 16
17 Les méthodes d apprentissage statistique CART - Illustration (1/4) Choix de la première segmentation sur la base d apprentissage de 700 individus. 1,00 0,80 0,60 0,80 0,54 Réduction d'hétérogénéité 0,40 0,20 0,00 0,17 0,17 0,20 0,08 0,11 0,09 0,09 0,08 0,03 0,01 0,01 0, Index Variable Testée Nœud Gauche Nœud Droite E[Y] E[Y N_G] E[Y N_D] MSE Total MSE Gauche MSE Droite Delta 1 LUXE Y N 0,15 0,00 0,16 115,34 0,00 115,17 0,17 2 CITADINE Y N 0,15 0,09 0,17 115,34 13,61 100,92 0,80 3 CYLINDRE 4 6 et 8 0,15 0,15 0,16 115,34 73,29 42,02 0,03 4 CYLINDRE 4 et 6 8 0,15 0,16 0,13 115,34 111,86 3,47 0,01 5 USAGE B P et C 0,15 0,00 0,16 115,34 0,00 114,80 0,54 6 USAGE C B et P 0,15 0,23 0,15 115,34 4,31 110,95 0,08 7 USAGE P B et C 0,15 0,16 0,09 115,34 110,42 4,74 0,17 8 AGE_COND <=20 >20 0,15 0,13 0,15 115,34 1,73 113,60 0,01 9 AGE_COND <=23 >23 0,15 0,10 0,16 115,34 2,71 112,52 0,11 10 AGE_COND <=25 >25 0,15 0,12 0,16 115,34 9,91 105,34 0,09 11 AGE_COND <=30 >30 0,15 0,12 0,16 115,34 20,39 94,75 0,20 12 AGE_COND <=40 >40 0,15 0,16 0,15 115,34 56,41 58,93 0,00 13 AGE_COND <=50 >50 0,15 0,16 0,13 115,34 90,48 24,76 0,09 14 AGE_COND <=60 >60 0,15 0,15 0,19 115,34 104,34 10,91 0,08 17
18 Les méthodes d apprentissage statistique CART - Illustration (2/4) Arbre saturé obtenu sur la base d apprentissage. CITADINE: N USAGE: B AGE_COND < AGE_COND < AGE_COND < CYLINDRE < 7 AGE_COND < 55 AGE_COND < 27.5 AGE_COND < CYLINDRE < LUXE: N CYLINDRE < AGE_COND < USAGE: AGE_COND B AGE_COND < 35 < AGE_COND < AGE_COND < AGE_COND 24 < LUXE: N AGE_COND < 45 CYLINDRE < CYLINDRE < AGE_COND < 24 AGE_COND < CYLINDRE < CYLINDRE < 7 LUXE: N AGE_COND < USAGE: C USAGE: C USAGE: C AGE_COND AGE_COND < 45 < 45AGE_COND <
19 deviance Les méthodes d apprentissage statistique CART - Illustration (3/4) Choix du nombre de feuilles à conserver sur notre arbre saturé size 19
20 Les méthodes d apprentissage statistique CART - Illustration (4/4) Résultat de l élagage sur notre exemple. CITADINE: N USAGE: B AGE_COND < AGE_COND < AGE_COND < CYLINDRE < 7 AGE_COND < 55 AGE_COND < 27.5 AGE_COND < CYLINDRE < LUXE: N CYLINDRE < AGE_COND < USAGE: AGE_COND B AGE_COND < 35 < AGE_COND < AGE_COND < AGE_COND 24 < LUXE: N AGE_COND < 45 CYLINDRE < CYLINDRE < AGE_COND < 24 AGE_COND < CYLINDRE < CYLINDRE < 7 LUXE: N AGE_COND < USAGE: C USAGE: C USAGE: C AGE_COND AGE_COND < 45 < 45AGE_COND <
21 deviance Les méthodes d apprentissage statistique CART - Illustration sur la base complète 1.4e e e e e e e e e e e e e e e e e e e-02 -Inf R validation φ k size Arbre tronc φ 1 1 feuille Arbre élagué φ 5 5 feuilles Arbre élagué φ feuilles Arbre optimal φ feuilles Arbre saturé φ obs. par feuille 21
22 Les méthodes d apprentissage statistique Méthodes d agrégation Les arbres CART présentent certains avantages : Représentation graphique hiérarchisée intuitive, avec des règles simples Interactions crédibles et naturelles «faire parler» les données Mais possèdent également quelques limites : Non robustesse de la structure : «Effet papillon» Fonction prédictive en escaliers On se tourne alors vers des méthodes d agrégation parallèles et adaptatives. Bagging et Random Forests Base d apprentissage Erreur de prédiction Gradient Boosting et Stochastic Gradient Boosting Bootstrap : tirage avec remise de l échantillon Meilleur modèle Échantillon 1 Échantillon Échantillon Bagging : CART Random Forests : CART avec une sélection aléatoire de variables parmi les disponibles avant de segmenter Arbre saturé Arbre saturé Arbre saturé Complexité du modèle Modèle trivial Modèle sur-appris 22
23 Les méthodes d apprentissage statistique Comparaison des méthodes sur la base complète 86,7 15% 13% 20% 86,6 0% 6% 6% 0% 86,5 86,4-24% -18% -20% 86,3-40% 86,2-60% 86,1 86,0-80% 85,9-100% Arbre tronc Arbre saturé (1000 obs) Arbre optimal (122 feuilles) GLM sélectionné Bagging (B=55) Random Forest (B=17) Gradient Boosting (B=515) Sto. Gradient Boosting (B=585) -100% Erreur de prédiction sur la base de test en fonction du modèle Gain d'écart relatif au modèle trivial par rapport au GLM 23
24 Sommaire Introduction Les méthodes d apprentissage statistique Illustration 24
25 Illustration Présentation de l illustration Une compagnie d assurance dommages souhaite faire un état des lieux de son tarif auto existant (GLM). L état des lieux peut consister à répondre aux diagnostics suivants : 1. Est-ce que la structure actuelle du GLM est toujours pertinente? 2. Est-ce que des variables (auto) qui étaient candidates à la modélisation (et donc non-retenues) lors de la création du tarif pourraient aujourd hui améliorer la structure tarifaire? 3. Est-ce que les variables (auto) nouvellement disponibles (externe ou nouveau champ) depuis la création du tarif pourraient améliorer la structure tarifaire? 4. Est-ce que les variables des clients sur les autres branches pourraient permettre d identifier de nouveaux segments de clientèle créateurs de richesse (lien avec la valeur client) pour la compagnie? Diagnostic 1 = OUI Test de validité du GLM existant au sein de la compagnie : Application des paramètres du GLM sur une nouvelle base (test) : par exemple un sondage sur les 12 derniers mois de production Présentation du diagnostic sous l angle de vue du GLM : la population est répartie en 30 paquets triés par fréquence prédite du GLM dans la base de test Nous proposons une démarche possible pour mettre en œuvre les diagnostics 2 et 3 à l aide des méthodes d apprentissage 25
26 Illustration Présentation du modèle Pour répondre aux diagnostics 2 et 3, l algorithme d apprentissage statistique que nous avons mis en œuvre a pour fonction objectif la fréquence résiduelle de sinistre sachant la fréquence prédite par le GLM existant : Nombre de sinistres observés y = Exposition fréquence prédite du GLM Les variables candidates : Ne sont pas les variables explicatives déjà retenues par le GLM Et sont donc toutes les autres variables explicatives disponibles pour prédire la fréquence Un exemple d une variable non-candidate : Un exemple d une variable candidate : Fréquence Observée Fréquence Observée Fréquence Résiduelle Fréquence Résiduelle 26
27 Illustration Résultats graphiques du modèle Les résultats du modèle sont présentés sous l angle des segments créés par l algorithme. L algorithme a été paramétré pour créer 30 segments L algorithme a permis d identifier des segments de clientèle pour qui la compagnie pourrait augmenter son tarif au maximum de 45% ou au contraire le baisser jusqu à 28%. Score Fréquence résiduelle 145% Score Fréquence résiduelle 72% 27
28 Illustration Intégration des résultats dans la structure GLM existante La compagnie souhaite intégrer les résultats de l algorithme dans sa structure tarifaire GLM existante Apprentissage statistique (30 segments) DEFINITION DES SEGMENTS Variable 1 Variable 2 Variable 3 Variable N 1 N D C 60 3 N B N A 6 30 N 8 30 Contrairement à une structure GLM, il se peut que certains segments soient définis sans utiliser l ensemble des variables de l algorithme. PARAMETRES y Fréquence résiduelle 1 145% 2 135% 3 125% 29 78% 30 72% Structure GLM existante TABLE FACTEURS GLM VARIABLE MODALITE FACTEUR INTERCEPT - 2 AGE_COND 40 0 AGE_COND 23 0,8 AGE_COND 60 0,1 CYLINDRE 6 0 USAGE PRIVE 0 Nouvelle structure GLM TABLE FACTEURS GLM VARIABLE MODALITE FACTEUR INTERCEPT - 2 AGE_COND 40 0 AGE_COND 23 0,8 AGE_COND 60 0,1 CYLINDRE 6 0 USAGE PRIVE 0 SCORE 1 1,45 SCORE 2 1,35 SCORE 3 1,25 SCORE SCORE 30 0,72 Il est nécessaire que chaque variable retenue par le score soit lisible dans le système d informations pour être intégrée dans la structure GLM de la compagnie 28
29 Conclusion L illustration a permis de montrer que l utilisation des méthodes d apprentissage statistique pouvait être un complément pertinent à l utilisation des GLM dans un cadre tarifaire. En effet, l application de ces méthodes permet : De pallier certaines limites des GLM D optimiser le temps d implémentation pour mettre en œuvre un modèle De traiter un grand nombre de variables tarifaires Plus généralement, ces méthodes permettent également d ouvrir un horizon de modélisation plus large que la tarification. En effet, les méthodes d apprentissage statistique permettent par exemple : De répondre à un besoin de suivi des actions du management en «temps réel» D être une réponse pertinente à la mise en place d un concept de valeur client au sein d une compagnie D être la réponse de modélisation pour les données de masse dont les assureurs vont pouvoir ou peuvent déjà disposer. 29
30 Contacts Fabrice TAILLIEU Principal Sébastien DELUCINGE Senior Consultant sebastien.delucinge@milliman.com Rémi BELLINA Consultant remi.bellina@milliman.com
Méthodes d apprentissage statistique «Machine Learning»
Méthodes d apprentissage statistique «Machine Learning» Fabrice TAILLIEU, Sébastien DELUCINGE, Rémi BELLINA Le marché de l assurance a rarement été marqué par un environnement aussi difficile qu au cours
Plus en détailLe métier d actuaire IARD
JJ Mois Année Le métier d actuaire IARD Journées Actuarielles de Strasbourg 6-7 octobre 2010 PLAN Présentation de l assurance non vie Le rôle de l actuaire IARD La tarification des contrats L évaluation
Plus en détailArbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Plus en détailLe Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Plus en détailSAS ENTERPRISE MINER POUR L'ACTUAIRE
SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada AGENDA Survol d Enterprise Miner de
Plus en détailJournées d études IARD
Journées d études IARD Gestion des risques liés à la refonte tarifaire d un portefeuille automobile Niort, le 20 mars 2014 Marie Foucher mfoucher@galea-associes.eu Pierre Thérond ptherond@galea-associes.eu
Plus en détailProjet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Plus en détailTechniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit
Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit Adil Belhouari HEC - Montréal - Journées de l Optimisation 2005-09 Mai 2005 PLAN DE LA PRÉSENTATION
Plus en détailMémoire d Actuariat Tarification de la branche d assurance des accidents du travail Aymeric Souleau aymeric.souleau@axa.com 3 Septembre 2010 Plan 1 Introduction Les accidents du travail L assurance des
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailAssurance auto des véhicules électriques: risques et réalité Stanislas Roth Directeur Excellence Technique IARD Particuliers AXA GLOBAL P&C
Assurance auto des véhicules électriques: risques et réalité Stanislas Roth Directeur Excellence Technique IARD Particuliers AXA GLOBAL P&C 6 décembre 203 - Paris 0 0 Sujets abordés dans cette présentation
Plus en détailIntroduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailOptimisation des ressources des produits automobile première
EURIA EURo Optimisation produits automobile première Pauline PERROT promotion 2011 EURIA EURo 1 ère partie : contexte MMA (FFSA) MAAF (GEMA) SGAM : COVEA (AFA) GMF (GEMA) MMA : Plus 3 millions clients
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailResolution limit in community detection
Introduction Plan 2006 Introduction Plan Introduction Introduction Plan Introduction Point de départ : un graphe et des sous-graphes. But : quantifier le fait que les sous-graphes choisis sont des modules.
Plus en détailBIG DATA et données externes dans les modèles de tarification
BIG DATA et données externes dans les modèles de tarification BIG DATA BIG DATA : Quelques clés Eric FROIDEFOND MAAF MBA CNAM ENASS en cours Intégration du BIG DATA dans la tarification en assurances IARD
Plus en détailData Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.
des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le
Plus en détailTARIFICATION EN ASSURANCE COMPLEMENTAIRE SANTE: il était une fois, un statisticien, un actuaire, un économiste de la santé
TARIFICATION EN ASSURANCE COMPLEMENTAIRE SANTE: il était une fois, un statisticien, un actuaire, un économiste de la santé Plan de l intervention 1 2 3 Généralités sur le fonctionnement de l assurance
Plus en détailTravailler avec les télécommunications
Travailler avec les télécommunications Minimiser l attrition dans le secteur des télécommunications Table des matières : 1 Analyse de l attrition à l aide du data mining 2 Analyse de l attrition de la
Plus en détailComment mieux lutter contre la fraude à l assurance? Gestion de sinistres Odilon Audouin, le 4 avril 2013
Comment mieux lutter contre la fraude à l assurance? Gestion de sinistres Odilon Audouin, le 4 avril 2013 Eléments de contexte Un coût significatif, une évolution des typologies Selon l ALFA (sur la base
Plus en détailConstruction de bases biométriques pour l assurance dépendance. SCOR inform - Novembre 2012
Construction de bases biométriques pour l assurance dépendance SCOR inform - Novembre 2012 Construction de bases biométriques pour l assurance dépendance Auteur Laure de Montesquieu Responsable Centre
Plus en détailL'intelligence d'affaires: la statistique dans nos vies de consommateurs
L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires
Plus en détailL olivier Assurances Licence 3 Econométrie Lyon II
15 novembre 2013 L olivier Assurances Licence 3 Econométrie Lyon II Pascal Gonzalvez 1 L olivier Assurances et le Groupe Admiral Segmentation et tarification en assurance auto Autres applications de la
Plus en détailENSEIGNEMENT ET MONDE PROFESSIONNEL. Illustration d un lien fort au travers d un cours de scoring. Jean-Philippe KIENNER 7 novembre 2013
ENSEIGNEMENT ET MONDE PROFESSIONNEL Illustration d un lien fort au travers d un cours de scoring Jean-Philippe KIENNER 7 novembre 2013 CONTEXTE Une bonne insertion professionnelle des étudiants passe par
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Plus en détailSurabondance d information
Surabondance d information Comment le manager d'entreprise d'assurance peut-il en tirer profit pour définir les stratégies gagnantes de demain dans un marché toujours plus exigeant Petit-déjeuner du 25/09/2013
Plus en détailCoup de Projecteur sur les Réseaux de Neurones
Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche
Plus en détailOrganisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.
2 jours : Mardi 15 et mercredi 16 novembre 2005 de 9 heures 30 à 17 heures 30 Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. Madame, Monsieur, On parle
Plus en détailINTRODUCTION (Eric BERTHOUX Directeur Délégué Administratif et Financier MAIF)
JOURNEES D ETUDES IARD 20 et 21 mars 2014 «Les nouveaux défis de la tarification» INTRODUCTION (Eric BERTHOUX Directeur Délégué Administratif et Financier MAIF) Quelques réflexions sur le contexte, le
Plus en détailLe data mining et l assurance Mai 2004. Charles Dugas Président Marianne Lalonde Directrice, développement des affaires
Le data mining et l assurance Mai 2004 Charles Dugas Président Marianne Lalonde Directrice, développement des affaires AGENDA Qu est-ce que le data mining? Le projet et les facteurs de réussite Les technologies
Plus en détailLes algorithmes de fouille de données
Février 2005 Les algorithmes de fouille de données DATAMINING Techniques appliquées à la vente, aux services client, interdictions. Cycle C Informatique Remerciements Je remercie les personnes, les universités
Plus en détailSolution logicielle pour le pilotage et l ERM. Journées d études IARD 26 mars 2010 2 mars 2010
Présentation d ERMS Solution logicielle pour le pilotage et l ERM Journées d études IARD 26 mars 2010 2 mars 2010 Sommaire 1 Présentation d ACTUARIS 2 Les problématiques rencontrées 3 Présentation d ERMS
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring
ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des
Plus en détailAgrégation des portefeuilles de contrats d assurance vie
Agrégation des portefeuilles de contrats d assurance vie Est-il optimal de regrouper les contrats en fonction de l âge, du genre, et de l ancienneté des assurés? Pierre-O. Goffard Université d été de l
Plus en détailLa baisse tendancielle des rentes réduitelle la demande d épargne retraite? Leçons tirées d une réforme des tables de mortalité
La baisse tendancielle des rentes réduitelle la demande d épargne retraite? Leçons tirées d une réforme des tables de mortalité Alexis DIRER LEO, Université d Orléans Co-écrit avec Rim Ennajar-Sayadi Journée
Plus en détailun environnement économique et politique
Vision d un économiste sur le risque agricole et sa gestion un sol un climat un environnement économique et politique Jean Cordier Professeur Agrocampus Ouest Séminaire GIS GC HP2E Prise en compte du risque
Plus en détailLe rôle de CCR dans le régime d indemnisation des catastrophes naturelles. Séisme de Lambesc (1909 - Sud-est de la France)
Le rôle de CCR dans le régime d indemnisation des catastrophes naturelles. Séisme de Lambesc (1909 - Sud-est de la France) MACIF le 12 mai 2013 1 Rôle de la réassurance fractionner les risques afin de
Plus en détailAgenda de la présentation
Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining
Plus en détailL Assurance. L Assurance
L Assurance Benjamin Leroy et Sébastien Vidal L Assurance Définition et Historique Assurance directe et privée Assurance indirecte et Assurance sociale Mutuelle Fondement économique de l assurance 2 Définition
Plus en détailUniversité de Montréal. par Sylvain Pannetier Lebeuf
Université de Montréal Prédiction de l attrition en date de renouvellement en assurance automobile avec l aide de processus gaussiens par Sylvain Pannetier Lebeuf Département de mathématiques et statistiques
Plus en détailContents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes
Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire
Plus en détailManipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner
Le cas Orion Star Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star... 1 Manipulation de données avec SAS Enterprise Guide et modélisation
Plus en détailPrésentation du cabinet
Présentation du cabinet Depuis 2005, Selenis intervient aux côtés d acteurs de référence de l assurance. Ce qui nous caractérise fait aussi notre différence : Conseil métier, nous sommes spécialistes de
Plus en détailProvisions pour risques croissants en santé SACEI 13 mars 2008
Provisions pour risques croissants en santé SACEI 13 mars 2008 Anne MARION A C T U A R I E L L E S actuarielles@actuarielles.com L aléa en santé Assurance vie : (décès) Survenance certaine à date aléatoire
Plus en détailSpécificités, Applications et Outils
Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining
Plus en détailTable des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Plus en détaildes compagnies d assurance : évolutions récentes
Les Contrôle normes IFRS de la solvabilité en assurance des compagnies d assurance : évolutions récentes - DIAF Hanoi, le 28 février 2005 Pierre THEROND Consultant JWA - Actuaires & chargé de cours à l
Plus en détailActuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.
Actuariat I ACT2121 septième séance Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement
Plus en détailLe risque Idiosyncrasique
Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailProbabilités conditionnelles Exercices corrigés
Terminale S Probabilités conditionnelles Exercices corrigés Exercice : (solution Une compagnie d assurance automobile fait un bilan des frais d intervention, parmi ses dossiers d accidents de la circulation.
Plus en détailAlgorithmes d'apprentissage
Algorithmes d'apprentissage 1 Agents qui apprennent à partir d'exemples La problématique : prise de décision automatisée à partir d'un ensemble d'exemples Diagnostic médical Réponse à une demande de prêt
Plus en détailANALYSE STATISTIQUE PRÉDICTIVE
Yoshua Bengio Chaire de Recherche du Canada sur les Algorithmes d Apprentissage Statistique, Université de Montréal Charles Dugas ApSTAT Technologies Inc. Et Aviva Canada SALON INTELLIGENCE D AFFAIRE 8
Plus en détailpoint sur l assurance française
le point sur l assurance française conférence de presse de la FFSA maison de l assurance / jeudi 29 janvier le point sur l assurance française ce qu il faut pour 2 Loi ALUR Publication Omnibus 2 L année
Plus en détail1 Modélisation d être mauvais payeur
1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage
Plus en détailMesure et gestion des risques d assurance
Mesure et gestion des risques d assurance Analyse critique des futurs référentiels prudentiel et d information financière Congrès annuel de l Institut des Actuaires 26 juin 2008 Pierre THEROND ptherond@winter-associes.fr
Plus en détailLa survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Plus en détailSOMMAIRE INTRODUCTION... 3
SOMMAIRE INTRODUCTION... 3 I - PRESENTATION DE L ENQUETE... 5 A - OBJECTIFS DE L ENQUETE...5 B - CHAMP DE L ENQUETE...5 C - DETERMINATION DES «GROUPES» DE SOCIETES...6 II - VUE D ENSEMBLE DES CESSIONS...
Plus en détailLES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN
LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN Les contenues de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas
Plus en détailGender Directive Impacts opérationnels pour les assureurs
Gender Directive Impacts opérationnels pour les assureurs Conférence ActuariaCnam Présentation 3 1 / 0 5 / 2 0 1 2 Julien Chartier, Actuaire Manager AGENDA Introduction Partie 1 - L arrêt «Test-Achats»
Plus en détailSTA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes
STA108 Enquêtes et sondages Sondages àplusieurs degrés et par grappes Philippe Périé, novembre 2011 Sondages àplusieurs degrés et par grappes Introduction Sondages à plusieurs degrés Tirage des unités
Plus en détailIBM SPSS Direct Marketing
IBM SPSS Statistics 19 IBM SPSS Direct Marketing Comprenez vos clients et renforcez vos campagnes marketing Points clés Avec IBM SPSS Direct Marketing, vous pouvez : Comprendre vos clients de manière plus
Plus en détail5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: 514.592.9301 F: 514.340.6850 info@apstat.com www.apstat.com
Application des réseaux de neurones au plan de répartition des risques 5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: 514.592.9301 F: 514.340.6850 info@apstat.com www.apstat.com Copyright c
Plus en détailPourquoi l apprentissage?
Pourquoi l apprentissage? Les SE sont basés sur la possibilité d extraire la connaissance d un expert sous forme de règles. Dépend fortement de la capacité à extraire et formaliser ces connaissances. Apprentissage
Plus en détailLes critères de segmentation Critères Variables retenues Description Exemple Pays, région, ville, Chauffage,
SYNTHÈSE DU CHAPITRE 11 : LA SEGMENTATION DE LA DEMANDE. La segmentation. La segmentation de la demande consiste à définir des groupes de clients (des segments de clientèle) ayant des comportements homogènes
Plus en détailFast and furious decision tree induction
Institut National des Sciences Appliquées de Rennes Rapport de pré-étude Encadrants : Nikolaos Parlavantzas - Christian Raymond Fast and furious decision tree induction Andra Blaj Nicolas Desfeux Emeline
Plus en détailJade. Projet Intelligence Artificielle «Devine à quoi je pense»
Jade Projet Intelligence Artificielle «Devine à quoi je pense» Réalisé par Djénéba Djikiné, Alexandre Bernard et Julien Lafont EPSI CSII2-2011 TABLE DES MATIÈRES 1. Analyse du besoin a. Cahier des charges
Plus en détailStéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 24/12/2006 Stéphane Tufféry - Data Mining - http://data.mining.free.fr
1 Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 2 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data
Plus en détailBusiness Intelligence simple et efficace
Business Intelligence simple et efficace avec Excel et PowerPivot Jean-Philippe GOUIGOUX Table des matières 1 Chapitre 1 Présentation de PowerPivot A. L analyse de données.....................................................
Plus en détailProbabilités Loi binomiale Exercices corrigés
Probabilités Loi binomiale Exercices corrigés Sont abordés dans cette fiche : (cliquez sur l exercice pour un accès direct) Exercice 1 : épreuve de Bernoulli Exercice 2 : loi de Bernoulli de paramètre
Plus en détailLe Data Risk Center. Plateforme de pilotage et de gestion des risques Pilier I de la directive Solvabilité II
Le Data Risk Center Plateforme de pilotage et de gestion des risques Pilier I de la directive Solvabilité II Sommaire Le conseil en Risk Management 1) Le projet Solvabilité II Objectifs et moyens à mettre
Plus en détailSESSION 2013 BTS ASSURANCE CORRIGE E3
SESSION 2013 BTS ASSURANCE CORRIGE E3 U3 Corrigé Page 1 Sujet n 1 1. Indiquez les éléments pris en compte pour déterminer une cotisation d assurance. La prime dépend de : (3x0,5 pt = 1,5) - La fréquence
Plus en détailPARTIE 1. Phénoménologie
TABLE DES MATIÈRES Du même auteur........................................ Table des matières....................................... Abréviations........................................... Sigles.................................................
Plus en détailESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit
ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Plan de la séance 3 : Le risque de crédit (1) Les opérations de crédit Définition d un crédit La décision de crédit Les crédits aux petites
Plus en détail$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU
$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le
Plus en détailAccélérer l agilité de votre site de e-commerce. Cas client
Accélérer l agilité de votre site de e-commerce Cas client L agilité «outillée» devient nécessaire au delà d un certain facteur de complexité (clients x produits) Elevé Nombre de produits vendus Faible
Plus en détailAssurance automobile : défis et perspectives des compagnies d assurances
Assurance automobile : défis et perspectives des compagnies d assurances Une analyse de fond des forces en présence et des impacts en matière de développement pour les compagnies d assurances Un écosystème
Plus en détailLe Guide Pratique des Processus Métiers
Guides Pratiques Objecteering Le Guide Pratique des Processus Métiers Auteur : Version : 1.0 Copyright : Softeam Equipe Conseil Softeam Supervisée par Philippe Desfray Softeam 21 avenue Victor Hugo 75016
Plus en détailTravaux pratiques. Compression en codage de Huffman. 1.3. Organisation d un projet de programmation
Université de Savoie Module ETRS711 Travaux pratiques Compression en codage de Huffman 1. Organisation du projet 1.1. Objectifs Le but de ce projet est d'écrire un programme permettant de compresser des
Plus en détailProcessus de comptage, Poisson mélange, fonction de perte exponentielle, système bonus-malus.
JF WALHIN* J PARIS* * Université Catholique de Louvain, Belgique Le Mans Assurances, Belgique RÉSUMÉ Nous proposons une méthodologie générale pour construire un système bonus-malus équilibré basé sur une
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailMesures de Risque Multipériodes Cohérentes Appliquées au Compte à Terme
TFE Ingénieur Civil Mathématiques Appliquées 24 juin 2010 Mesures de Risque Multipériodes Cohérentes Appliquées au Compte à Terme Auteur Christophe Pochet Promoteur Pierre Devolder Comment garantir la
Plus en détailPROGRAMME (Susceptible de modifications)
Page 1 sur 8 PROGRAMME (Susceptible de modifications) Partie 1 : Méthodes des revues systématiques Mercredi 29 mai 2013 Introduction, présentation du cours et des participants Rappel des principes et des
Plus en détailLe ranking de Augure Influencers La méthodologie AIR en détails
Le ranking de Augure Influencers La méthodologie AIR en détails V1.0 Octobre 2014 Oualid Abderrazek Product Marketing Sommaire 1. Contexte...3 2. L algorithme...3 a. Exposition...4 b. Echo...4 c. Niveau
Plus en détailTable des matières: Guidelines Fonds de Pensions
Table des matières: Guidelines Fonds de Pensions TABLE DES MATIERES... 1 INTRODUCTION... 2 1 FINANCEMENT ET FINANCEMENT MINIMUM... 3 1.1 FINANCEMENT... 3 1.2 FINANCEMENT DE PLAN... 3 1.3 FINANCEMENT MÉTHODE
Plus en détailENJEUX ET PERSPECTIVES DU MODÈLE DE BANCASSURANCE NON-VIE À L AUNE DES ANNÉES 2020
Jean-Louis DELPÉRIÉ Directeur ENJEUX ET PERSPECTIVES DU MODÈLE DE BANCASSURANCE NON-VIE À L AUNE DES ANNÉES 2020 Antoine FOURNIER Directeur LES DEUX DERNIÈRES DÉCENNIES ONT VU L ÉMERGENCE EN FRANCE DES
Plus en détailSolvabilité II Les impacts sur la tarification et l offre produit
Solvabilité II Les impacts sur la tarification et l offre produit Colloque du CNAM 6 octobre 2011 Intervenants OPTIMIND Gildas Robert actuaire ERM, senior manager AGENDA Introduction Partie 1 Mesures de
Plus en détailK. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau
Apport des modèles de krigeage à la simulation numérique K Ammar, F Bachoc, JM Martinez CEA-Saclay, DEN, DM2S, F-91191 Gif-sur-Yvette, France Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau Apport des
Plus en détailTABLE DES MATIÈRES AVANT-PROPOS... 5 RÉFÉRENCES ABRÉGÉES À DES PUBLICATIONS FRÉQUEMMENT CITÉES... 7 INTRODUCTION... 9. Section 1
TABLE DES MATIÈRES AVANT-PROPOS... 5 RÉFÉRENCES ABRÉGÉES À DES PUBLICATIONS FRÉQUEMMENT CITÉES... 7 Section 1 INTRODUCTION... 9 RISQUES ET ASSURANCE... 9 Section 2 HISTORIQUE... 11 Section 3 TECHNIQUE
Plus en détailSolutions EMC Documentum pour les assurances
Caractéristiques d EMC Documentum La famille de produits EMC Documentum aide les compagnies d assurance à gérer tous les types de contenu de plusieurs départements au sein d un seul référentiel. Grâce
Plus en détailLes Journées Régionales de la Création & Reprise d Entreprise
Les Journées Régionales de la Création & Reprise d Entreprise 8 ème ÉDITION S.M.A.R.T. Production 2004-2005 - Tous droits de reproduction réservés. Retrouvez dans ce PDF, les commentaires audios des intervenants,
Plus en détailDes données à la connaissance client. A la découverte de la plateforme de connaissance client knowlbox
Des données à la connaissance client A la découverte de la plateforme de connaissance client knowlbox Livre blanc mai 2013 A l heure du Big Data, les entreprises s interrogent davantage sur leurs données.
Plus en détailRésumé des communications des Intervenants
Enseignements de la 1ere semaine (du 01 au 07 décembre 2014) I. Titre du cours : Introduction au calcul stochastique pour la finance Intervenante : Prof. M hamed EDDAHBI Dans le calcul différentiel dit
Plus en détailUne comparaison de méthodes de discrimination des masses de véhicules automobiles
p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans
Plus en détailFIMA, 7 juillet 2005
F. Corset 1 S. 2 1 LabSAD Université Pierre Mendes France 2 Département de Mathématiques Université de Franche-Comté FIMA, 7 juillet 2005 Plan de l exposé plus court chemin Origine du problème Modélisation
Plus en détailL analyse de la gestion de la clientèle
chapitre 1 - La connaissance du client * Techniques utilisées : observation, recherche documentaire, études de cas, études qualitatives (entretiens de groupes ou individuels, tests projectifs, analyses
Plus en détailClasse de première L
Classe de première L Orientations générales Pour bon nombre d élèves qui s orientent en série L, la classe de première sera une fin d étude en mathématiques au lycée. On a donc voulu ici assurer à tous
Plus en détail