Application du data mining pour l évaluation de risque en assurance automobile 4 Septembre 2012 Sylvain Pannetier Lebeuf Recherche & Analytique
Contenu Qui on est: La compagnie L équipe de recherche et analytique Problème d évaluation de risque (Risk Sharing Pool) La problématique Ce qu on aimerais obtenir Les données dont nous disposons Préparation des données Construction du modèle Évaluation des bénéfices Vente et implantation du modèle Apprentissage retenu + bénéfices
Qui on est: The Co-operators Compagnie canadienne détenue par des cooopératives Mountain Equipment Coop Coop fédérée. Gamme de produits: Assurance vie Assurance dommage personnelle Assurance commerciale Assurance voyage Placements financiers Assurance Collective Coopérative d épargne Modes de distribution: Agent Direct Courtier
Qui on est: The Co-operators Le groupe Co-operators en chiffres: Gestion de plus 38 milliards de dollars d actifs Plus de 5000 employés 688 points de vente et en pleine expansion au Québec 844 000 habitations canadiennes assurées 1,2 millions de véhicules assurés Les valeurs coopératives font partie intégrante de l entreprise.
Qui on est: Recherche et Analytique Situation et effectif: Département d Intelligence d Affaires Basée à Montréal Petite équipe de 6 membres Horizons divers Jeune Ouverte à la nouveauté Mission: Contribuer à développer la tarification de demain Ajouter de la science derrière les décisions Être à l affut de la nouveauté Formation technique aux autres départements
:: Définition de la problématique :: Assurance automobile en Ontario Régime totalement privé Blessures corporelles coûteuses Primes de plus en plus coûteuses Risk Sharing Pool (RSP) en assurance automobile Ontario Quota = 5% de l exposition Pertes assumées par tous les assureurs Inconnu de l assuré non discriminatoire
:: Ce qu on aimerais obtenir :: Connaître les 5% de véhicules les moins bien tarifés Ordonnancement de ces risques S approcher du 5% dans jamais dépasser Agilité requise Estimation des pertes pour ces véhicules Estimation de la profitabilité espérée Calibration par rapport au volume cédé Modèle explicable Modèle facilement implantable Discussions avec IT
:: Les données dont nous disposons :: Données traditionnelles de l assurance Âge de l assuré Sexe Véhicule conduit Accidents de la route Infractions au code de la route Emplacement du domicile Plusieurs systèmes distincts Casse-tête potentiel pour unifier les données Qualité des données Pas de mensonges à son assureur Vieux systèmes Possibilité de données louches
:: Préparation des données :: Unification des données de différentes tables Trouver les variables nécessaires Trouver la clef d unification S assurer que la clef fonctionne Nettoyage des données Systèmes dans 2 langues potentielles Données manquantes Pourquoi? On fait quoi?
:: Construction du modèle :: Choix du modèle: Modèle linéaire généralisé? Capable de prendre beaucoup de prédicteurs Traditionnel en assurance Linéaire Mauvais dans les ailes d une distribution Arbre de décision? Peu de prédicteurs utilisés Explicable graphiquement Interractions non-linéaires Morcelle l espace Réseaux de neurones? Capable de prendre beaucoup de prédicteurs Très grande capacité (nécessite une attention particulière) Difficilement explicable Difficile à implanter dans le système opérationnel
:: Construction du modèle :: Pourquoi SPSS? Convivialité d utilisation Courbe d apprentissage rapide Possibilité «d exporter» la méthodologie à d autres département très facilement Possible de construire des arbres de façon manuelle Représentation graphique de l arbre produit Facile à comprendre Facile à expliquer
:: Construction du modèle ::
:: Construction du modèle ::
:: Construction du modèle ::
:: Construction du modèle ::
:: Construction du modèle ::
:: Évaluation des bénéfices:: Comparaison des différents modèles construits Sur ensemble de test (éviter sur-entraînement) Métrique de performance: Argent économisé S assurer de battre la solution actuelle
:: «Vente» et implantation du modèle :: Validation avec IT que le modèle répond aux attentes Présentation au «Portfolio Manager» Explication du fonctionnement du pool Vulgarisation du modèle Explication des bénéfices du modèle Clef: Confiance Livraison du modèle à IT Explication des bénéfices reliés au changement Énoncé du nouveau modèle (language IT) Clef: clarté
Apprentissage retenu + bénéfices Apprentissage: Ne pas sous-estimer le nettoyage de données Travail collectif = succès Bénéfices Meilleure compréhension des règles du pool Plus grande confiance mutuelle entre les équipes
Merci Contact: Sylvain Pannetier Lebeuf 1-800-363-6442 x208916 Sylvain.pannetier-lebeuf@cooperators.ca