BIG DATA et données externes dans les modèles de tarification
BIG DATA BIG DATA : Quelques clés Eric FROIDEFOND MAAF MBA CNAM ENASS en cours Intégration du BIG DATA dans la tarification en assurances IARD Stéphane CHAPPELLIER ACTUARIS ISG CEA IA 2
BIG DATA : Quelques clés 1 2 Le Big Data Les opportunités pour l assurance 3 Le fonctionnement 4 5 6 Les moyens techniques pour le Big Data La gouvernance des données Conclusion 3
BIG DATA : Définition VOLUME VALEUR VELOCITE VARIETE D après le Gartner, le «Big Data» peut se définir avec le concept des 3V : Volume des données disponibles Variété : données semi structurées voire non structurées complexes et de tous types (textes, images, ) Vélocité : fréquence à laquelle les données sont générées, capturées et partagées (nombre de tweets à la seconde par exemple) 4
BIG DATA : Une avalanche de données 5 5
BIG DATA : Principales opportunités pour l assurance Les Produits Marketing & Ventes Gestion des contrats Gestion Sinistres Gestion des Actifs Nouveaux marchés Nouveaux produits Connaissance des risques et meilleure tarification Segmentation plus fine Optimisation des produits Nouveaux clients Vente multi-canal Détection résiliation Optimisation et ciblage des campagnes commerciales «just in time» Gestion des paiements Tarification temps réel Optimisation de la gestion des réseaux de prestataires Détection des fraudes Prévention et mitigation des risques Stratégie de placement Gestion de Portefeuille Gestion des actifs et passifs Modélisation des risques Gestion de la performance 6
BIG DATA : Fonctionnement 7
BIG DATA : Intégration 8
BIG DATA : Zoom sur le MapReduce Calcul du nombre de tweets par utilisateur 9
BIG DATA : Moyens techniques (le cloud computing) 10
BIG DATA : La visualisation 11
BIG DATA : Une gouvernance des données obligatoire Les dimensions de la qualité des données Qualité intrinsèque Exactitude Objectivité Plausibilité Réputation Qualité liée au contexte et à la représentation Pertinence Exhaustivité Actualité Quantité appropriée des informations Représentation concise Représentation cohérente Interprétabilité Compréhensible Facilité de manipulation Qualité liée à la sécurité et à l accessibilité Disponibilité / Opportunité Restriction d accès 12
BIG DATA : Conclusion Etudes Marketing Support Client Produits & Services assurance CLIENT Innovation Analyses & Etudes Stratégie 13
BIG DATA dans la tarification en assurances IARD 1 2 Tarification prime pure et données Positionnement tarifaire et données 3 Quel apport de données externes? 4 5 6 Challenge BIG DATA : connectabilité & algorithmes Assurances et capteurs / réseaux sociaux Conclusion 14
Tarification prime pure et données Etablissement prime pure : recherche de données permettant d expliquer la sinistralité grâce au : GLM Classification pour zonier et véhiculier Données traditionnellement utilisées pour l établissement de la prime pure limitées : Données essentiellement internes Faible recours à des données externes Mouvement vers l utilisation de plus données : Variables croisées : âge x sexe (maintenant banni) Interne : croisement de données entre produits : Auto / MRH : âge x propriétaire/location résidence principale : variable tarifaire en auto Données bancaires / prêt et données assurances Externe : INSEE : densité, éloignement des services essentiels Données véhicules : SIV Existe-t-il des données BIG DATA permettant de mieux expliquer la sinistralité que les données existantes? 15
Positionnement tarifaire et données Positionnement tarifaire : recherche de données permettant d expliquer le choix de l assuré : Modèle d élasticité au prix de la demande Positionnement concurrentiel Algorithme de «valeur client» Optimisation tarifaire Ces modèles très utilisés au Royaume-Uni, sont encore très peu utilisés en France, néanmoins cela devrait évoluer : Loi Hamon potentiel effet ciseau Comment fidéliser le portefeuille? Comparateurs potentiel anti-sélection Comment acquérir les profils à valeur ajoutée? Ces modèles sont très gourmands en données : Données connaissance du risque Données relation client Données flux primes / sinistres avec effet retard Existe-t-il des données BIG DATA permettant de mieux expliquer la propension des assurés à souscrire / renouveler? 16
Quel apport de données externes? L utilisation de données externes (sans parler de BIG DATA) est actuellement faible et limité : Données INSEE, données délinquance (CartoCrime) Données Véhicules : SRA, constructeurs, SIV Ces données permettent d acquérir des variables complémentaires qui permettent de qualifier plus finement le risque qu à partir des données transmises par le réseau et/ou l assuré : La ville de résidence est-elle en zone rurale peu peuplée ou en zone urbaine? Est-ce un lieu où la criminalité est faible ou élevée? Le véhicule est-il une : citadine : pour aller faire les course le week-end? sportive : pour épater les copains et sortir en boîte? familiale : pour partir en vacances avec la famille? commerciale : pour faire des tournées en province? Tout apport d information permettant de renforcer la caractérisation d un profil de risque est utile pour éviter l anti-sélection 17
Challenge BIG DATA : connectabilité & algorithmes Il y a plusieurs problèmes majeurs à l utilisation des données BIG DATA en assurance : Connectabilité : il faut pouvoir relier les données à un client en portefeuille ou en affaires nouvelles Algorithme : il faut pouvoir disposer d un algorithme permettant de valoriser ces données Quelle influence ce critère a sur la sinistralité ou le comportement de souscrire / renouveler? Pour ce critère, quelles sont les modalités qui permettent de connaitre l intensité de cette influence? Pouvoir prédictif suffisant : Ce critère n était pas déjà capturé par d autres variables déjà connues Ce critère est-il plus puissant / prédictif que les variables déjà connues? Est-ce que l investissement nécessaire le mérite? 18
Assurance et capteurs Parmi les données BIG DATA, il existe une catégorie qui regroupe les qualités recherchées permettant de mieux caractériser le risque. Plutôt que de se baser sur la recherche de variable permettant de traduire un comportement à risque, cette catégorie cherche à capturer le comportement à risque directement à la source Port OBD-II Les capteurs : Auto : OBD-II comportement de conduite : freinage brusque, coups de volant intempestifs MRH : Domotique comportement des occupants Santé : capteur de données physiologiques activité physique, intellectuelle Source : VAG Capteur de données physiologiques Source: TF1 De nombreux handicaps empêchent l exploitation de ces données Au-delà d obtenir des algorithmes permettant de mesurer le comportement et son influence sur le coût du risques Prix de l installation, transmission des données chute de prix attendue Protection de la vie privée algorithme embarqué, transmission du score Domotique Source: Tech-Securité 19
Assurance et réseaux sociaux Il semble difficile de trouver des données pertinentes qui traduisent un comportement à risque de façon plus pertinente que celles déjà utilisées Par contre, les réseaux sociaux peuvent apporter beaucoup concernant le positionnement tarifaire : Sensibilité, attentes (écoresponsable, développement durable ) Réceptivité aux messages marketing Réactivité face aux changements Fidélité Elasticité au prix Du fait de cet apport, la chaine de répartition de la valeur va-t-elle se recomposer pour prendre en compte l apport des réseaux sociaux dans l équation? Réseaux sociaux réseaux affinitaires? Réseaux sociaux apporteurs d affaires / comparateurs / distributeurs? 20
Conclusion Conjoncture favorable aux assurés et défavorable aux assureurs : La «génération internet» rentre sur le marché : zapping Possibilité de zapper d assureurs plus facilement (Loi Hamon, comparateurs) Pouvoir d achat en baisse suite à la crise Processus tarifaire «français» en retard sur les autres marchés Opportunités : Les assurés n attendront pas que les assureurs aient sophistiqué leur processus tarifaire pour changer d assureur Tirer partie des enseignements reçus sur les autres marché pour se positionner / différencier Un challenge pour les actuaires Expérimentations Utilisation de données et de modèles moins bien maitrisés Evolutions plus rapides et plus fréquentes des processus tarifaire Importance cruciale d un suivi et d une réactivité aux changements de tendances Source : L Argus de l Assurance 21
BIG DATA : Bibliographie VINT Research report 2 of 4 Big Social - Predicting behavior with Big Data SOGETI Site PEGASUSDATA.COM Wikipedia Livre blanc ISACA : BIG DATA : Impacts et Avantages http://www.journaldunet.com/developpeur/outils/les-solutions-du-big-data/principe-defonctionnement-de-mapreduce.shtml http://datascience.bluestone.fr/blog/les-origines-les-grands-principes-du-big-data VINT Research report 1 of 4 Creating clarity with Big Data Jaap Bloem, Menno Van Doorn Sander Duivestein Thomas Van Manen Erik Van Ommeren - SOGETI Basé sur une analyse du Boston Consulting Group (BCG) IDC (International Data Corporation) 22
Les intervenants Eric FROIDEFOND Direction Systèmes d Information Manager Entité DSI Professionnels MBA CNAM ENASS en cours Direct : +33 (0)5 49 17 55 90 Port : +33 (0)6 83 18 76 53 E-mail : eric.froidefond@maaf.fr Stéphane CHAPPELLIER Actuaire IA Responsable du Pôle IARD Tél. : +33 (0)1 56 89 07 70 Direct : +33 (0)1 56 89 30 72 Fax : +33 (0)1 56 89 07 71 E-mail : stephane.chappellier@actuaris.com 23