Application des réseaux de neurones au plan de répartition des risques 5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: 514.592.9301 F: 514.340.6850 info@apstat.com www.apstat.com
Copyright c 2002 par Apstat Technologies Inc. Tous droits réservés
3 1 INTRODUCTION Au cours de la dernière décennie, les algorithmes d apprentissage statistique ont suscité beaucoup d intérêt dans le milieu académique et au sein d entreprises de diverses industries. Ils ont été implantés avec succès pour l accomplissement de tâches prédictives reliées à des processus statistiques observés pour lesquels on peut identifier plusieurs variables explicatives. Ce document se concentre sur une classe particulière de ces algorithmes : les réseaux de neurones artificiels ou RNA. Les RNA tirent leur puissance de modélisation de leur capacité à capter les dépendances de haut niveau, c.-à-d. qui impliquent plusieurs variables à la fois. Ce document vise à démontrer la profitabilité qui peut être tirée de l application des réseaux de neurones pour la sélection des risques à céder au PRR. En utilisant les données d un assureur automobile nord-américain, nous avons conduit plusieurs expériences à cet effet. Nous décrivons le PRR à la section 2. Les hypothèses utilisées et la méthodologie suivie font l objet de la section 3. Les résultats numériques obtenus sont dévoilés à la section 4 et nous concluons à la section 5. Réseaux de neurones artificiels. Plan de Répartition des Risques. 2 GÉNÉRALITÉS DU PRR Le PRR a été créé par le GAA dans le but de permettre aux assureurs de partager une certaine portion de leurs risques, au maximum 10%. Chaque assureur choisit les risques à céder au PRR. Pour ces risques, le PRR remboursera les réclamations que l assureur a encourues. En contrepartie, l assureur doit verser au PRR 75% des primes qui ont été chargées aux risques cédés. Différentes vues sur le PRR existent : initialement, il a été conçu pour compenser les assureurs qui devaient obligatoirement accepter (et sous-tarifer) certains mauvais risques qui avaient été refusés par les souscripteurs de plusieurs assureurs. On peut aussi percevoir le PRR comme une forme de réassurance qui permet à l assureur de céder certains risques qui, bien qu ils aient été tarifés adéquatement, pourraient causer des pertes importantes (par exemple, les assurés qui voyagent beaucoup aux États-Unis où l assureur couvre la responsabilité civile). Enfin, le PRR peut être vu comme un moyen de céder les risques qui n ont pu être tarifés de façon suffisante par le Groupement des Assureurs Automobile.
4 système en place. Cette dernière vue fait l objet du présent document. Dans l industrie, les assureurs cherchent donc, à l aide de modèles de scoring, à identifier les risques qui ont été sous-tarifés, c.-à-d. pour lesquels on estime que l espérance mathématique des réclamations que l assuré encourera est supérieure à 75% de la prime qui lui a été chargée. Pour ces risques, la cession au PRR est profitable. Présentement, il semble que peu d assureurs arrivent à le faire de façon réellement fiable et profitable puisque la plupart n utilisent pas pleinement la portion maximale de 10% qui leur est allouée. Les assureurs sont donc à la recherche de modèles qui leur permettront d utiliser le PRR de façon plus profitable. 3 HYPOTHÈSES ET MÉTHODOLOGIE Generalized Linear Model (modèle linéaire généralisé). Dans cette section, nous décrivons les hypothèses et la méthodologie qui nous permettent d obtenir une approximation des bénéfices financiers qui pourraient découler de l implantation des RNA pour la sélection des risques à céder au PRR. Les chiffres sont basés sur les données hors-québec d un assureur nord-américain mais n incluent pas les montants des réclamations pour blessures corporelles. Le modèle de référence pour le calcul des primes pures est un GLM et le modèle utilisé pour le choix des risques à céder au PRR est un modèle à base de RNA. En supposant un ratio sinistres/primes de 65%, on peut en déduire la prime chargée à un assuré : et la prime versée au PRR : Prime brute = Prime GLM/65% Prime payée au PRR = Prime GLM 75%/65%. La prime pure correspond à l espérance mathématique des réclamations associées à un risque particulier. En supposant que le modèle à base de RNA puisse identifier les failles dans la tarification, on peut calculer, pour chaque risque, le profit projeté de sa cession au PRR : Profit Projeté = Prime RNA Prime GLM 75%/65%.
5 Une fois ce profit projeté calculé, il suffit de trier les risques en ordre décroissant selon le ratio Profit Projeté Prime GLM et de céder en priorité les risques avec le ratio le plus élevé jusqu à ce que la limite de 10% ait été atteinte ou que le profit projeté et le ratio deviennent négatifs. Finalement, pour chaque risque cédé au PRR, le profit réalisé est obtenu selon la formule suivante : Profit Réalisé = Réclamations Prime GLM 75%/65%. Ces simples formules résument la stratégie adoptée pour le PRR dans nos expériences. Elles ne tiennent pas compte des technicalités liées à l actualisation avec intérêts des versements. Le lecteur intéressé à introduire ses propres hypothèses à cet effet pourra utiliser les montants de la section suivante pour tirer ses propres conclusions. Dans l industrie, le ratio sinistres/primes varie beaucoup d un assureur à l autre, en particulier en regard du PRR qui ne reconnaît pas les réductions concédées de façon ad hoc. Or, le ratio sinistres/primes est crucial dans le calcul de la profitabilité du PRR : plus le ratio est élevé, plus l utilisation du PRR devient profitable. Enfin, nous concluons cette section par des considérations méthodologiques. Les données des années 1994, 1995 et 1996 ont été utilisées pour l optimisation des paramètres des modèles. Plusieurs modèles différents ont été entraînés et le meilleur modèle a été choisi sur la base de sa performance sur les données de 1997. Cette procédure a été appliquée pour le choix du meilleur GLM, puis pour le choix du meilleur RNA. Finalement, les résultats de la section suivante sont obtenus en confrontant le meilleur modèle de chacune des deux catégories sur les données de 1998. 4 RÉSULTATS NUMÉRIQUES Les résultats obtenus ont été mis à l échelle pour un assureur dont le volume d affaires annuel en assurance automobile au Québec est de 100M$. La Figure 1 illustre la profitabilité du PRR en fonction du pourcentage du volume d affaires qui a été cédé. Si l assureur
6 choisit de céder le maximum permis de 10%, alors les primes versées au PRR sont de 7.5M$ et le profit est supérieur à 1.25M$, c.-à-d. que le montant total des réclamations associées aux risques cédés est de 8.75M$. Donc, le ratio sinistres/primes de ces risques est de 87.5% et le même ratio pour les risques retenus par l assureur est de 62.5%, une réduction de 2.5% par rapport à l ensemble du portefeuille. 5 CONCLUSION Selon nos expériences, le modèle à base de RNA permet de détecter, de façon fiable et profitable, certains risques sous-tarifés par un modèle GLM. Ces modèles sont pourtant considérés comme étant à l état de l art. Selon les résultats obtenus, pour un assureur dont le volume d affaires annuel en assurance automobile au Québec est de 100M$, l utilisation d un modèle à base de RNA pourrait se traduire en un profit supérieur à 1.25M$. Nous croyons que les technologies avancées d apprentissage statistique, telles que celles basées sur les RNA feront bientôt leur entrée dans le monde de l assurance tout comme les GLM sont maintenant devenus populaires. Ces technologies sont puissantes parce qu elles permettent de détecter de façon automatique, les dépendances non-linéaires de haut niveau entre les variables explicatives. Les premières compagnies à implanter ces nouvelles technologies seront celles qui en profiteront le plus à long terme.
7 1.5M$ 1.25M$ Profit réalisé Profit projeté Profit du PRR (volume: 100M$, Ratio S/P: 65%) FIG. 1. Profitabilité du PRR en fonction du pourcentage de cession des risques. 1M$ 0.75M$ 0.5M$ 0.25M$ 1% 2% 3% 4% 5% 6% 7% 8% 9% 10% Pourcentage de cession au PRR