SAS ENTERPRISE MINER POUR L'ACTUAIRE



Documents pareils
données en connaissance et en actions?

TABLE DES MATIERES. C Exercices complémentaires 42

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

Coup de Projecteur sur les Réseaux de Neurones

La place de SAS dans l'informatique décisionnelle

Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives *************


Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)

Modélisation aléatoire en fiabilité des logiciels

5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: F:

1 Modélisation d être mauvais payeur

Calcul élémentaire des probabilités

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

Arbres binaires de décision

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Guide d exploration de base de données de IBM SPSS Modeler 15

Découvrez le portefeuille de produits IBM SPSS

CMI ECONOMIE, FINANCE QUANTITATIVE ET STATISTIQUES - PARCOURS FORMATION EN APPRENTISSAGE

Comment valoriser votre patrimoine de données?

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

PROBABILITES ET STATISTIQUE I&II

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Crédit Scoring. Master 2 SRO. Année scolaire 2009/2010. Professeur : RICHARD EMILION. Réalisé par : MAHAMAT OUMAR ALHABO et OULD EL HADDAD CHEIKH

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

TRANSPORT ET LOGISTIQUE :

Annexe commune aux séries ES, L et S : boîtes et quantiles

Outils pour les réseaux de neurones et contenu du CD-Rom

1 Imputation par la moyenne

Lois de probabilité. Anita Burgun

Guide de l utilisateur de IBM SPSS Modeler 15

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

Processus de comptage, Poisson mélange, fonction de perte exponentielle, système bonus-malus.

Le Guide Pratique des Processus Métiers

CCNA Discovery Travailler dans une PME ou chez un fournisseur de services Internet

1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données

Pentaho Business Analytics Intégrer > Explorer > Prévoir

ENSEIGNEMENT ET MONDE PROFESSIONNEL. Illustration d un lien fort au travers d un cours de scoring. Jean-Philippe KIENNER 7 novembre 2013

Cycle de vie du logiciel. Unified Modeling Language UML. UML: définition. Développement Logiciel. Salima Hassas. Unified Modeling Language

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Le data mining et l assurance Mai Charles Dugas Président Marianne Lalonde Directrice, développement des affaires

La classification automatique de données quantitatives

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Améliorer la Performance des Fournisseurs

ENSPS 3A ISAV Master ISTI AR. J. Gangloff

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Accélérer l agilité de votre site de e-commerce. Cas client

QUANTIFICATION DU RISQUE

Master Exploration Informatique des données Data Mining & Business Intelligence. Evelyne CHARIFOU Priscillia CASSANDRA

Agenda de la présentation

Journées d études IARD

Table des matières. I Mise à niveau 11. Préface

Collecter les 54 milliards d'euros de bénéfices issus des nouveaux usages de la donnée

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Evaluation des performances de programmes parallèles haut niveau à base de squelettes

INITIATION AU LOGICIEL SAS

INTRODUCTION AU DATA MINING

CNAM léments de cours Bonus-malus et Crédibilité

LES DIFFERENTS TYPES DE MESURE

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Solutions Décisionnelles SPAD. La maîtrise des données, l'art de la décision

(Customer Relationship Management, «Gestion de la Relation Client»)

Introduction au datamining

FICHE UE Licence/Master Sciences, Technologies, Santé Mention Informatique

Logiciel XLSTAT version rue Damrémont PARIS

Conférence Bales II - Mauritanie. Patrick Le Nôtre. Directeur de la Stratégie - Secteur Finance Solutions risques et Réglementations

Enjeux mathématiques et Statistiques du Big Data

PROGRAMME (Susceptible de modifications)

L olivier Assurances Licence 3 Econométrie Lyon II

Cluster High Availability. Holger Hennig, HA-Cluster Specialist

Resolution limit in community detection

4. Résultats et discussion

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

L intégration entre Infor EAM et le SIG d ESRI Carine Deshayes, Account Manager Edouard Podolak, Consultant Avant-Ventes CPIM

MASTER de sciences et technologies, Mention MATHÉMATIQUES ET APPLICATIONS Université Pierre et Marie Curie (Paris VI) Année

Commande Prédictive des. Convertisseurs Statiques

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Application du data mining pour l évaluation de risque en assurance automobile

Données longitudinales et modèles de survie

Poursuivre ses études à l'université de Rouen Masters professionnels en Informatique et en Mathématiques. UFR Sciences et Techniques /18

Comparaison du coût total de propriété de MongoDB et d Oracle. Un livre blanc 10gen

Optimisation des ressources des produits automobile première

Algèbre 40 Analyse Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS

Didier MOUNIEN Samantha MOINEAUX

IBM SPSS Direct Marketing

Stratégie et Vision de SAP pour le secteur Banque- Assurance: Data-Management, BI, Mobilité

Malgré la crise, Le décisionnel en croissance en France

Notes de mise à jour. 4D v11 SQL Release 3 (11.3) Notes de mise à jour

SSLS116 - Chargement membranaire d une plaque excentrée

VI. Tests non paramétriques sur un échantillon

FORMULAIRE DE STATISTIQUES

2010 Minitab, Inc. Tous droits réservés. Version Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

Transcription:

SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada

AGENDA Survol d Enterprise Miner de SAS Enterprise Miner pour les Assurances Modèles linéaires généralisés Modèles à deux étapes Tarification Formation SAS Questions

SURVOL D ENTERPRISE MINER

SURVOL D ENTERPRISE MINER

SURVOL D ENTERPRISE MINER Contient des fonctionnalités qui permettent d'améliorer la performance et de construire des modèles plus simplement et efficacement Échantillon et partition Sélection des variables Imputation et transformation

SURVOL D ENTERPRISE MINER Enterprise Miner offre une grande variété d'algorithmes de modélisation prédictive et facilite la comparaison des modèles et le scoring de nouvelles données.

SURVOL D ENTERPRISE MINER Données de Training Données de Validation inputs target inputs target Complexité 1 2 3 4 5 Création d une séquence de modèles avec une complexité croissante....

SURVOL D ENTERPRISE MINER Données de Training Données de validation inputs target inputs target Complexité 1 2 3 4 5 Évaluation de la performance sur les données de Validation...

SURVOL D ENTERPRISE MINER Données de Training Données de validation inputs target inputs target 1 2 3 4 5 Complexité Choisir le modèle le plus simple avec la meilleure performance sur les données de validation Évaluation de la performance...

SURVOL D ENTERPRISE MINER Données de Training Données de validation inputs target inputs target 1 2 3 4 5 Complexité Choisir le modèle le plus simple avec la meilleure performance sur les données de validation Évaluation de la performance...

SURVOL D ENTERPRISE MINER Fonctionnalités de Text Mining: Traitement du langage naturel Désambiguïsation lexicale Reconnaissance d'entités nommées Classification et la catégorisation de documents

ENTERPRISE MINER POUR LES ASSURANCES : MODÈLES LINÉAIRES GÉNÉRALISÉS

MODÈLES LINÉAIRES GÉNÉRALISÉS g ( E ( y )) = β + β x + + β x = X β i 0 1 1i k k i Composante aléatoire: la variable de réponse Y, à laquelle est associée une loi de probabilité La loi de probabilité de la composante aléatoire appartient à la famille exponentielle Composante déterministe: combinaison linéaire Xβ des variables explicatives X1. XK utilisées comme prédicteurs dans le modèle La fonction de lien g() décrit la relation entre la combinaison linéaire des variables X1.XK et l espérance mathématique de la variable de réponse Y 13 Copyright 13 2012, SAS Institute Inc. All rights reserved.

MODÈLES LINÉAIRES GÉNÉRALISÉS Modèle Régression linéaire Régression Logistique Régression Poisson Régression Gamma 14 14 Variable Dépendante Distribution Moyenne Variance Fonction de lien Continue (gravité des identité réclamations) Normale µ σ 2 µ Dichotomique (propension à la réclamation) Binomiale π π(1- π)/n Comptage (fréquence de réclamation) Poisson λ λ Continuel (sévérité de réclamation ) Gamma µ µ 2 /ν logit log[π/(1-π)] log log(λ) Inverse 1/µ (mais le log est souvent utilisé)

MODÈLES LINÉAIRES GÉNÉRALISÉS Le noeud de régression s adapte à la régression logistique ou linéaire dépendant du niveau de la variable cible.

MODÈLES LINÉAIRES GÉNÉRALISÉS Le nœud de réseau neuronal s adapte aux modèles linéaires généralisés et peut donner des estimations qui sont identiques à PROC GENMOD en SAS / STAT. L'inverse de la fonction de lien est appliquée à la partie droite de l'équation du modèle et est appelée une fonction d'activation (par exemple lien: log = activation: Exponentielle).

MODÈLES LINÉAIRES GÉNÉRALISÉS Le noeud de code SAS avec ses fonctionnalités de macro permet un codage plus simple des procédures SAS/STAT telle que PROC GENMOD.

ENTERPRISE MINER POUR LES ASSURANCES : MODÈLES À DEUX ÉTAPES

MODÈLES A DEUX ÉTAPES Le noeud TwoStage permet l'estimation de la perte prévue par l adéquation et la combinaison d'un modèle binaire (probabilité de réclamation) et un modèle continu (montant de la réclamation). P é =

MODÈLES A DEUX ÉTAPES Les résultats incluent des rapports et des statistiques d adéquation pour chaque modèle

ENTERPRISE MINER POUR LES ASSURANCES : TARIFICATION

TARIFICATION Différents types de modèles: Fréquence, sévérité, pure premium La distribution Tweedie est utilisée pour modéliser le pure premium

TARIFICATION Toutes les variables continues sont regroupées, par le nœud de transformation ou dans le noeud de tarification lui-même Les modèles peuvent être Pure Premium (Tweedie) ou Défini par l utilisateur.

TARIFICATION Les modèles définis par l utilisateur peuvent être de la famille exponentielle ou de distribution mixte comme le ZIP et le Tweedie, avec des fonctions de liens.

TARIFICATION Les résultats incluent les estimations des paramètres, les statistiques d adéquation et le Relativity Plot. Le Relativity Plot exponentie les estimateurs des paramètres

FORMATION SAS

FORMATION SAS Advanced Predictive Modeling Using SAS Enterprise Miner Cours publics Formation intra-entreprise Mentorat Cours LiveWeb Cours elearning

QUESTIONS? SYLVAIN TREMBLAY SPÉCIALISTE EN FORMATION STATISTIQUE SYLVAIN.TREMBLAY@SAS.COM MERCI! www.sas.com