ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

Documents pareils

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

ENSEIGNEMENT ET MONDE PROFESSIONNEL. Illustration d un lien fort au travers d un cours de scoring. Jean-Philippe KIENNER 7 novembre 2013

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Mémo technique MODELES GENERIQUES DE SCORE DE CREDIT ou Le scoring de crédit «prêt à l emploi»

a) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées :

Coup de Projecteur sur les Réseaux de Neurones

ESSEC Cours Wealth management

Introduction au datamining

«Credit scoring» : une approche objective dans l'octroi de crédit?

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

données en connaissance et en actions?

Définitions. Définitions sur le logement

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 24/12/2006 Stéphane Tufféry - Data Mining -

Arbres binaires de décision

Apprentissage Automatique

Cours de méthodes de scoring

Le scoring est-il la nouvelle révolution du microcrédit?

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Ouvrage conçu et coordonné par HERVÉ HUTIN TOUTE LA FINANCE. Éditions d Organisation, 1998, 2002, 2005 ISBN :

Les algorithmes de fouille de données

Optimisation des ressources des produits automobile première

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Comment évaluer une banque?

Agenda de la présentation

Le plan d action marketing et commercial : De la réflexion marketing à l action commerciale

marketing, scoring comportemental & analyse prédictive

1 Modélisation d être mauvais payeur

Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit

Groupe Eyrolles, 2004 ISBN :

GLOBAL SUPPLY CHAIN MANAGEMENT & STRATEGIE LOGISTIQUE

TRANSPORT ET LOGISTIQUE :

La méthode des scores, particulièrement de la Banque de France

Premier modèle - Version simple

RÉSUMÉ POINT SUR LA SITUATION ÉCONOMIQUE ET FINANCIÈRE DU QUÉBEC. Par : Service de fiscalité

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

Introduction des. comptes d épargne libre d impôt

VI. Tests non paramétriques sur un échantillon

Journées d études IARD

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit

Chapitre 2/ La fonction de consommation et la fonction d épargne

Réforme des cotisations sociales des TNS: Evolution ou révolution?

Programmation linéaire

TABLE DES MATIERES. C Exercices complémentaires 42

ANALYSE DU RISQUE DE CRÉDIT

Méthodes d apprentissage statistique «Machine Learning»

Associations Dossiers pratiques

Du marketing dans ma PME!

Chapitre 1 : Introduction au contrôle de gestion. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 1

CHAPITRE 14 LA DIVERSITÉ ET L ORGANISATION DES RÉSEAUX D UNITÉS COMMERCIALES.

Le calcul du barème d impôt à Genève

Spécificités, Applications et Outils

LES RÉFÉRENTIELS RELATIFS AUX ÉDUCATEURS SPÉCIALISÉS

LE PLAN D'AMÉLIORATION DE LA FONCTION MARKETING

Données longitudinales et modèles de survie

Travailler avec les télécommunications

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner

INF6304 Interfaces Intelligentes

Exercice 3 du cours Management Bancaire : «Risque de crédit et scoring»

Cybermarché et analyse comportementale

NON-LINEARITE ET RESEAUX NEURONAUX

Les services à la personne : nouveaux marchés pour de nouveaux entrepreneurs

UE Marketing Stratégique

HEC Montréal MODÈLE DE PROBABILITÉ DE DÉFAUT DES PRÊTS D UNE BANQUE CANADIENNE

Leader en entraînement 30 minutes et en nutrition

Le data mining et l assurance Mai Charles Dugas Président Marianne Lalonde Directrice, développement des affaires

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.

Avis légal. I 2 FISCALLIANCE 2011 L Incorporation des Courtiers Immobiliers du Québec

Marketing III. Calcul du prix & Indicateurs. Contenu

DEMANDE D INFORMATION RFI (Request for information)

L évaluation de la performance de la communication media

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO

observatoire du Transport Sanitaire 2014 kpmg.fr

Elaboration et Suivi des Budgets

Fiche qualité relative à l enquête Santé et Itinéraire Professionnel 2010 (SIP) Carte d identité de l enquête

Annexe commune aux séries ES, L et S : boîtes et quantiles

Pour une entreprise plus performante

Conseil économique et social

Projet Business Object

MASTER EUROPEEN EN MANAGEMENT ET STRATEGIE D ENTREPRISE SPECIALISATION MANAGEMENT DU DEVELOPPEMENT DURABLE

Chapitre 3. Les distributions à deux variables

La classification automatique de données quantitatives

Le «scoring» en microfinance : un outil de gestion du risque de crédit

Octroi de crédit : la minimisation des risques de défaillance n'a pas le dernier mot

EXERCICES - ANALYSE GÉNÉRALE

Eco-Fiche BILAN DE L ANNEE 2012 QUELLES PERSPECTIVES POUR 2013? 1

Marketing stratégique : Du diagnostic au plan marketing stratégique

Masters Spécialisés «Actuariat et Prévoyance» et «Actuariat et Finance»

Les exploitations de grandes cultures face à la variabilité de leurs revenus : quels outils de gestion des risques pour pérenniser les structures?

S84-1 LA GRC ET LE SI (Système d Information) Qualification des données clientèle La segmentation de la clientèle

LES MODELES DE SCORE

Présentation du Système d Administration Générale des Projets (Agape )

Modélisation de la réforme des pensions

Des données à la connaissance client. A la découverte de la plateforme de connaissance client knowlbox

Améliorer les performances du site par l'utilisation de techniques de Web Mining

Transcription:

ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des pertes possibles sont relativement peu importantes, les banques ne peuvent passer beaucoup de temps sur l analyse du crédit. Les données des petites et moyennes entreprises et des ménages sont standard et permettent un traitement de masse informatisé. Les modèles peuvent être utilisés à plusieurs fins : Evaluer les risques : calculer la probabilité d être un bon client Décider : accorder ou ne pas accorder le crédit Proposer : marketing

Rappel du problème et exemples (1) Formalisation du problème Discriminer au mieux les différents groupes d une population dont les individus sont décrits par des variables afin de prendre une décision.

Rappel du problème et exemples (2) Exemple: le risque de crédit pour les clients particuliers d un réseau bancaire Le problème: discriminer les clients en fonction de leur degré de risque (les bons et les mauvais clients) Information disponible: caractéristiques des clients (âge, situation familiale, salaire, ancienneté dans l entreprise, etc.) Objectif : accorder un crédit au client et éventuellement de déterminer le montant, la durée et le taux du crédit. Exercice: trouver d autres exemples de tels problèmes dans la banque.

Les étapes de la mise en place d un outil d aide à la décision (1) Construire une base de données historique Définir la base de données Définir précisément l événement étudié : qu est ce qu un mauvais payeur? Définir les caractéristiques à retenir : âge, salaire, ancienneté dans l entreprise, etc. Collecter les informations Retraiter la base de données Valeurs manquantes, valeurs aberrantes Redresser éventuellement la base de données Comment traiter les dossiers refusés?

Les étapes de la mise en place d un outil d aide à la décision (2) Construire une règle de décision à partir d une méthode d analyse discriminante (détaillée plus loin pour le scoring) Choisir une méthode et un modèle Estimer le modèle et définir la règle de décision

Mettre en œuvre Les étapes de la mise en place d un outil d aide à la décision (3) Mettre en place des outils informatiques Mettre en place des procédures Former les utilisateurs Evaluer la r ègle de décision et suivr e le modèle sous jacent

Les étapes de la mise en place d un outil d aide à la décision (4) Réactualiser régulièrement le modèle et la règle de décision Ajouter de nouvelles variables ou supprimer d anciennes variables Estimer à nouveau les paramètres du modèle Changer la valeur des paramètres de la règle de décision (la valeur du seuil pour une fonction de score par exemple)

Les méthodes d analyse discriminantes (1) L analyse discriminante regroupent différentes méthodes: Les méthodes de scoring : Méthodes statistiques qui permettent d affecter à chaque individu un score (une note) représentatif de son profil. La comparaison de ce score à un seuil fixé aboutit à une décision : accorder un crédit à un client de la banque par exemple. Les méthodes d arbre Méthodes descriptives fondées sur un arbre décisionnel mettant en valeur les variables discriminantes importantes et les liens entre ces variables. Le cheminement d un individu dans l arbre permet de le classer et d aboutir à une décision.

Les méthodes d analyse discriminantes (2) Les réseaux de neurones Modélisations sophistiquées de la relation entre les inputs (variables décrivant les individus) et les outputs (classement des individus permettant de prendre une décision) adaptées à des données complexes. Toutes ces méthodes permettent de classer les individus et de prendre une décision de façon automatique (gain de temps dans l analyse des dossiers et rapidité de décision).

Objectifs des méthodes d analyse discriminante (1) Les différentes méthodes d analyse discriminante partagent les mêmes objectifs : Un objectif descriptif Mettre en évidence les variables qui permettent de séparer au mieux les groupes d individus. Déterminer si les différences entre les groupes sont significatives. Donner une représentation graphique qui rende compte de cette séparation. L analyse discriminante à but descriptif repose sur la notion de distance.

Objectifs des méthodes d analyse discriminante (2) Un objectif décisionnel Construire une règle d affectation des nouveaux individus à l un des groupes. L analyse discriminante à but décisionnel repose sur le concept de probabilité.

Etapes de la construction d un score Construire un modèle Choisir un modèle (exemples : linéaire ou logistique) Séparer la base de données historiques en deux échantillons : un échantillon d apprentissage (pour estimer le modèle) et un échantillon test (pour tester le modèle) Sélectionner les variables explicatives du modèle et estimer les paramètres du modèle à partir de l échantillon d apprentissage Interpréter des paramètres estimés (signe des paramètres) Construire une règle de décision fondée sur le modèle Déterminer un seuil pour la règle de décision Mesurer la qualité d ajustement du modèle sur un échantillon test

Le modèle linéaire (1) Un modèle vise à expliquer une variable par d autres variables : p Y i = β j X ij + j = 1 où Y i représente la variable à expliquer qualitative (Y i =0 si le client i est un mauvais client et Y i = 1 si le client i est un bon client). Pour un client de l échantillon d apprentissage, la valeur de cette variable est connue. Pour un futur client, cette valeur n est pas connue au moment de la décision mais le modèle en fournira une estimation qui permettra de prendre une décision. u i

Le modèle linéaire (2) où (X ij ) j=1, p représente les p variables explicatives qui peuvent être qualitatives (propriétaire ou locataire, marié ou non marié) ou quantitatives (âge, nombre d enfants, salaire, etc.). Pour un client de l échantillon d apprentissage ou un futur client, la valeur de ces variables est connue.

Le modèle linéaire (3) Rappel de l équation p Y i = β j X ij + j = 1 u i où (β j ) j=1, p représentent les p paramètres du modèle. Ces paramètres sont estimés à partir de l échantillon d apprentissage. où u i : le terme d erreur du modèle. Le modèle n est pas parfait!

Le modèle linéaire (4) Définition du score Z = i p = j 1 β j X ij Le score noté Z i synthétise les caractéristiques du client i au regard de la variable à expliquer. Plus la valeur du score Z i est élevée, plus le client i a de chance d être un bon client.

Le modèle linéaire (5) Les limites du modèle linéaire Remarque 1 : connaissant les variables X, l anticipation de la variable Y est égale à la probabilité que le client i soit un bon client. E ( Y / X ) = 1 p + 0 ( 1 p ) = p où p = P( Y 1 / X ) i i i i i i =

Le modèle linéaire (6) Remarque 2 : une probabilité est comprise entre 0 et 1. Or, dans le modèle linéaire, cette probabilité estimée peut être en dehors du segment [0, 1], ce qui pose problème E p ( Y ) = = i / X p i = j 1 β j X ij Question: quel modèle proposer?

Le modèle logisitique Amélioration du modèle linéaire E Le modèle logistique p = j = ( Y ) i / X p i = F β j X ij x e F(x) =, 0 F(x) x 1 + e La relation entre la probabilité d être un bon client et le niveau du score est représentée ci dessous : 1 1.

Le modèle logisitique: probabilité et score 1,00 Probabilité d'être un bon client 0,80 0,60 0,40 0,20 0,00 10 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 Niveau du score

La sélection des variables (1) Idée : Les variables explicatives sont choisies de manière à prédire l appartenance des individus aux groupes. Lorsqu une variable est introduite dans le modèle, elle apporte de l information pour discriminer les individus appartenant à des groupes différents, mais elle apporte aussi du bruit. La pertinence de la variable dépend du ratio information/bruit.

La sélection des variables (2) Méthode : La contribution marginale de chaque variable au modèle est considérée et testée. Une variable donnée est retenue d après un critère objectif : comparaison du maximum de vraisemblance de deux modèles (l un comprenant la variable l autre pas).

La sélection des variables Tau x d erreu r d e classem en t (TEC) TEC exact su r éch an tillon test su r éch an tillon s d ap p ren tissage TEC ap p aren t bon nes variables variables red ond antes variables n u isibles Figu re 1 : Evolu tion d u tax d erreu r d e classem ent en fon ction d u nom bre d e variables exp licatives d an s le m od èle.

La règle de décision (1) La règle de décision repose sur le choix d un score limite (seuil) noté Zl. Si Z i <Z l, alors la décision est «non». Si Z i Z l, alors la décision est «oui». Choisir un score limite Zl revient à choisir une probabilité limite notée p l : p l = F(Z l ) Si la probabilité estimée du client i d être «un bon client» est inférieure à la probabilité limite, c est à dire si p i <p l, alors la décision est «non». Si la probabilité estimée du client i d être «un bon client» est supérieure à la probabilité limite, c est à dire si p i p l, alors la décision est «oui».

La règle de décision (2) En pratique, pour une valeur du score limite donnée, de bons clients auront un score inférieur au score limite et de mauvais clients auront un score supérieur au score limite. Encore une fois, le modèle n est pas parfait! Si on fixe une valeur basse pour le score limite, on acceptera tous les bons clients mais aussi beaucoup de mauvais. Si on fixe une valeur trop élevé pour le score limite, on n acceptera pas de mauvais clients mais très peu de bons clients. Pour déterminer la valeur optimale du score limite, il faut effectuer au préalable une analyse de rentabilité des bons clients et des mauvais clients. La valeur optimale du score limite est la valeur qui maximise le profit de la banque.

Distribution du score Distribution du score de tous les clients (bons et mauvais) 200 Nom bre de clients 150 100 50 0 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Score Tous les clients

Distribution du score par groupe (1) Distribution du score des bons clients et des mauvais clients CAS 1: le score est discriminant 200 Nombre de clients 150 100 50 0 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Score Mauvais cl ients Bons cli ents

Distribution du score par groupe (2) Distribution du score des bons clients et des mauvais clients CAS 2: le score est parfaitement discriminant 200 Nombre de clients 150 100 50 0 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Scor e Mauvais clients Bons clients

Distribution du score par groupe (3) Distribution du score des bons clients et des mauvais clients CAS 3: le score n'est pas discriminant 200 Nombre de clients 150 100 50 0 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Score Mauvais clients Bons clients

Distribution du score par groupe modélisée Distribution du score de bons clients et des m auvais clients Modélisation de l'échantillon 0,20 Densité du nombre de clients 0,15 0,10 0,05 0,00 5 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Score Mauvais clients Bons clients

La méthode de l arbre n n 1 2 = = 100 100 X < s 1 i X 1 X > s 1 i X 1 n n 1 2 = = 40 80 n n 1 2 = = 60 20 X i 3 = 0 X 3 i = 1 n n 2 1 = 5 = 75 n n 1 2 = 35 = 5 n 1 : nombre de bons clients n 2 : nombre de mauvais clients X 1 : salaire (variable quantitative) X 3 : état marital (variable qualitative : X 3 =0 si non marié et X 3 =1 si marié) Exem p le d arbre d e d écision b in aire à 2 n iv ea u x

Validation de l analyse discriminante (1) Une fois la règle de décision construite (fonction de score, arbre de décision ou réseau de neurones), il est important d évaluer sa performance. La performance est mesurée par les taux d erreur de classement. Outil d évaluation ex ante : la matrice de classement ou la matrice de confusion Groupes d'origine Groupes d'affectation Bons clients Mauvais clients Bons clients 52 12 Mauvais clients 9 47

Validation de l analyse discriminante (2) Dans cet exemple, après application de la méthode, 52 bons clients et 47 mauvais clients ont bien été classés dans leur groupe d origine. Par contre, 12 bons clients ont été considérés comme mauvais clients et 9 mauvais clients comme bons clients. Outil d évaluation ex post : comparaison des taux d erreur de classement anticipé et r éalisé