Interprétation graphique de la courbe ROC

Documents pareils
FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

Cours Fonctions de deux variables

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

PRIME D UNE OPTION D ACHAT OU DE VENTE

AC AB. A B C x 1. x + 1. d où. Avec un calcul vu au lycée, on démontre que cette solution admet deux solutions dont une seule nous intéresse : x =

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)

Comparaison de fonctions Développements limités. Chapitre 10

F411 - Courbes Paramétrées, Polaires

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

La classification automatique de données quantitatives

Fonctions de deux variables. Mai 2011

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

Chapitre 3. Les distributions à deux variables

Nom de l application

Fonctions de plusieurs variables

3 Approximation de solutions d équations

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Etude de fonctions: procédure et exemple

Techniques d interaction dans la visualisation de l information Séminaire DIVA

CH.6 Propriétés des langages non contextuels

Représentation des Nombres

Continuité et dérivabilité d une fonction

chapitre 4 Nombres de Catalan

Optimisation, traitement d image et éclipse de Soleil

Dérivation : cours. Dérivation dans R

Baccalauréat L spécialité, Métropole et Réunion, 19 juin 2009 Corrigé.

UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1

EPFL TP n 3 Essai oedomètrique. Moncef Radi Sehaqui Hamza - Nguyen Ha-Phong - Ilias Nafaï Weil Florian

Arithmétique binaire. Chapitre. 5.1 Notions Bit Mot

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

Eteindre. les. lumières MATH EN JEAN Mme BACHOC. Elèves de seconde, première et terminale scientifiques :

Fonctions homographiques

Définition 0,752 = 0,7 + 0,05 + 0,002 SYSTÈMES DE NUMÉRATION POSITIONNELS =

Les capitalistes sociaux sur Twitter : détection via des mesures de similarité

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

LE PROBLEME DU PLUS COURT CHEMIN

Chapitre 2 Le problème de l unicité des solutions

Equilibrage de charge pour les grilles de calcul : classe des tâches dépendantes et indépendantes.

Cours 1. Bases physiques de l électronique

INF6304 Interfaces Intelligentes

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Trépier avec règle, ressort à boudin, chronomètre, 5 masses de 50 g.

COMPTE-RENDU «MATHS EN JEANS» LYCEE OZENNE Groupe 1 : Comment faire une carte juste de la Terre?

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Deux disques dans un carré

Calcul intégral élémentaire en plusieurs variables

Les algorithmes de base du graphisme

Théorèmes de Point Fixe et Applications 1

choisir H 1 quand H 0 est vraie - fausse alarme

Relation d ordre. Manipulation des relations d ordre. Lycée Pierre de Fermat 2012/2013 Feuille d exercices

ir value.com Le Fundamental Value Indicator

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Relation entre deux variables : estimation de la corrélation linéaire

O, i, ) ln x. (ln x)2

Chapitre 2 Les ondes progressives périodiques

Inconvénient les micro paiements (très faibles montants) ne sont pas toujours possibles.

Rappels sur les suites - Algorithme

Principe de symétrisation pour la construction d un test adaptatif

Programmation linéaire

Le produit semi-direct

C f tracée ci- contre est la représentation graphique d une

Resolution limit in community detection

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

Les données d un jeu sous Shadow Manager

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

Nombre dérivé et tangente

Exprimer ce coefficient de proportionnalité sous forme de pourcentage : 3,5 %

L E Ç O N. Marches aléatoires. Niveau : Terminale S Prérequis : aucun

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Bien lire l énoncé 2 fois avant de continuer - Méthodes et/ou Explications Réponses. Antécédents d un nombre par une fonction

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

Chap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Texte Agrégation limitée par diffusion interne

Exercice 3 (5 points) A(x) = 1-e -0039' e- 0,039x A '() -'-,..--,-,--,------:-- X = (l_e-0,039x)2

Détection et suivi d'objets dans une séquence d'images par contours actifs

Chapitre 6. Fonction réelle d une variable réelle

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Master d Informatique M1 Université Paris 7 - Denis Diderot Travail de Recherche Encadré Surf Bayesien

Algèbre binaire et Circuits logiques ( )

Equilibrage de charge pour les grilles de calcul : classe des tâches dépendantes

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires

Conception d une base de données

enquête pour les fautes sur le fond, ce qui est graves pour une encyclopédie.

UNE APPROCHE POUR LA GENERATION AUTOMATIQUE DE TESTS DE ROBUSTESSE

Mathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans

L apprentissage automatique

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

La fonction exponentielle

Université Paris-Dauphine DUMI2E 1ère année, Applications

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Transcription:

Interprétation graphique de la courbe ROC François Rioult GREYC CRS UMR6072, Université de Caen Basse-ormandie francois.rioult@unicaen.fr Résumé. L aire sous la courbe ROC est un outil pertinent pour mesurer la performance d un classifieur et possède de nombreux avantages par rapport aux mesures de rappel et précision par classe : la performance est indiquée par une seule mesure et ne dépend pas des populations des classes. Cet avantage se transforme néanmoins en inconvénient lorsqu il s agit, lors de la lecture de la courbe, de calculer rapidement les mesures de rappel et de précision par classe ou d estimer le comportement du classifieur en tenant compte des populations des classes. Cet article propose une analyse graphique de la courbe ROC, qui permet d améliorer son interprétation en fournissant une estimation des rappel et précision par classe. Cet article a été publié sous une forme résumée à EGC 2011 (Rioult (2011)), présentation poster. 1 Introduction La courbe ROC (Receiver Operating Characteristics) [Fawcett (2003)] offre à la fois une vision graphique et une mesure pertinentes de la performance d un classifieur. Elle possède de nombreux avantages par rapport aux mesures de rappel et précision par classe : : la performance est synthétisée par une unique mesure qui ne dépend pas des proportions de classe. Cet avantage se transforme néanmoins en inconvénient lorsqu il s agit de revenir rapidement aux mesures de rappel et de précision par classe ou d estimer le comportement du classifieur selon les classes. Les mesures de rappel et précision sont en effet utiles car elles caractérisent précisément le comportement du classifieur sur chacune des classes. En particulier, lorsque les classes sont déséquilibrées, ces mesures fournissent des indications de performance plus représentatives et concrètes qu un unique score pour le classifieur. otre travail vise à améliorer l estimation des performances d un classifieur dont on connaît la courbe ROC : il s agit donc d une méthode graphique d estimation, qui d un coup d œil permet de lire sur la courbe les rappel, précision et Fscore par classe. Bien évidemment, un calcul adapté, étant donnés les points de la courbe, permettrait de préciser tout score. ous souhaitons plutôt introduire un mode nouveau de lecture de la courbe ROC qui permette d appréhender plus profondément le comportement du classifieur. ar exemple, s il est aisé de mesurer graphiquement le rappel en chaque point de la courbe (c est son ordonnée), la valeur de la précision ne peut être obtenue que par calcul. Une méthode graphique pour la déterminer rapidement serait la bienvenue.

Interprétation géométrique de la courbe ROC La courbe ROC est une caractéristique de la performance indépendante de la classe, cependant elle représente le point de vue de la classe positive, généralement la classe majoritaire. Des mesures concernant la classe minoritaire sont donc difficiles à obtenir graphiquement. ous présentons donc une méthode simple d interprétation graphique de la courbe ROC, tant d un point de vue de la classe positive que négative. Des considérations graphiques sur le point d intersection de la courbe avec la diagonale descendante fournissent simplement des valeurs fiables du rappel et de la précision pour chaque classe. 2 réliminaires Dans un contexte d apprentissage supervisé, qui étudie des exemples d apprentissage (u i ) pourvus d une étiquette indiquant sa classe, nous focalisons notre attention sur les problèmes de classification binaire ou conceptuelle [Cornuéjols A. (2010)] : il n y a que deux classes, notées et, contenant respectivement et exemples. Le résultat de la classification est noté dans une table de contingence : Décision Vérité total T F F T total + Le résultat d un classifieur utilise : T (resp. T ) : le nombre de vrais positifs (resp. négatifs) F (resp. F ) : le nombre de faux positifs (resp. négatifs). Les mesures traditionnelles de la performance en classification sont propres à chaque classe : Rappel : pour la classe : Ra = T pour la classe récision : r = T T +F, r =, Ra = T T T +F β2 Ṙa r Fscore : le Fscore est une moyenne harmonique de paramètre β : F S = β2ṙa+. Dans la r suite on considérera le cas β = 1. our obtenir des rappel, précision et Fscore indépendants des classes, on effectue les moyennes des valeurs par classe. Une autre mesure traditionnelle est le score de classification, qui indique la proportion d exemples bien classés (dans les deux classes). Aire sous la courbe ROC L utilisation des mesures précédemment décrites est contestée [rovost et al. (1998)], notamment car elles fournissent une vue trop particulière de la performance du classifieur et parce qu elles sont trop sensibles à la disproportion de classe. On leur préfère souvent l aire sous la courbe ROC, qui utilise des mesures normalisées par les populations des classes : les taux de vrais ou de faux positifs. Considérant que le classifieur rend sa décision sous la forme d une probabilité d appartenance à la classe, la décision finale est modulable par un seuil. En faisant varier ce seuil, on calcule pour chaque classification le taux de faux positifs T T et celui de vrais positifs, qui définissent la courbe dite ROC. L aire sous cette courbe indique la probabilité que le classifieur fournisse un score d appartenance à supérieur à celui d appartenir à.

F. Rioult 3 Méthode graphique d interprétation de la courbe ROC otre travail vise à mieux cerner les différences de classification selon les classes grâce à une lecture graphique de la courbe ROC. ous considérons pour cela disposer de la courbe ROC fournie par un classifieur, et nous déduisons des informations de cette courbe pour des constructions graphiques. 3.1 Courbe ROC pour la classe négative La courbe ROC classique est relative aux performances pour la classe, nous la notons désormais ROC. ous introduisons alors la courbe ROC, qui représente le taux de vrais négatifs T soit Ra en fonction du taux de faux négatifs F. Le rapport graphique entre les deux courbes est trivial : Théorème 1 Soit d la diagonale descendante (ou diagonale de gauche), d équation x+y = 1. Cette diagonale constitue un axe de symétrie pour ROC et ROC. reuve : ROC affiche les points de coordonnées (x, y ) = ( F, T ), ROC les points (x, y ) = ( F, T F ). Or = T = 1 T et T = F = 1 F. Donc x = 1 y et y = 1 x. On reconnaît une symétrie d axe d. T = Ra = y T = Ra = y 1 0.8 0.6 d d D ROC D y = 1 x 0.4 0.2 y = 1 x ROC D d 0 0 0.2 0.4 0.6 0.8 1 F = x F = x FIG. 1 Interprétation graphique de la courbe ROC selon les classes. La courbe ROC, en trait plein, a pour équation y = x 1/4. Sur la figure 1, nous avons représenté les courbes pour les deux classes, ainsi que leurs axes de coordonnées (x, y ) et (x, y ). En corollaire, les aires sous les courbes ROC et ROC sont égales, par symétrie. C est là encore l intérêt de cette mesure, qui ne caractérise pas le comportement du classifieur selon une seule classe mais fournit une évaluation générale sur les deux classes.

Interprétation géométrique de la courbe ROC 3.2 Analyse de la courbe ROC dans le cas de classes équilibrées ( = ) Définition 1 ous introduisons le point D d intersection entre les courbes ROC, ROC et la diagonale descendante d. Au point D, les équations suivantes, selon les systèmes d axes, sont satisfaites : Ra + F = 1 et Ra + F = 1. Les calculs suivants sont menés au point D. roposition 1 Au point D, le rappel, la précision et le Fscore sont tous égaux, pour les deux classes : r = Ra = F score = r = Ra = F score reuve : D une façon générale, r = T = Ṙa = Ra T +F Ṙa+F r = Ra Ra+ F Ra+ F. Si =, alors : Le dénominateur de la précision représente donc la somme des coordonnées d un point de la courbe ROC. Au point D, cette somme vaut 1 et r = Ra = F score. La même propriété est valable pour la classe négative. Ainsi, dans le cas de classes équilibrées, le rappel (coordonnée y) au point D donne immédiatement la précision et le Fscore, car tous sont égaux. Il s agit là d un moyen extrêmement simple et rapide d évaluer la performance d un classifieur. Ce point définit le seuil d équilibre (breakeven), largement utilisé et discuté 1 comme mesure de performance (voir par exemple [Sebastiani (2002)]). Ses propriétés géométriques, soulignées ici, nous semblent nouvelles et intéressantes pour améliorer l interprétation de la courbe ROC, en la rapprochant de considérations en rappel/précision. 3.3 Classes deséquilibrées ( > ) ous introduisons désormais deux points d intersection avec les courbes ROC : D est le point d intersection entre ROC et la droite d équation y + x = 1 ; D est le point d intersection entre ROC et la droite d équation y + x = 1. ropriété 1 Aux points D et D, le rappel, la précision et le Fscore sont tous égaux : r = Ra = F score et r = Ra = F score Ra reuve : Dans la preuve de la propriété 1, l expression de la précision est r =. = Ra+ F. Au point D, ce dénominateur vaut 1 et on obtient la propriété. Ra Ra+ F our déterminer les valeurs par classe, on lit le rappel pour comme l ordonnée du point D, qui fournit également précision et Fscore. our la classe, on peut construire D comme le symétrique de D par rapport à d et son ordonnée livre rappel, précision et Fscore ; le complémentaire à 1 de abscisse de D remplit également cette fonction. Sur notre exemple de la figure 1, si nous considérons que =, toutes les mesures valent 0.72 si les classes sont équilibrées. ous avons représenté D et D pour = 8 : on obtient des mesures de 0.91 pour la classe et de 0.3 pour la classe. 1. Entre autres, ce seuil ne fournit le maximum ni de la précision ni du rappel.

F. Rioult Cette méthode de lecture graphique de la courbe fournit des mesures de précision et de Fscore selon les classes. Elle illustre également les compromis entre rappel et précision obtenus en ces points particuliers, lorsque les disproportions de classe augmentent. 3.4 Variations de déséquilibre et évolution des mesures ous proposons de compléter la lecture d une courbe ROC pour mieux cerner les évolutions de la précision et du Fscore en chaque point de la courbe, selon la variation de faux positifs. Cette analyse graphique fournit des tendances pour les rappel, précision et Fscore dans le cas de classe déséquilibrées. ous avons les relations suivantes : r = F score = Ra Ra +/.F / 2Ra 2 Ra + Ra (Ra + /.F /) = 2Ra 1 + Ra + /.F / La courbe de précision en fonction du taux de faux positifs passe donc par les points (0, 1) 1 (par prolongement par continuité, avec une tangente verticale), D et (1, 1+/ ). La courbe de Fscore en fonction du taux de faux positifs passe par les points (0, 0) (par prolongement par 2 continuité, avec une tangente verticale), D et (1, 2+/ ). La figure 2 montre les évolutions des points d intersection lorsque le déséquilibre entre les classes augmente. our chaque valeur de, on affiche, en fonction du taux de faux positifs, les courbes de rappel (ou courbe ROC), de précision et de Fscore. Sachant que ces courbes passent par D et D, la position de ces points permet d estimer les évolutions de ces mesures. et Ra r F s Ra = 1 = 1.5 = 3 Fs r = 4 = 8 FIG. 2 our une même courbe ROC, différentes valeurs de précision et de Fscore sont modifiées en conséquence. : 1, 1.5, 3, 4, 8. Les courbes de Bien que la courbe ROC soit un indicateur indépendant de la répartition des classes, elle permet ici d imaginer l impact d un déséquilibre des classes :

Interprétation géométrique de la courbe ROC la situation neutre symbolisée par le point D fournit des mesures de rappel, précision et Fscore égales pour chaque classe ; en faisant varier le rapport entre et (on suppose > ), les droites d et d s écartent de la diagonale ; le point D monte le long de la courbe ROC à partir du point D : les rappel, précision et Fscore pour la classe dominante augmentent conjointement ; le point D descend le long de la courbe ROC à partir de D et les mesures chutent. Dans le cas de classes déséquilibrées, tracer les droites d et d permet d appréhender graphiquement le comportement du classifieur selon les deux classes : les performances en rappel, précision et Fscore seront meilleures pour la classe majoritaire, au détriment de la classe minoritaire. 4 Conclusion ous avons proposé une méthode simple d interprétation des performances d un classifieur étant donnée sa courbe ROC. L ordonnée des points d intersection avec des diagonales descendantes fait le lien avec le rappel, la précision et le Fscore par classes. Cette construction permet d appréhender graphiquement les différences de performance selon les classes et d approfondir la lecture de la courbe ROC. Références Cornuéjols A., M. L. (2010). Apprentissage artificiel - Concepts et algorithmes. aris : Eyrolles. Fawcett, T. (2003). Roc graphs : otes and practical considerations for researchers. Tech Report HL-2003-4, H Laboratories. rovost, F. J., T. Fawcett, et R. Kohavi (1998). The case against accuracy estimation for comparing induction algorithms. In ICML 98, pp. 445 453. Rioult, F. (2011). Interprétation graphique de la courbe roc. In Extraction et Gestion des Connaissances (EGC 11), pp. 301 304. Sebastiani, F. (2002). Machine learning in automated text categorization. ACM Computing Surveys 34(1), 1 47.