L analyse ROC en agronomie



Documents pareils
Proposition de labellisation d un projet de thèse pour une Allocation de Recherche (5 pages maximum)

Medication management ability assessment: results from a performance based measure in older outpatients with schizophrenia.

HENDRICH FALL RISK MODEL (HFRM)

Intérêts de l utilisation conjointe des modèles CERES et AZODYN pour raisonner la modulation de la fertilisation azotée

Post-processing of multimodel hydrological forecasts for the Baskatong catchment

WHEATPEST, simulating multiple pest damage in varying winter wheat production situations

CLIQUEZ ET MODIFIEZ LE TITRE

Population responses to environmental forcing : approaches to model and monitor habitat characteristics

INF6304 Interfaces Intelligentes

Mulford C. (1992). The Mother-Baby Assessment(MBA): An Apgar Score for breastfeeding. Journal of Human Lactation, 8(2),

Face Recognition Performance: Man vs. Machine

Christian BONTEMPS né le 08 juillet 1969

Validation probabiliste d un Système de Prévision d Ensemble

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Revision of hen1317-5: Technical improvements

Chapitre 1 Evaluation des caractéristiques d un test diagnostique. José LABARERE

Étude d impact et Services Écosystémiques : Comment identifier et spatialiser les enjeux?

CarrotAge, un logiciel pour la fouille de données agricoles

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Scénarios économiques en assurance

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

3 rd ORGANIC PROCESSING CONFERENCE

Mesure chimique. Chemical measurement. Sonde de température Pt 1000 Inox Pt 1000 stainless steel. Ref : Français p 1.

Christophe SANNIER

RAPPORT INDICATEURS IAD

Data issues in species monitoring: where are the traps?

Détection de la défaillance des entreprises tunisiennes par la régression logistique semi paramétrique et les réseaux de neurones

Mesure non invasive du débit cardiaque

Proposition d une démarche pour la conception et l évaluation d idéotypes de plantes

Title Text. Gestion de données de mobilité Mobility data management

Introduction au Data Mining et à l apprentissage statistique

Evaluation et gestion du risque des champs radiofréquences: Une perspective de l'oms

PVCHECK Rel /11/12

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin

Projet MERINOVA : Les risques météorologiques comme moteurs d innovation environnementale dans la gestion des agro-écosystèmes

L approche de régression par discontinuité. Thomas Lemieux, UBC Atelier de formation du Congrès de l ASDEQ Le 18 mai 2011

10 en agronomie. Domaine. Les engrais minéraux. Livret d autoformation ~ corrigés. technologique et professionnel

1 Modélisation d être mauvais payeur

Principe de symétrisation pour la construction d un test adaptatif

Archived Content. Contenu archivé

Macro-to-Microchannel Transition in Two-Phase Flow and Evaporation

DAIRYMAN aux Pays-Bas

Apport d un nouveau test Interféron Gamma

IODE Consulting I Intelligence on Demand Slide 1

Improving the breakdown of the Central Credit Register data by category of enterprises

HEC Montréal MODÈLE DE PROBABILITÉ DE DÉFAUT DES PRÊTS D UNE BANQUE CANADIENNE

BNP Paribas Personal Finance

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

PROGRAMME (Susceptible de modifications)

PLAN DIRECTEUR DES PARCS, MILIEUX NATURELS ET ESPACES VERTS PARKS, NATURAL HABITATS AND GREEN SPACES MASTER PLAN

Économétrie, causalité et analyse des politiques

Les variables financières sont-elles utiles pour anticiper la croissance économique?

Revue de la littérature

Christian BONTEMPS né le 08 juillet 1969

ERA-Net Call Smart Cities. CREM, Martigny, 4 décembre 2014 Andreas Eckmanns, Responsable de la recherche, Office Fédéral de l énergie OFEN

Régionalisation des régimes de perturbations et implications pour l aménagement dans un contexte de changement climatique

PIB : Définition : mesure de l activité économique réalisée à l échelle d une nation sur une période donnée.

Ordonnance du DFE concernant les filières d études, les études postgrades et les titres dans les hautes écoles spécialisées

RÔLES DE LA MICROSTRUCTURE ET DE LA COMPOSITION MINERALOGIQUE DE SOLS ARGILEUX DU BASSIN DE PARIS SUR LEUR SENSIBILITE AU RETRAIT - GONFLEMENT

CONCLUSION. 31 mars 2015 Laurène Chochois Helpdesk REACH&CLP Luxembourg

Exemple PLS avec SAS

Evolution récente et à venir de l environnement réglementaire européen: Quelle implication pour le secteur carrier?

Interest Rate for Customs Purposes Regulations. Règlement sur le taux d intérêt aux fins des douanes CONSOLIDATION CODIFICATION

Ordonnance du DFE concernant les filières d études, les études postgrades et les titres dans les hautes écoles spécialisées

Introduction aux outils BI de SQL Server Fouille de données avec SQL Server Analysis Services (SSAS)

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

OUVRIR UN COMPTE CLIENT PRIVÉ

Objectifs pédagogiques Lecture critique d article

Abschlusskonferenz OUI Biomasse / Conférence de clôture OUI Biomasse

Wealth Effect on Labor Market Transitions

OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT)

CALCUL DE LA CONTRIBUTION - FONDS VERT Budget 2008/2009

Quelles représentations des interactionsbiotiques dans les modèles?

Why Software Projects Escalate: The Importance of Project Management Constructs

Quantification de l AgHBs Pouquoi? Quand?

Forthcoming Database

Résumé du suivi phytosanitaire du canola au Centre-du-Québec de 2009 à 2011

GEIDE MSS /IGSS. The electronic document management system shared by the Luxembourg

Comptes des changements de la biodiversité des systèmes et des espèces

Programme GREAT-MED: «Generating a Risk and Ecological Analysis Toolkit for the Mediterranean»

Quoi manger et boire avant, pendant et après l activité physique

Institut français des sciences et technologies des transports, de l aménagement

ANALYSE QUANTITATIVE DE RISQUE MICROBIOLOGIQUE EN ALIMENTATION

SAGE nécessaires ( Disposition 13A-1 SDAGE Loire Bretagne)

Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données

Nicolas Turenne. Université Paris-Est & INRA. UMR LISIS (Joint Research Unit Interdisciplinary Laboratory Sciences Innovations Societies)

Spécificités, Applications et Outils

DIAGNOSTIC DE DURABILITE du Réseau Agriculture Durable

Les systèmes de gestion des actifs immobiliers par Gilles Marchand, Ministère de l'éducation du Québec & Dino Gerbasi, GES Technologies

4. Verdissement, une PAC plus verte

Cancer bronchique primitif: données épidémiologiques récentes

Livret d animations Sarthe Nature Environnement

Cloud Computing: de la technologie à l usage final. Patrick CRASSON Oracle Thomas RULMONT WDC/CloudSphere Thibault van der Auwermeulen Expopolis

Appel à Candidature Thèse de doctorat en agronomie

The space to start! Managed by

ASPIB Approche Systémique pour appréhender les communautés de bioagresseurs : application à la Protection Intégrée du Blé

D Expert en Finance et Investissements

La méthode de régression par discontinuité et l évaluation des politiques de l emploi

BASE DE DONNÉES DES ASPECTS SOCIOÉCONOMIQUES EN MÉDITERRANÉE OCCIDENTALE

Transcription:

RMT Modelia, Paris, 16 novembre 2009 L analyse ROC en agronomie David Makowski makowski@grignon.inra.fr

Pourquoi s intéresser aux erreurs des modèles?

Pourquoi s intéresser aux erreurs des modèles? i. Les modèles font plusieurs types d erreur Erreur de prédiction Erreur de classement Erreur de décision Erreur d estimation

Pourquoi s intéresser aux erreurs des modèles? ii. Évaluer les erreurs pour faciliter le choix d un modèle Plusieurs modèles sont souvent disponibles pour un usage donné. Difficile de déduire le niveau d erreur d un modèle à partir de sa structure ou de son niveau de complexité. Résultats des comparaisons de modèles parfois inattendus.

Evaluation des erreurs de 16 modèles prédisant l incidence du piétin échaudage du blé au stade GS33. RMSEP (%) 70 60 50 Choix initial 40 30 20 10 0 15 18 21 24 27 30 Nombre de paramètres Ennaïfar, Makowski, Meynard, Lucas. 2007.

Pourquoi s intéresser aux erreurs des modèles? iii. Donner aux utilisateurs une information sur les risques d erreurs Les modèles agronomiques jouent un rôle de plus en plus important dans les expertises scientifiques à diverses échelles. Important de fournir une information sur les erreurs liées à l utilisation d un modèle donné.

Pourquoi s intéresser aux erreurs des modèles? iv. Orienter les recherches futures Quantifier l intérêt d une amélioration des modèles. Faire des hypothèses sur les points faibles des modèles et sur la meilleure façon de les améliorer.

Pourquoi s intéresser aux erreurs des modèles? i. Les modèles peuvent conduire à différents types d erreur ii. Evaluer les erreurs pour faciliter le choix d un modèle iii. Donner aux utilisateurs une information sur les risques d erreurs iv. Orienter les recherches futures

Comment évaluer les erreurs des modèles? Analyses d incertitude et de sensibilité Evaluation de la qualité prédictive Evaluation des erreurs de classement

«Le MSEP de mon modèle est très mauvais mais ce n est pas grave. Mon modèle n est pas utilisé pour prédire mais pour classer». Un agronome anonyme.

Règle de décision binaire «Si la prédiction I du modèle est supérieure au seuil de décision S alors je considère que la variable d intérêt Y est égale à 1. Sinon je considère que Y=0.» «Si I > S, alors Y=1, sinon Y=0»

Exemples d utilisation de règles de décision binaires en agronomie Si la prédiction est supérieure à S - le risque de pollution par les nitrates sera élevé - la teneur en protéines du blé sera forte - il y aura une perte de rendement due au sclérotinia - cette espèce d oiseau sera présente dans cette prairie

Deux types d erreurs de classification Faux positif: I > S mais Y=0 Faux négatif: I < S mais Y=1

Décision basée sur le modèle I I Décision optimale Y = 0 Y = 1 < S Vrai négatif Faux négatif S Faux positif Vrai positif Le but de l analyse ROC est d estimer les fréquences de faux négatif et de faux positif pour tous les seuils de décision S.

Un exemple détaillé

Objectif Evaluer plusieurs indicateurs de risque de pollution nitrique à partir de données expérimentales

Les indicateurs Indicator I 1 I 2 I 3 I 4 I 5 Expression I 1 = amount of applied nitrogen I 2 I 3 = [applied nitrogen + soil mineral nitrogen in winter]/grain yield I 4 = applied nitrogen + soil mineral nitrogen in winter = applied nitrogen nitrogen content in grain *grain yield I 5 = residual soil mineral nitrogen predicted by a dynamic model

Données Bassin de Bruyères 36 sites = 145 ha 10 années =1991-2000 92 sites-années de blé Mesures - Reliquat N récolte dans le sol - Entrée de tous les indicateurs Beaudoin et al., 2005

Analyse ROC Décision basée sur le modèle I I Décision optimale Y = 0 Y = 1 < S Vrai négatif Faux négatif S Faux positif Vrai positif Sensibilité = Nombre de vrai positif/ Nombre total de situations avec Y=1 Spécificité = Nombre de vrai négatif / Nombre total de situations avec Y=0

Estimation de la sensibilité et de la spécificité pour un indicateur et tous les seuils de décision S n sites-années avec Y=0 (faible reliquat récolte: RR< D thresh ) m sites-années avec Y=1 (fort reliquat récolte: RR D thresh ) (i). Déterminer la valeur I de l indicateur pour chaque site-année. (ii). Définir un seuil de décision S. (iii). Sensibilité = Prob(I S Y=1) = 1 Proba. Faux négatif (iv). Spécificité = Prob(I < S Y=0) = 1 Proba. Faux positif (v). Courbe ROC: Sensibilité (S) versus 1 Spécificité (S) (vi). Estimer l aire sous la courbe ROC (AUC) pour l indicateuri. Si AUC~0.5, l indicateur n est pas meilleur qu un classement aléatoire.

Fréquence Sites-années avec Y=1 Sites-années avec Y=0 Spécificité Sensibilité Valeur de I S

Courbe ROC Sensibilité 1 Valeur optimale Surface sous la courbe = Probabilité de classer correctement deux sites-années 0 1 1 - Spécificité

TAB<-read.table("f:\\David\\Projets\\BleBruyere.txt",header=T,sep="\t") #Gold standard RR.t<-30 Ref<-TAB$RR Ref[Ref<RR.t]<-0 Ref[Ref>=RR.t]<-1 #ROC analysis Ind.list<-c(1,2,3,4,5) Auc.vec<-Ind.list for (i in 1:length(Ind.list)) { Code R (library ROCR) } Ind<-TAB[,i] pred<-prediction(ind,ref) perf<-performance(pred,"auc") auc<-perf@"y.values" Auc.vec[i]<-as.numeric(auc) print(auc.vec)

Résultats

Sensibilité, spécificité, et AUC de l indicateur I 3 (D thresh = 30 kg/ha) I3 = [applied nitrogen + soil mineral nitrogen in winter]/grain yield Sensitivity Sensitivity 0.0 0.2 0.4 0.6 0.8 1.0 AUC=0.69 Sensitivity Sensitivity/Specificity / Specificity 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Specificity 1.5 2.0 2.5 3.0 3.5 4.0 Decision threshold Makowski, Tichit, Guichard, Van Keulen, Beaudoin. 2009.

Capacité de 5 indicateurs à discriminer les sites-années avec des niveaux élévés et faibles de reliquat N récolte Indicator Area under the ROC curve (probability of correct ranking) D thresh =20 kg/ha D thresh =30 kg/ha D thresh =40 kg/ha I 1 0.58 (*) 0.62 (**) 0.61 (**) I 2 0.64 (**) 0.63 (***) 0.58 (.) I 3 0.70 (***) 0.69 (***) 0.63 (**) I 4 0.64 (***) 0.67 (***) 0.63 (**) I 5 0.45 (.) 0.58 (.) 0.50 (.)

Indicator I 1 I 2 I 3 I 4 I 5 Expression I 1 = amount of applied nitrogen I 2 I 3 = [applied nitrogen + soil mineral nitrogen in winter]/grain yield I 4 = applied nitrogen + soil mineral nitrogen in winter = applied nitrogen nitrogen content in grain *grain yield I 5 = residual soil mineral nitrogen predicted by a dynamic model

Capacité de 5 indicateurs à discriminer les sites-années avec des niveaux élévés et faibles de reliquat N récolte Indicator Area under the ROC curve (probability of correct ranking) D thresh =20 kg/ha D thresh =30 kg/ha D thresh =40 kg/ha I 1 0.58 (*) 0.62 (**) 0.61 (**) I 2 0.64 (**) 0.63 (***) 0.58 (.) I 3 0.70 (***) 0.69 (***) 0.63 (**) I 4 0.64 (***) 0.67 (***) 0.63 (**) I 5 0.45 (.) 0.58 (.) 0.50 (.)

Autres exemples d applications de l analyse ROC

Classification par rapport à un seuil de teneur en protéines SPAD INN Sensitivity 0.0 0.2 0.4 0.6 0.8 1.0 a AUC= 0.75 Sensitivity 0.0 0.2 0.4 0.6 0.8 1.0 b AUC= 0.84 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 1-specificity 1-specificity Crop Model 1 Crop Model 2 Sensitivity 0.0 0.2 0.4 0.6 0.8 1.0 c AUC= 0.46 0.0 0.2 0.4 0.6 0.8 1.0 Sensitivity 0.0 0.2 0.4 0.6 0.8 1.0 d AUC= 0.59 0.0 0.2 0.4 0.6 0.8 1.0 Barbottin, Makowski, LeBail, Jeuffroy. 2008 1-specificity 1-specificity

Prédiction du risque de perte de rendement associé au sclérotinia du colza Sensitivity 0.0 0.2 0.4 0.6 0.8 1.0 a. Flowers Algorithm 1 Algorithm 2 No discrimination Sensitivity 0.0 0.2 0.4 0.6 0.8 1.0 b. Flowers Algorithm 1 Algorithm 2 No discrimination 0.0 0.2 0.4 0.6 0.8 1.0 1-Specificity 0.0 0.2 0.4 0.6 0.8 1.0 1-Specificity Makowski, D., M. Taverne, J. Bolomier, M. Ducarne. 2005 Sensitivity 0.0 0.2 0.4 0.6 0.8 1.0 c. Flowers Algorithm 1 Algorithm 2 No discrimination 0.0 0.2 0.4 0.6 0.8 1.0 1-Specificity

Prédiction de la présence/absence de deux espèces d oiseaux dans les praires du marais poitevin AUC with cross validation 0.8 0.6 0.4 0.2 a) Lapwing BIC NS BMA AIC AIC BIC NS BMA BIC AIC BMA NS Habitat variable models Management variable models All type variables models AUC with cross validation 0.8 0.6 0.4 0.2 b) Redshank BIC BIC AIC NS BMA BIC Habitat variable models Management variable models All type variables models AIC NS BMA AIC NS BMA 0 1000 2000 3000 4000 5000 Cost (euros) 0 1000 2000 3000 4000 5000 Cost (euros) Barbottin, Tichit, Cadet, Makowski. In press.

«Les prédictions de mon modèle sont imprécises et le modèle ne classe pas mieux que le hasard. Mais c est peut-être dû à l utilisation de mesures peu fiables et pas au modèle lui-même. On ne peut donc pas dire que le modèle est mauvais». Un agronome anonyme.

Possible en théorie Les bases de données utilisées dans les travaux présentés ici ont été choisies par les modélisateurs eux-mêmes Avec ces bases de données, tous les modèles n ont pas le même niveau de précision S il n y a pas de mesures fiables disponibles pour évaluer le(s) modèle(s), il faut commencer pas collecter de telles mesures!

Quelques recommandations Constituer des bases de données de référence pour évaluer les modèles Utiliser des procédures statistiques d évaluation de modèles, comme l analyse ROC ou autres Comparer plusieurs modèles de niveaux de complexité contrastés pour un usage donné Utiliser des méthodes d analyse de sensibilité et d incertitude Ne pas tout miser sur les modèles; utiliser des méthodes de synthèses de connaissance (e.g., meta-analyse de données et d articles)

Références Barbottin A, Makowski D, Le Bail M, Jeuffroy M-H, Bouchard Ch, Barrier C. 2008. Comparison of models and indicators for categorizing soft wheat fields according to their grain protein contents. European Journal of Agronomy 29, 159-183. Makowski D., Denis J-B., Ruck L., Penaud A. 2008. A Bayesian approach to assess the accuracy of a diagnostic test based on plant disease measurement. Crop Protection 27:1187-1193. Makowski, D., M. Taverne, J. Bolomier, M. Ducarne. 2005. Comparison of risk indicators for sclerotinia control in oilseed rape. Crop Protection 24:527-531 Makowski D., Tichit M., Guichard L., van Keulen H., Beaudoin N. 2009. Measuring the accuracy of agro-environmental indicators. Journal of Environmental Management 90, S139-S146. Pepe MS. 1998. Three approaches to regression analysis of ROC curves for continuous test results. Biometrics 54, 124-135. Pepe MS. 2003. The statistical evaluation of medical tests for classification and prediction. Oxford Statistical Science series-28 Primot, S., M. Valantin-Morison, D. Makowski. 2006. Predicting the risk of weed infestation in winter oilseed rape crops. Weed Research 46:22-33 Swets, J.A., 1988. Measuring the accuracy of diagnostic systems. Science 240, 1285-1293.