28 nov. 1 déc. 2005 Formation INRA ACTA ICTA La Rochelle. David Makowski. UMR Agronomie INRA/INA-PG makowski@grignon.inra.fr



Documents pareils
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Programmation linéaire

Évaluation de la régression bornée

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

Chapitre 3. Les distributions à deux variables

CAPTEURS - CHAINES DE MESURES

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

1 Complément sur la projection du nuage des individus

Programmation linéaire

choisir H 1 quand H 0 est vraie - fausse alarme

Relation entre deux variables : estimation de la corrélation linéaire

Exercice : la frontière des portefeuilles optimaux sans actif certain

Quantification Scalaire et Prédictive

VITICULTURE 2012 V 12 / PACA 02 STRATEGIE D APPLICATION DU CUIVRE EN VITICULTURE

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

La classification automatique de données quantitatives

Introduction à l approche bootstrap

Comment tracer une droite représentative d'une fonction et méthode de calcul de l'équation d'une droite.

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Fonctions de deux variables. Mai 2011

Le montant des garanties constituées aux fins du STPGV est-il excessif?

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Valérie Roy-Fortin, agr. Bio pour tous! - 6 mars 2015

Bien lire l énoncé 2 fois avant de continuer - Méthodes et/ou Explications Réponses. Antécédents d un nombre par une fonction

Annexe 6. Notions d ordonnancement.

Grandes cultures Engrais liquides ou granulaires?

Soutenance de stage Laboratoire des Signaux et Systèmes

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

STATISTIQUES. UE Modélisation pour la biologie

Probabilités sur un univers fini

La fonction exponentielle

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Les coûts de la production. Microéconomie, chapitre 7

TSTI 2D CH X : Exemples de lois à densité 1

PROJET MODELE DE TAUX

Durée de L épreuve : 2 heures. Barème : Exercice n 4 : 1 ) 1 point 2 ) 2 points 3 ) 1 point

La réalisation d essais en réacteur pilote en vue d une demande d homologation de digestat

Architecture des Systèmes d Information Architecture des Systèmes d Information

de calibration Master 2: Calibration de modèles: présentation et simulation d

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Les exploitations de grandes cultures face à la variabilité de leurs revenus : quels outils de gestion des risques pour pérenniser les structures?

Chapitre 0 Introduction à la cinématique

Analyse en Composantes Principales

Oscillations libres des systèmes à deux degrés de liberté

Voici une demande qui revient régulièrement lors de mes rencontres avec les employeurs :

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Qu est-ce qu une probabilité?

Optimiser les performances du mouvement de monte de l Axe Z.

Chapitre 1 I:\ Soyez courageux!

FICHE 1 Fiche à destination des enseignants

Méthodes de Simulation

Intérêts de l utilisation conjointe des modèles CERES et AZODYN pour raisonner la modulation de la fertilisation azotée

4. Verdissement, une PAC plus verte

Une application de méthodes inverses en astrophysique : l'analyse de l'histoire de la formation d'étoiles dans les galaxies

Les indices à surplus constant

Sylvie Guessab Professeur à Supélec et responsable pédagogique du Mastère Spécialisé en Soutien Logistique Intégré des Systèmes Complexes

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48

ANR ESCAPE Changements environnementaux et sociaux en Afrique : passé, présent et futur.

Probabilités sur un univers fini

Gestion obligataire passive

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

FORMULAIRE DE STATISTIQUES

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Rotations dans la culture de pomme de terre : bilans humiques et logiciel de calcul

Le théorème des deux fonds et la gestion indicielle

Arithmétique binaire. Chapitre. 5.1 Notions Bit Mot

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

Plus courts chemins, programmation dynamique

Nombre dérivé et tangente

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Perrothon Sandrine UV Visible. Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Filtrage stochastique non linéaire par la théorie de représentation des martingales

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

TD1 Signaux, énergie et puissance, signaux aléatoires

Eteindre. les. lumières MATH EN JEAN Mme BACHOC. Elèves de seconde, première et terminale scientifiques :

Menu INVEST STORE. COMMENT VOUS CONNECTER SUR VOTRE CAEL AVEC OPTION BOURSE : Adresse du site

Chapitre 6 La lumière des étoiles Physique

Items étudiés dans le CHAPITRE N5. 7 et 9 p 129 D14 Déterminer par le calcul l'antécédent d'un nombre par une fonction linéaire

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Indicateurs de résultats en Agriculture Durable

RESOLUTION OIV-VITI GUIDE D APPLICATION DU SYSTÈME HACCP (HAZARD ANALYSIS AND CRITICAL CONTROL POINTS) A LA VITICULTURE DE L OIV

Baccalauréat L spécialité, Métropole et Réunion, 19 juin 2009 Corrigé.

Exercices de dénombrement

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

L utilisation d un réseau de neurones pour optimiser la gestion d un firewall

Systèmes de transmission

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

INF6304 Interfaces Intelligentes

Régime de retraite patronal-syndical (Québec) de l'association internationale des machinistes (A.I.M.)

Protocoles cryptographiques

Item 169 : Évaluation thérapeutique et niveau de preuve

Transcription:

28 nov. 1 déc. 2005 Formation INRA ACTA ICTA La Rochelle David Makowski UMR Agronomie INRA/INA-PG makowski@grignon.inra.fr Mon cours sur l estimation des paramètres comportent deux parties. La première partie présentent des principes généraux. La deuxième partie porte sur un problème particulier que je définirai par la suite. 1

f ( x; θ ) Les équations Les variables d entrée Les paramètres «Un paramètre est une valeur numérique qui n est pas calculé par le modèle et qui n est pas une variable d entrée mesurée ou observée» Tout d abord, je définis ici ce qu est un paramètre. Un modèle comporte plusieurs éléments: une fonction, des variables d entrée et des paramètres. 2

«consiste à approcher les valeurs des paramètres à partir de données expérimentales et/ou d informations issues de l expertise» «Les performances d un modèle vont dépendre de la méthode utilisée pour estimer les paramètres» 3

Pb.1: Modèle linéaire avec un seul paramètre. Pb.2 : Modèle linéaire avec 2 paramètres. Pb.3 : Modèle non linéaire avec 18 paramètres. Je vais aborder le problème de l estimation des paramètres à travers trois problèmes de complexité croissante. 4

«Estimer le rendement moyen du colza en 2004 dans une petite région à partir de 3 mesures de rendement obtenues sur 3 parcelles» y 1 y 2 Échantillon y 3 Population Commençons par le problème le plus simple. L objectif est On considère donc un échantillon de trois mesures de rendement y1, y2, y3. Cet échantillon a été obtenu en réalisant des mesures sur trois parcelles agricoles tirées de façon aléatoire dans la région d intérêt. L ensemble des parcelles de colza de la région représente ce qu on appelle une population. 5

Quels paramètres doit-on estimer? Un seul paramètre à estimer, le rendement moyen de la région noté θ. Estimer un ou plusieurs paramètres revient toujours à se poser une série de questions. La première question que l on se pose est 6

Quelle information utiliser? Information disponible: un échantillon de trois mesures obtenues sur 3 parcelles de la population d intérêt. La deuxième 7

Un estimateur du rendement de la parcelle est : Exemple : Quelle méthode d estimation? ˆ θ = y + y + y 3 1 2 3 Si y 1 =30, y 2 =39 et y 3 =35, la valeur estimée du rendement moyen est 34.7 q/ha. Si y 1 =32, y 2 =38 et y 3 =39, la valeur estimée du rendement moyen est 36.3 q/ha. «Un estimateur est une fonction qui relie le paramètre à des observations» La troisième question est Quelle méthode d estimation? Une solution naturelle consiste ici à faire simplement la moyenne des trois observations. J en profite ici pour définir ce qu est un estimateur. C est une fonction qui relie le paramètre aux observations. En changeant les observations, on change la valeur du paramètre en utilisant l estimateur. Voici un exemple. Supposons qu on ait observé les valeurs suivantes Ici l estimateur a une expression très simple. En pratique, ce sera souvent plus compliqué comme on le verra par la suite. 8

Cet estimateur est-il précis? 2 ( ˆ θ θ ) = E ( ˆ θ ) θ 2 + var ( ˆ θ ) E Erreur quadratique moyenne Biais² Variance La dernière question consiste à se demander si l estimateur est précis. Pour étudier la précision d un estimateur, il est utile de considérer l erreur quadratique moyenne. Theta est la vraie valeur du paramètre (inconnue), THETA^est la valeur estimée pour un échantillon de donnée, l espérance est prise sur l ensemble des échantillons de données possibles. L EQM est égale à la somme de deux termes. Le premier est le biais, c est l erreur systématique. Le biais indique si l estimateur surestime ou sousestime systématiquement la vraie valeur du paramètre. Le deuxième terme est la variance de l estimateur. La variance donne une information sur la variabilité de THETA^ lorsqu on change d échantillon. En pratique, on en connaît pas la vraie valeur theta, ni la vraie valeur du biais et de la variance de l estimateur. Par contre, on peut approcher ces valeurs de différentes façons. 9

Cet estimateur est-il précis? a. Aspect théorique «Sous certaines conditions, notre estimateur est sans biais et de variance minimale parmi les estimateurs sans biais» Certains aspects théoriques peuvent être considérés pour juger de la précision d un estimateur. Ainsi, 10

Cet estimateur est-il précis? b. Variance de l estimateur On peut estimer Exemple : var ( θˆ ) à partir des données Si y 1 =30, y 2 =39 et y 3 =35, la valeur estimée de la variance est 6.78 q²/ha², soit e.t=2.6 q/ha. Si y 1 =32, y 2 =38 et y 3 =39, la valeur estimée de la variance est 4.78 q²/ha², soit e.t=2.19 q/ha. On peut également estimer la variance de l estimateur à partir des données. 11

«Estimer les paramètres du modèle f(x;θ 1,θ 2 )» f(x;θ 1,θ 2 ) = θ 1 + θ 2 x Azote absorbé par le colza Dose d engrais Le modèle simule l azote absorbé en fonction de la dose d engrais. Passons maintenant à un problème un petit peu plus complexe et plus intéressant. On veut estimer les paramètres d un modèle qui simule l azote absorbé du colza dans une parcelle agricole en fonction de la dose d engrais N appliquée sur cette parcelle. On veut que le modèle soit utilisable pour une région. Ce modèle inclut une variable d entrée x et deux paramètres. On suppose que lors de l utilisation du modèle, x sera connu mais ni theta1 ni theta2. 12

Quels paramètres doit-on estimer? Les deux paramètres du modèle: θ 1 et θ 2 Je reprends ici ma série de questions. 13

Quelle information utiliser? Un échantillon de cinq mesures «d azote absorbé» obtenues sur cinq parcelles de colza de la population d intérêt (une région) 350 Azote absorbé (kg/ha) 300 250 200 150 100 50 0 0 50 100 150 200 250 Dose d'engrais N (kg/ha) 14

Quelle méthode d estimation utiliser? La méthode des moindres carrés ordinaires Les estimateurs des paramètres sont les valeurs de θ 1 et θ 2 qui minimisent N i= 1 ( y θ θ x ) 2 i 1 2 i C est à dire ˆ N ( yi Y. )( xi X. ) θ i 1 2 = = N 2 ( xi X. ) i= 1 ˆ θ = Y. ˆ θ X. 1 2 L estimation des paramètres de ce modèle est un peu plus compliquée que pour le premier problème. Une méthode assez simple est la méthode des moindres carrés ordinaires. Avec cette méthode, le estimateurs Pour ce modèle particulier, on sait que les valeurs de theta1 et theta2 qui minimisent cette fonction sont définies par les fonctions suivantes Peu importe l expression de ces fonctions. L idée a retenir est qu on dispose d un moyen simple pour calculer les estimateurs des deux paramètres à partir des données. Ce sera le cas pour tous les modèles linéaires, c est à dire pour tous les modèles qui correspondent à une combinaison linéaire des paramètres. 15

Ici, avec nos 5 mesures, on obtient ˆ -1 θ = 106.01 kg.ha et ˆ -1 1 θ = 0.78 kg.kg 2 350 Azote absorbé (kg/ha) 300 250 200 150 100 50 0 0 50 100 150 200 250 Dose d'engrais N (kg/ha) 16

Ces estimateurs sont-ils précis? 2 ( ˆ θ θ ) = E ( ˆ θ ) θ 2 + var ( ˆ θ ) E Erreur quadratique moyenne Biais² Variance 17

Ces estimateurs sont-ils précis? a. Aspect théorique «Sous certaines conditions, nos estimateurs sont sans biais et de variances minimales parmi les estimateurs sans biais». Il faut notamment : - indépendance des résidus, - homogénéité des variances des résidus. 18

Ces estimateurs sont-ils précis? b. Variances des estimateurs On peut estimer var ( θˆ ) à partir des données. var var ( ˆ -1 θ 1) = 11.99 kg.ha ( ˆ -1 θ 2 ) = 0.09 kg.kg 19

Ces estimateurs sont-ils précis? c. Analyse des résidus ( θ1 θ2 ) r = y ˆ + ˆ x, i = 1,...,5 i i i Utile pour vérifier l indépendance des résidus et l homogénéité de leurs variances. Une dernière méthode pour juger de la qualité de la procédure d estimation est de faire une analyse des résidus. Un résidu est un écart entre une observation et la valeur correspondante prédite par le modèle. Ici on peut calculer 5 résidus car on dispose de 5 mesures. L analyse des résidus est utile pour vérifier qu il y a bien indépendance des résidus et homogénéité des variances. Si ce n est pas le cas, alors la méthode des moindres carrés ordinaire n est pas la méthode conduisant à des estimateurs de variances minimales. Nous verrons plus loin que d autres méthodes sont plus appropriées. 20

Résidu Residus -10 0 10 0 50 100 150 200 DOSE Dose d engrais (kg/ha) 21

Programme S+ DOSE<-c(0,50,120,160,220) NABS<-c(114.75,144.0,192.38,213,294.16) DATA<-data.frame(DOSE,NABS) Fit<-lm(NABS~DOSE,data=DATA) print(summary(fit)) plot(dose,fit$residuals,ylab="residu",ylab="dose",pch=15) abline(0,0) 22

1. Quels paramètres estimer? 2. Quelle information disponible? 3. Quelle méthode d estimation? 4. Quelle est la précision des estimateurs? 23

C est facile car θ 0 + θ 1 x 1 + θ 2 x 2 + + θ p x p Relation analytique entre estimateurs et données connue.!"#"$"%$&$'() 24

! θ * %θ +, + %θ -, - %( %θ, Relation analytique entre estimateurs et données inconnue. ", plusieurs types de mesures, mesures corrélées. / 25

" Modèle non linéaire. Beaucoup de paramètres. Information a priori. Différents types de mesures obtenues sur plusieurs parcelles. Je considère maintenant un problème bcp plus complexe. Habituellement, quand j ai un peu plus de temps, je présente un problème d un niveau de complexité intermédiaire mais là je n ai pas le temps, donc j attaque directement le cas le plus délicat. Ce problème est caractérisé par 26

# Estimer les paramètres du module «fonctionnement potentiel» du modèle AZODYN (Jeuffroy et Recous, 1999) Variables simulées entre sortie hiver et floraison (pas de temps = jour): - Matière sèche des parties aériennes du blé (kg/ha), - azote absorbé (kg/ha), - LAI. Variables d entrée: - Rayonnement global journalier, - température moyenne journalière de l air, - MS et azote absorbé sortie hiver 27

# Quelques équations ( Eb max Ei C RG j ) MS = MS + ft Ei j LAI j j 1 j 1 j 1 1 1 = E 1 exp ( K LAI j ) imax 1 = D QNc j 1 j 1 { Eb max C Ei ( 1) 1 } m x K D j G j 1 MS j = MS j 1 + a 1 exp QNc j ft R Les paramètres sont en bleu. 28

18 paramètres Paramètre Signification Valeur initiale Gamme Ebmax Efficience de conversion du rayonnement 3.3 g/mj 1.8-4 K Coefficient d extinction du rayonnement 0.72 0.6-0.8 D Rapport LAI / N absorbé critique 0.028 0.02-0.045 Vmax Vitesse maximale d absorption d N 0.5 kg/ha/dj 0.2-0.7 C PAR/RG 0.48 Tmin Température minimale pour photosynthèse 0 C Topt Température optimale pour photosynthèse 15 C Tmax Température maximale pour photosynthèse 40 C Eimax Efficience d interception du rayonnement 0.96 Tep-flo Durée entre épiaison et floraison 150 dj E Paramètre de la courbe critique 1.55 t/ha F Paramètre de la courbe critique 4.4 % G Paramètre de la courbe critique 5.35 % H Paramètre de la courbe critique -0.442 L Paramètre de la courbe max 2 t/ha M Paramètre de la courbe max 6 % N Paramètre de la courbe max 8.3 % P Paramètre de la courbe max -0.44 29

Les deux formes d un modèle dynamique Forme 1: Système dynamique ( ) MS MS g X θ t = t 1 + t 1 ; Forme 2 : Modèle de réponse t (, ; ) MS = f t X θ Il est utile à ce stade de rappeler qu un modèle dynamique peut se mettre sous deux formes On vient de voir la première forme. Mais c est la deuxième forme que l on va considérer ici, c est à dire la forme intégrée c est à dire le modèle de réponse. 30

Quels paramètres estimer? Il est nécessaire de sélectionner les paramètres à estimer θ 1 θ 2 θ 3 θ 4 θ P-1 θ P $! %! % Problèmes numériques si on estime tous les paramètres. Même si on pouvait estimer tous les paramètres il ne faudrait pas le faire. Estimer beaucoup de paramètre variances élevées des estimateurs. augmentation des erreurs de prédictions. Un problème nouveau que l on n a pas rencontrer dans les problèmes précédents est qu on ne peut pas estimer tous les paramètres du modèle. Il est donc nécessaire de réaliser une sélection. 31

Nouveau problème: Comment sélectionner les paramètres? i. Utilisation de la littérature. ii. Analyse des équations du modèle. iii. Analyse de sensibilité. iv. Sélection à l aide de données. 32

% " «. 0 1». Inconvénients : - Approche assez subjective. - Pas toujours de concordance entre les situations considérées dans les articles et celles qui intéressent l utilisateur. 33

% &' «. / 02». 34

( Eb max Ei C RG j ) MS = MS + ft Ei j j 1 j 1 j 1 1 j LAI 1 = E 1 exp ( K LAI j ) imax 1 = D QNc j 1 j 1 { Eb max C Ei ( 1) 1 } m x K D j G j 1 MS j = MS j 1 + a 1 exp QNc j ft R Quels paramètres si on a uniquement des mesures de MS? Quels paramètres si on a uniquement des mesures de MS et de LAI? 35

( Eb max Ei C RG j ) MS = MS + ft Ei j j 1 j 1 j 1 1 j LAI 1 = E 1 exp ( K LAI j ) imax 1 = D QNc j 1 j 1 { Eb max C Ei ( 1) 1 } m x K D j G j 1 MS j = MS j 1 + a 1 exp QNc j ft R Uniquement des mesures de MS : Impossible d estimer simultanément - les 3 paramètres - les 2 paramètres E bmax K, D, C, E imax Mesures de MS et de LAI : Impossible d estimer simultanément les 3 paramètres E bmax, C, E imax 36

% &' «" / 0». Inconvénients : Il faut définir un seuil de sensibilité. Ne permet pas de diagnostiquer les problèmes d identifiabilité. 37

!% " «" / / 0 (Wallach et al., 2001)». Nb de paramètres estimés avec des données MSEPvc 1 MSEP 1 2 MSEP 2 3 MSEP 3 P MSEP P Sélection des paramètres qu il faut estimer pour minimiser le MSEP 38

Quels paramètres estimer? # sont fixés aux valeurs fournies par la littérature. " est fixé après analyse des équations. ( sont estimés à partir des données : E BMAX, D, K et V MAX 39

Quelle information disponible? Mesures de matière sèches des parties aériennes du blé, de LAI et d azote absorbé obtenues à Grignon pour 6 années. Dix dates de mesure chaque année entre sortie-hiver et floraison. Trois répétitions à chaque date. On utilise les moyennes. Matière sèche (kg/ha) 14000 12000 1999 10000 8000 6000 4000 2000 0 0 25 50 75 100 125 150 Jour Azote absorbé (kg/ha) 300 250 200 150 100 50 0 0 25 50 75 100 125 150 Jour Indice foliaire 6 5 4 3 2 1 0 0 25 50 75 100 125 150 Jour 40

Quelle méthode d estimation utiliser? 1 er possibilité : La méthode des moindres carrés ordinaires Trouver la valeur de θ qui minimise : N i i i i= 1 ( θ ) = (, ; θ ) 2 Z y f t x Problème : - le modèle est non linéaire, - on ne peut pas trouver l expression analytique des estimateurs. 41

Appliquer la méthode des MCO avec un algorithme itératif Z ( θ ) ˆ θ0 ˆ θ1 ˆ θ * 2 θˆ θ La solution consiste à appliquer la méthode à l aide d un algorithme itératif. Ce graphique présente en abscisse la valeur d un paramètre hypothétique theta et en ordonnée la valeur du critère des moindres carrés en fonction de theta. La courbe présente un minimum et on cherche à déterminer la valeur du paramètre qui correspond à ce minimum. Pour cela, on part d une valeur initiale theta0 que l utilisateur doit fournir. Puis on va s approcher de la valeur optimale theta* en passant par des valeurs intermédiaires theta1, theta2 42

Minimum locaux et minimum globaux Z ( θ ) ML MG ML θ Essayez plusieurs valeurs initiales! En pratique, la fonction Z est souvent moins idéale. Elle présente souvent des minimums locaux que l on va chercher à éviter et un minimum global qu on va chercher à atteindre. Pour éviter de tomber dans un minimum local, il est nécessaire de faire tourner l algorithme d estimation plusieurs fois à partir de plusieurs valeurs initiales différentes. 43

Aspect pratique On peut utiliser un logiciel statistique (SAS, S+, MatLab, bibliothèques Fortran ou C++ ) On donne : - des données, - un modèle, - des valeurs initiales des paramètres. Le logiciel fournit en sortie les valeurs estimées des paramètres. 44

Quelle méthode d estimation utiliser? 1 er possibilité : La méthode des moindres carrés ordinaires Trouver la valeur de θ qui minimise : Inconvénient : N i i i i= 1 ( θ ) = (, ; θ ) 2 Z y f t x - Les estimateurs ne sont pas de variances minimales si les résidus ont des variances hétérogènes. - Or, ici, il y a plusieurs types de mesures et la variance des mesures dépend de la date d observation. 45

Les variances des mesures sont hétérogènes Dry matter variance 400 350 300 250 200 150 100 50 0 0 25 50 75 100 125 150 Day 46

Quelle méthode d estimation utiliser? ) * Trouver la valeur de θ qui minimise : Z ( θ ) N = i= 1 y (, ; θ ) 2 f t x i i i 2 σi avec ˆ σ K 2 1 i = ik i K( K 1) k= 1 ( y y ) 2 La seule différence est qu on divise chaque terme par la variance des observations. L idée est de donner moins de poids aux mesures dont la variance est grande. 47

Quelle méthode d estimation utiliser? ) * On minimise ZMCP ( θ) 6 10 MS MS ( ) 6 10 N N, ; (, ; ) 6 10 L L yij f t j xi θ yij f t j xi θ yij f ( tj, xi ; θ) 2 2 2 = + + 2 2 2 i= 1 j= 1 ˆ σms. ij i= 1 j= 1 ˆ σn. ij i= 1 j= 1 ˆ σlij. K 2 2 1 MS MS ˆMS. ij = ijk ij ( 1) y y K K k = 1 σ La méthode des MCP est appliquée à notre modèle dynamique. L indice i est l indice de l année de mesure et l indice j est l indice de la date de mesure. Ici on a trois types de mesures yijms, On calcule la différence entre chaque mesure et la prédiction du modèle correspondante. On élève la différence au carré et on la divise par la variance de la mesure. Chaque mesure correspond à la moyenne de trois répétitions. On peut calculer les variances à partir des valeurs élémentaires obtenues sur les répétitions. 48

Application des moindres carrés pondérés pour estimer les 4 paramètres Paramètre Valeur initiale Valeur estimée MCP E BMAX (g/mj) 3.3 3.29 (0.11) D 0.028 0.037 (0.06) K 0.72 0.74 (0.001) V MAX (kg/ha/dj) 0.5 0.38 (0.02) 49

Ces estimateurs sont-ils précis? Analyse des résidus obtenus avec la méthodes des moindres carrés pondérés Les résidus ne sont pas indépendants Observation - Prédiction (kg/ha) 2500 2000 1500 1000 500 0-500 -1000-1500 -2000 0 50 100 150 1992 1995 Jour +* - Moindres carrés généralisés. - Modèles mixtes. 50

Un dernier problème Comment prendre en compte l information a priori? Jusqu à présent, nos quatre paramètres sont estimés à partir des données, sans utiliser l information a priori. Les méthodes Bayésiennes sont utiles pour estimer les paramètres à la fois à partir des données et de l information a priori. 51

1. Quels paramètres estimer? Dans les cas simples, on peut tout estimer. Dans les cas complexes, il faut faire une sélection. 2. Quelle information disponible? Les données Information a priori 3. Quelle méthode d estimation? Moindres carrés ordinaires, Moindres carrés pondérés/généralisés, Méthodes Bayésiennes 4. Quelle est la précision des estimateurs? Aspects théoriques, variances, résidus. 52