TP SdF N 26 La Théorie des Valeurs Etrêmes (TVE) Ce TP porte sur la théorie des valeurs etrêmes qui a pour objet de modéliser ue queue de distributio pour laquelle peu d observatios sot dispoibles et d estimer la probabilité d occurrece d u évèemet rare (ue hauteur de crue, ue vitesse de vet, ue dérive de sigal jamais observées jusqu alors par eemple). Théorie des valeurs etrêmes Préseter la théorie des valeurs etrêmes. 2 Applicatio à la loi ormale - Simuler 2 échatillos de valeurs suivat ue loi ormale (m =, = 2) correspodat par eemple à 2 aées d observatio d ue hauteur d eau. - Estimer la probabilité d occurrece d ue valeur supérieure à m + 3,5 au cours d u siècle : - par la loi théorique (ormale), - par la loi gééralisée des etrêmes (GEV ) à partir des valeurs simulées, - par la méthode des dépassemets (POT) à partir de ces mêmes valeurs. - Comparer les résultats obteus.
Théorie des valeurs etrêmes La théorie des valeurs etrêmes propose d approimer la queue d ue distributio epérimetale par ue loi théorique particulière puis de réaliser des estimatios à partir de cette derière. Deu approches sot evisagées : l aalyse des maima par itervalles de temps fies (crues maimales déceales par eemple), l aalyse des valeurs au-dessus d u seuil (toutes les crues supérieures à ue certaie hauteur par eemple) selo la méthode des dépassemets ou POT (Peak Over Threshold) La loi gééralisée des etrêmes ou GEV (Geeralized Etreme Value) est utilisée das le premier cas et la loi gééralisée de Pareto ou GPD (Geeralized Pareto Distributio) das la secode. L approche POT est gééralemet préférée car elle eploite plus d iformatios sas avoir la cotraite de devoir relever les valeurs epérimetales à itervalle régulier.. Loi gééralisée des etrêmes (GEV) Soit X, X 2, X 3,, X, u esemble de valeurs prises par ue variable aléatoire de loi icoue et M, la valeur maimale parmi ces valeurs, le but est de défiir la loi que suit M. D après le théorème de Fischer-Tippett, s il eiste deu réels a et b tels que M b lim P( ) = G( ), alors G est du type de l ue des trois distributios suivates : a Gumbel : Fréchet : µ G = ep( ep( )) avec < < + µ α G ( ) = si µ G() = ep( ( ) ) si > µ, α > et > Weibull égative : G ( ) = ep( ( ( µ )) α si < µ, α > et > G( ) = si µ Vo Mises et Jekiso ot uifié ces 3 lois par la distributio gééralisée des valeurs etrêmes (GEV : Geeralized Etreme Value) : - µ G() = ep(-(+ ( )) - µ G() = ep(-ep(- )) ) pour pour = - µ et + ( ) > Avec µ le paramètre de localisatio, le paramètre de dispersio et le paramètre de forme. loi de Gumbel si = loi de Fréchet si > loi de Weibull égative si < G() = pour µ - / G() = pour µ - / Plus la valeur de est élevée plus la queue de la distributio est épaisse comme le motret les graphiques suivats.
LOI GEV mu : sigma : 2 si :,2 Foctio de répartitio de la loi GEV,9,8,7,6,5,4,3,2, 5 5 2 25 3 35 si si=-,5 si= si=,5 Desité de probabilité de la loi GEV,35,3,25,2,5, si si=-,5 si= si=,5,5 5 5 2 25 3 35 Les fichiers Ecel sot dispoibles e cliquat sur les icôes : Microsoft Ecel La loi GEV a pour desité de probabilité : g( ) = e µ (+ ( )) µ ( + ( )) pour µ µ g ( ) = ep( ( )) ep( ep( ( )) pour = La méthode du maimum de vraisemblace permet d ajuster la loi GEV e maimisat le produit des desités de probabilité obteues pour les valeurs epérimetales (ou la somme de leur logarithme). La valeur d u quatile peut être calculée par la formule suivate obteue par iversio de la foctio de répartitio G : q p = µ ( ( l( p)) ) pour et q p = µ l( l( p)) pour =
.2 Méthode des dépassemets (POT) Soit X ue variable aléatoire de foctio de répartitio F et u ue valeur de seuil, la variable aléatoire Y = X u pour X > u suit la foctio de répartitio coditioelle : F( ) F( u) G( y) = G( u) = avec > u F( u) Pour ue grade valeur de seuil u, G suit ue loi gééralisée de Pareto (GPD : Geeralized Pareto Distributio) de la forme : = ( ) y + G y ( ) pour et y -/ ( si < ) y G( y) = - ep(- ) pour = La queue de la distributio est d autat plus épaisse que la valeur de est élevée : LOI GPD u : sigma : 2 si :,2 Foctio de répartitio de la loi GPD,9,8,7,6,5,4,3,2, 5 5 2 25 3 35 si si=-,5 si= si=,5 Desité de probabilité de la loi GPD,6,5,4,3,2 si si=-,5 si= si=,5, 5 5 2 25 3 35 Microsoft Ecel La loi GPD a pour desité de probabilité : y y f ( y) = ( + ( )) pour f ( y) = ep( ) pour =
La méthode du maimum de vraisemblace permet d ajuster la loi GPD. Ue difficulté réside cepedat das le choi de la valeur du seuil u. E effet, u biais va apparaître si le seuil est trop petit et o perdra de l iformatio si le seuil est trop grad. Aussi, est-il précoisé de choisir comme seuil la valeur pour laquelle la foctio moyee des ecès (FME) deviet approimativemet liéaire : FME = u u i= ( i u) avec u le seuil et u le ombre de dépassemets de u La valeur d u quatile peut être calculée par la formule suivate obteue par iversio de la foctio de répartitio G : q p = u + (( p / k) ) pour et q p = u l( p / k) pour = avec k le ombre de dépassemets parmi le ombre de valeurs. De par la défiitio même de G(-u), il est égalemet possible de calculer F() à partir de F(u) calculé par ailleurs : F() = F(u) + G(-u)[-F(u)] 2 Applicatio à la loi ormale (m =, = 2) 2. Estimatio par la loi théorique La probabilité qu ue valeur de la loi ormale e dépasse pas m + 3,5 s obtiet par la foctio de répartitio directemet fourie sous Ecel : = LOI.NORMALE(m+3,25*;m; ;VRAI) soit,999767327 A raiso de valeurs par a, la probabilité de dépassemet au cours d u siècle est : -(,999767327) =,9242363 2.2 Estimatio par la loi gééralisée des etrêmes (GEV) O simule 2 échatillos de valeurs suivat la loi ormale e appliquat la foctio iverse de la foctio de répartitio à ue valeur tirée aléatoiremet etre et, soit sous Ecel : = LOI.NORMALE.INVERSE(ALEA();m; ) Puis o ajuste la loi GEV par la méthode du maimum de vraisemblace à partir des 2 valeurs maimales de chaque échatillo comme das l eemple ci-dessous.
Ajustemet de la loi GEV mu : 4,865459 (moyee + 3,5 sigma) : 7 sigma :,789228 LN Vraisemblace G() : si : -,46558745-2,6427956 Probabilité de dépassemet au cours d u siècle : Valeur théorique :,924236 Aée Echatillo g() L (g()) 6,3227467,382293-2,33952 2 6,67479,2866559 -,255345 Foctio de répartitio de la loi GEV 3 5,9526568,34956825 -,55647 4 5,83235,483393 -,8956568 5 5,68468,4668634 -,7636985,9 6 5,575592,49766777 -,69782256,8 7 5,472732,579344 -,6579667 8 5,43277,5233297 -,64754482,7 9 5,29834,533643 -,6323793,6 5,3627,525779 -,65927,5 G() 5,6943,54926 -,692329,4 2 4,85633,462253 -,776466,3 3 4,74399,43586 -,8439339,2 4 4,6572754,448293 -,925925, 5 4,68554,388493 -,94662289 6 4,56667,369943 -,99448393 5 5 2 25 3 35 7 4,46835,3324855 -,59 8 4,55973,22568627 -,4886945 9 3,8797645,475887 -,937992 2 3,475298,6748823-2,69582 Kapla-Meyer Microsoft Ecel Das cet eemple, la probabilité de dépassemet de m + 3,5 au cours d u siècle est estimée égligeable, cotrairemet à la valeur théorique. 2.3 Estimatio par la méthode des dépassemets (POT) A partir des 2 valeurs simulées précédemmet suivat la loi ormale, o utilise la foctio moyee des ecès (FME) pour détermier le seuil u. La FME peut être calculée sous Ecel au moye de foctios coditioelles : u FME( u) = ( i u) = SOMME.SI(plage;">u")/NB.SI(plage;">u")-u u i= Foctio moyee des ecès (FME) i u FME 9,79979342 9,987554 6,87979476, 9,887554 6,3658887,2 9,787554 8,377379,3 9,687554,976432,4 9,587554,3499,5 9,487554,35547,6 9,387554,4644,7 9,287554,44869,8 9,87554,897427,9 9,87554 8,5666 8,987554,99428, 8,887554 9,4545958,2 8,787554 8,853978,3 8,687554 9,543568,4 8,587554 9,29969,5 8,487554 8,492653,6 8,387554,459793,7 8,287554 9,2277533,8 8,87554 8,97387973,9 8,87554 5,793738 2 7,987554 7,4646584 2, 7,887554,345452 2,2 7,787554 6,5925442 2,3 7,687554 FME = u u i = ( u) Foctio moyee des ecès (FME) 2 8 6 4 2 5 5 2 25 u i Microsoft Ecel La valeur 2 (m + ) apparaît coveir comme valeur de seuil.
La loi GPD, ci-dessous, a été ajustée par la méthode du maimum de vraisemblace à partir de 33 valeurs dépassat le seuil, parmi les 2 valeurs simulées. Ajustemet de la loi GPD : 3,5 u : 2 (moyee + sigma) : 7 sigma :,3768724 LN Vraisemblace G() :,9997367 par siècle si : -,2346649-327,657337 Probabilité de dépassemet : 4,8579E-5,3422489 Valeur théorique :,232673,924236 Xi g() L (g()) 6,3227467-4,73474-4,73474 6,67479-4,97963-4,97963 Foctio de répartitio de la loi GPD 5,9526568-3,993794-3,993794 5,83235-3,7922939-3,7922939 5,792745-3,726924-3,726924,9 5,68468-3,568729-3,568729,8 5,575592-3,4544-3,4544 5,5662766-3,3879534-3,3879534,7 5,472732-3,25672349-3,25672349,6 5,43277-3,22685-3,22685,5 5,49666-3,7638-3,7638,4 5,29834-3,497357-3,497357,3 5,22897-2,9377624-2,9377624,2 5,46497-2,8364364-2,8364364, 5,3627-2,8242639-2,8242639 5,293848-2,69837-2,69837 5 5 2 25 3 35 5,6943-2,672252-2,672252 4,8589698-2,5636899-2,5636899 4,85633-2,4977456-2,4977456 4,7896378-2,435676-2,435676 G() Kapla-Meyer Microsoft Ecel Das cet eemple, l estimatio de la probabilité de dépassemet apparaît sesiblemet iférieure à la valeur théorique. 2.4 Comparaiso des résultats Le graphique suivat doe les quatiles correspodat à ue observatio estimés par les différetes méthodes à partir d u échatillo. Estimatio d'u quatile 3 25 2 5 q(-p) Théorique q(-p) GEV q(-p) POT,E-9,E-7,E-5,E-3,E-,E+ 5 p Microsoft Ecel Les estimatios par la méthode GEV sot très sesibles au jeu de doées simulées ( positive ou égative).
Coclusios : - La Théorie des Valeurs Etrêmes permet d effectuer des iterpolatios das la queue des distributios epérimetales mais les etrapolatios apparaisset discutables. Aussi doit-o se méfier des estimatios effectuées pour des valeurs o ecore observées, otammet quad elles coceret des problématiques relatives à la sécurité des persoes et des bies, même si des itervalles de cofiace peuvet être calculés par iversio de la matrice de Fisher. - L ajustemet par la méthode du maimum de vraisemblace de la loi gééralisée des etrêmes (GEV) et de la loi gééralisée de Pareto (GPD) peut s effectuer de maière très efficace et précise au moye d u outil d optimisatio globale pouvat s affrachir des divers optima locau (GENCAB das ces eemples). Diverses méthodes approchées d ajustemet sot proposées das la littérature scietifique. Bibliographie : Balkema A., de Haa L. (974) - Residual life time at great age - The Aals for Probability, vol. 2, 5, pp. 792-84 Fisher R.A., Tippett L.H.C. (928) - Limitig forms of the frequecy distributio of the largest or smallest member of a sample - Proc. Cambridge Philos. Soc., 24, pp.8-9 Fréchet M. (927) - Sur la loi de probabilité de l écart maimum - A. Soc. Math. Polo., vol. 6, pp. 93-6 Gedeko B.V. (943) - Sur la distributio limite du terme maimum d ue série aléatoire - A. Math., 44, pp. 423-453 Gumbel E.J. (955) - Statistical theory of etremes values ad some practical applicatios - Joural of the Royal Statistical Society, Serie A, vol. 9,., p. 6 Jekiso A.F (955) - The frequecy distributio of the aual maimum (or miimum) of meteorological elemets - Quart. J. R. Met. Soc. 8, pp.58-7 Mises, R., vo (954). La distributio de la plus grade de valeurs. Selected papers, Vol. II, p. 27-294. Providece, R. I.: Amer. Math. Soc. Pickads J. (975) - Statistical iferece usig etreme order statistics - A. Statist.3, 9-3. Devrait faire l objet d u prochai TP.