La Théorie des Valeurs Extrêmes (TVE)



Documents pareils
Module 3 : Inversion de matrices

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

STATISTIQUE : TESTS D HYPOTHESES

Principes et Méthodes Statistiques

SÉRIES STATISTIQUES À DEUX VARIABLES

Cours 5 : ESTIMATION PONCTUELLE

Statistique descriptive bidimensionnelle

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

Chapitre 3 : Fonctions d une variable réelle (1)

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

Cours de Statistiques inférentielles

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

CHAPITRE 2 SÉRIES ENTIÈRES

Chap. 5 : Les intérêts (Les calculs financiers)

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

Séquence 5. La fonction logarithme népérien. Sommaire

Limites des Suites numériques

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

La fibre optique arrive chez vous Devenez acteur de la révolution numérique

Processus géométrique généralisé et applications en fiabilité

Statistique Numérique et Analyse des Données

EXERCICES : DÉNOMBREMENT

c. Calcul pour une évolution d une proportion entre deux années non consécutives

Suites et séries de fonctions

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

Les Nombres Parfaits.

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

Chapitre 3 : Transistor bipolaire à jonction

STATISTIQUE AVANCÉE : MÉTHODES

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

55 - EXEMPLES D UTILISATION DU TABLEUR.

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

RESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *)

Processus et martingales en temps continu

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

PROBLEMES DIOPTIMISATION EN NOMBRES ENTIERS J. L. NICOLAS

Etude de la fonction ζ de Riemann

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

1 Mesure et intégrale

Risque de longévité et détermination du besoin en capital : travaux en cours

Dominique Tapsoba, Vincent Fortin, François Anctil et Mario Haché

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

UNIVERSITÉ DE SFAX École Supérieure de Commerce

Comportement d'une suite

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

Le chef d entreprise développe les services funéraires de l entreprise, en

Nous imprimons ce que vous aimez!

Université Pierre et Marie Curie. Biostatistique PACES - UE

Télé OPTIK. Plus spectaculaire que jamais.

Échantillonnage et estimation

20. Algorithmique & Mathématiques

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours.

Comment les Canadiens classent-ils leur système de soins de santé?

One Office Voice Pack Vos appels fixes et mobiles en un seul pack

Le Sphinx. Enquêtes, Sondages. Analyse de données. Internet :

LE WMS EXPERT DE LA SUPPLY CHAIN DE DÉTAIL

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Une action! Un message!

La simulation probabiliste avec Excel

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

Lorsque la sécurisation des paiements par carte bancaire sur Internet conduit à une concurrence entre les banques et les opérateurs de réseau

Dares Analyses. Plus d un tiers des CDI sont rompus avant un an

LE PRINCIPE DU RAISONNEMENT PAR RÉCURRENCE

2 ième partie : MATHÉMATIQUES FINANCIÈRES

Dénombrement. Chapitre Enoncés des exercices

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

RÈGLES ORDINALES : UNE GÉNÉRALISATION DES RÈGLES D'ASSOCIATION

La tarification hospitalière : de l enveloppe globale à la concurrence par comparaison

Gérer les applications

Les algorithmes de tri

Tests non paramétriques de spécification pour densité conditionnelle : application à des modèles de choix discret

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

Keywords: Probability of catastrophic events, Bivariate extreme value theory, Heavy tailed distributions, ALS methods.

Exercices de mathématiques

Les nouveaux relevés de compte

Simulations interactives de convertisseurs en électronique de puissance

Résolution numérique des équations aux dérivées partielles (PDE)

Semestre : 4 Module : Méthodes Quantitatives III Elément : Mathématiques Financières Enseignant : Mme BENOMAR

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

Divorce et séparation

Solutions particulières d une équation différentielle...

Donnez de la liberté à vos données. BiBOARD.

CIGI 2011 Job shop sous contraintes de disponibilité des ressources : modèle mathématique et heuristiques

MUTUELLE D&O MUTUELLE D&O. Copilote de votre santé. AGECFA-Voyageurs CARCEPT CARCEPT-Prévoyance CRC CRIS CRPB-AFB

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus

Probabilités et statistique pour le CAPES

Institut de démographie

Des résultats d irrationalité pour deux fonctions particulières

Transcription:

TP SdF N 26 La Théorie des Valeurs Etrêmes (TVE) Ce TP porte sur la théorie des valeurs etrêmes qui a pour objet de modéliser ue queue de distributio pour laquelle peu d observatios sot dispoibles et d estimer la probabilité d occurrece d u évèemet rare (ue hauteur de crue, ue vitesse de vet, ue dérive de sigal jamais observées jusqu alors par eemple). Théorie des valeurs etrêmes Préseter la théorie des valeurs etrêmes. 2 Applicatio à la loi ormale - Simuler 2 échatillos de valeurs suivat ue loi ormale (m =, = 2) correspodat par eemple à 2 aées d observatio d ue hauteur d eau. - Estimer la probabilité d occurrece d ue valeur supérieure à m + 3,5 au cours d u siècle : - par la loi théorique (ormale), - par la loi gééralisée des etrêmes (GEV ) à partir des valeurs simulées, - par la méthode des dépassemets (POT) à partir de ces mêmes valeurs. - Comparer les résultats obteus.

Théorie des valeurs etrêmes La théorie des valeurs etrêmes propose d approimer la queue d ue distributio epérimetale par ue loi théorique particulière puis de réaliser des estimatios à partir de cette derière. Deu approches sot evisagées : l aalyse des maima par itervalles de temps fies (crues maimales déceales par eemple), l aalyse des valeurs au-dessus d u seuil (toutes les crues supérieures à ue certaie hauteur par eemple) selo la méthode des dépassemets ou POT (Peak Over Threshold) La loi gééralisée des etrêmes ou GEV (Geeralized Etreme Value) est utilisée das le premier cas et la loi gééralisée de Pareto ou GPD (Geeralized Pareto Distributio) das la secode. L approche POT est gééralemet préférée car elle eploite plus d iformatios sas avoir la cotraite de devoir relever les valeurs epérimetales à itervalle régulier.. Loi gééralisée des etrêmes (GEV) Soit X, X 2, X 3,, X, u esemble de valeurs prises par ue variable aléatoire de loi icoue et M, la valeur maimale parmi ces valeurs, le but est de défiir la loi que suit M. D après le théorème de Fischer-Tippett, s il eiste deu réels a et b tels que M b lim P( ) = G( ), alors G est du type de l ue des trois distributios suivates : a Gumbel : Fréchet : µ G = ep( ep( )) avec < < + µ α G ( ) = si µ G() = ep( ( ) ) si > µ, α > et > Weibull égative : G ( ) = ep( ( ( µ )) α si < µ, α > et > G( ) = si µ Vo Mises et Jekiso ot uifié ces 3 lois par la distributio gééralisée des valeurs etrêmes (GEV : Geeralized Etreme Value) : - µ G() = ep(-(+ ( )) - µ G() = ep(-ep(- )) ) pour pour = - µ et + ( ) > Avec µ le paramètre de localisatio, le paramètre de dispersio et le paramètre de forme. loi de Gumbel si = loi de Fréchet si > loi de Weibull égative si < G() = pour µ - / G() = pour µ - / Plus la valeur de est élevée plus la queue de la distributio est épaisse comme le motret les graphiques suivats.

LOI GEV mu : sigma : 2 si :,2 Foctio de répartitio de la loi GEV,9,8,7,6,5,4,3,2, 5 5 2 25 3 35 si si=-,5 si= si=,5 Desité de probabilité de la loi GEV,35,3,25,2,5, si si=-,5 si= si=,5,5 5 5 2 25 3 35 Les fichiers Ecel sot dispoibles e cliquat sur les icôes : Microsoft Ecel La loi GEV a pour desité de probabilité : g( ) = e µ (+ ( )) µ ( + ( )) pour µ µ g ( ) = ep( ( )) ep( ep( ( )) pour = La méthode du maimum de vraisemblace permet d ajuster la loi GEV e maimisat le produit des desités de probabilité obteues pour les valeurs epérimetales (ou la somme de leur logarithme). La valeur d u quatile peut être calculée par la formule suivate obteue par iversio de la foctio de répartitio G : q p = µ ( ( l( p)) ) pour et q p = µ l( l( p)) pour =

.2 Méthode des dépassemets (POT) Soit X ue variable aléatoire de foctio de répartitio F et u ue valeur de seuil, la variable aléatoire Y = X u pour X > u suit la foctio de répartitio coditioelle : F( ) F( u) G( y) = G( u) = avec > u F( u) Pour ue grade valeur de seuil u, G suit ue loi gééralisée de Pareto (GPD : Geeralized Pareto Distributio) de la forme : = ( ) y + G y ( ) pour et y -/ ( si < ) y G( y) = - ep(- ) pour = La queue de la distributio est d autat plus épaisse que la valeur de est élevée : LOI GPD u : sigma : 2 si :,2 Foctio de répartitio de la loi GPD,9,8,7,6,5,4,3,2, 5 5 2 25 3 35 si si=-,5 si= si=,5 Desité de probabilité de la loi GPD,6,5,4,3,2 si si=-,5 si= si=,5, 5 5 2 25 3 35 Microsoft Ecel La loi GPD a pour desité de probabilité : y y f ( y) = ( + ( )) pour f ( y) = ep( ) pour =

La méthode du maimum de vraisemblace permet d ajuster la loi GPD. Ue difficulté réside cepedat das le choi de la valeur du seuil u. E effet, u biais va apparaître si le seuil est trop petit et o perdra de l iformatio si le seuil est trop grad. Aussi, est-il précoisé de choisir comme seuil la valeur pour laquelle la foctio moyee des ecès (FME) deviet approimativemet liéaire : FME = u u i= ( i u) avec u le seuil et u le ombre de dépassemets de u La valeur d u quatile peut être calculée par la formule suivate obteue par iversio de la foctio de répartitio G : q p = u + (( p / k) ) pour et q p = u l( p / k) pour = avec k le ombre de dépassemets parmi le ombre de valeurs. De par la défiitio même de G(-u), il est égalemet possible de calculer F() à partir de F(u) calculé par ailleurs : F() = F(u) + G(-u)[-F(u)] 2 Applicatio à la loi ormale (m =, = 2) 2. Estimatio par la loi théorique La probabilité qu ue valeur de la loi ormale e dépasse pas m + 3,5 s obtiet par la foctio de répartitio directemet fourie sous Ecel : = LOI.NORMALE(m+3,25*;m; ;VRAI) soit,999767327 A raiso de valeurs par a, la probabilité de dépassemet au cours d u siècle est : -(,999767327) =,9242363 2.2 Estimatio par la loi gééralisée des etrêmes (GEV) O simule 2 échatillos de valeurs suivat la loi ormale e appliquat la foctio iverse de la foctio de répartitio à ue valeur tirée aléatoiremet etre et, soit sous Ecel : = LOI.NORMALE.INVERSE(ALEA();m; ) Puis o ajuste la loi GEV par la méthode du maimum de vraisemblace à partir des 2 valeurs maimales de chaque échatillo comme das l eemple ci-dessous.

Ajustemet de la loi GEV mu : 4,865459 (moyee + 3,5 sigma) : 7 sigma :,789228 LN Vraisemblace G() : si : -,46558745-2,6427956 Probabilité de dépassemet au cours d u siècle : Valeur théorique :,924236 Aée Echatillo g() L (g()) 6,3227467,382293-2,33952 2 6,67479,2866559 -,255345 Foctio de répartitio de la loi GEV 3 5,9526568,34956825 -,55647 4 5,83235,483393 -,8956568 5 5,68468,4668634 -,7636985,9 6 5,575592,49766777 -,69782256,8 7 5,472732,579344 -,6579667 8 5,43277,5233297 -,64754482,7 9 5,29834,533643 -,6323793,6 5,3627,525779 -,65927,5 G() 5,6943,54926 -,692329,4 2 4,85633,462253 -,776466,3 3 4,74399,43586 -,8439339,2 4 4,6572754,448293 -,925925, 5 4,68554,388493 -,94662289 6 4,56667,369943 -,99448393 5 5 2 25 3 35 7 4,46835,3324855 -,59 8 4,55973,22568627 -,4886945 9 3,8797645,475887 -,937992 2 3,475298,6748823-2,69582 Kapla-Meyer Microsoft Ecel Das cet eemple, la probabilité de dépassemet de m + 3,5 au cours d u siècle est estimée égligeable, cotrairemet à la valeur théorique. 2.3 Estimatio par la méthode des dépassemets (POT) A partir des 2 valeurs simulées précédemmet suivat la loi ormale, o utilise la foctio moyee des ecès (FME) pour détermier le seuil u. La FME peut être calculée sous Ecel au moye de foctios coditioelles : u FME( u) = ( i u) = SOMME.SI(plage;">u")/NB.SI(plage;">u")-u u i= Foctio moyee des ecès (FME) i u FME 9,79979342 9,987554 6,87979476, 9,887554 6,3658887,2 9,787554 8,377379,3 9,687554,976432,4 9,587554,3499,5 9,487554,35547,6 9,387554,4644,7 9,287554,44869,8 9,87554,897427,9 9,87554 8,5666 8,987554,99428, 8,887554 9,4545958,2 8,787554 8,853978,3 8,687554 9,543568,4 8,587554 9,29969,5 8,487554 8,492653,6 8,387554,459793,7 8,287554 9,2277533,8 8,87554 8,97387973,9 8,87554 5,793738 2 7,987554 7,4646584 2, 7,887554,345452 2,2 7,787554 6,5925442 2,3 7,687554 FME = u u i = ( u) Foctio moyee des ecès (FME) 2 8 6 4 2 5 5 2 25 u i Microsoft Ecel La valeur 2 (m + ) apparaît coveir comme valeur de seuil.

La loi GPD, ci-dessous, a été ajustée par la méthode du maimum de vraisemblace à partir de 33 valeurs dépassat le seuil, parmi les 2 valeurs simulées. Ajustemet de la loi GPD : 3,5 u : 2 (moyee + sigma) : 7 sigma :,3768724 LN Vraisemblace G() :,9997367 par siècle si : -,2346649-327,657337 Probabilité de dépassemet : 4,8579E-5,3422489 Valeur théorique :,232673,924236 Xi g() L (g()) 6,3227467-4,73474-4,73474 6,67479-4,97963-4,97963 Foctio de répartitio de la loi GPD 5,9526568-3,993794-3,993794 5,83235-3,7922939-3,7922939 5,792745-3,726924-3,726924,9 5,68468-3,568729-3,568729,8 5,575592-3,4544-3,4544 5,5662766-3,3879534-3,3879534,7 5,472732-3,25672349-3,25672349,6 5,43277-3,22685-3,22685,5 5,49666-3,7638-3,7638,4 5,29834-3,497357-3,497357,3 5,22897-2,9377624-2,9377624,2 5,46497-2,8364364-2,8364364, 5,3627-2,8242639-2,8242639 5,293848-2,69837-2,69837 5 5 2 25 3 35 5,6943-2,672252-2,672252 4,8589698-2,5636899-2,5636899 4,85633-2,4977456-2,4977456 4,7896378-2,435676-2,435676 G() Kapla-Meyer Microsoft Ecel Das cet eemple, l estimatio de la probabilité de dépassemet apparaît sesiblemet iférieure à la valeur théorique. 2.4 Comparaiso des résultats Le graphique suivat doe les quatiles correspodat à ue observatio estimés par les différetes méthodes à partir d u échatillo. Estimatio d'u quatile 3 25 2 5 q(-p) Théorique q(-p) GEV q(-p) POT,E-9,E-7,E-5,E-3,E-,E+ 5 p Microsoft Ecel Les estimatios par la méthode GEV sot très sesibles au jeu de doées simulées ( positive ou égative).

Coclusios : - La Théorie des Valeurs Etrêmes permet d effectuer des iterpolatios das la queue des distributios epérimetales mais les etrapolatios apparaisset discutables. Aussi doit-o se méfier des estimatios effectuées pour des valeurs o ecore observées, otammet quad elles coceret des problématiques relatives à la sécurité des persoes et des bies, même si des itervalles de cofiace peuvet être calculés par iversio de la matrice de Fisher. - L ajustemet par la méthode du maimum de vraisemblace de la loi gééralisée des etrêmes (GEV) et de la loi gééralisée de Pareto (GPD) peut s effectuer de maière très efficace et précise au moye d u outil d optimisatio globale pouvat s affrachir des divers optima locau (GENCAB das ces eemples). Diverses méthodes approchées d ajustemet sot proposées das la littérature scietifique. Bibliographie : Balkema A., de Haa L. (974) - Residual life time at great age - The Aals for Probability, vol. 2, 5, pp. 792-84 Fisher R.A., Tippett L.H.C. (928) - Limitig forms of the frequecy distributio of the largest or smallest member of a sample - Proc. Cambridge Philos. Soc., 24, pp.8-9 Fréchet M. (927) - Sur la loi de probabilité de l écart maimum - A. Soc. Math. Polo., vol. 6, pp. 93-6 Gedeko B.V. (943) - Sur la distributio limite du terme maimum d ue série aléatoire - A. Math., 44, pp. 423-453 Gumbel E.J. (955) - Statistical theory of etremes values ad some practical applicatios - Joural of the Royal Statistical Society, Serie A, vol. 9,., p. 6 Jekiso A.F (955) - The frequecy distributio of the aual maimum (or miimum) of meteorological elemets - Quart. J. R. Met. Soc. 8, pp.58-7 Mises, R., vo (954). La distributio de la plus grade de valeurs. Selected papers, Vol. II, p. 27-294. Providece, R. I.: Amer. Math. Soc. Pickads J. (975) - Statistical iferece usig etreme order statistics - A. Statist.3, 9-3. Devrait faire l objet d u prochai TP.