Agrégation externe de mathématiques, session 2008 Épreuve de modélisation, option A : Probabilités et Statistiques



Documents pareils
1 Mesure et intégrale

STATISTIQUE AVANCÉE : MÉTHODES

Chapitre 3 : Fonctions d une variable réelle (1)

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

STATISTIQUE : TESTS D HYPOTHESES

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

Les Nombres Parfaits.

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Limites des Suites numériques

CHAPITRE 2 SÉRIES ENTIÈRES

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

14 Chapitre 14. Théorème du point fixe

Processus et martingales en temps continu

4 Approximation des fonctions

Cours 5 : ESTIMATION PONCTUELLE

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

Cours de Statistiques inférentielles

Séquence 5. La fonction logarithme népérien. Sommaire

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

20. Algorithmique & Mathématiques

Etude de la fonction ζ de Riemann

SÉRIES STATISTIQUES À DEUX VARIABLES

Dénombrement. Chapitre Enoncés des exercices

c. Calcul pour une évolution d une proportion entre deux années non consécutives

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

Statistique descriptive bidimensionnelle

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Processus géométrique généralisé et applications en fiabilité

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Statistique Numérique et Analyse des Données

Sommaire Chapitre 1 - L interface de Windows 7 9

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

Chap. 5 : Les intérêts (Les calculs financiers)

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Comportement d'une suite

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Séries réelles ou complexes

EXERCICES : DÉNOMBREMENT

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Contribution à la théorie des entiers friables

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

Échantillonnage et estimation

Des résultats d irrationalité pour deux fonctions particulières

Chapitre 3 : Transistor bipolaire à jonction

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

55 - EXEMPLES D UTILISATION DU TABLEUR.

Principes et Méthodes Statistiques

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

Formation d un ester à partir d un acide et d un alcool

Exercices de mathématiques

Probabilités et statistique pour le CAPES

Introduction : Mesures et espaces de probabilités

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

2 ième partie : MATHÉMATIQUES FINANCIÈRES

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

MESURE DE L'INFORMATION

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

UNIVERSITÉ DE SFAX École Supérieure de Commerce

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

Les algorithmes de tri

Baccalauréat S Asie 19 juin 2014 Corrigé

Dominique Tapsoba, Vincent Fortin, François Anctil et Mario Haché

Comment les Canadiens classent-ils leur système de soins de santé?

Suites et séries de fonctions

Module 3 : Inversion de matrices

Faites prospérer vos affaires grâce aux solutions d épargne et de gestion des dettes

Tests non paramétriques de spécification pour densité conditionnelle : application à des modèles de choix discret

Risque de longévité et détermination du besoin en capital : travaux en cours

Mécanismes de protection contre les vers

Compte Sélect Banque Manuvie Guide du débutant

Logiciel de synchronisation de flotte de baladeurs MP3 / MP4 ou tablettes Androïd

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

INTRODUCTION AUX MATRICES ALÉATOIRES. par. Djalil Chafaï

RECHERCHE DE CLIENTS simplifiée

Initiation à l analyse factorielle des correspondances

Neolane Leads. Neolane v6.0

Solutions particulières d une équation différentielle...

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

LE PRINCIPE DU RAISONNEMENT PAR RÉCURRENCE

Création et développement d une fonction audit interne*

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

PROBLEMES DIOPTIMISATION EN NOMBRES ENTIERS J. L. NICOLAS

Gérer les applications

Dares Analyses. Plus d un tiers des CDI sont rompus avant un an

Une action! Un message!

Neolane Message Center. Neolane v6.0

POLITIQUE ECONOMIQUE ET DEVELOPPEMENT

Transcription:

Agrégatio extere de mathématiques, sessio 2008 Épreuve de modélisatio, optio (public 2008) Mots clefs : Loi des grads ombres, espace des polyômes, estimatio o-paramétrique Il est rappelé que le jury exige pas ue compréhesio exhaustive du texte. Vous êtes laissé(e) libre d orgaiser votre discussio comme vous l etedez. Des suggestios de développemet, largemet idépedates les ues des autres, vous sot proposées e fi de texte. Vous êtes pas teu(e) de les suivre. Il vous est coseillé de mettre e lumière vos coaissaces à partir du fil coducteur costitué par le texte. Le jury appréciera que la discussio soit accompagée d exemples traités sur ordiateur. Itroductio Lorsque l o cherche à étudier ue suite de mesures proveat de la répétitio d ue expériece, ue méthode de modélisatio cosiste à supposer que ces mesures sot des réalisatios de variables aléatoires idépedates équi-distribuées. Compredre ces mesures et la faço dot elles sot distribuées reviet à étudier la loi de probabilité de la variable aléatoire sous-jacete. Par exemple, e médecie, o cherche à étudier l assimilatio d u traitemet atibiotique admiistré par voie orale. Pour cela, o mesure, pour chaque patiet i = 1,,, la cocetratio x i de l atibiotique qui est passée das le sag du patiet après 5 heures (temps moye de digestio). O modélise le phéomèe de la maière suivate : x 1,,x sot les réalisatios de variables aléatoires idépedates X 1,,X ayat même desité f. Das ce cotexte médical, compredre le processus d assimilatio de l atibiotique das le sag reviet à coaître f. Lorsque l o a pas d idée a priori sur la forme particulière que peut predre la desité f, costruire u estimateur de f e se résume pas à l estimatio d ue moyee et d ue variace, comme c est le cas pour des lois gaussiees. Il s agit de recostruire ue foctio. Le problème est alors dit o-paramétrique. 1. Estimatio o-paramétrique d ue desité 1.1. De la foctio de répartitio à la desité Supposos que ous observos variables aléatoires idépedates et idetiquemet distribués X 1,,X de desité de probabilité par rapport à la mesure de Lebesgue ue foctio icoue f de R das [0, + [. L objectif de otre étude est la costructio d u estimateur de f, c est-à-dire ue foctio ˆf (x) = f (x,x 1,...,X ) mesurable par rapport à la tribu egedrée par (X 1,...,X ). Page 1/6 2008AB1X 25

Notos F(x) = P(X 1 x) la foctio de répartitio de la loi de X 1 et cosidéros la foctio de répartitio empirique (1) ˆF (x) = 1 1 {Xi x}, x R. La loi forte des grads ombres permet d affirmer que ˆF est u estimateur de F. Il est même possible d obteir des itervalles de cofiace et de tester l adéquatio des doées à différetes lois. Néamois, il est pas évidet d utiliser ˆF pour estimer f. Ue des premières idées ituitives est de cosidérer pour h > 0 petit ˆf (x) = ˆF (x + h) ˆF (x h) 2h = 1 2h 1 { h Xi x h}. Cet estimateur, appelé estimateur de Roseblatt (1956), est le premier exemple d estimateur à oyau costruit à l aide du oyau K(u) = 1 2 1 { 1<u 1}, otio que ous allos étudier maiteat. 1.2. Noyaux Défiissios maiteat plus gééralemet la otio d estimateur à oyau : Défiitio 1. Soit K : R R ue foctio itégrable telle que K(u)du = 1. K est appelé oyau. Pour tout N, o appelle h > 0 la feêtre et ˆf l estimateur à oyau de f, défii pour tout x R par ˆf (x) = 1 h ( Xi x K U oyau est dit positif si K 0 : l estimateur à oyau est alors ue desité quelles que soiet les valeurs des observatios X 1,...,X. U oyau est dit symétrique si, pour tout u das so esemble de défiitio, K(u) = K( u). Exemples de oyaux : Voici quelques exemples de oyaux les plus commuémet utilisés : K(u) = 2 11 { u 1} (oyau rectagulaire) ; K(u) = 3 4 (1 u2 )1 { u 1} (oyau d Epaechikov) ; K(u) = 1 2π exp( u 2 /2) (oyau Gaussie) ; Défiitio 2. Soit r 1 u etier. O dit qu u oyau K est d ordre r si : j = 1,...,r, u j K(u)du = 0 et u r+1 K(u)du 0. h ). Existece de oyaux d ordre doé : il est possible de costruire explicitemet des oyaux 2008AB1X 25 Page 2/6

d ordre r. Par exemple, cosidéros les polyômes de Legedre P 0 (x) = 1 2, P m (x) = 2m + 1 2 1 d m 2 m m! dx m [(x2 1) m ]. Les polyômes (P m ) m 0 costituet ue base orthoormée de L 2 ([ 1,1]). Dès lors, o peut voir que la foctio K défiie par est u oyau d ordre r. K(u) = r P k (0)P k (u)1 { u 1} k=0 2. Propriétés des estimateurs à oyaux 2.1. Estimatio de la desité Afi d évaluer la performace de l estimateur à oyau défii précédemmet, ous calculeros so écart quadratique moye e u poit x 0 doé : EQM(x 0 ) = E[ ˆf (x 0 ) f (x 0 )] 2. La vitesse de décroissace vers 0 de cette quatité, appelée vitesse de covergece, mesurera la qualité de l estimateur au poit x 0 : plus la perte quadratique est petite et plus l estimateur sera u "bo" estimateur. La vitesse de covergece déped de la régularité de la desité que l o cherche à estimer. Aisi, estimer ue foctio régulière est plus facile qu estimer ue foctio qui fluctue beaucoup et rapidemet. Nous ous limiteros doc aux desités apparteat à la classe de Hölder défiie de la maière suivate : Défiitio 3. Soiet [a,b] u itervalle de R, α > 0, s la partie etière de α et L > 0. La classe de Hölder H(α, L)([a, b]) est formée de toutes les foctios f : [a, b] R telles que la dérivée f (s) existe (par covetio f (0) = f ) et vérifie f (s) (x) f (s) (y) L x y α s, (x,y) [a,b] 2. O peut décomposer l erreur quadratique e 2 termes, respectivemet le biais b(.) et la variace σ 2 (.) de l estimateur au poit x 0 : (2) EQM(x 0 ) = [E ˆf (x 0 ) f (x 0 )] 2 + E [ ˆf } {{ } (x 0 ) E ( ˆf (x 0 ) )] 2, } {{ } b 2 (x 0 ) σ 2 (x 0 ) e otat b(x 0 ) = E ˆf (x 0 ) f (x 0 ) et σ 2 (x 0 ) = E [ ˆf (x 0 ) E ( ˆf (x 0 ) )] 2 Page 3/6 2008AB1X 25

Propositio 1. Supposos que f H(α, L)([a, b]) soit borée, c est-à-dire qu il existe M ]0,+ [ tel que f (x) M pour tout x R. Soit K u oyau d ordre s N tel que K 2 (u)du <, u α K(u) du <. Alors il existe deux costates C 1 et C 2 telles que (3) (4) σ 2 (x 0 ) C 1 h b(x 0 ) C 2 h α. Démostratio. La partie variace est facile à étudier, e cosidérat les variables aléatoires Xi x 0 K E [ Xi x 0 ], K i = 1,...,. h De plus, après chagemet de variable, le biais s écrit b(x 0 ) = K(u)[ f (x 0 + uh ) f (x 0 )]du. U développemet de Taylor à l ordre s permet d obteir le résultat aocé. ( 2α+1 1 ), ous obteos, quad + et uifor- Aisi, pour le choix optimal de h = O mémet e x 0, (5) EQM(x 0 ) = O h 2α+1 2α. De faço similaire, o défiit l écart quadratique moye itégré (6) EQMI = E[ ( ˆf (x) f (x)) 2 dx]. Alors, o peut obteir [mais la preuve est plus techique] l estimatio ( [ ] 1 2 ) K EQMI = O u α K(u) du h 2α 2 s! + (u)du h = O 2α+1 2α pour le choix optimal de h. 3. Risque optimal e pratique 3.1. Choix du paramètre de lissage Nous avos vu que lorsque K est choisi, ous pouvos calculer e foctio du choix de la feêtre h la valeur de l écart quadratique moye itégré EQMI. Nous écriros doc doréavat EQMI(h ). Le meilleur choix théorique obteu pour h déped de la régularité de la desité. Or, cette régularité état représetée par u paramètre icou, ce choix théorique est doc pas 2008AB1X 25 Page 4/6

utilisable e pratique. Cepedat, cet icovéiet peut être cotouré e utilisat la techique dite de validatio croisée. Remarquos e effet qu o a l égalité [ ] arg mi EQMI(h ) = arg mi E ˆf 2 (x)dx 2 f (x) ˆf (x)dx. h >0 h >0 Il suffit doc d estimer sas biais les deux quatités G (1) = E ( ) ) ˆf 2 (x)dx et G (2) = E( f (x) ˆf (x)dx = E ˆf (X), e désigat par X ue variable aléatoire de desité f, idépedate de X 1,...,X. O défiit 1 Xj x (7) ˆf, i (x) = ( 1)h K. j i h O a alors le théorème suivat. Théorème 1. Soit ˆf u estimateur à oyau K d ue desité f telle que f 2 (x)dx < + et x y K f (x) f (y)dxdy <. h Alors, Ĝ (1) = ˆf 2 (x)dx et Ĝ(2) = 1 ˆf, i (X i ) sot des estimateurs sas biais respectivemet de G (1) et G (2). Il s esuit, e posat VC(h ) = ˆf 2 (x)dx 2 qu o a, pour tout h > 0, l égalité (8) E[VC(h )] = EQMI(h ) Fialemet, o peut calculer h = arg mi h >0 VC(h ) ˆf, i (X i ), f 2 (x)dx. et défiir l estimateur optimal, obteu par validatio croisée, comme état égal à ˆf (x) = 1 Xi x h K h. Le calcul de l estimateur G (1) peut se faire explicitemet, e utilisat l expressio aalytique de K(u). E outre, o peut démotrer (il est pas demadé pas de le faire ici) que l écart quadratique moye itégré de cet estimateur est proche asymptotiquemet de celui de l estimateur théorique idéal. Page 5/6 2008AB1X 25

Suggestios pour le développemet Souligos qu il s agit d u meu à la carte et que vous pouvez choisir d étudier certais poits, pas tous, pas écessairemet das l ordre, et de faço plus ou mois fouillée. Vous pouvez aussi vous poser d autres questios que celles idiquées plus bas. Il est très vivemet souhaité que vos ivestigatios comportet ue partie traitée sur ordiateur et, si possible, des représetatios graphiques de vos résultats. Modélisatio. A quoi peut servir cocrètemet ue estimatio de la desité? Quelles sot les limites du modèle proposé? Que feriez-vous das u cadre paramétrique? Quelle autre méthode proposer das le cadre o paramétrique? Développemets mathématiques. Quelles sot les propriétés de l estimateur de Roseblatt? Quel est l ordre d u oyau symétrique? Complétez les preuves de la propositio 1 et du théorème 1. Que pesez-vous du rôle de la feêtre? Expliquez l idée à la base de la validatio croisée. Que pesez-vous du choix des critères EQM et EQMI? Etude umérique. Costruire u estimateur par oyau pour différets échatillos que vous simulerez : avec ue loi gaussiee, u mélage de deux loi gaussiees (c est-à-dire ue desité costituée d ue combiaiso covexe de deux desités gaussiees), ue loi o-gaussiee. Le choix de la feêtre est-il importat? Que pesez-vous du choix du oyau? 2008AB1X 25 Page 6/6