Statistique mathématique pour le Master 1 Cours de l ENS Cachan Bretagne. Benoît Cadre
|
|
- Michel Larocque
- il y a 8 ans
- Total affichages :
Transcription
1 Statistique mathématique pour le Master 1 Cours de l ENS Cacha Bretage Beoît Cadre 4 jui 2010
2 2
3 Table des matières 1 Modélisatio statistique U exemple Pricipe fodametal de la statistique Modèle statistique Domiatio das u modèle statistique Estimatio Costructio des estimateurs Pricipes de l iférece statistique Critères de performace e moyee Critères de performace asymptotique Itervalles de cofiace Itervalle de cofiace pour ue taille d échatillo fiie Itervalle de cofiace asymptotique Vraisemblace Le cocept de vraisemblace Cosistace de l EMV Iformatio de Fisher Normalité asymptotique de l EMV Classificatio des statistiques Estimateurs efficaces Statistiques exhaustives Statistiques complètes Test statistique Problème de test
4 4 TABLE DES MATIÈRES 5.2 Erreurs d u test Comparaiso des tests Optimalité das les tests simples Optimalité das les tests composites Tests asymptotiques Statistique des échatillos gaussies Projectio de vecteurs gaussies Tests sur les paramètres Comparaiso de 2 échatillos Modèle liéaire gaussie Le problème et sa formulatio vectorielle Statistique de test
5 Chapitre 1 Modélisatio statistique 1.1 U exemple Ue pièce a ue probabilité p 0 ]0,1[ de tomber sur "pile". Sur les 1000 lacers réalisés idépedammet les us des autres, o compte 520 "pile" et 480 "face". O est doc teté de coclure que p Cepedat, de la même maière qu il est sas itérêt de doer ue valeur approchée d ue itégrale sas préciser l erreur d approximatio, ce résultat a que peu de valeur, car il e ous reseige pas sur l erreur commise. Nous allos examier de quelle maière la costructio d u modèle permet de combler cette lacue. O ote x 1,,x les résultats des = 1000 lacers de pièce, avec la covetio suivate : x i = 1 si le i-ème lacer a doé "pile", et 0 das le cas cotraire. Le pricipe de base de l estimatio statistique est de cosidérer que x 1,,x est ue réalisatio de la loi B(p 0 ), si pour chaque p [0,1], B(p) désige la loi de Berouilli de paramètre p (i.e. B(p) = pδ 1 + (1 p)δ 0, avec δ 0 et δ 1 les mesures de Dirac e 0 et 1). E l absece d iformatios sur la valeur de p 0, o e peut e fait que supposer que x 1,,x est ue réalisatio de l ue des lois {B(p), p ]0,1[}. De cet esemble de probabilités, appelé modèle statistique, o cherche à déduire la valeur de p qui s ajuste le mieux aux observatios x 1,,x. Ue répose raisoable est basée sur l ituitio suivate : compte teu des iformatios dot o dispose, la meilleure approximatio de p 0 que l o puisse doer est ue valeur 5
6 6 CHAPITRE 1. MODÉLISATION STATISTIQUE qui maximise la foctio p B(p) ({x 1,,x }) = B(p)({x i }) = p x i (1 p) x i. C est le pricipe de costructio d ue valeur approchée -o parlera d estimateurde p 0 par maximisatio de la vraisemblace. Selo ce pricipe, la valeur qui s ajuste le mieux aux observatios est la moyee empirique des observatios : x = 1 O retrouve aisi la valeur x = 0.52 du début. L itroductio d u modèle ous permet e plus de doer ue erreur das l approximatio. Soit p ]0,1[, et X 1,,X des v.a. i.i.d. sur l espace probabilisé (Ω,F,P) de loi commue B(p). O peut calculer le risque quadratique, c està-dire le carré de la distace L 2 etre la cible p et l estimateur X = (1/) X i obteu par le pricipe de maximisatio de la vraisemblace : x i. E( X p) 2 = 1 EX 1(1 EX 1 ) = 1 p(1 p). Comme p(1 p) 1/4, l erreur quadratique moyee commise est doc majorée par 1/(2 ) Cepedat, si le résultat doe des iformatios sur la qualité de l approximatio, ce est qu ue évaluatio e moyee, qui e déped doc pas des observatios. Bie d autres pricipes peuvet être evisagés pour préciser la qualité de l approximatio. Par exemple, supposos que l o veuille costruire u itervalle das lequel p 0 doit se trouver, avec ue probabilité de 0.95 par exemple. Le pricipe de costructio est le suivat : pour chaque p ]0,1[, o cherche das u premier temps u itervalle de cofiace par excès I(X 1,,X ) costruit avec la suite de v.a. X 1,,X tel que P(p I(X 1,,X )) O peut alors coclure, avec les observatios x 1,,x, que p 0 I(x 1,,x ), avec ue probabilité de 95% au mois. Das l exemple qui ous itéresse, l iégalité de Bieaymé-Tchebytchev ous doe, pour tout ε > 0 : P( X p ε) var( X ) ε 2 = var(x 1) ε 2 = p(1 p) ε 2 1 4ε 2.
7 1.2. PRINCIPE FONDAMENTAL DE LA STATISTIQUE 7 De ce fait, P( X p ε) 0.05 au mois si 1/(4ε 2 ) 0.05 soit, tous calculs faits, si ε Par suite, P(p [ X 0.07, X ]) E utilisat les observatios x 1,,x o a x = 0.52, et doc p 0 [0.45,0.59] avec ue probabilité 0.95 au mois. Le mois que l o dire ici est que cette iformatio est peu satisfaisate, eu égard au grad ombre d observatios! Commet améliorer ces résultats? Si la questio posée est "la pièce est-elle équilibrée?", l itervalle ci-dessus e permet pas de doer ue répose ; dès lors, quelle stratégie de décisio evisager? L objet de ce cours est de doer quelques élémets de répose à ces questios. Das u premier temps, il coviet de fixer les objectifs de l iférece statistique, aisi que le cotexte mathématique. 1.2 Pricipe fodametal de la statistique Le phéomèe aléatoire fourit observatios x 1,,x de l espace topologique H. Celles-ci sot supposées être les réalisatios d ue loi Q 0 sur l espace probabilisable (H, B(H )). Le pricipe de base de l iférece statistique est d utiliser ces observatios pour e déduire des iformatios sur Q 0. Cette approche estelle raisoable? De maière plus ambitieuse, est-il possible de recostruire u approximatio de Q 0 à partir des observatios x 1,,x? Nous allos voir que la répose est affirmative, au mois das le cas où le phéomèe aléatoire global cosiste e phéomèes idépedats et régis par la même loi. Au préalable, rappelos que la suite de probabilités (ν ) sur R d coverge étroitemet vers ν si, pour chaque foctio f : R d R cotiue borée, o a : f dν f dν. R d R d Le critère de covergece de Lévy ous affirme que (ν ) coverge étroitemet vers ν si, pour chaque t R d, la suite ( ˆν (t)) coverge vers ˆν(t), où ˆν désige la traformée de Fourier de ν, i.e. la foctio ˆν : t exp(itt x)ν(dx), R d et idem pour ˆν.
8 8 CHAPITRE 1. MODÉLISATION STATISTIQUE Das la suite, δ x désige la mesure de Dirac e x R d. Théorème [VARADARAJAN] Soiet X 1,X 2, des v.a.i.i.d. sur (Ω,F,P) à valeurs das R k, de loi commue µ. O ote µ la mesure empirique des premières v.a., i.e. µ = 1 δ Xi. Alors, P-p.s., la suite de mesures (µ ) coverge étroitemet vers µ. Preuve Pour simplifier la preuve, o suppose que X 1 est itégrable. D après le critére de Lévy, il suffit de motrer que ( ) P t R d : ˆµ (t) ˆµ(t) = 1, si ˆµ et ˆµ désiget les trasformées de Fourier de µ et µ. Or, la loi forte des grads ombres ous motre que pour tout t R d, l évéemet t T Ω(t) = { ˆµ (t) ˆµ(t)} est de probabilité. Soit T R d u esemble déombrable dese, et Ω 0 = Ω(t) { } 1 X j E X 1, j=1 où. désige la orme euclidiee de R d. Comme X 1 est itégrable et T est déombrable, o a P(Ω 0 ) = 1 d après la loi forte des grads ombres et car P(Ω(t)) = 1 pour tout t. Fixos t R d et ω Ω 0. O choisit ue suite (t p ) p de T telle que t p t, et o ote pour tout s R d, ˆµ ω (s) la réalisatio e ω de ˆµ (s), i.e. ˆµ ω (s) = 1 exp(is T X j (ω)). j=1 Soit p fixé. O a : ˆµ ω (t) ˆµ(t) ˆµ ω (t) ˆµ ω (t p ) + ˆµ ω (t p ) ˆµ(t p ) + ˆµ(t p ) ˆµ(t) ( ) 1 t t p X j (ω) + E X 1 + ˆµ ω (t p ) ˆµ(t p ) j=1
9 1.3. MODÈLE STATISTIQUE 9 Par suite, pour tout p : lim sup ˆµ ω (t) ˆµ(t) 2 t t p E X 1. E faisat efi tedre p vers l ifii, o peut e déduire que pour tout ω Ω 0 et tout t R d, ˆµ ω (t) ˆµ(t). Comme P(Ω 0 ) = 1, le résultat est démotré. Repreos le cotexte où les observatios (x 1,,x ) H sot issues de phéomèes aléatoires idépedats et régis par la même loi Q 0 sur H = R d. Le théorème de Varadaraja motre que si (X 1,,X ) suit la loi Q 0 alors la mesure empirique 1 est proche de la mesure Q 0, lorsque est assez grad. Autremet dit, e multipliat les expérieces, la mesure discrète 1 est proche de la mesure Q 0. Ce résultat doe u appui théorique à la démarche statistique cosistat à teter de recostruire la mesure théorique Q 0 à l aide des observatios x 1,,x. Toute démarche e statistique iféretielle asymptotique est basée sur ce théorème, qui mérite doc so titre de "Théorème fodametal de la statistique". δ Xi δ xi 1.3 Modèle statistique Formalisos le cocept de modèle statistique vu das la sectio 1.1. Das ce cadre, l espace des observatios était {0,1}. Défiitios U modèle statistique est u couple (H,P), où H est l espace -supposé topologique- de chaque observatio, et P est ue famille de lois de probabilités sur H mui de sa tribu boréliee. Le modèle statistique (H,P) est paramétré par Θ si P = {P θ } θ Θ L expériece aléatoire sous-jacete fourit observatios (x 1,,x ) H du même phéomèe aléatoire, qui est régit par la loi icoue P 0. Le pricipe
10 10 CHAPITRE 1. MODÉLISATION STATISTIQUE de base de la statistique est de cosidérer que (x 1,,x ) est régit par l ue des lois d u modèle P, avec P 0 P. Cette étape de modélisatio état achevée, il s agira de chercher quelle loi de ce modèle s ajuste le mieux aux observatios. Par exemple, lorsque les expérieces ot été meées idépedammet les ues des autres, l observatio (x 1,,x ) est régie par la loi P 0 = Q 0, et le modèle statistique est u esemble de probabilités sur H coteat Q A oter, doc : à l iverse du probabiliste, le statisticie travaille plutôt sur l espace des observatios, qui costitue u cadre d étude plus aturel. Par ailleurs, le statisticie e suppose pas que la loi des observatios est coue, à l iverse du probabiliste. Exemple E utilisat des observatios idépedates x 1,,x de la durée de vie de ampoules du même type, o veut coaître la loi suivie par la durée de vie de ce type d ampoule. La 1ère étape cosiste à défiir le modèle statistique associé, dot l espace des observatios est R +. Du poit de vue de la modélisatio, il est raisoable d affirmer qu ue v.a. X sur (Ω,F,P) qui représete la durée de vie de l ampoule est sas mémoire, i.e. L (X t X t) = L (X), t 0. Cette propriété sigifie que l ampoule "e se souviet pas d avoir vieilli". Par ailleurs, o peut aussi supposer que la loi de X est à desité par rapport à la mesure de Lebesgue. O sait alors qu il existe λ > 0 tel que X E (λ). Comme les observatios des durées de vie sot idépedates, x 1,,x est ue réalisatio d ue loi E (λ 0 ), pour u certai λ 0 > 0 qu il s agira de trouver. Le modèle statistique associé à cette expériece aléatoire est doc (R +,{E (λ) } λ>0 ). Nous verros das la suite commet trouver ue valeur de λ qui s ajuste aux observatios. Das l exemple de la sectio 1.1, comme les lacers de pièce sot idépedats, la loi dot sot issues les résultats de l expériece est clairemet l ue des lois du modèle P = {B(p), p ]0,1[}. Remarquos aussi que l applicatio p B(p) est ijective : cette propriété, appelée idetifiabilité, ôte tout ambiguité das le modèle, e permettat d associer à des observatios ue, et ue seule loi du modèle. Défiitios Soit P = {P θ } θ Θ u modèle statistique. 0.
11 1.4. DOMINATION DANS UN MODÈLE STATISTIQUE Il est dit idetifiable si l applicatio θ P θ défiie sur Θ est ijective. 2. Il est dit paramétrique si il existe d N tel que Θ R d. Sio, il est o paramétrique. Le modèle statistique {N(m,σ 2 );m R,σ > 0} est paramétrique et idetifiable, mais {N(m,σ 2 );m R,σ 0}, qui est aussi paramétrique, est pas idetifiable car N(m,σ 2 ) = N(m,( σ) 2 ). Par ailleurs, le modèle costitué de toutes les lois à desité est o paramétrique. O s itéressera das ce cours aux modèles paramétriques. Cette restrictio cofère au modèle u atout majeur : e limitat l espace des probabilités à explorer, elle permet d obteir de meilleurs résultats quatitatifs. 1.4 Domiatio das u modèle statistique Soit le modèle statistique paramétrique (H,P), avec u espace d observatios idividuelles H R k. Rappelos que, pour 2 mesures σ-fiies µ et ν sur R p, µ est absolumet cotiue par rapport à ν, et o ote µ ν, si pour tout A B(R p ) tel que ν(a) = 0, o a µ(a) = 0. Das ce cas, le théorème de Rado-Nikodym ous doe l existece d ue foctio mesurable f et ν-p.p. positive, appelée desité de µ par rapport à ν, telle que dµ = f dν. Si ν est la mesure de Lebesgue, o parle plus simplemet de la desité de µ. Efi, si µ est borée, f est ν-itégrable. Défiitio Le modèle statistique (H,P) est dit domié si il existe ue mesure σ-fiie µ telle que P µ pour chaque P P. La mesure µ est appelée mesure domiate du modèle. Les modèles {N(m,σ 2 );m R,σ > 0} et {B(p) ; p ]0,1[} sot domiés : ue mesure domiate du premier est la mesure de Lebesgue sur R, alors qu ue mesure domiate du secod est (δ 0 + δ 1 ). De maière plus géérale, les exemples de modèles domiés que ous recotreros le serot soit par rapport à ue mesure de comptage, soit par rapport à ue mesure de Lebesgue. Théorème Supposos que (H,P) est domié, et otos cov(p) so covexi-
12 12 CHAPITRE 1. MODÉLISATION STATISTIQUE fié, i.e. { cov(p) = } a P, avec P k P, a k 0 et a = 1. Alors, il existe ue probabilité de cov(p) qui domie P. Preuve Soit µ ue mesure domiate. O ote C l esemble des évéemets C tels que µ(c) > 0 et tels qu il existe P C cov(p) dot la desité f C par rapport à µ vérifie f C > 0 µ-p.p. sur C. Choisissos (C ) 1, ue suite de C, telle que : lim µ(c ) = sup µ(c) +. C C O ote P C la probabilité associée à chaque C, et f C la desité associée. O pose : C s = 1C, f = 2 f C. 1 La probabilité Q telle que dq = f dµ, qui est das cov(p), admet f pour desité par rapport à µ. Comme µ(c s ) > 0 et f > 0 µ-p.p. sur C s, o a C s C. Par ailleurs, o a aussi µ(c s ) = sup C C µ(c). Motros maiteat que Q domie P. Soit P P, de desité p par rapport à µ, et A u évéemet tel que Q(A) = 0. Comme 0 = Q(A C s ) = A C s f dµ et que f > 0 µ-p.p. sur C s, o a µ(a C s ) = 0, d où P(A C s ) = 0 car P µ. Par ailleurs, P(Cs c ) = 0. E effet, il est clair que C s { f + p > 0} µ-p.p., et comme { f + p > 0} C, la propriété de maximalité de C s motre que C s = { f + p > 0} µ-p.p. Comme P µ, o a aussi C s = { f + p > 0} P-p.p. et doc P(Cs c ) = P({ f + p = 0}) P({p = 0}) = {p=0} pdµ = 0. E remarquat fialemet que A (A C s ) Cs c, o e déduit que P(A) = 0, c est-à-dire que P Q. Comme Q cov(p), le théorème est démotré. 1.5 Estimatio Soit le modèle statistique paramétrique (H,{P θ } θ Θ ), avec u espace d observatios idividuelles H R k et u espace de paramètres Θ R d. Das ce modèle, le paramètre d itérêt est θ. Si les expérieces du phéomèe sot idépedates, o a alors P θ = Q θ pour chaque θ Θ.
13 1.5. ESTIMATION 13 Das u soucis de simplicité, o se limitera das tout le cours au cas où le paramètre d itérêt est θ, état etedu que les défiitios et la plupart des propriétés qui suivet s adaptet sas difficulté au cas où le paramètre d itérêt est ue foctio boréliee de θ. Défiitio U échatillo de loi P θ est ue v.a. caoique sur (H,P θ ). O rappelle qu ue v.a. caoique (X 1,,X ) sur (H,P θ ) est ue v.a. qui vérifie pour chaque i = 1,, : X i : (x 1,,x ) H x i H. La taille de l échatillo est le ombre d expérieces aléatoires. Das l exemple de la sectio 1.1, la taille de l échatillo est = 1000, et ue suite X 1,,X de v.a.i.i.d. issues de la loi B(p) costitue, après cocatéatio, u échatillo de la loi B(p). A l aide de cette modélisatio stochastique, l ejeu est de costruire ue foctio de l échatillo, qui fourira l iformatio sur le paramètre icou, oté p 0 das la sectio 1.1. Ceci ous amèe à la otio d estimateur, qui est ue quatité cesé être proche du paramètre. Différetes otios de proximité serot abordées au chapitre 2. Défiitios 1. Ue statistique est ue v.a. défiie sur H idépedate de θ, i.e. ue foctio boréliee défiie sur H idépedate de θ. 2. U estimateur (de θ) est ue statistique à valeurs das u sur-esemble de Θ. Remarque U échatillo de loi P θ état ue v.a. caoique (X 1,,X ), il s esuit qu ue statistique s écrit aussi : g(.) = g(x 1,,X ). O utilisera l ue ou l autre de ces représetatios, selo le cotexte. Par exemple, pour isister sur le fait que la statistique déped de l échatillo, o utilisera la représetatio g(x 1,,X ). Pour distiguer ue statistique d u estimateur, o otera ce derier avec u chapeau. Das l exemple de la sectio 1.1, si (X 1,,X ) est u échatillo de la loi B(p), X 1 et X sot des estimateurs de p. Ces 2 estimateurs ot évidemmet
14 14 CHAPITRE 1. MODÉLISATION STATISTIQUE pas le même itérêt ; la termiologie du chapitre 2 permettra d etrepredre ue première classificatio. 1.6 Costructio des estimateurs Soit le modèle statistique paramétrique (H,{Q θ } θ Θ ), avec u espace d observatios idividuelles H R k et u espace de paramètres Θ R d. Pour costruire u estimateur raisoable, o utilise e gééral l ue ou l autre des 2 procédures suivates : le pricipe de la vraisemblace maximale, qui fera l objet du chapitre 3, ou ue méthode ad hoc das laquelle, par le calcul, o observe tout d abord ce que représete le paramètre θ pour la loi Q θ, puis o e costruit ue versio empirique. Examios e détail la 2ème méthode. Das u premier temps, o regarde ce que ce paramètre représete pour la loi Q θ, puis o remplace la mesure Q θ par sa versio empirique. Supposos par exemple que θ = H f dq θ, pour ue certaie foctio coue f L 1 (Q θ ). E vertu de la loi des grads ombres, u estimateur raisoable sera : ˆθ = 1 f (X i ). U tel procédé de costructio s appelle méthode des momets, bie qu il e cocere pas écessairemet les momets de la loi Q θ. Bie etedu, ce est qu u procédé de costructio, et rie e ous assure e gééral qu u estimateur costruit de la sorte ait de boes propriétés statistiques. Néamois, o retrouve des estimateurs aturels. Par exemple, si θ représete la moyee de la loi Q θ, l estimateur costruit par cette méthode sera la moyee empirique : X = 1 Par ailleurs, si θ représete la variace de la loi Q θ, l estimateur sera la variace empirique : ˆσ 2 = 1 X i. (X i X ) 2. D autres procédés de costructio d estimateurs sot evisageables, e foctio
15 1.6. CONSTRUCTION DES ESTIMATEURS 15 du modèle statistique étudié. Exemples 1. Das le modèle (R +,{E (λ) } λ>0 ), le paramètre λ représete l iverse de la moyee de la loi E (λ). U estimateur aturel de λ, costruit avec l échatillo (X 1,,X ) de la loi E (λ) est doc ˆλ = 1 X. 2. Das le modèle (R +,{U ([0,θ]) } θ>0 ), θ représete le maximum des valeurs prises par ue réalisatio de la loi U ([0, θ]). L estimateur aturel costruit avec l échatillo (X 1,,X ) de la loi U ([0,θ]) est doc ˆθ = max 1 i X i. U autre estimateur, costruit cette fois avec la mesure empirique est, par exemple, ˆθ = 1 2 X.
16 16 CHAPITRE 1. MODÉLISATION STATISTIQUE
17 Chapitre 2 Pricipes de l iférece statistique O s itéresse ici à des critères de performace des estimateurs, posat aisi les bases de l iférece statistique. Le modèle statistique cosidéré est (H,{P θ } θ Θ ), avec H R k et Θ R d. Rappelos que, pour simplifier les écritures, o suppose que le paramètre d itérêt, i.e. le paramètre que l o souhaite estimer avec les observatios, est θ. Das ce qui suit, toutes les défiitios et les résultats gééraux s étedet au cas où le paramètre d itérêt est ue foctio g(θ) de θ. O désigera par E θ la moyee sous la loi P θ : sous la propriété d itégrabilité adéquate, E θ g(.) = E θ g(x 1,,X ) = g(x)p H θ (dx), pour g : H R et (X 1,,X ) u échatillo de loi P θ. 2.1 Critères de performace e moyee La première propriété que l o puisse exiger d u estimateur est qu il se comporte e moyee comme so paramètre cible. C est le cocept de biais, décrit ci-dessous. Doréavat, o dira qu ue statistique ˆθ est d ordre p si ˆθ L p (P θ ) pour chaque θ Θ. 17
18 18 CHAPITRE 2. PRINCIPES DE L INFÉRENCE STATISTIQUE Défiitios Soit ˆθ u estimateur d ordre Le biais de ˆθ e θ est E θ ˆθ θ ; 2. ˆθ est sas biais lorsque so biais est ul e chaque θ Θ. 3. ˆθ est asymptotiquemet sas biais si pour chaque θ Θ, lim E θ ˆθ = θ. Pour reveir à l exemple de la sectio 1.1, lorsque (X 1,,X ) est u échatillo de la loi B(p), les 2 estimateurs X 1 et X sot sas biais. La proximité etre l estimateur et sa cible peut être évaluée grâce à la distace L 2 etre les 2 quatités. Das ce qui suit,. désige la orme euclidiee de R d. Défiitios Soit ˆθ u estimateur d ordre Le risque quadratique de ˆθ sous P θ est R(θ; ˆθ) = E θ ˆθ θ Soit ˆθ u autre estimateur d ordre 2. O dit que ˆθ est préférable à ˆθ lorsque pour chaque θ Θ, R(θ; ˆθ) R(θ; ˆθ ). 3. Supposos que ˆθ est sas biais. O dit que ˆθ est de variace uiformémet miimum parmi les estimateurs sas biais (VUMSB) si il est préférable à tout autre estimateur sas biais d ordre 2. L existece d u estimateur VUMSB est e gééral pas acquise. Nous reviedros sur ce problème das la partie 4.3. Das la sectio 1.1, o a remarqué que lorsque (X 1,,X ) est u échatillo de la loi B(p), R(p; X ) = p(1 p)/. Aisi, à mesure que l o acquiert de l iformatio e multipliat les expérieces aléatoires, l estimateur X gage e précisio. Ce est pas le cas pour l estimateur X 1, dot le risque quadratique vaut R(p;X 1 ) = p(1 p). Comme o pouvait s y attedre, X est doc préférable à X 1. E fait, X est VUMSB. Pour le motrer, cosidéros u estimateur sas biais quelcoque ˆϕ := ˆϕ(X 1,,X ), et otos : L(p;X 1,,X ) = p X (1 p) X, et K(p) = ll(p;x 1,,X ). O remarque das u premier temps que : ( 1 E p K (p) = E p p X 1 ) 1 p ( X ) = 0.
19 2.1. CRITÈRES DE PERFORMANCE EN MOYENNE 19 Par suite, si var p et cov p désiget la variace et la covariace sous la loi B(p) : cov p ( ˆϕ,K (p)) = E p ˆϕK (p) = ˆϕ(i 1, i )L (p;i 1,,i ) i 1,,i {0,1} = d dp E p ˆϕ = 1, car ˆϕ est sas biais. Comme, d après l iégalité de Cauchy-Schwarz, ( covp ( ˆϕ,K (p)) ) 2 varp ( ˆϕ)var p (K (p)), o a doc Or, var p ( ˆϕ) 1 var p (K (p)). ( 1 var p (K (p)) = var p p X + 1 ) 1 p X 2 = p 2 (1 p) 2 var p ( X ) = p(1 p) = (R(p; X )) 1. (2.1.1) O a doc obteu R(p; ˆϕ) = var p ( ˆϕ) R(p; X ), c est-à-dire que X est VUMSB. Cette preuve, qui peut sembler ici miraculeuse, sera formalisée das les sectios 3.3 et 4.1. Exercice [CAS OÙ LE PARAMÈTRE D INTÉRÊT EST UNE FONCTION DE θ] Soit le modèle statistique (R,{Q θ } θ Θ ) tel que pour chaque θ Θ, Q θ admet u momet d ordre 2. Pour u échatillo (X 1,,X ) de loi Q θ, o ote : X = 1 X i, et S 2 = 1 1 (X i X ) 2. Motrer que X et S 2 sot des estimateurs sas biais de la moyee et de la variace de la loi Q θ, respectivemet. O ote doréavat, pour deux vecteurs aléatoires X,Y de carrés itégrables et à valeurs das R d : K θ (X,Y ) = E θ (X E θ X) T (Y E θ Y ) = E θ X T Y E θ X T E θ Y et V θ (X) = K θ (X,X) = E θ X E θ X 2.
20 20 CHAPITRE 2. PRINCIPES DE L INFÉRENCE STATISTIQUE Noter que K θ (X,Y ) = K θ (Y,X). Par ailleurs, K θ et V θ e représetet pas la covariace et la variace sous la loi P θ (respectivemet otées cov θ et var θ ), sauf lorsque d = 1. Propositio [DÉCOMPOSITION BIAIS-VARIANCE] Soit ˆθ u estimateur d ordre 2. O a alors la décompositio : R(θ; ˆθ) = E θ ˆθ θ 2 +V θ ( ˆθ). Pour u risque doé, abaisser le biais reviet doc à augmeter la variatio, et réciproquemet. Preuve O a : R(θ; ˆθ) = E θ ( ˆθ E θ ˆθ) + (E θ ˆθ θ) 2 = E θ ˆθ E θ ˆθ 2 + E θ ˆθ θ 2 + 2E θ ( ˆθ E θ ˆθ) T (E θ ˆθ θ). Le résultat e découle, car E θ ( ˆθ E θ ˆθ) = 0 et V θ ( ˆθ) = E θ ˆθ E θ ˆθ 2. Propositio Soit ˆθ u estimateur d ordre 2. Alors, ˆθ est VUMSB si, et seulemet si, pour tout estimateur ˆϕ d ordre 2 tel que E θ ˆϕ = 0 pour chaque θ Θ, o a : K θ ( ˆϕ, ˆθ) = 0, θ Θ. Preuve Pour toute la preuve, fixos θ Θ. Supposos que ˆθ est VUMSB. Soit ˆϕ ue statistique d ordre 2 telle que E θ ˆϕ = 0. Pour tout α R, l estimateur ˆϕ α = ˆθ + α ˆϕ est sas biais. Comme ˆθ est sas biais et VUMSB, o a alors : V θ ( ˆθ) = R(θ; ˆθ) R(θ; ˆϕ α ) = V θ ( ˆϕ α ) = V θ ( ˆθ) + 2αK θ ( ˆθ, ˆϕ) + α 2 V θ ( ˆϕ). Par suite, o a pour tout α R : 2αK θ ( ˆθ, ˆϕ) + α 2 V θ ( ˆϕ) 0. Ce polyôme e α e peut garder u sige positif que si K θ ( ˆθ, ˆϕ) = 0.
21 2.2. CRITÈRES DE PERFORMANCE ASYMPTOTIQUE 21 Réciproquemet, tout estimateur sas biais ˆψ tel que ˆψ L 2 (P θ ) s écrit ˆψ = ˆθ ˆϕ, où ˆϕ = ˆθ ˆψ est ue statistique telle que E θ ˆϕ = 0 et ˆϕ L 2 (P θ ). Par hypothèse, o a alors K θ ( ˆθ, ˆϕ) = 0 et la statistique ˆψ vérifie doc : R(θ; ˆψ) = V θ ( ˆθ ˆϕ) = V θ ( ˆθ) +V θ ( ˆϕ) 2K θ ( ˆθ, ˆϕ) ce qui motre que ˆθ est VUMSB. = V θ ( ˆθ) +V θ ( ˆϕ) V θ ( ˆθ) = R(θ; ˆθ), Théorème Soiet ˆθ et ˆθ des estimateurs VUMSB. Alors, pour chaque θ Θ, ˆθ = ˆθ P θ -p.s. Preuve Fixos θ Θ. Comme la statistique ˆϕ = ˆθ ˆθ vérifie les hypothèses du théorème précédet, o a : V θ ( ˆθ ˆθ ) = E θ ( ˆθ θ ˆ ) T ( ˆθ θ ˆ ) = E θ ( ˆθ θ ˆ ) T ( ˆθ θ) E θ ( ˆθ θ ˆ ) T ( θ ˆ θ) = K θ ( ˆθ θ ˆ, ˆθ) K θ ( ˆθ θ ˆ, θ ˆ ) = 0, ce qui motre que ˆθ = ˆθ P θ -p.s., car ˆθ et ˆθ sot sas biais. 2.2 Critères de performace asymptotique A mesure que la taille de l échatillo croît, l échatillo cotiet de plus e plus d iformatios sur la vraie valeur du paramètre. O est alors ameé à s itéresser aux propriétés asymptotiques des estimateurs. Das la suite, sauf metio explicite du cotraire, toute propriété de covergece sera etedue pour ue taille d échatillo qui ted vers l ifii. Défiitio O dit que l estimateur ˆθ est cosistat lorsque pour chaque θ Θ, ˆθ P θ θ. Das l exemple de la sectio 1.1, l estimateur X costruit avec u échatillo (X 1,,X ) de loi B(p) est cosistat, car X B(p) p pour chaque p ]0, 1[. Remarque U estimateur peut être asymptotiquemet sas biais sas être cosistat. De même, u estimateur peut être cosistat sas être asymptotiquemet
22 22 CHAPITRE 2. PRINCIPES DE L INFÉRENCE STATISTIQUE sas biais. Pour se covaicre du secod poit par exemple, cosidéros le modèle statistique (R,{N(m,1) } m ]0,1[ ), et l estimateur ˆm issu de l échatillo (X 1,,X ) de la loi N(m,1), pour m ]0,1[ : ˆm = X + 1 F( ) 1 { X 0}, où F désige la foctio de répartitio de la loi N(0,1). Comme m > 0, la loi faible des grads ombres motre que ˆm P m m, si P m = N(m,1). Par ailleurs, comme X N(m,1/) : P m ( X 0) = 1 m e t2 /2 dt F( ), 2π car m 1. Doc E m ˆm m + 1, et ˆm est pas asymptotiquemet sas biais. Exercice [CAS OÙ LE PARAMÈTRE D INTÉRÊT EST UNE FONCTION DE θ] Soit le modèle statistique (R,{Q θ } θ Θ ) tel que pour chaque θ Θ, Q θ admet u momet d ordre 2. Pour u échatillo (X 1,,X ) de loi Q θ, o ote : ˆσ 2 = 1 (X i X ) 2. Motrer que ˆσ 2 est u estimateur biaisé de la variace de Q θ, mais qu il est asymptotiquemet sas biais et cosistat. Cette propriété e doit être vue que comme ue propriété miimale que doit satisfaire u estimateur raisoablemet costitué. Cepedat, elle e permet pas de préciser l erreur commise. C est précisémmet l objet de la défiitio qui suit. Défiitios Soit (v ) ue suite de réels positifs telle que v. O dit que l estimateur ˆθ est : 1. de vitesse (v ) si, pour chaque θ Θ, il existe ue loi l(θ) telle que v ( ˆθ θ) L /P θ l(θ). 2. asymptotiquemet ormal si, e outre, les lois l(θ) sot gaussiees. La performace d u estimateur est otammet évaluée sur sa vitesse car, pour ue précisio doée, plus la vitesse est rapide, mois la taille de l échatillo
23 2.3. INTERVALLES DE CONFIANCE 23 doit être importate. Néamois, il e faut pas oublier qu u estimateur performat doit aussi pouvoir être calculé via u algorithme de complexité raisoable. Comme, e pricipe, ces 2 cotraites s opposet, il est importat de savoir réaliser u compromis etre ces exigeces. Remarque U estimateur qui possède la propriété 1. de la défiitio ci-dessus est cosistat. E effet, fixos θ Θ. O suppose pour simplifier que (v ) est croissate, et que l(θ) est ue loi sas atomes (sio, il suffit de travailler sur l esemble des poits de cotiuité de la foctio de répartitio de la loi de l(θ) ; à toutes fis utiles, rappelos que l esemble des poits de discotiuité d ue v.a.r. est au plus déombrable). Pour chaque ε > 0, o a P θ ( ˆθ θ ε) P θ (v ˆθ θ v p ε), pour tout p. O e déduit que pour tout p, lim supp θ ( ˆθ θ ε) P θ ( l(θ) v p ε). E faisat fialemet tedre p vers +, o peut coclure que ˆθ P θ θ. Das l exemple de la sectio 1.1, o a vu que l estimateur X costruit avec u échatillo (X 1,,X ) de loi B(p) est asymptotiquemet ormal, de vitesse, car pour chaque p [0,1], ( X p) L /B(p) N(0, p(1 p)). Exercice Soit le modèle statistique (R,{U ([θ,θ + 1]) } θ [0,1] ). Costruire et étudier des estimateurs du paramètre θ, e utilisat les statistiques mi i X i, max i X i et X issues d u échatillo (X 1,,X ) de la loi U ([θ,θ + 1]). 2.3 Itervalles de cofiace Nous avos déjà vu, das la sectio 1.1, u exemple de costructio d itervalle de cofiace. L objectif de cette sectio est d e rappeler le pricipe, sas toutefois retrer das u formalisme excessif, qui pourrait être préjudiciable à la compréhesio de la démarche. Das cette sectio, le modèle statistique est (H,{P θ } θ Θ ), avec Θ R. L observatio (x 1,,x ) H est issue d ue loi P θ0, avec θ 0 Θ icou.
24 24 CHAPITRE 2. PRINCIPES DE L INFÉRENCE STATISTIQUE Itervalle de cofiace pour ue taille d échatillo fiie O fixe α ]0,1[. Défiitio Soit T ue foctio défiie sur H et à valeurs das les itervalles de R telle que pour chaque θ Θ : P θ (θ T (.)) = (resp. )1 α. T (x 1,,x ) s appelle itervalle de cofiace (resp. par excès) pour θ 0, au iveau de cofiace 1 α. Aisi, θ 0 T (x 1,,x ) avec ue P θ0 -probabilité (resp. au mois) 1 α. O peut remarquer d emblée qu u itervalle de cofiace est d autat plus itéressat qu il est de logueur faible, pour u iveau de cofiace élevé. Comme ces 2 exigeces s opposet, il est impératif de réaliser u compromis. Exemple Cosidéros le cas d u modèle statistique {P θ } θ Θ = {Q θ } θ Θ pour lequel H x2 Q θ (dx) 1 et θ = H xq θ (dx) pour tout θ Θ. Soit (X 1,,X ) u échatillo de la loi Q θ. D après l iégalité de Bieaymé-Tchebytchev : P θ ( X θ > t) var θ ( X ) t 2 = var θ (X 1 ) t 2 1, t > 0. t2 Si t vérifie (t 2 ) 1 α, o a doc P θ ( X θ > t) α. Pour u tel t, [ x t, x +t] est doc u itervalle de cofiace par excès pour θ 0, au iveau de cofiace 1 α. O peut trouver des itervalles de cofiace plus précis e utilisat, au lieu de l iégalité de Bieaymé-Tchebytchev, ue iégalité expoetielle (iégalité de Berstei, iégalité de Hoeffdig,...), forcémet plus précise. Souvet, l u des igrédiets de base pour costruire u itervalle de cofiace est le quatile d ue loi sur R. Défiitio-Propositio Soit F la foctio de répartitio d ue loi ν sur R. Le quatile d ordre r ]0,1[ de la loi ν est défii par q r = if{x R : F(x) r}.
25 2.3. INTERVALLES DE CONFIANCE 25 Si F est cotiue, F(q r ) = r. Si, de plus, F est strictemet croissate, alors q r est l uique solutio de l équatio F(.) = r. Preuve Il suffit de remarquer que, comme F est croissate et cotiue à droite, F(q r ) r F(q r ), si F(q r ) est la limite à gauche de F e q r. Exemple Cosidéros le modèle statistique {N(m,1) } m R. Pour (X 1,,X ) u échatillo de la loi P m = N(m,1), o a ( X m) N(0,1). Soit t 0 le quatile d ordre 1 α/2 de la loi N(0,1) : si Φ est la foctio de répartitio de la loi N(0,1), o sait que Φ(t 0 ) = 1 α/2. Comme la loi N(0,1) possède ue desité paire : P m ( X m t 0 ) = 2Φ(t0 ) 1 = 1 α. Si les observatios x 1,,x sot régies par la loi N(m 0,1), [ x t 0 /, x + t 0 / ] est u itervalle de cofiace pour m 0, au iveau 1 α. Si l obtetio d ue telle propriété est hors d atteite, ou si T est trop complexe pour pouvoir être utilisé, o se retrache sur ue propriété asymptotique Itervalle de cofiace asymptotique Soit α ]0,1[. Défiitio Soit, pour chaque, T ue foctio défiie sur H et à valeurs das les itervalles de R telle que pour chaque θ Θ : P θ (θ T (.)) 1 α. T (x 1, x ) s appelle itervalle de cofiace asymptotique pour θ 0 au iveau de cofiace 1 α. Exemple Supposos par exemple que ˆθ est u estimateur asymptotiquemet ormal, de vitesse (v ) : pour chaque θ Θ, v ( ˆθ θ) L /P θ N(0, 1). (2.3.1) Notos q 1 α/2 et q α/2 les quatiles d ordre 1 α/2 et α/2 de la loi N(0,1). Par symétrie de la loi N(0,1), q 1 α/2 = q α/2. Si q = q 1 α/2 > 0, alors : P θ ( q v ( ˆθ θ) q ) 1 α.
26 26 CHAPITRE 2. PRINCIPES DE L INFÉRENCE STATISTIQUE L itervalle de cofiace asymptotique au iveau 1 α est doc : [ ˆθ(x 1,,x ) q v ; ˆθ(x 1,,x ) + q v ]. Pour la costructio des itervalles de cofiace asymptotiques, le lemme de Slutsky (au programme du L3) est souvet utile. Lemme [SLUTSKY] Soiet (X ) et (Y ) des suites de v.a.r. sur (Ω,F,P). Si il P L /P existe ue v.a.r. Y et u réel a tels que X a et Y Y, alors (X,Y ) L /P L /P L /P (X,Y ). E particulier, X Y ay et X +Y a +Y. Exemple Supposos à ouveau que ˆθ est u estimateur asymptotiquemet ormal, de vitesse (v ) : pour chaque θ Θ, il existe σθ 2 > 0 tel que v ( ˆθ θ) L /P θ N(0,σθ 2 ). (2.3.2) Soit ˆσ u estimateur cosistat de σ θ. O a recours au lemme de Slutsky pour e déduire de (2.3.2) que pour chaque θ Θ : v ˆθ θ ˆσ L /P θ N(0,1). Par suite, avec les otatios de l exemple précédet : ( ) ˆθ θ P θ q v q 1 α, ˆσ ou bie, avec ue écriture équivalete : [ P θ (θ ˆθ ˆσq ; ˆθ + ˆσq ]) 1 α. v v Comme les quatités ˆθ et ˆσ qui itervieet das cet itervalle peuvet être calculées pour les observatios x 1,,x, cette propriété ous doe l itervalle de cofiace asymptotique recherché.
27 2.3. INTERVALLES DE CONFIANCE 27 La δ-méthode est aussi souvet utilisée pour la costructio d itervalle de cofiace asymptotiques. Lemme [δ -MÉTHODE] Soit (X ) ue suite de v.a.r. sur (Ω,F,P), g : R R ue foctio cotiûmet dérivable e x 0 et (v ) ue suite de réels tedat vers +. Si v (X x 0 ) L /P X, alors v (g(x ) g(x 0 )) L /P g (x 0 )X. Preuve D après la formule de Taylor-Lagrage, il existe ξ compris etre x 0 et X tel que g(x ) = g(x 0 ) + (X x 0 )g (ξ ). Comme g est cotiue e x 0 et (X ) coverge e probabilité vers x 0, o a doc v (g(x ) g(x 0 )) = v (X x 0 )g (ξ ) L /P g (x 0 )X, d après le lemme de Slutsky. Exemple Supposos que l o veuille costruire u itervalle de cofiace asymptotique au iveau 1 α pour le paramètre λ, das le modèle {E (λ) } λ>0. Soit (X 1,,X ) u échatillo de la loi E (λ). D après le théorème de la limite cetrale : ( X 1 ) L /E (λ) N(0,1/λ 2 ). λ O a recours à la δ-méthode pour e déduire que ( 1 X λ) L /E (λ) 1 λ 2 N(0,1/λ 2 ) = 1 λ 3 N(0,1). Fialemet, e utilisat l estimateur cosistat 1/ X, le lemme de Slutsky ous doe ( X 3 L /E (λ) λ) N(0,1). 1 X L itervalle de cofiace asymptotique s e déduit facilemet.
28 28 CHAPITRE 2. PRINCIPES DE L INFÉRENCE STATISTIQUE
29 Chapitre 3 Vraisemblace La méthode de costructio des estimateurs par maximisatio de la vraisemblace est sas doute la plus répadue. Le pricipe de la costructio est ituitivemet évidet : il s agit de choisir comme estimateur le paramètre pour lequel l observatio est la plus probable, ou la plus vraisemblable... Das tout le chapitre, l espace des observatios idividuelles est H R k, et l espace des paramètres est Θ R d. 3.1 Le cocept de vraisemblace Défiitio O appelle vraisemblace du modèle statistique (H,{P θ } θ Θ ) domié par µ toute applicatio L : H Θ R + telle que, pour chaque θ Θ, l applicatio partielle L(.;θ) : H R + soit u élémet de la classe d équivalece de la desité de P θ par rapport à µ. Remarque La vraisemblace, dot l existece est acquise grâce au théorème de Rado-Nikodym, déped doc du choix de la mesure domiate du modèle, qui est pas uique. De plus, e raiso du fait que que chaque desité dp θ /dµ est uique qu à ue équivalece près, ue vraisemblace elle-même est pas uique. Malgré cela, ous parleros de "la" vraisemblace, sachat que, das la pratique, le choix d ue vraisemblace s impose souvet par ses propriétés aalytiques. Exemples 1. Das le modèle statistique ({0,1},{B(p) } p ]0,1[ ) de la sectio 1.1, qui 29
30 30 CHAPITRE 3. VRAISEMBLANCE est domié par la mesure (δ 0 + δ 1 ), la vraisemblace L s exprime par : L(x 1,,x ; p) = B(p) ({x 1,,x }) = p x i (1 p) x i, pour p ]0,1[ et x 1,,x {0,1}. 2. Das le modèle (R,{N(m,σ 2 ) } m R,σ R + ), qui est domié par la mesure de Lebesgue sur R, la vraisemblace est : L(x 1,,x ;m,σ 2 ) = pour x i R, m R et σ R +. 1 ( 2πσ 2 ) exp ( (x i m) 2 Das le cadre de modèles statistiques issus d observatios idépedates, l expressio aturelle de la vraisemblace est simple, comme le motre la propositio ci-dessous. Propositio Soit (H,{Q θ } θ Θ ) u modèle statistique domié par la mesure µ, et de vraisemblace L. Alors, la foctio L : H Θ R (x 1,,x,θ) L(x i ;θ), est la vraisemblace du modèle (H,{Q θ } θ Θ ) pour la mesure domiate µ. Preuve Il suffit de remarquer que, pour chaque θ Θ, est ue versio de la desité de Q θ L(x i ;θ), par rapport à µ. Repreos l exemple de la sectio 1.1. Les lacers de la pièce ot fouri ue suite d observatios x 1,,x {0,1}. Il est aturel de cosidérer que la loi B(p 0 ) qui régit ces observatios est la loi qui apporte la plus forte probabilité à cette réalisatio. C est aisi que, pour doer ue valeur approchée de la vraie valeur du paramètre, o est ameé à maximiser e p la vraisemblace L(x 1,,x ; p) : l idée sous-jacete est que la valeur de p obteue est celle qui 2σ 2 ),
31 3.2. CONSISTANCE DE L EMV 31 s ajuste le mieux aux observatios. C est cette observatio qui motive le cocept de maximum de vraisemblace. Défiitio Soit (H,{P θ } θ Θ ) u modèle statistique domié, et L la vraisemblace associée. U estimateur du maximum de vraisemblace (EMV) est ue statistique g à valeurs das Θ qui vérifie : L(x;g(x)) = sup L(x;θ), x H. θ Θ Aisi, si (X 1,,X ) est u échatillo de la loi P θ, l EMV (de θ) est g(x 1,,X ). Bie etedu, i l existece, i l uicité des EMV e sot e gééral pas acquises. Das le modèle statistique issu d observatios idépedates de la propositio précédete, o préfère calculer l EMV e maximisat la "log-vraisemblace" - c est-à-dire le logarithme de la vraisemblace- plutôt que la vraisemblace, car celle-ci s exprime comme : ll (x 1,,x ;θ) = ll(x i ;θ). L itérêt pratique est clair, l étape de maximisatio état e pricipe plus facile à meer. Exemple L EMV du modèle statistique (R,{N(m,1) } m R ) est la moyee empirique. 3.2 Cosistace de l EMV L u des outils de base pour l étude des EMV est décrit ci-dessous : Défiitio-Propositio Soit (H,{P θ } θ Θ ) u modèle statistique idetifiable et domié par µ, de vraisemblace L. Pour chaque α,θ Θ, o suppose que ll(.;α) L 1 (P θ ). O ote : K(α,θ) = E θ l L(.;α) L(.;θ)
32 32 CHAPITRE 3. VRAISEMBLANCE l iformatio de Kullback etre les lois P α et P θ. Alors, K(α,θ) 0 et de plus K(α,θ) = 0 α = θ. Preuve Tout d abord, il est clair que K(θ,θ) = 0. Soiet doc α θ. Comme la foctio t lt défiie sur R + est covexe, o a avec l iégalité de Jese : K(α,θ) = l H l L(.;α) L(.;θ) dp θ H L(.;α) L(.;θ) dp θ = l H L(.;α)dµ = 0. Supposos que K(α,θ) = 0. O est alors das u cas d égalité das l iégalité de Jese. Comme t lt défiie sur R + est strictemet covexe, o e déduit qu il existe C R + tel que L(.;α) = CL(.;θ) P θ -p.s. Or, P α est absolumet cotiue par rapport à P θ, de desité L(.;α)/L(.;θ). Par suite, pour tout borélie A H, L(.;α) P α (A) = L(.;α)dµ = L(.;θ) dp θ = CP θ (A). A O e déduit tout d abord que C = 1 (predre A = H ), puis que P θ = P α, ce qui cotredit l idetifiabilité du modèle. Cette propriété de l iformatio de Kullback permet d idetifier le paramètre icou θ e tat que seule solutio de l équatio K(.,θ) = 0. C est e ce ses que l iformatio de Kullback doe des iformatios sur le modèle. A priori, il y a pas de raiso pour qu u EMV soit cosistat, comme e atteste l exemple suivat : Exemple Soit (R,{C (θ) } θ>0 ) u modèle statistique, où C (θ) désige la loi sur R, de desité θ 1 π θ 2 + x 2, x R. Notos (X 1,,X ) u échatillo de la loi C (θ), avec θ > 0. U simple calcul ous motre que l EMV ˆθ est la seule solutio de l équatio ϕ (.) = 1/2, où l o a oté ϕ (α) = 1 A (X i /α) 2, α > 0.
33 3.2. CONSISTANCE DE L EMV 33 Par ailleurs, o vérifie facilemet que pour tous α 1,α 2 > 0 : ϕ (α 1 ) ϕ (α 2 ) α 2 1 α α1 2 + X i 2 Par l absurde, supposos que ˆθ est cosistat. La loi des grads ombres et cette iégalité ous motret que pour chaque θ > 0. Par suite, ϕ ( ˆθ) C (θ) E θ (X/θ) 2 1 E θ 1 + (X/θ) 2 = 1, θ > 0, 2 ce qui est impossible car le terme de gauche ted vers 1 lorsque θ. Il est doc écessaire de doer des coditios suffisates de cosistace des EMV. Théorème Soit (H,{Q θ } θ Θ ) u modèle statistique idetifiable et domié, de vraisemblace L. O suppose que Θ est compact, et que : (i) x H, ll(x;.) est cotiu sur Θ ; (ii) θ Θ, il existe H L 1 (Q θ ) telle que sup α Θ ll(.;α) H. O ote ˆθ l EMV de θ associé à la vraisemblace L (x 1,,x ;θ) = L(x i ;θ) du modèle (H,{Q θ } θ Θ ). Alors, ˆθ est cosistat. Preuve O fixe θ Θ et o ote P θ = Q θ. Soit (X 1,,X ) u échatillo de la loi P θ et, pour chaque α Θ : U (α) = 1 ll (X 1,,X ;α) = 1 U(α) = E θ ll(.;α).. ll(x i ;α) Remarquos que U ( ˆθ) = if Θ U et, par hypothèse, que U est cotiue. D après P la loi des grads ombres, U θ U poctuellemet ; ous allos tout d abord
34 34 CHAPITRE 3. VRAISEMBLANCE motrer que cette covergece est e fait uiforme. Pour tout η > 0, o désige par g(.,η) la foctio défiie pour chaque x H par g(x,η) = sup ll(x;α) ll(x;β). α β η O fixe maiteat ε > 0. Comme g(.,η) 2H avec H L 1 (P θ ) et g(x,η) 0 si η 0 pour tout x H, o a E θ g(.,η) < ε/3 d après le théorème de Lebesgue, pour ue certaie valeur de η que ous fixos doréavat. O recouvre le compact Θ par N boules fermées de Θ de rayo η : O a das u premier temps : sup U U max Θ j=1,,n B(θ j,η) + max 1 N Θ = B(θ j,η). j=1 sup sup j=1,,n B(θ j,η) g(x i,η) + U U (θ j ) + max j=1,,n U (θ j ) U(θ j ) U(θ j ) U max U (θ j ) U(θ j ) + E θ g(.,η). j=1,,n O e déduit das u secod temps que, puisque E θ g(.,η) < ε/3 : ) ( ) 1 P θ (sup U U ε P θ Θ g(x i,η) + max U (θ j ) U(θ j ) 2ε/3 j=1,,n ( ) P θ max U (θ j ) U(θ j ) ε/3 j=1,,n ( ) 1 +P θ g(x i,η) ε/3. Or, d après la la loi des grads ombres, o a à la fois : max U (θ j ) U(θ j ) j=1,,n P θ 1 0 et g(x i,η) P θ E θ g(.,η) < ε/3. P Ces observatios ous permettet de déduire que sup Θ U U θ 0. E particulier, U ( ˆθ) = if Θ U P θ if Θ U. (3.2.1)
35 3.3. INFORMATION DE FISHER 35 Comme Θ est compact et U est cotiue, il existe t Θ tel que U(t) = if Θ U. Par suite : U ( ˆθ) U (θ) P θ U(t) U(θ) = K(t,θ). De plus, U ( ˆθ) U (θ) = if Θ U U (θ) 0. O a doc K(t,θ) 0, ce qui motre que K(t,θ) = 0 d où t = θ. D après (3.2.1), U ( ˆθ) P θ U(θ) et, puisque U coverge uiformémet vers U e probabilité, o e déduit que K( ˆθ,θ) = U( ˆθ) U(θ) P θ 0. Soit ε > 0. Il existe γ > 0 tel que si α Θ vérifie α θ ε, alors K(α,θ) γ. Par coséquet, P θ ( ˆθ θ ε ) P θ ( K( ˆθ,θ) γ ) 0, doc ˆθ ted vers θ e probabilité. 3.3 Iformatio de Fisher Das le cadre d u modèle statistique (H,{P θ } θ Θ ) de vraisemblace L telle que pour chaque x H, ll(x;.) C 1, la foctio score au poit θ défiie par x ll(x;θ), et das laquelle désige le gradiet par rapport à θ, évalue la variabilité du modèle. C est ue otio itrisèque au modèle, e ce ses qu elle e déped i de la mesure domiate, i de la vraisemblace. C est ce qui justifie la défiitio qui suit. Par covetio, dès que l o parle de gradiet (resp. hessiee), il est sousetedu que la foctio est de classe C 1 (resp. C 2 ). Défiitio Soit (H,{P θ } θ Θ ) u modèle statistique domié de vraisemblace L. O suppose que Θ est ouvert, et que pour chaque θ Θ : ll(.;θ) L 2 (P θ ).
36 36 CHAPITRE 3. VRAISEMBLANCE O appelle iformatio de Fisher la foctio ( ( )) I : θ var θ ( ll(.;θ)) = cov θ ll(.;θ), ll(.;θ). θ i θ j i, j=1,,d Lorsque ous parleros d iformatio de Fisher, il sera sous-etedu que les hypothèses imposées das cette défiitio serot satisfaites. L iformatio de Fisher est doc ue foctio à valeurs das l esemble des matrices semi-défiies positives qui évalue le pouvoir de discrimiatio du modèle etre 2 valeurs proches du paramètre d itérêt. E effet, o voit directemet das le cas d = 1 que I(θ) grad traduit ue grade variatio de la ature des probabilités du modèle au voisiage de P θ, d où ue discrimiatio de la vraie valeur du paramètre icou facilitée. A l iverse, si I(θ) est petit, la loi est très piquée : c est mauvais, car o est ameé à rechercher le maximum de la vraisemblace das ue régio très vaste. Ce sot ces propriétés de I(θ) qui fourisset ue iformatio sur le modèle. Pour illustrer ces affirmatios, repreos le modèle de la sectio 1.1, pour lequel la vraisemblace vaut, si p ]0,1[ et x 1,,x {0,1} : L(x 1,,x ; p) = p x i (1 p) x i. O a déjà vu das la relatio (2.1.1) que : I(p) = var p ( ll(.; p)) = p(1 p). Das ce modèle, l icertitude est faible pour p proche de 0 et 1 alors qu elle est grade pour p = 1/2. Ceci se traduit bie par ue iformatio I(p) maximale pour p proche de 0 et 1, et miimale pour p = 1/2. Das ue situatio d échatilloage i.i.d., l iformatio de Fisher est proportioelle à la taille de l échatillo. Cette propriété, que ous motros cidessous, légitime ecore plus ce cocept e tat que mesure d ue quatité d iformatio. Propositio Soit (H,{Q θ } θ Θ ) u modèle statistique domié d iformatio de Fisher I. Alors, l iformatio de Fisher I du modèle (H,{Q θ } θ Θ ) vaut I (θ) =
37 3.3. INFORMATION DE FISHER 37 I(θ) pour chaque θ Θ. Preuve Si L désige la vraisemblace du modèle (H,{Q θ } θ Θ ), la vraisemblace L du modèle (H,{Q θ } θ Θ ) est : L (x 1,,x ;θ) = Le score de ce derier modèle est doc : ll (x 1,,x ;θ) = L(x i ;θ). ll(x i ;θ). Si (X 1,,X ) est u échatillo de la loi P θ = Q θ, o a alors par idépedace : ) I (θ) = var θ ( ll(x i ;θ) = var θ ( ll(x i ;θ)) = I(θ). Du poit de vue des calculs, o se réfèrera souvet à la propositio qui suit, dot l objectif pricipal est de doer ue forme simplifiée pour la matrice d iformatio de Fisher. Das la suite, 2 g(θ) désige la matrice Hessiee de g : Θ R évaluée e θ Θ. Propositio Soit (H,{P θ } θ Θ ) u modèle statistique domié par µ, de vraisemblace L et d iformatio de Fisher I. Soit θ Θ. O suppose qu il existe u voisiage V Θ de θ tel que sup α V L(.;α) L 1 (µ). Alors : (i) E θ ll(.;θ) = 0. (ii) si, e outre, sup α V 2 L(.;α) L 1 (µ), o a I(θ) = E θ 2 ll(.;θ). Les coditios de cette propositio e sot pas aussi restrictives qu elle peuvet le sembler, car elle sot satisfaites par bo ombre de modèles statistiques. Comme ous allos le voir, il s agit essetiellemet de doer des coditios pour faire passer l opératio de dérivatio sous ue itégrale. Preuve O commece par remarquer que, sous la coditio sup α V L(.;α) L 1 (µ), o a d après le théorème de Lebesgue : L(x;θ)µ(dx) = L(x;θ)µ(dx) = 0. H H
38 38 CHAPITRE 3. VRAISEMBLANCE Par suite, E θ ll(.;θ) = ( ll(x;θ))l(x;θ)µ(dx) = H H L(x;θ)µ(dx) = 0, d où (i). Pour motrer (ii), o remarque das u premier temps que d après (i), ( ( )) I(θ) = cov θ ll(.;θ), ll(.;θ) θ i θ j i, j=1,,d ( = E θ ll(.;θ) ) ll(.;θ). (3.3.1) θ i θ j i, j=1,,d Soit alors i, j = 1,,d. Pour x H, o a ( ) 2 2 θ i θ j L(x;θ) ll(x;θ) = θ i θ j L(x;θ) ( )( ) θ i L(x;θ) θ j L(x;θ) L 2 (x;θ) Il est bo de remarquer que chacue des expressios qui itervieet das le membre de droite est ue foctio de x qui est das L 1 (P θ ) : c est clair pour le 1er terme car 2 L(.;θ) L 1 (µ) ; c est vrai aussi pour le 2d membre sous la coditio d existece de l iformatio de Fisher, i.e. ll(.;θ) L 2 (P θ ). Le théorème de Lebesgue motre que sous l hypothèse sup α V 2 L(.;α) L 1 (µ), o a : Par suite, L(x;θ)µ(dx) = 2 θ i θ j θ i θ j H 2 E θ 2 θ i θ j ll(.;θ) = H = H L(x;θ)µ(dx) = 0. ( 2 ) ll(x;θ) L(x; θ)µ(dx) θ i θ j ( )( ) 1 L(x;θ) L(x;θ) θ i θ j L(x;θ) µ(dx) H = E θ θ i ll(.;θ) θ j ll(.;θ). D après (3.3.1), cette derière quatité coicide avec I(θ) i j, d où (ii). Cette propositio légitime la défiitio qui suit. Défiitio O dit que le modèle statistique domié (H,{P θ } θ Θ ) domié et de vraisemblace L est régulier si pour chaque θ Θ :.
39 3.4. NORMALITÉ ASYMPTOTIQUE DE L EMV 39 (i) so iformatio de Fisher e θ existe et est iversible ; (ii) E θ ll(.;θ) = 0 et I(θ) = E θ 2 ll(.;θ). La propositio précédete ous doe doc des coditios suffisates de régularité d u modèle. A ouveau, il est etedu das cette défiitio que les coditios d existece de l iformatio de Fisher sot satisfaites. De même, o évoque l espérace d ue v.a. que lorsque celle-ci existe. 3.4 Normalité asymptotique de l EMV Théorème Soit (H,{Q θ } θ Θ ) u modèle domié régulier, de vraisemblace L et d iformatio de Fisher I tel que, pour chaque θ Θ, il existe u voisiage V Θ de θ avec sup α V 2 ll(.;α) L 1 (P θ ). O ote ˆθ l EMV de θ associé à la vraisemblace L (x 1,,x ;θ) = L(x i ;θ) du modèle (H,{Q θ } θ Θ ). Si ˆθ est cosistat, alors il est asymptotiquemet ormal, de vitesse et de variace asymptotique I(θ) 1 : ( ˆθ θ ) L /Q θ N(0,I(θ) 1 ), θ Θ. Remarque Si les coditios de régularité du modèle e sot certaiemet pas optimales pour garatir u tel résultat, il e reste pas mois qu il est écessaire d imposer ue certaie régularité. Cosidéros e effet le cas du modèle (R +,{U ([0,θ]) } θ>0 ). Sa vraisemblace L s écrit pour θ > 0 : { θ si 0 x L (x 1,,x ;θ) = 1,,x θ; 0 sio. L EMV calculé à partir d u échatillo (X 1,,X ) de loi U ([0,θ]) est doc ˆθ = max 1 i X i. Calculos maiteat sa vitesse de covergece. E adoptat la otatio P θ = U ([0,θ]), o a pour chaque 0 < t < θ : ( ( P θ θ ˆθ ) t ) ( = 1 P θ max X i < θ t ) 1 i ( = 1 1 t ). θ
40 40 CHAPITRE 3. VRAISEMBLANCE Comme la limite est 1 exp( t/θ) dès que t > 0, o a doc motré que ( θ ˆθ ) L /P θ E (1/θ). Aisi, das cet exemple de modèle o régulier, i la vitesse de l EMV, i la loi limite, e correspodet à celles du théorème. Preuve O fixe θ Θ et o pose P θ = Q θ. Das la suite, (X 1,,X ) est u échatillo de loi P θ. Pour chaque α Θ, o ote : L (α) = ll (X 1,,X ;α) = ll(x i ;α). Comme ˆθ maximise L, u développemet de Taylor avec reste itégral ous doe : ( 1 0 = L ( ˆθ) = L (θ) + 2 ( L θ +t( ˆθ θ) ) ) dt ( ˆθ θ). (3.4.1) 0 Nous examios séparémet chacu des termes qui itervieet das cette relatio. Rappelos que, puisque le modèle est régulier, E θ ll(.;θ) = 0. Par ailleurs, var θ ( ll(.;θ)) = I(θ). Doc, d après le théorème de la limite cetrale : 1 L (θ) = 1 ll(x i ;θ) L /P θ N(0,I(θ)). (3.4.2) Motros maiteat que : L ( θ +t( ˆθ θ) ) dt Notos, pour chaque x H et r > 0 : σ(x,r) = P θ I(θ) sup 2 ll(x;α) 2 ll(x;θ). α θ r Or, σ(.,r) L 1 (P θ ) pour r assez petit et de plus, ll(x;.) C 2 pour chaque x H. Fixos ε > 0. D après le théorème de Lebesgue, il existe r > 0 tel que E θ σ(.,r) < ε/2. Par ailleurs, comme L ( θ +t( ˆθ θ) ) dt = ll ( X i ;θ +t( ˆθ θ) ) dt,
Chapitre 3 : Fonctions d une variable réelle (1)
Uiversités Paris 6 et Paris 7 M1 MEEF Aalyse (UE 3) 2013-2014 Chapitre 3 : Foctios d ue variable réelle (1) 1 Lagage topologique das R Défiitio 1 Soit a u poit de R. U esemble V R est u voisiage de a s
Plus en détail. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1
Premières propriétés des ombres réels 2 Suites umériques 3 Suites mootoes : à faire 4 Séries umériques 4. Notio de série. Défiitio 4.. Soit (u ) ue suite de ombres réels ou complexes. Pour N N, o ote S
Plus en détailSTATISTIQUE : TESTS D HYPOTHESES
STATISTIQUE : TESTS D HYPOTHESES Préparatio à l Agrégatio Bordeaux Aée 203-204 Jea-Jacques Ruch Table des Matières Chapitre I. Gééralités sur les tests 5. Itroductio 5 2. Pricipe des tests 6 2.a. Méthodologie
Plus en détail1 Mesure et intégrale
1 Mesure et itégrale 1.1 Tribu boréliee et foctios mesurables Soit =[a, b] u itervalle (le cas où b = ou a = est pas exclu) et F ue famille de sous-esembles de. OditqueF est ue tribu sur si les coditios
Plus en détailIntégration et probabilités ENS Paris, 2012-2013. TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :
Itégratio et probabilités EN Paris, 202-203 TD 203 Lois des grads ombres, théorème cetral limite. Corrigé Lois des grads ombres Exercice. Calculer e cet leços Détermier les limites suivates : x +... +
Plus en détail[http://mp.cpgedupuydelome.fr] édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ 02475 ] [correction] Si n est un entier 2, le rationnel H n =
[http://mp.cpgedupuydelome.fr] édité le 1 juillet 14 Eocés 1 Nombres réels Ratioels et irratioels Exercice 1 [ 9 ] [correctio] Motrer que la somme d u ombre ratioel et d u ombre irratioel est u ombre irratioel.
Plus en détailCHAPITRE 2 SÉRIES ENTIÈRES
CHAPITRE 2 SÉRIES ENTIÈRES 2. Séries etières Défiitio 2.. O appelle série etière toute série de foctios ( ) f dot le terme gééral est de la forme f ()=a, où (a ) désige ue suite réelle ou complee et R.
Plus en détailEtude de la fonction ζ de Riemann
Etude de la foctio ζ de Riema ) Défiitio Pour x réel doé, la série de terme gééral,, coverge si et seulemet si x >. x La foctio zeta de Riema est la foctio défiie sur ], [ par : ( x > ), = x. Remarque.
Plus en détailProcessus et martingales en temps continu
Chapitre 3 Processus et martigales e temps cotiu 1 Quelques rappels sur les martigales e temps discret (voir [4]) O cosidère u espace filtré (Ω, F, (F ) 0, IP). O ote F = 0 F. Défiitio 1.1 Ue suite de
Plus en détailCours 5 : ESTIMATION PONCTUELLE
Cours 5 : ESTIMATION PONCTUELLE A- Gééralités B- Précisio d u estimateur C- Exhaustivité D- iformatio E-estimateur sas biais de variace miimale, estimateur efficace F- Quelques méthode s d estimatio A-
Plus en détail* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable
Exo7 Topologie Exercices de Jea-Louis Rouget Retrouver aussi cette fiche sur wwwmaths-fracefr * très facile ** facile *** difficulté moyee **** difficile ***** très difficile I : Icotourable Exercice **
Plus en détailSéries réelles ou complexes
6 Séries réelles ou complexes Comme pour le chapitre 3, les suites cosidérées sot a priori complexes et les résultats classiques sur les foctios cotiues ou dérivables d ue variable réelle sot supposés
Plus en détailCours de Statistiques inférentielles
Licece 2-S4 SI-MASS Aée 2015 Cours de Statistiques iféretielles Pierre DUSART 2 Chapitre 1 Lois statistiques 1.1 Itroductio Nous allos voir que si ue variable aléatoire suit ue certaie loi, alors ses réalisatios
Plus en détail14 Chapitre 14. Théorème du point fixe
Chapitre 14 Chapitre 14. Théorème du poit fixe Si l o examie de plus près les méthodes de Lagrage et de Newto, étudiées au chapitre précédet, elles revieet das leur pricipe à remplacer la résolutio de
Plus en détailLimites des Suites numériques
Chapitre 2 Limites des Suites umériques Termiale S Ce que dit le programme : CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES Limite fiie ou ifiie d ue suite. Limites et comparaiso. Opératios sur les ites. Comportemet
Plus en détailStatistique descriptive bidimensionnelle
1 Statistique descriptive bidimesioelle Statistique descriptive bidimesioelle Résumé Liaisos etre variables quatitatives (corrélatio et uages de poits), qualitatives (cotigece, mosaïque) et de types différets
Plus en détailSéquence 5. La fonction logarithme népérien. Sommaire
Séquece 5 La foctio logarithme épérie Objectifs de la séquece Itroduire ue ouvelle foctio : la foctio logarithme épérie. Coaître les propriétés de cette foctio : sa dérivée, ses variatios, sa courbe, sa
Plus en détailSTATISTIQUE AVANCÉE : MÉTHODES
STATISTIQUE AVANCÉE : MÉTHODES NON-PAAMÉTIQUES Ecole Cetrale de Paris Arak S. DALALYAN Table des matières 1 Itroductio 5 2 Modèle de desité 7 2.1 Estimatio par istogrammes............................
Plus en détailStatistique Numérique et Analyse des Données
Statistique Numérique et Aalyse des Doées Arak DALALYAN Septembre 2011 Table des matières 1 Élémets de statistique descriptive 9 1.1 Répartitio d ue série umérique uidimesioelle.............. 9 1.2 Statistiques
Plus en détail4 Approximation des fonctions
4 Approximatio des foctios Ue foctio f arbitraire défiie sur u itervalle I et à valeur das IR peut être représetée par so graphe, ou de maière équivalete par la doée de l esemble de ses valeurs f(t) pour
Plus en détailx +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.
EXERCICE 3 (6 poits ) (Commu à tous les cadidats) Il est possible de traiter la partie C sas avoir traité la partie B Partie A O désige par f la foctio défiie sur l itervalle [, + [ par Détermier la limite
Plus en détail* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable
Eo7 Séries etières Eercices de Jea-Louis Rouget Retrouver aussi cette fiche sur wwwmaths-fracefr * très facile ** facile *** difficulté moyee **** difficile ***** très difficile I : Icotourable Eercice
Plus en détailSuites et séries de fonctions
[http://mp.cpgedupuydelome.fr] édité le 3 avril 5 Eocés Suites et séries de foctios Propriétés de la limite d ue suite de foctios Eercice [ 868 ] [correctio] Etablir que la limite simple d ue suite de
Plus en détailExercice I ( non spé ) 1/ u 1 = 3 4. 2 3 u 2 4 + 3 9. 19 4 2/ Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1
Bac blac TS Correctio Exercice I ( Spé ) / émotros par récurrece que 5x y = pour tout etier aturel 5x y = 5 8 = La propriété est doc vraie au rag = Supposos que la propriété est vraie jusqu au rag, o a
Plus en détailConvergences 2/2 - le théorème du point fixe - Page 1 sur 9
Au sommaire : Suites extraites Le théorème de Bolzao-Weierstrass La preuve du théorème de Bolzao-Weierstrass3 Foctio K-cotractate4 Le théorème du poit fixe5 La preuve du théorème du poit fixe6 Utilisatios
Plus en détailFEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI
FEUILLE D EXERCICES 7 - PROBABILITÉS SUR UN UNIVERS FINI Exercice - Lacer de dés O lace deux dés à 6 faces équilibrés. Calculer la probabilité d obteir : u double ; ue somme des deux dés égale à 8 ; ue
Plus en détailExo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X
Exo7 Détermiats Exercices de Jea-Louis Rouget Retrouver aussi cette fiche sur wwwmaths-fracefr * très facile ** facile *** difficulté moyee **** difficile ***** très difficile I : Icotourable T : pour
Plus en détailII LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009
M LA REGRESSION : HYPOTHESES ET TESTS Avril 009 I LES HYPOTHESES DE LA MCO. Hypothèses sur la variable explicative a. est o stochastique. b. a des valeurs xes das les différets échatillos. c. Quad ted
Plus en détailProbabilités et statistique pour le CAPES
Probabilités et statistique pour le CAPES Béatrice de Tilière Frédérique Petit 2 3 jui 205. Uiversité Pierre et Marie Curie 2. Uiversité Pierre et Marie Curie 2 Table des matières Modélisatio de phéomèes
Plus en détailDénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre 2010. 1.1 Quelques dénitions
Déombremet ECE3 Lycée Carot 12 ovembre 2010 Itroductio La combiatoire, sciece du déombremet, sert comme so om l'idique à compter. Il e s'agit bie etedu pas de reveir au stade du CP et d'appredre à compter
Plus en détailPrincipes et Méthodes Statistiques
Esimag - 2ème aée 0 1 2 3 4 5 6 7 0 5 10 15 x y Pricipes et Méthodes Statistiques Notes de cours Olivier Gaudoi 2 Table des matières 1 Itroductio 7 1.1 Défiitio et domaies d applicatio de la statistique............
Plus en détailProcessus géométrique généralisé et applications en fiabilité
Processus géométrique gééralisé et applicatios e fiabilité Lauret Bordes 1 & Sophie Mercier 2 1,2 Uiversité de Pau et des Pays de l Adour Laboratoire de Mathématiques et de leurs Applicatios - Pau UMR
Plus en détailLes Nombres Parfaits.
Les Nombres Parfaits. Agathe CAGE, Matthieu CABAUSSEL, David LABROUSSE (2 de Lycée MONTAIGNE BORDEAUX) et Alexadre DEVERT, Pierre Damie DESSARPS (TS Lycée SUD MEDOC LETAILLAN MEDOC) La première partie
Plus en détailSÉRIES STATISTIQUES À DEUX VARIABLES
1 ) POSITION DU PROBLÈME - VOCABULAIRE A ) DÉFINITION SÉRIES STATISTIQUES À DEUX VARIABLES O cosidère deux variables statistiques umériques x et y observées sur ue même populatio de idividus. O ote x 1
Plus en détailComportement d'une suite
Comportemet d'ue suite I) Approche de "ses de variatio et de ite d'ue suite" : 7 Soit la suite ( ) telle que = 5 ( + ) 2 Représetos graphiquemet la suite das u pla mui d' u repère. Il suffit de placer
Plus en détailUniversité de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent http://www.math.u-bordeaux.fr/ machaven/ 2014-2015
Uiversité de Bordeaux - Master MIMSE - 2ème aée Scorig Marie Chavet http://www.math.u-bordeaux.fr/ machave/ 2014-2015 1 Itroductio L idée géérale est d affecter ue ote (u score) global à u idividu à partir
Plus en détail20. Algorithmique & Mathématiques
L'éditeur L'éditeur permet à l'utilisateur de saisir les liges de codes d'u programme ou de défiir des foctios. Remarque : O peut saisir directemet des istructios das la cosole Scilab, mais il est plus
Plus en détailTRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )
RAIRO Operatios Research RAIRO Oper. Res. 34 (2000) 99-129 TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 ) Commuiqué par Berard LEMAIRE Résumé. L étude
Plus en détailChapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.
Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES PLAN DU CHAPITRE 2 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.1 Pla de sodage 2.2.2 Probabilités d iclusio 2.3 SONDAGE
Plus en détailIntroduction : Mesures et espaces de probabilités
Itroductio : Mesures et espaces de probabilités Référeces : Poly cédric Berardi et Jea Michel Morel. J.-F. Le Gall, Itégratio, Probabilités et Processus Aléatoire J.-Y. Ouvrard, Probabilités 2, maîtrise-agrégatio,
Plus en détailPROMENADE ALÉATOIRE : Chaînes de Markov et martingales
PROMENADE ALÉATOIRE : Chaîes de Markov et martigales Thierry Bodieau École Polytechique Paris Départemet de Mathématiques Appliquées thierry.bodieau@polytechique.edu Novembre 2013 2 Table des matières
Plus en détailLES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.
Qu appelle-t-o éclipse? Éclipser sigifie «cacher». Vus depuis la Terre, deu corps célestes peuvet être éclipsés : la Lue et le Soleil. LES ÉCLIPSES Pour qu il ait éclipse, les cetres de la Terre, de la
Plus en détailGroupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3
1 Groupe orthogoal d'u espace vectoriel euclidie de dimesio, de dimesio Voir le chapitre 19 pour l'étude des espaces euclidies et des isométries. État doé u espace euclidie E de dimesio 1, o rappelle que
Plus en détailDénombrement. Chapitre 1. 1.1 Enoncés des exercices
Chapitre 1 Déombremet 1.1 Eocés des exercices Exercice 1 L acie système d immatriculatio fraçais était le suivat : chaque plaque avait 4 chiffres, suivis de 2 lettres, puis des 2 uméros du départemet.
Plus en détailUNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire 2006-2007. Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4
UNVERSTE MONTESQUEU BORDEAUX V Licece 3 ère aée Ecoomie - Gestio Aée uiversitaire 2006-2007 Semestre 2 Prévisios Fiacières Travaux Dirigés - Séaces 4 «Les Critères Complémetaires des Choix d vestissemet»
Plus en détailEXERCICES : DÉNOMBREMENT
Chapitre 7 ECE 1 - Grad Nouméa - 015 EXERCICES : DÉNOMBREMENT LISTES / ARRANGEMENTS Exercice 1 : Le code ativol Pour so vélo, Toto possède u ativol a code. Le code est ue successio de trois chiffres compris
Plus en détailDeuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES
DEUXIEME PARTIE Deuième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES Chapitre. L assurace de capital différé Chapitre 2. Les opératios de retes Chapitre 3. Les assuraces décès Chapitre 4. Les assuraces
Plus en détailExercices de mathématiques
MP MP* Thierry DugarDi Marc rezzouk Exercices de mathématiques Cetrale-Supélec, Mies-Pots, École Polytechique et ENS Coceptio et créatio de couverture : Atelier 3+ Duod, 205 5 rue Laromiguière, 75005 Paris
Plus en détailUniversité Pierre et Marie Curie. Biostatistique PACES - UE4 2013-2014
Uiversité Pierre et Marie Curie Biostatistique PACES - UE4 2013-2014 Resposables : F. Carrat et A. Mallet Auteurs : F. Carrat, A. Mallet, V. Morice Mise à jour : 21 octobre 2013 Relecture : V. Morice,
Plus en détail55 - EXEMPLES D UTILISATION DU TABLEUR.
55 - EXEMPLES D UTILISATION DU TABLEUR. CHANTAL MENINI 1. U pla possible Les exemples qui vot suivre sot des pistes possibles et e aucu cas ue présetatio exhaustive. De même je ai pas fait ue étude systématique
Plus en détailUNIVERSITÉ DE SFAX École Supérieure de Commerce
UNIVERSITÉ DE SFAX École Supérieure de Commerce Aée Uiversitaire 2003 / 2004 Auditoire : Troisième Aée Études Supérieures Commerciales & Scieces Comptables DÉCISIONS FINANCIÈRES Note de cours N 3 Première
Plus en détailDes résultats d irrationalité pour deux fonctions particulières
Collect. Math. 5, 00, 0 c 00 Uiversitat de Barceloa Des résultats d irratioalité pour deux foctios particulières Richard Choulet 7, Rue du 4 Août, 40 Aveay, Frace E-mail: richardchoulet@waadoo.fr Received
Plus en détailUniversité Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME
Uiversité Victor Segale Bordeaux Istitut de Saté Publique, d Épidémiologie et de Développemet (ISPED) Campus Numérique SEME MODULE Pricipaux outils e statistique Versio du 8 août 008 Écrit par : Relu par
Plus en détailPolynésie Septembre 2002 - Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.
Polyésie Septembre 2 - Exercice O peut traiter la questio 4 sas avoir traité les questios précédetes Pour u achat immobilier, lorsqu ue persoe emprute ue somme de 50 000 euros, remboursable par mesualités
Plus en détailStatistiques appliquées à la gestion Cours d analyse de donnés Master 1
Aalyse des doées Statistiques appliquées à la gestio Cours d aalyse de doés Master F. SEYTE : Maître de coféreces HDR e scieces écoomiques Uiversité de Motpellier I M. TERRAZA : Professeur de scieces écoomiques
Plus en détailChaînes de Markov. Arthur Charpentier
Chaîes de Markov Arthur Charpetier École Natioale de la Statistique et d Aalyse de l Iformatio - otes de cours à usage exclusif des étudiats de l ENSAI - - e pas diffuser, e pas citer - Quelques motivatios.
Plus en détailChapitre 3 : Transistor bipolaire à jonction
Chapitre 3 : Trasistor bipolaire à joctio ELEN075 : Electroique Aalogique ELEN075 : Electroique Aalogique / Trasistor bipolaire U aperçu du chapitre 1. Itroductio 2. Trasistor p e mode actif ormal 3. Courats
Plus en détailChap. 5 : Les intérêts (Les calculs financiers)
Chap. 5 : Les itérêts (Les calculs fiaciers) Das u cotrat de prêt, le prêteur met à la dispositio de l empruteur, à u taux d itérêt doé, ue somme d arget (le capital) qu il devra rembourser à ue certaie
Plus en détail2 ième partie : MATHÉMATIQUES FINANCIÈRES
2 ième partie : MATHÉMATIQUES FINANCIÈRES 1. Défiitios L'itérêt est l'idemité que doe au propriétaire d'ue somme d'arget celui qui e a joui pedat u certai temps. Divers élémets itervieet das le calcul
Plus en détailc. Calcul pour une évolution d une proportion entre deux années non consécutives
Calcul des itervalles de cofiace our les EPCV 996-004 - Cas d u ourcetage ou d ue évolutio e oit das la oulatio totale des méages - Cas d u ourcetage ou d ue évolutio das ue sous oulatio das les méages
Plus en détailFormation d un ester à partir d un acide et d un alcool
CHAPITRE 10 RÉACTINS D ESTÉRIFICATIN ET D HYDRLYSE 1 Formatio d u ester à partir d u acide et d u alcool 1. Nomeclature Acide : R C H Alcool : R H Groupe caractéristique ester : C Formule géérale d u ester
Plus en détailUV SQ 20. Automne 2006. Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1
UV SQ 0 Probabilités Statistiques UV SQ 0 Autome 006 Resposable d Rémy Garadel ( m.-el. remy.garadel@utbm.fr ) page SQ-0 Probabilités - Statistiques Bibliographie: Titre Auteur(s) Editios Localisatio Niveau
Plus en détailModule 3 : Inversion de matrices
Math Stat Module : Iversio de matrices M Module : Iversio de matrices Uité. Défiitio O e défiira l iverse d ue matrice que si est carrée. O appelle iverse de la matrice carrée toute matrice B telle que
Plus en détailLa fibre optique arrive chez vous Devenez acteur de la révolution numérique
2 e éditio Edité par l Autorité de régulatio des commuicatios électroiques et des postes RÉPUBLIQUE FRANÇAISE DÉCEMBRE 2010 La fibre optique arrive chez vous Deveez acteur de la révolutio umérique Petit
Plus en détailTempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation
Tempêtes : Etude des dépedaces etre les braches Automobile et Icedie à l aide de la théorie des copulas Topic Risk evaluatio Belguise Olivier Charles Levi ACM Guy Carpeter 34 rue du Wacke 47/53 rue Raspail
Plus en détailBaccalauréat S Asie 19 juin 2014 Corrigé
Bcclurét S Asie 9 jui 24 Corrigé A. P. M. E. P. Exercice Commu à tous les cdidts 4 poits Questio - c. O peut élimier rpidemet les réposes. et d. cr les vecteurs directeurs des droites proposées e sot ps
Plus en détailÉchantillonnage et estimation
Stage «Nouveaux programmes de Termiale S» - Ho Chi Mih-Ville Novembre 202 Échatilloage et estimatio Partie C - Frédéric Barôme page Échatilloage et estimatio Partie C : Capacités et exercices-types. Rappelos
Plus en détailLa tarification hospitalière : de l enveloppe globale à la concurrence par comparaison
ANNALES D ÉCONOMIE ET DE STATISTIQUE. N 58 2000 La tarificatio hospitalière : de l eveloppe globale à la cocurrece par comparaiso Michel MOUGEOT * RÉSUMÉ. Cet article cosidère différetes politiques de
Plus en détailExamen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot
Exame fial pour Coseiller fiacier / coseillère fiacière avec brevet fédéral Recueil de formules Auteur: Iwa Brot Ce recueil de formules sera mis à dispositio des cadidats, si écessaire. Etat au 1er mars
Plus en détailInitiation à l analyse factorielle des correspondances
Fiche TD avec le logiciel : tdr620b Iitiatio à l aalyse factorielle des correspodaces A.B. Dufour & M. Royer & J.R. Lobry Das cette fiche, o étudie l Aalyse Factorielle des Correspodaces. Cette techique
Plus en détailChap. 6 : Les principaux crédits de trésorerie et leur comptabilisation
1 / 9 Chap. 6 : Les pricipaux crédits de trésorerie et leur comptabilisatio Le cycle d exploitatio des etreprises (achats stockage productio stockage vetes) peut etraîer des décalages de trésorerie plus
Plus en détailContribution à la théorie des entiers friables
UFR STMIA École Doctorale IAE + M Uiversité Heri Poicaré - Nacy I DFD Mathématiques THÈSE présetée pour l obtetio du titre de Docteur de l Uiversité Heri Poicaré, Nacy-I e Mathématiques par Bruo MARTIN
Plus en détailChap. 6 : Les principaux crédits de trésorerie et leur comptabilisation
Chap. 6 : Les pricipaux crédits de trésorerie et leur comptabilisatio Les etreprises ot souvet besoi de moyes de fiacemet à court terme : elles ot alors recours aux crédits bacaires (découverts bacaires
Plus en détailUn nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction
A ew adaptive operator of fusio par Fraçois DELMOTTE LAMIH, Uiversité de Valeciees et du Haiaut-Cambrésis, Le Mot Houy, BP 3, 5933 Valeciees CEDEX 9 fdelmott@flore.uiv-valeciees.fr résumé et mots clés
Plus en détailRéseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus
Réseaux d odelettes et réseaux de euroes pour la modélisatio statique et dyamique de processus Yacie Oussar To cite this versio: Yacie Oussar. Réseaux d odelettes et réseaux de euroes pour la modélisatio
Plus en détailLa France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe
1/5 Trois objectifs poursuivis par le gouveremet : > améliorer la compétitivité fiscale de la Frace > péreiser les activités de R&D > faire de la Frace u territoire attractif pour l iovatio Les icitatios
Plus en détailConsolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe
Cosolidatio La société THEOS, qui commercialise des vis, exerce so activité das trois villes : Paris, Nacy et Nice. Le directeur de la société souhaite cosolider les résultats de ses vetes par ville das
Plus en détailEtude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?
Etude Spéciale o. 7 Javier 2003 SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT? MARK SCHNEIDER Le CGAP vous ivite à lui faire part de vos commetaires, de vos rapports et de toute demade d evoid autres
Plus en détail3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.
3 Réseau Le réseau costitue u aspect essetiel d u eviroemet virtuel ESX. Il est doc importat de compredre la techologie, y compris ses différets composats et leur coopératio. Das ce chapitre, ous étudios
Plus en détailMESURE DE L'INFORMATION
MESURE DE L'INFORMATION Marc URO TABLE DES MATIÈRES INTRODUCTION... 3 INCERTITUDE D'UN ÉVÉNEMENT (OU SELF-INFORMATION)... 7 INFORMATION MUTUELLE DE DEUX ÉVÉNEMENTS... 9 ENTROPIE D'UNE VARIABLE ALÉATOIRE
Plus en détailDETERMINANTS. a b et a'
2003 - Gérard Lavau - http://perso.waadoo.fr/lavau/idex.htm Vous avez toute liberté pour télécharger, imprimer, photocopier ce cours et le diffuser gratuitemet. Toute diffusio à titre oéreux ou utilisatio
Plus en détailTests non paramétriques de spécification pour densité conditionnelle : application à des modèles de choix discret
Tests o paramétriques de spécificatio pour desité coditioelle : applicatio à des modèles de choix discret Mémoire Koami Dzigbodi AMEGBLE Maîtrise e écoomique Maître ès arts (M.A.) Québec, Caada Koami Dzigbodi
Plus en détailcapital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...
Applicatios des maths Algèbre fiacière 1. Itérêts composés O place u capital C 0 à u taux auel T a pedat aées. Quelle est la valeur fiale C de ce capital? aée capital e fi d'aée 1 C 0 + T C 0 = C 0 (1
Plus en détailRESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *)
RESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *) *) Uiversité de Blida Faculté des scieces Départemet de Mathématiques. BP 270, Route de Soumaa. Blida, Algérie. Tel &
Plus en détailPOLITIQUE ECONOMIQUE ET DEVELOPPEMENT
POLTQU ONOMQU T DVLOPPMNT TRUTUR DU MAR NATONAL DU AF-AAO T PR AU PRODUTUR MALAN Beïla Beoit osultat PD N 06/008 ellule d Aalyse de Politiques coomiques du R Aée de pulicatio : Avril 009 Résumé e papier
Plus en détailSolutions particulières d une équation différentielle...
Solutios particulières d ue équatio différetielle......du premier ordre à coefficiets costats O cherche ue solutio particulière de y + ay = f, où a est ue costate réelle et f ue foctio, appelée le secod
Plus en détailINTRODUCTION AUX MATRICES ALÉATOIRES. par. Djalil Chafaï
INTRODUCTION AUX MATRICES ALÉATOIRES par Djalil Chafaï Résumé. E cocevat les mathématiques comme u graphe, où chaque sommet est u domaie, la théorie des probabilités et l algèbre liéaire figuret parmi
Plus en détailRenseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers.
Reseigemets et moitorig. Reseigemets commerciaux et de solvabilité sur les etreprises et les particuliers. ENSEMBLE CONTRE LES PERTES. Reseigemets Creditreform. Pour plus de trasparece. Etreteir des rapports
Plus en détailRisque de longévité et détermination du besoin en capital : travaux en cours
Risque de logévité et détermiatio du besoi e capital : travaux e cours Frédéric PLANCHET ISFA Laboratoire SAF Versio.6 / Septembre 2008 Sommaire La prise e compte de l expériece propre au groupe das l
Plus en détailLes algorithmes de tri
CONSERVATOIRE NATIONAL DES ARTS ET METIERS PARIS MEMOIRE POUR L'EXAMEN PROBATOIRE e INFORMATIQUE par Nicolas HERVE Les algorithmes de tri Souteu le mai JURY PRESIDENTE : Mme COSTA Sommaire Itroductio....
Plus en détailGérer les applications
Gérer les applicatios E parcourat les rayos du Widows Phoe Store, vous serez e mesure de compléter les services de base de votre smartphoe à travers plus de 10 000 applicatios. Gratuites ou payates, ces
Plus en détailLorsque la sécurisation des paiements par carte bancaire sur Internet conduit à une concurrence entre les banques et les opérateurs de réseau
Lorsque la sécurisatio des paiemets par carte bacaire sur Iteret coduit à ue cocurrece etre les baques et les opérateurs de réseau David Bouie Das cet article, ous ous iterrogeos sur l issue de la cocurrece
Plus en détail16.1 Convergence simple et convergence uniforme. une suite de fonctions de I dans R ou C.
16 Suites de foctios Suf précisio cotrire, I est u itervlle réel o réduit à u poit et les foctios cosidérées sot défiies sur I à vleurs réelles ou complexes. 16.1 Covergece simple et covergece uiforme
Plus en détailS-PENSION. Constituez-vous un capital retraite complémentaire pour demain tout en bénéficiant d avantages fiscaux dès aujourd hui.
S-PENSION Costituez-vous u capital retraite complémetaire pour demai tout e bééficiat d avatages fiscaux dès aujourd hui. Sommaire 1. Il est temps de predre l iitiative 4 2. Profitez dès aujourd hui des
Plus en détailLes études. Recommandations applicables aux appareils de levage "anciens" dans les ports. Guide Technique
es Cetre d Etudes Techiques Maritimes et Fluviales Les études Recommadatios applicables aux appareils de levage "acies" das les ports Guide Techique PM 03.01 Cetre d Etudes Techiques Maritimes et Fluviales
Plus en détailChapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Plus en détailPROBLEMES DIOPTIMISATION EN NOMBRES ENTIERS J. L. NICOLAS
PROBLEMES DIOPTIMISATION EN NOMBRES ENTIERS ET APPROXIMATIONS DIOPHANTIENNES J. L. NICOLAS Cet article expose sup 3 e quelques iter'f~reces etre les pr'obl~res dloptimisatio e hombres etiers et la th~or-ie
Plus en détailMécanique non linéaire
M MN9 Mécaique o liéaire Zhi-Qiag FENG UFR Sciece et Techologies Uiversité d Evry Val d Essoe TABLES DES MATIERES INTRODUCTION Chapitre : CONCEPTS ELEMENTAIRES. Pricipales propriétés des matériaux. Coaissace
Plus en détailDonnez de la liberté à vos données. BiBOARD. www.biboard.fr
Doez de la liberté à vos doées BiBOARD www.biboard.fr Le décisioel pour tous Le décisioel évolue. L etreprise quelle que soit sa taille, a besoi de piloter so activité à l aide d outils simples, fiables,
Plus en détailLe marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.
II LE MARCHE DU CAFE 1 L attractivité La segmetatio selo le mode de productio Le marché du café peut être segmeté e foctio de deux modes de productio pricipaux : la torréfactio et la fabricatio de café
Plus en détail