STATISTIQUE : ESTIMATION Préparatio à l Agrégatio Bordeaux Aée 202-203 Jea-Jacques Ruch
Table des Matières Chapitre I. Estimatio poctuelle 5. Défiitios 5 2. Critères de comparaiso d estimateurs 6 3. Exemples fodametaux 6 3.a. Estimatio de m 6 3.b. Estimatio de σ 2 e supposat m cou 7 3.c. Estimatio de σ 2 lorsque m est icou 7 4. Cas particulier de la loi ormale 8 5. Costructio d estimateur par la méthode du maximum de vraisemblace 5.a. Cas discret 5.b. Cas à desité 2 Chapitre II. Estimatio par itervalle 3. Défiitio d ue régio de cofiace 3 2. Costructio de régios de cofiace 3 3. Exemples classiques d estimatio par itervalle 5 3.a. Estimatio de la moyee quad la variace est coue 5 3.b. Estimatio de la moyee quad la variace est icoue 5 3.c. Estimatio de la variace quad la moyee est coue 6 3.d. Estimatio de la variace quad la moyee est icoue 8 4. Comparaiso de moyees et de variaces 8 4.a. Itervalle de cofiace de la différece de deux moyee 8 4.b. Itervalle de cofiace du rapport de deux variaces 20 5. Estimatio d ue proportio 20 5.a. Estimatio poctuelle 2 5.b. Estimatio par itervalle 2 5.c. Méthode du Bootstrap 22
CHAPITRE I Estimatio poctuelle E statistique, comme das la théorie des probabilités le hasard iterviet fortemet. Mais das la théorie des probabilités, o suppose la loi coue précisémet et o cherche à doer les caractéristiques de la variable qui suit cette loi. L objectif de la statistique est le cotraire : à partir de la coaissace de la variable, que peut-o dire de la loi de cette variable?. Défiitios Soit X ue variable aléatoire dot la desité de probabilité fx, θ) déped d u paramètre θ apparteat à I R. A l aide d u échatillo issu de X, il s agit de détermier au mieux la vraie valeur θ 0 de θ. O pourra utiliser deux méthodes : - estimatio poctuelle : o calcule ue valeur vraisemblable ˆθ de θ 0 - estimatio par itervalle : o cherche u itervalle das lequel θ 0 se trouve avec ue probabilité élevée. Défiitio. U -échatillo de X est u -uplet X, X 2,..., X ) tel que les X k ot la même loi que X et sot idépedates. Ue réalisatio de l échatillo est alors u -uplet x, x 2,..., x ) de valeurs prises par l échatillo. Défiitio 2. Ue statistique de l échatillo est ue variable aléatoire ϕx, X 2,..., X ) où ϕ est ue applicatio de R das R. U estimateur T de θ est ue statistique à valeurs das I. Ue estimatio est la valeur de l estimateur correspodat à ue réalisatio de l échatillo. Exemple : X = X k est u estimateur de l espérace mathématique. Défiitio 3. Le biais de l estimateur T de θ est E[T ] θ 0. S il est ul, o dit que T est u estimateur sas biais. L estimateur T est asymptotiquemet sas biais si lim E[T ] = θ 0. O ote souvet le biais b θ T ). Défiitio 4. L estimateur est dit coverget si la suite T ) coverge e probabilité vers θ 0 : ε > 0, P T θ 0 > ε) 0. + O parle d estimateur fortemet coverget lorsqu o a covergece presque sûre. D après Bieaymé-Tchebychev pour qu u estimateur asymptotiquemet sas biais soit coverget il suffit que VarT ) 0. +
6 Chapitre I. Estimatio poctuelle 2. Critères de comparaiso d estimateurs U bo critère de comparaiso est le risque quadratique. Défiitio 5. Soiet T u estimateur de θ. Le risque quadratique est défii par RT, θ) = E[T θ) 2 ] O peut alors comparer deux estimateurs. Défiitio 6. O dit que T est u meilleur estimateur que T 2 si θ I, RT, θ) RT 2, θ) et θ I, RT, θ) < RT 2, θ). U estimateur est dit admissible s il existe pas d estimateur meilleur. L erreur quadratique moyee de T se décompose e deux termes, le carré du biais et la variace de T : E[T θ) 2 ] = b 2 θt ) + VarT ). Cette décompositio permet de se rameer à ue discussio sur la variace pour les estimateurs sas biais de θ. Défiitio 7. Soiet T et T 2 deux estimateurs sas biais de θ. O dit que T est u plus efficace que T 2 si θ I, VarT ) VarT 2 ) et θ I, VarT ) < VarT 2 ). O parle d estimateur à variace miimale si seul le premier poit est vérifié, c est-à-dire : VarT ) VarT 2 ). 3. Exemples fodametaux Soit X ue variable aléatoire telle que E[X] = m et VarX) = σ 2. 3.a. Estimatio de m. Théorème 8. La moyee empirique X = X k est u estimateur sas biais et coverget de m. O a E[X ] = E[X k ] = m et VarX ) = 2 Var[X k ] = σ2 D après la loi forte des grads ombres X est même fortememet coverget. Il est possible de détermier la loi asymptotique de la moyee empirique. 0. +
3. Exemples fodametaux 7 Propositio 9. Si est assez grad o peut utiliser l approximatio ormale lorsque X admet u momet d ordre 2) X L N m, σ 2 /). C est ue coséquece du TCL qui ous assure que L X m) N 0, + σ2 ). 3.b. Estimatio de σ 2 e supposat m cou. Théorème 0. Lorsque m est cou S 2 = est u estimateur sas biais et coverget de σ 2. X k m) 2 O a E[S 2 ] = E [ ] X k m) 2 = Par ailleurs, les variables X k m) 2 état idépedates : VarS 2 ) = 2 avec µ k = EX m) k ). VarX k m) 2 ) = VarX k ) = σ 2 E[X m) 4 ] E[X m) 2 ] 2) = µ4 σ 4) Doc S 2 est u estimateur coverget. La loi forte des grads ombres appliquée aux variables X k m) 2 etraîe même la covergece presque sûre vers σ 2. Comme das le cas de la moyee empirique le TCL ous permet de détermier la loi asymptotique de S 2 ; o a lorsque est assez grad : S 2 L N σ 2, µ 4 σ 4 )/). 3.c. Estimatio de σ 2 lorsque m est icou. E gééral o e coaît pas m ; o le remplace par u estimateur et o itroduit la variace empirique associée : S 2 = X k X ) 2. Théorème. La variace empirique S 2 est u estimateur biaisé et coverget de σ 2. Il est asymptotiquemet sas biais. O a E[S 2 ] = EX 2 k) E[X 2 ] = m2 + σ 2 )) m 2 + σ2 ) = σ2.
8 Chapitre I. Estimatio poctuelle D autre part, o peut motrer que : VarS) 2 = µ4 σ 4) 2 µ4 2 2σ 4) + µ4 3 3σ 4) 0 avec µ k = EX m) k ). L estimateur est doc coverget. Le résultat précédet et le lemme de Slutsky Probabilité 2, Jea-Yves Ouvrard, p. 347) permet de détermier la loi asymptotique de S 2 : S 2 L N σ 2, µ 4 σ 4 )/). Théorème 2. La variace empirique corrigée Ŝ 2 = est u estimateur sas biais et coverget de σ 2. X k X ) 2. Cela se motre facilemet e remarquat que Ŝ 2 = S2. 4. Cas particulier de la loi ormale O suppose das ce paragraphe que X suit la loi ormale N m, σ 2 ). O sait que X = X k suit alors la loi ormale N m, σ 2 /), ce qui cofime que c est u estimateur sas biais, coverget de m. Les résultats obteus au paragraphe précédet pour l estimatio de σ 2 sot ecore valables ; e particulier o a : ES) 2 = σ 2 et VarS) 2 2 ) = 2 σ 4 E effet, calculos µ k µ k = EX m) k ) = + ) x m) k x m)2 exp dx 2πσ 2σ = + 2σu) k exp u 2 ) 2σdu e posat x = m 2σu 2πσ = 0 si k est impair. Lorsque k = 2p est pair o obtiet et doc µ 2p = 2p σ 2p + u 2p exp u 2 )du = 2p+ σ 2p + u 2p exp u 2 )du π π = 2p σ 2p + v p /2 exp v)dv π 0 = 2p σ 2p π Γp + /2) = 2p)! 2 p p!) σ2p VarS 2 ) = 0 e posat u = v µ4 σ 4) 2 2 µ4 2σ 4) + 3 µ4 3σ 4) = 2 ) 2 σ 4
4. Cas particulier de la loi ormale 9 Défiitio 3. Soiet X,..., X, variables aléatoires idépedates idetiquemet distribuées de loi N 0, ). La loi du χ 2 à degrés de liberté est la loi de la variable aléatoire χ 2 = Xk. 2 La desité de cette loi est doée par : u ) /2 f χ 2 u) = exp u ) u>0 2Γ/2) 2 2 et sa foctio caractéristique par φ χ 2 t) = 2it) /2 f χ 2 k Pour détermier la desité o peut remarquer que : si U suit ue loi N 0, ) alors o a pour t > 0 PU 2 t) = P t U t) = F U t) F U t) et par coséquet f U 2t) = 2 t f U t) + 2 t f U t) = f U t) = exp t ) t 2πt 2 Esuite o obtiet le résultat gééral par récurece. Théorème 4. Soit X,..., X ) u échatillo de le loi N 0, ). Les variables aléatoires X et X k X ) 2 = S 2 = )Ŝ2 sot idépedates et suivet respectivemet la loi ormale réduite et la loi du χ 2 à ) degrés de liberté.
0 Chapitre I. Estimatio poctuelle Démostratio. Motros que X et Le vecteur aléatoire X X X. X X X. X Par coséquet, le vecteur N 0, AA t ). Or = A X. X X k X ) 2 sot idépedates. O a où A =............ est gaussie de loi N 0, I ) où I est la matrice idetité d ordre. X X X. X X = A X. X est égalemet gaussie de loi N 0, AI A t ) = 0 0 0 0 AA t = 0............ 0 X X doc la variable X est idépedate du vecteur. et doc de X k X ) 2. X X Comme X suit la loi N 0, /) o e déduit que X suit la loi N 0, ). Motros S 2 = X k X ) 2 suit la loi du χ 2 à ) degrés de liberté. O a X X. X X = B X. X où B =............ Comme B est ue matrice symétrique, il existe ue matrice orthogoale U et ue matrice diagoale D telle que B = UDU t Or les valeurs propres de B sot : - la valeur propre simple 0 dot le sous-espace propre associé a pour équatio x = = x ; - la valeur propre d ordre ) égale à dot le sous-espace propre associé a pour équatio x + x 2 + + x = 0 E ordoat coveablemet la base de vecteurs propres o peut choisir 0 0. D = 0.......... 0 0 0 0
5. Costructio d estimateur par la méthode du maximum de vraisemblace O a Y = BX = UDU t X et X k X ) 2 = Y t Y = X t UDU t UDU t X = U t X) t DU t X) Or le vecteur aléatoire Z = U t X est gaussie de loi N 0, U t I U) = N 0, U t U) = N 0, I ). D où qui suit la loi du χ 2 à ) degrés de liberté. X k X ) 2 = Z t DZ = Z 2 i O e déduit immédiatemet que si X,..., X ) est u échatillo d ue variable aléatoire N m, σ 2 ) la variable aléatoire σ 2 X k X ) 2 suit la loi du χ 2 à ) degrés de liberté. Il suffit de poser Y k = X k m/σ. Alors, comme o a Y = X m et σ σ 2 X k X ) 2 = le résultat découle de ce qui précède. Y k Y ) 2 5. Costructio d estimateur par la méthode du maximum de vraisemblace 5.a. Cas discret. O suppose doée ue observatio X tirée selo ue loi P θ, θ Θ. O supposera ici que P θ est discrète et o pose : f θ x) = P θ X = x). O appelle alors foctio de vraisemblace la foctio L X θ) = f θ X). Quad o dispose d u échatillo X,..., X ) de loi P θ, la vraisemblace s écrit alors L X,...,X θ) = f θ X i ). Lorsque la foctio de vraisemblace admet u uique maximum atteit e ˆθ = g X,..., X ), o peut utiliser cette valeur pour estimer θ. O dit alors que i= T = g X,..., X ) est l estimateur par maximum de vraisemblace de θ. Cet estimateur est aturel puisqu il coduit à privilégier la valeur de θ la "plus probable" au vu de l observatio. Il possède e gééral de boes propriétés. L icovéiet est que ce maximum peut e pas exister ou e pas être uique et il peut être difficile à exhiber. E pratique, la recherche de ce maximum se fait par dérivatio de L relativemet à θ. O peut de maière équivalete maximiser le logarithme de la vraisemblace la foctio logarithme état croissate, maximiser la vraisemblace et la log-vraisemblace reviet au même, mais souvet les calculs sot plus simples). Exemple : Estimatio du paramètre d ue loi de Beroulli. Ici o suppose Θ =]0, [ et les X i suivet ue loi de Beroulli de paramètre θ Θ. O a θ si x = f θ x) = P θ X = x) = θ si x = 0 0 sio
2 Chapitre I. Estimatio poctuelle Posos S = X + + X. Aisi S est le ombre de das l échatillo et S le ombre de 0. La vraisemblace et la log-vraisemblace s écrivet alors : L X,...,X θ) = θ S θ) S U calcul motre alors que le maximum est atteit e ˆθ = S. Par coséquet l estimateur de θ par maximum de vraisemblace est T = X i. qui est égalemet l estimateur de la moyee. ll X,...,X θ) = S lθ + S )l θ). 5.b. Cas à desité. O suppose doée ue observatio X tirée selo ue loi P θ, θ Θ. O supposera ici que P θ admet ue desité par rapport à la mesure de Lebesgue otée f θ. O appelle alors foctio de vraisemblace la foctio L X θ) = f θ X). Quad o dispose d u échatillo X,..., X ) o a la vraisemblace L X,...,X θ) = f θ X i ). Esuite, o procède comme das le cas discret. Exemple : s écrit : i= i= O cherche à estimer le paramètre θ icou d ue loi expoetielle. La vraisemblace L X,...,X θ) = exp Le maximum est atteit e u uique poit ˆθ = X. i= X i /θ)θ i= Xi
CHAPITRE II Estimatio par itervalle. Défiitio d ue régio de cofiace Soit α ]0, [ u iveau de risque fixé par le statisticie. Défiitio. Ue régio de cofiace de θ de iveau de cofiace α est u esemble dépedat de l observatio mais pas du paramètre icou θ), CX) Θ, telle que θ Θ, P θ θ CX)) α O dit alors qu o a ue régio par excès. Das le cas où o a égalité o parle de iveau exactemet égal à α. Lorsqu o a X = X,..., X ), o parle de régio de cofiace asymptotique de iveau α, si θ Θ, lim P θ θ CX,..., X )) α + Les valeurs usuelles de α sot %, 5% ou 0%. Das le cas uidimesioel, la plupart du temps, ue régio de cofiace s écrit sous la forme d u itervalle uilatère ou bilatère). U itervalle de cofiace de iveau de cofiace 95% a ue probabilité au mois égale à 0, 95 de coteir la vraie valeur icoue θ. Par passage au complémetaire, le iveau de risque α correspodat à ue majoratio de la probabilité que la vraie valeur du paramètre θ e soit pas das CX). A iveau de cofiace fixé, ue régio de cofiace est d autat meilleure qu elle est de taille petite. Avat d aller plus loi, rappelos la otio de quatile d ue loi de probabilité. Défiitio 2. Soit α ]0, [. O appelle quatile d ordre α d ue loi de probabilité P, la quatité z α = if {x, P], x]) α}. Par exemple pour la loi N 0, ), le quatile d ordre 97, 5% est.96, et celui d ordre 95% est.645. 2. Costructio de régios de cofiace Ue première méthode cosiste à appliquer l iégalité de Bieaymé-Tchebychev. Rappelos que si X est ue variable aléatoire ayat u momet d ordre 2, alors ε > 0, P X EX) > ε) VarX) ε 2 Appliquos cette iégalité das le cas de variables aléatoires idépedates X,..., X idetiquemet distribuées de loi de Beroulli Bθ), où l o souhaite estimer θ à l aide de X. O a θ θ) ε > 0, P X θ > ε) ε 2 4ε 2. O obtiet aisi ue régio de cofiace de iveau α e cosidérat [ X 2 α, X + ] 2. α
4 Chapitre II. Estimatio par itervalle Pour α = 5% et = 00, la précisio de l itervalle est 0.22. Il faut oter que la majoratio obteue par l applicatio de l iégalité de Bieaymé-Tchebychev est pas très précise. O obtiet u meilleur résultat e utilisat l iégalité de Hoeffdig Ouvrad, Probabilité 2, page 32). Propositio 3. Soit X,..., X ) ue suite de variables aléatoires idépedates telles que pour tout i, a i X i b i p.s., alors pour tout ε > 0, e posat S = i= X i, 2ε 2 2ε PS ES ) ε) exp ), 2 ) i= b PS i a i ) 2 ES ) ε) exp i= b i a i ) 2 et 2ε 2 P S ES ) ε) 2 exp ). i= b i a i ) 2 Appliquos cette iégalité à l exemple précédet. O a : ε > 0, P X θ ε) P S θ ε) 2 exp 2ε 2 ). O obtiet aisi l itervalle de cofiace de iveau α suivat : [ ] X 2 l 2/α), X + l 2/α). 2 Pour α = 5% et = 00, la précisio de l itervalle est 0.4 et 0.23 avec la première méthode. Il peut s avérer plus pratique de chercher u itervalle de cofiace asymptotique. Supposos que ous cherchios u itervalle de cofiace pour u paramètre θ à partir d u échatillo de taille de loi P θ. Lorsqu o dispose de suffisammet de doées et pour les modèles les plus classiques, le théorème cetral limite s avère être u très bo outil, pour obteir u itervalle de cofiace asymptotique. Par exemple si o souhaite estimer la moyee d ue variable aléatoire dot o coait la variace σ 2 =. O pred u -échatillo X,..., X ). L applicatio du TCL doe : L X m) N 0, ) + O obtiet alors l itervalle de cofiace asymptotique de iveau α suivat [ X q α/2, X + q ] α/2 où q α/2 est le quatile d ordre α/2 de la loi N 0, ). Ce est pas toujours aussi évidet. Si o part d ue variable aléatoire de Beroulli dot o veut estimer le paramètre θ. E cosidérat l estimateur du maximum de vraisemblace X, le TCL doe : L X θ) N 0, θ θ)) + Ici la loi limite déped de θ ce qui est gêat pour costruire u itervalle de cofiace. Das ce cas, o peut surmoter ce problème, e remarquat que θ θ) 0.25. O obtiet doc u itervalle de cofiace asymptotique : [ X q α/2 2, X + q ] α/2 2. Das le cas où o cosidère X,..., X ) u échatillo de loi de Poisso de paramètre θ > 0 à estimer, le TLC doe : X θ) L N 0, θ) + Des outils plus élaborés doivet être utilisés pour costruire u itervalle de cofiace si o e coaît pas de majorat de θ. Le lemme de Slutsky permet de surmoter certaies difficultés comme le motre l exemple suivat. Si o repred l exemple, e utilisat les propriétés de forte cosistace d estimateur, o obtiet : X θ) L N 0, ) X +
3. Exemples classiques d estimatio par itervalle 5 mais aussi avec S 2 = X i X ) 2 qui est u estimateur fortemet cosistat de la variace X θ) L N 0, ). S 2 + i= 3. Exemples classiques d estimatio par itervalle Soit X ue variable aléatoire de loi ormale N m, σ 2 ). 3.a. Estimatio de la moyee quad la variace est coue. Théorème 4. Lorsque σ 2 est cou u itervalle de cofiace au iveau α de m est [X q α/2 σ, X + q α/2 σ ] où q α/2 est le quatile d ordre α/2 F q α/2 ) = α/2) de la loi ormale cetrée réduite. Démostratio. O sait que X m)/σ suit la loi N 0, ). Par coséquet o a X m [ [ ] ] σ σ q α/2, q α/2 m X q α/2, X + q α/2 σ Exemple : puisque q 0,975 =.96 l itervalle de cofiace de m au iveau 95% est [X.96 σ, X +.96 σ ] ce qui sigifie que sur u grad ombre d expérieces cet itervalle cotiedra effectivemet m das 95% des cas e moyee. 3.b. Estimatio de la moyee quad la variace est icoue. Défiitio 5. Soiet X et Y deux variables aléatoires idépedates suivat respectivemet la loi ormale cetrée réduite et la loi du χ 2 à degrés de liberté. La variable aléatoire T = X Y/ suit la loi de Studet à degrés de liberté. La desité de cette loi est doée par : f T u) = Γ + )/2) π Γ/2) + u 2 /) +)/2 Cette variable a pas d espérace pour = et pas de variace pour 2. Sio o a ET ) = 0 et VarT ) = / 2).
6 Chapitre II. Estimatio par itervalle f Tk Théorème 6. Lorsque σ 2 est icou u itervalle de cofiace au iveau α de m est Ŝ X 2 Ŝ 2 t, α/2, X + t, α/2 où t, α/2 est le quatile d ordre α/2 de la loi de Studet à degrés de liberté. Cela proviet du résultat précédet et de l estimatio de σ 2 par Ŝ2. Exemple : pour = 0, avec u iveau de cofiace de 95% et u itervalle symétrique o obtiet l itervalle X 2, 26 Ŝ 2, X + 2, 26 Ŝ 2 L itervalle de cofiace est plus grad que celui obteu lorsqu o coaît la variace. 3.c. Estimatio de la variace quad la moyee est coue.
3. Exemples classiques d estimatio par itervalle 7 Théorème 7. Lorsque m est cou u itervalle de cofiace au iveau α de σ 2 est [ ] X k m) 2, X k m) 2 u u 2 où u et u 2 sot les quatiles d ordre α/2 et α/2 de la loi du χ 2 à degrés de liberté. Exemples d itervalles bilatères et uilatères pour la loi du χ 2 : Démostratio. Si X k suit ue loi N m, σ 2 ) alors X k m)/σ suit ue loi N 0, ) et par coséquet X k m σ ) 2 suit ue loi du χ 2 à degrés de liberté. O défiit alors u et u 2 tels que Pχ 2 u ) = α 2 et Pχ 2 u 2 ) = α 2, et doc o a P u σ 2 X k m) 2 u 2 ) = α.
8 Chapitre II. Estimatio par itervalle D où o e déduit le résultat. 3.d. Estimatio de la variace quad la moyee est icoue. Théorème 8. Lorsque m est icou u itervalle de cofiace au iveau α de σ 2 est [ X k X ) 2, ] X k X ) 2 u u 2 où u et u 2 sot les quatiles d ordre α/2 et α/2 de la loi du χ 2 à degrés de liberté. Démostratio. O estime m par X, puis Xk X ) 2 suit ue loi du χ 2 à degrés de liberté. Esuite o procède comme das la preuve précédete. σ Lorsqu o s itéresse à l écart-type o pred les racies carrées des bores des itervalles obteus pour la variace. 4. Comparaiso de moyees et de variaces Soiet X, X 2,..., X ) u échatillo d ue populatio suivat la loi ormale N m, σ 2 ) et Y, Y 2,..., Y 2 ) u échatillo d ue populatio suivat la loi ormale N m 2, σ 2 2) ; ces deux échatillos sot supposés idépedats. Nous souhaitos comparer les moyees, m et m 2, et les variaces, σ 2 et σ 2 2, à l aide de ces échatillos. Pour cela ous allos costruire des itervalles de cofiace pour m m 2 et pour σ 2 et σ 2 2. O pose 4.a. Itervalle de cofiace de la différece de deux moyee. X = X i, Y = 2 Y i, i= i= D = X Y Propositio 9. L estimateur D est u estimateur sas biais m m 2. Démostratio. Par défiitio X suit ue loi N m, σ/ 2 ) et Y suit ue loi N m 2, σ2/ 2 2 ) et par coséquet D suit la loi N m m 2, σ/ 2 + σ2/ 2 2 ), d où le résultat. Théorème 0. Si σ et σ 2 sot coues, u itervalle de cofiace de m m 2 au iveau α est ] [D q α/2 σ 2 / + σ 22 / 2, D + q α/2 σ 2/ + σ2 2/ 2 où q α/2 représete le fractile d ordre α/2 de la loi ormale cetrée réduite.
4. Comparaiso de moyees et de variaces 9 Démostratio. U itervalle de cofiace de m m 2 au iveau α est [D a, D + b] si α = PD a m m 2 D + b) = P b D m m 2 ) a) ) b = P σ 2 / + σ2 2/ D m m 2 ) a 2 σ 2 / + σ2 2/ 2 σ 2 / + σ2 2/ 2 = 2π u2 u O e déduit l itervalle aocé. exp x 2 /2)dx E gééral les variaces e sot pas coues. Il peut alors se préseter deux cas. Posos : Ŝ 2 =,X X i X) 2 Ŝ2 = 2 2,Y Y i Y ) 2 2 et i= ŜX,Y 2 = X i X) 2 + + 2 2 i= 2 i= Y i Y ) 2 ) i= = )Ŝ2,X + 2 )Ŝ2 2,Y + 2 2 Théorème. Si les variaces σ et σ 2 sot icoues mais égales, u itervalle de cofiace de m m 2 au iveau α est [ ] D t + 2 2, α/2 SX,Y 2 / + SX,Y 2 / 2, D + t + 2 2, α/2ŝ2 X,Y / + Ŝ2 X,Y / 2 où t + 2 2, α/2 représete le fractile d ordre α/2 de la loi de Studet à + 2 2 degrés de libertés. O aurait pu remplacer σ 2 et σ2 2 par Ŝ2 et,x Ŝ2 2,Y, mais e gééral o préfère predre u estimateur basé sur la réuio des deux échatillos. O a déjà vu que : ) 2 Xi X 2 ) 2 Yi Y Z = et Z 2 = i= σ suivet respectivemet ue loi du χ 2 à et 2 degrés de liberté. Par coséquet, comme Z et Z 2 sot idépedates, Z + Z 2 suit ue loi du χ 2 à + 2 2 degrés de liberté. O obtiet alors, e posat σ 2 = σ2 2 = σ 2, [ EZ + Z 2 ) = + 2 2 = ] σ 2 E 2 X i X) 2 + Y i Y ) 2 c est-à-dire que Ŝ2 X,Y est u estimateur sas biais de σ2. Démostratio. O va remplacer l écart-type de D, Ŝ2 X,Y / + Ŝ2 X,Y / 2 par O a i= i= σ 2 i= S 2 X,Y / + S 2 X,Y / 2. α = PD a m m 2 D + b) = P b D m m 2 ) a) b D m m 2 ) a = P Ŝ2 X,Y / + Ŝ2 X,Y / 2 Ŝ2 X,Y / + Ŝ2 X,Y / 2 Ŝ2 X,Y / + Ŝ2 X,Y / 2
20 Chapitre II. Estimatio par itervalle O pose D m m 2 ) T = = Ŝ2 X,Y / + Ŝ2 X,Y / 2 D m m 2) σ2 / +σ 2 / 2 Ŝ 2 X,Y σ 2 Ŝ 2 X,Y U Le umérateur suit ue loi ormale cetrée réduite. Au déomiateur o a σ 2 = + 2 2 où U suit ue loi du χ 2 à + 2 2 degrés de liberté. O e déduit que T suit ue loi de Studet à + 2 2 degrés de liberté, et doc o obtiet le résultat. Lorsqu o σ et σ 2 sot icoues mais o écessairemet égales, o utilise la méthode approchée suivate. Théorème 2. Si les échatillos ot des tailles importates et égales à = 2 = > 30, u itervalle de cofiace de m m 2 au iveau α est ] [D q α/2 Ŝ2,X + Ŝ22,Y )/ Ŝ2,X + Ŝ2 2,Y )/, D + q α/2 où q α/2 représete le fractile d ordre α/2 de la loi ormale cetrée réduite. Il suffit de remarquer que la variable réduite. D m m 2 ) Ŝ2,X + Ŝ22,Y )/ suit sesiblemet ue loi ormale cetrée 4.b. Itervalle de cofiace du rapport de deux variaces. Théorème 3. U itervalle de cofiace au iveau α de σ/σ 2 2 2 est Ŝ 2,X, f, 2, α/2 Ŝ 2 2,Y Ŝ 2,X f, 2, α/2 Ŝ 2 2,Y où les fractiles sot ceux de loi de Fisher-Sedecor F, 2 ). Le résultat s obtiet par les mêmes méthodes que pour les théorèmes précédets. La loi de Fisher-Sedecor peut être obteue comme le quotiet de deux lois du χ 2 időpedates : F, 2 ) = χ2 / ) χ 2 2 / 2 ) 5. Estimatio d ue proportio Das ue certaie populatio, la proportio d idividus ayat ue propriété doée est égale à p. Soit X le ombre d idividus d u échatillo de taille ayat la propriété.
5. Estimatio d ue proportio 2 5.a. Estimatio poctuelle. Théorème 4. U estimateur sas biais et cosistat de p est : T = X E effet, le ombre X d idividus de l échatillo ayat la propriété suit la loi biomiale B, p). O a : ET ) = EX) 5.b. Estimatio par itervalle. = p et VarT ) = VarX) p p) 2 = 0 O e sait pas détermier exactemet u itervalle de cofiace. O utilise des solutios approchées, qui foctioet lorsqu o dispose d échatillo de grade taille. Aisi, lorsque est grad ou/et p voisi de 0, 5 o peut approcher la loi biomiale par ue loi ormale. Rappel : Soit ue suite de variables aléatoires Z suivat la loi biomiale B, p) ; la suite des variables réduites Z = Z p coverge e loi vers la loi ormale cetrée réduite, et o a : p p) Pa Z b) b exp x 2 /2)dx 2π a Théorème 5. U itervalle de cofiace approché de p au iveau α est doée par [ ] T T ) T T ) T q α/2, T + q α/2 où q α/2 représete le fractile d ordre α/2 de la loi ormale cetrée réduite. Démostratio. D après le rappel, X p T p = p p) p p)/ suit approximativemet la loi ormale cetrée réduite. L itervalle [T a, T + b] est u itervalle de cofiace de p au iveau α si : ) b T p a α = PT a < p < T + b) = P < < p p)/ p p)/ p p)/ ) ) a b Φ Φ p p)/ p p)/ où Φu) = 2π u exp x 2 /2)dx E choisissat u itervalle symétrique o obtiet la quatile q α/2. Comme p p) est pas cou, o obtiet alors u itervalle de cofiace approché e remplaçat p par l estimateur T. O peut doer ue approximatio de l itervalle de cofiace u peu plus précise.
22 Chapitre II. Estimatio par itervalle U itervalle de cofiace approché de p au iveau α est doée par ) T + q2 α/2, T + q2 α/2 + q2 α/2 2 + q2 α/2 2 où = q α/2 cetrée réduite. T T ) + q2 α/2 4 Démostratio. O a : + ) et q α/2 représete le fractile d ordre α/2 de la loi ormale q α/2 < T p p p) < q α/2 T p) 2 < q α/2 2 p p) p 2 + q2 α/2 ) 2p T + q2 α/2 2 ) + T 2 < 0 Le paramètre p doit doc être compris etre les racies de l équatio du secod degré. O vérifie aisémet qu elle a deux racies réelles apparteat à l itervalle [0, ]. D où, o obtiet l itervalle de cofiace idiqué. 5.c. Méthode du Bootstrap. A partir d u échatillo X = X, X 2,..., X ) o détermie u estimateur poctuel sx) d u paramètre θ. Sauf das quelques cas particuliers sx) = X par exemple) le calcul de la variace est pas aisé, ce qui red problématique la détermiatio d itervalles de cofiace pour?. E 979 ue ouvelle méthode a été développé. Cette méthode s appuie sur des cocepts simples permettat, à partir d ue réalisatio x, x 2,..., x ) de l échatillo, d obteir ue estimatio de la variace de sx) et u itervalle de cofiace pour θ. O cosidère que la réalisatio de l échatillo x, x 2,..., x ) est représetative de la populatio et o tire parmi les x k, au hasard et avec remise, u échatillo bootstrapé X = X, X2,..., X) ; e pratique o tire ombres au hasard etre et et o associe au ombre tiré k la valeur X k. Sur cet échatillo bootstrapé o peut calculer u estimateur sx ) par le même algorithme que celui qui doe sx). O répète le tirage u grad ombre de fois, B, ce qui doe ue populatio de valeurs de sx ) S = s, s 2,..., s B que l o peut représeter par u histogramme. Sur cette populatio o peut calculer ue estimatio de la moyee et de l écart-type : s = B s k, B s k s) B B 2 La populatio S peut être triée par valeurs croissates ce qui permet de détermier u itervalle de cofiace e gardat ue certaie proportio des valeurs cetrales. Par exemple si B = 000 et si les valeurs triées de S sot α α 2 α 000, l itervalle de cofiace à 95% est [α 25, α 975 ].