STATISTIQUE : ESTIMATION



Documents pareils
Chapitre 3 : Fonctions d une variable réelle (1)

STATISTIQUE : TESTS D HYPOTHESES

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

1 Mesure et intégrale

Cours de Statistiques inférentielles

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

Limites des Suites numériques

CHAPITRE 2 SÉRIES ENTIÈRES

Cours 5 : ESTIMATION PONCTUELLE

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

Processus et martingales en temps continu

EXERCICES : DÉNOMBREMENT

Etude de la fonction ζ de Riemann

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

Séries réelles ou complexes

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

20. Algorithmique & Mathématiques

Dénombrement. Chapitre Enoncés des exercices

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

14 Chapitre 14. Théorème du point fixe

Statistique Numérique et Analyse des Données

Principes et Méthodes Statistiques

Les Nombres Parfaits.

STATISTIQUE AVANCÉE : MÉTHODES

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

SÉRIES STATISTIQUES À DEUX VARIABLES

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

4 Approximation des fonctions

c. Calcul pour une évolution d une proportion entre deux années non consécutives

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

Comportement d'une suite

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Séquence 5. La fonction logarithme népérien. Sommaire

Processus géométrique généralisé et applications en fiabilité

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

Échantillonnage et estimation

55 - EXEMPLES D UTILISATION DU TABLEUR.

Suites et séries de fonctions

Formation d un ester à partir d un acide et d un alcool

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

PROBLEMES DIOPTIMISATION EN NOMBRES ENTIERS J. L. NICOLAS

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Chapitre 3 : Transistor bipolaire à jonction

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

Statistique descriptive bidimensionnelle

Chaînes de Markov. Arthur Charpentier

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

Des résultats d irrationalité pour deux fonctions particulières

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

Probabilités et statistique pour le CAPES

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

Baccalauréat S Asie 19 juin 2014 Corrigé

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

Université Pierre et Marie Curie. Biostatistique PACES - UE

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Terminale S. Terminale S 1 F. Laroche

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Introduction : Mesures et espaces de probabilités

Exercices de mathématiques

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

La fibre optique arrive chez vous Devenez acteur de la révolution numérique

RÈGLES ORDINALES : UNE GÉNÉRALISATION DES RÈGLES D'ASSOCIATION

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

Contribution à la théorie des entiers friables

Chap. 5 : Les intérêts (Les calculs financiers)

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

2 ième partie : MATHÉMATIQUES FINANCIÈRES

Module 3 : Inversion de matrices

INTRODUCTION AUX MATRICES ALÉATOIRES. par. Djalil Chafaï

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

Risque de longévité et détermination du besoin en capital : travaux en cours

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

Initiation à l analyse factorielle des correspondances

Compte Sélect Banque Manuvie Guide du débutant

LE PRINCIPE DU RAISONNEMENT PAR RÉCURRENCE

La maladie rénale chronique

RECHERCHE DE CLIENTS simplifiée

RESOLUTION PAR LA METHODE DE NORTON, MILLMAN ET KENNELY

RESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *)

Gérer les applications

Les algorithmes de tri

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Mécanismes de protection contre les vers

Simulation de variables aléatoires

La tarification hospitalière : de l enveloppe globale à la concurrence par comparaison

Le chef d entreprise développe les services funéraires de l entreprise, en

Régulation analogique industrielle ESTF- G.Thermique

UNIVERSITÉ DE SFAX École Supérieure de Commerce

Neolane Leads. Neolane v6.0

Tests non paramétriques de spécification pour densité conditionnelle : application à des modèles de choix discret

Transcription:

STATISTIQUE : ESTIMATION Préparatio à l Agrégatio Bordeaux Aée 202-203 Jea-Jacques Ruch

Table des Matières Chapitre I. Estimatio poctuelle 5. Défiitios 5 2. Critères de comparaiso d estimateurs 6 3. Exemples fodametaux 6 3.a. Estimatio de m 6 3.b. Estimatio de σ 2 e supposat m cou 7 3.c. Estimatio de σ 2 lorsque m est icou 7 4. Cas particulier de la loi ormale 8 5. Costructio d estimateur par la méthode du maximum de vraisemblace 5.a. Cas discret 5.b. Cas à desité 2 Chapitre II. Estimatio par itervalle 3. Défiitio d ue régio de cofiace 3 2. Costructio de régios de cofiace 3 3. Exemples classiques d estimatio par itervalle 5 3.a. Estimatio de la moyee quad la variace est coue 5 3.b. Estimatio de la moyee quad la variace est icoue 5 3.c. Estimatio de la variace quad la moyee est coue 6 3.d. Estimatio de la variace quad la moyee est icoue 8 4. Comparaiso de moyees et de variaces 8 4.a. Itervalle de cofiace de la différece de deux moyee 8 4.b. Itervalle de cofiace du rapport de deux variaces 20 5. Estimatio d ue proportio 20 5.a. Estimatio poctuelle 2 5.b. Estimatio par itervalle 2 5.c. Méthode du Bootstrap 22

CHAPITRE I Estimatio poctuelle E statistique, comme das la théorie des probabilités le hasard iterviet fortemet. Mais das la théorie des probabilités, o suppose la loi coue précisémet et o cherche à doer les caractéristiques de la variable qui suit cette loi. L objectif de la statistique est le cotraire : à partir de la coaissace de la variable, que peut-o dire de la loi de cette variable?. Défiitios Soit X ue variable aléatoire dot la desité de probabilité fx, θ) déped d u paramètre θ apparteat à I R. A l aide d u échatillo issu de X, il s agit de détermier au mieux la vraie valeur θ 0 de θ. O pourra utiliser deux méthodes : - estimatio poctuelle : o calcule ue valeur vraisemblable ˆθ de θ 0 - estimatio par itervalle : o cherche u itervalle das lequel θ 0 se trouve avec ue probabilité élevée. Défiitio. U -échatillo de X est u -uplet X, X 2,..., X ) tel que les X k ot la même loi que X et sot idépedates. Ue réalisatio de l échatillo est alors u -uplet x, x 2,..., x ) de valeurs prises par l échatillo. Défiitio 2. Ue statistique de l échatillo est ue variable aléatoire ϕx, X 2,..., X ) où ϕ est ue applicatio de R das R. U estimateur T de θ est ue statistique à valeurs das I. Ue estimatio est la valeur de l estimateur correspodat à ue réalisatio de l échatillo. Exemple : X = X k est u estimateur de l espérace mathématique. Défiitio 3. Le biais de l estimateur T de θ est E[T ] θ 0. S il est ul, o dit que T est u estimateur sas biais. L estimateur T est asymptotiquemet sas biais si lim E[T ] = θ 0. O ote souvet le biais b θ T ). Défiitio 4. L estimateur est dit coverget si la suite T ) coverge e probabilité vers θ 0 : ε > 0, P T θ 0 > ε) 0. + O parle d estimateur fortemet coverget lorsqu o a covergece presque sûre. D après Bieaymé-Tchebychev pour qu u estimateur asymptotiquemet sas biais soit coverget il suffit que VarT ) 0. +

6 Chapitre I. Estimatio poctuelle 2. Critères de comparaiso d estimateurs U bo critère de comparaiso est le risque quadratique. Défiitio 5. Soiet T u estimateur de θ. Le risque quadratique est défii par RT, θ) = E[T θ) 2 ] O peut alors comparer deux estimateurs. Défiitio 6. O dit que T est u meilleur estimateur que T 2 si θ I, RT, θ) RT 2, θ) et θ I, RT, θ) < RT 2, θ). U estimateur est dit admissible s il existe pas d estimateur meilleur. L erreur quadratique moyee de T se décompose e deux termes, le carré du biais et la variace de T : E[T θ) 2 ] = b 2 θt ) + VarT ). Cette décompositio permet de se rameer à ue discussio sur la variace pour les estimateurs sas biais de θ. Défiitio 7. Soiet T et T 2 deux estimateurs sas biais de θ. O dit que T est u plus efficace que T 2 si θ I, VarT ) VarT 2 ) et θ I, VarT ) < VarT 2 ). O parle d estimateur à variace miimale si seul le premier poit est vérifié, c est-à-dire : VarT ) VarT 2 ). 3. Exemples fodametaux Soit X ue variable aléatoire telle que E[X] = m et VarX) = σ 2. 3.a. Estimatio de m. Théorème 8. La moyee empirique X = X k est u estimateur sas biais et coverget de m. O a E[X ] = E[X k ] = m et VarX ) = 2 Var[X k ] = σ2 D après la loi forte des grads ombres X est même fortememet coverget. Il est possible de détermier la loi asymptotique de la moyee empirique. 0. +

3. Exemples fodametaux 7 Propositio 9. Si est assez grad o peut utiliser l approximatio ormale lorsque X admet u momet d ordre 2) X L N m, σ 2 /). C est ue coséquece du TCL qui ous assure que L X m) N 0, + σ2 ). 3.b. Estimatio de σ 2 e supposat m cou. Théorème 0. Lorsque m est cou S 2 = est u estimateur sas biais et coverget de σ 2. X k m) 2 O a E[S 2 ] = E [ ] X k m) 2 = Par ailleurs, les variables X k m) 2 état idépedates : VarS 2 ) = 2 avec µ k = EX m) k ). VarX k m) 2 ) = VarX k ) = σ 2 E[X m) 4 ] E[X m) 2 ] 2) = µ4 σ 4) Doc S 2 est u estimateur coverget. La loi forte des grads ombres appliquée aux variables X k m) 2 etraîe même la covergece presque sûre vers σ 2. Comme das le cas de la moyee empirique le TCL ous permet de détermier la loi asymptotique de S 2 ; o a lorsque est assez grad : S 2 L N σ 2, µ 4 σ 4 )/). 3.c. Estimatio de σ 2 lorsque m est icou. E gééral o e coaît pas m ; o le remplace par u estimateur et o itroduit la variace empirique associée : S 2 = X k X ) 2. Théorème. La variace empirique S 2 est u estimateur biaisé et coverget de σ 2. Il est asymptotiquemet sas biais. O a E[S 2 ] = EX 2 k) E[X 2 ] = m2 + σ 2 )) m 2 + σ2 ) = σ2.

8 Chapitre I. Estimatio poctuelle D autre part, o peut motrer que : VarS) 2 = µ4 σ 4) 2 µ4 2 2σ 4) + µ4 3 3σ 4) 0 avec µ k = EX m) k ). L estimateur est doc coverget. Le résultat précédet et le lemme de Slutsky Probabilité 2, Jea-Yves Ouvrard, p. 347) permet de détermier la loi asymptotique de S 2 : S 2 L N σ 2, µ 4 σ 4 )/). Théorème 2. La variace empirique corrigée Ŝ 2 = est u estimateur sas biais et coverget de σ 2. X k X ) 2. Cela se motre facilemet e remarquat que Ŝ 2 = S2. 4. Cas particulier de la loi ormale O suppose das ce paragraphe que X suit la loi ormale N m, σ 2 ). O sait que X = X k suit alors la loi ormale N m, σ 2 /), ce qui cofime que c est u estimateur sas biais, coverget de m. Les résultats obteus au paragraphe précédet pour l estimatio de σ 2 sot ecore valables ; e particulier o a : ES) 2 = σ 2 et VarS) 2 2 ) = 2 σ 4 E effet, calculos µ k µ k = EX m) k ) = + ) x m) k x m)2 exp dx 2πσ 2σ = + 2σu) k exp u 2 ) 2σdu e posat x = m 2σu 2πσ = 0 si k est impair. Lorsque k = 2p est pair o obtiet et doc µ 2p = 2p σ 2p + u 2p exp u 2 )du = 2p+ σ 2p + u 2p exp u 2 )du π π = 2p σ 2p + v p /2 exp v)dv π 0 = 2p σ 2p π Γp + /2) = 2p)! 2 p p!) σ2p VarS 2 ) = 0 e posat u = v µ4 σ 4) 2 2 µ4 2σ 4) + 3 µ4 3σ 4) = 2 ) 2 σ 4

4. Cas particulier de la loi ormale 9 Défiitio 3. Soiet X,..., X, variables aléatoires idépedates idetiquemet distribuées de loi N 0, ). La loi du χ 2 à degrés de liberté est la loi de la variable aléatoire χ 2 = Xk. 2 La desité de cette loi est doée par : u ) /2 f χ 2 u) = exp u ) u>0 2Γ/2) 2 2 et sa foctio caractéristique par φ χ 2 t) = 2it) /2 f χ 2 k Pour détermier la desité o peut remarquer que : si U suit ue loi N 0, ) alors o a pour t > 0 PU 2 t) = P t U t) = F U t) F U t) et par coséquet f U 2t) = 2 t f U t) + 2 t f U t) = f U t) = exp t ) t 2πt 2 Esuite o obtiet le résultat gééral par récurece. Théorème 4. Soit X,..., X ) u échatillo de le loi N 0, ). Les variables aléatoires X et X k X ) 2 = S 2 = )Ŝ2 sot idépedates et suivet respectivemet la loi ormale réduite et la loi du χ 2 à ) degrés de liberté.

0 Chapitre I. Estimatio poctuelle Démostratio. Motros que X et Le vecteur aléatoire X X X. X X X. X Par coséquet, le vecteur N 0, AA t ). Or = A X. X X k X ) 2 sot idépedates. O a où A =............ est gaussie de loi N 0, I ) où I est la matrice idetité d ordre. X X X. X X = A X. X est égalemet gaussie de loi N 0, AI A t ) = 0 0 0 0 AA t = 0............ 0 X X doc la variable X est idépedate du vecteur. et doc de X k X ) 2. X X Comme X suit la loi N 0, /) o e déduit que X suit la loi N 0, ). Motros S 2 = X k X ) 2 suit la loi du χ 2 à ) degrés de liberté. O a X X. X X = B X. X où B =............ Comme B est ue matrice symétrique, il existe ue matrice orthogoale U et ue matrice diagoale D telle que B = UDU t Or les valeurs propres de B sot : - la valeur propre simple 0 dot le sous-espace propre associé a pour équatio x = = x ; - la valeur propre d ordre ) égale à dot le sous-espace propre associé a pour équatio x + x 2 + + x = 0 E ordoat coveablemet la base de vecteurs propres o peut choisir 0 0. D = 0.......... 0 0 0 0

5. Costructio d estimateur par la méthode du maximum de vraisemblace O a Y = BX = UDU t X et X k X ) 2 = Y t Y = X t UDU t UDU t X = U t X) t DU t X) Or le vecteur aléatoire Z = U t X est gaussie de loi N 0, U t I U) = N 0, U t U) = N 0, I ). D où qui suit la loi du χ 2 à ) degrés de liberté. X k X ) 2 = Z t DZ = Z 2 i O e déduit immédiatemet que si X,..., X ) est u échatillo d ue variable aléatoire N m, σ 2 ) la variable aléatoire σ 2 X k X ) 2 suit la loi du χ 2 à ) degrés de liberté. Il suffit de poser Y k = X k m/σ. Alors, comme o a Y = X m et σ σ 2 X k X ) 2 = le résultat découle de ce qui précède. Y k Y ) 2 5. Costructio d estimateur par la méthode du maximum de vraisemblace 5.a. Cas discret. O suppose doée ue observatio X tirée selo ue loi P θ, θ Θ. O supposera ici que P θ est discrète et o pose : f θ x) = P θ X = x). O appelle alors foctio de vraisemblace la foctio L X θ) = f θ X). Quad o dispose d u échatillo X,..., X ) de loi P θ, la vraisemblace s écrit alors L X,...,X θ) = f θ X i ). Lorsque la foctio de vraisemblace admet u uique maximum atteit e ˆθ = g X,..., X ), o peut utiliser cette valeur pour estimer θ. O dit alors que i= T = g X,..., X ) est l estimateur par maximum de vraisemblace de θ. Cet estimateur est aturel puisqu il coduit à privilégier la valeur de θ la "plus probable" au vu de l observatio. Il possède e gééral de boes propriétés. L icovéiet est que ce maximum peut e pas exister ou e pas être uique et il peut être difficile à exhiber. E pratique, la recherche de ce maximum se fait par dérivatio de L relativemet à θ. O peut de maière équivalete maximiser le logarithme de la vraisemblace la foctio logarithme état croissate, maximiser la vraisemblace et la log-vraisemblace reviet au même, mais souvet les calculs sot plus simples). Exemple : Estimatio du paramètre d ue loi de Beroulli. Ici o suppose Θ =]0, [ et les X i suivet ue loi de Beroulli de paramètre θ Θ. O a θ si x = f θ x) = P θ X = x) = θ si x = 0 0 sio

2 Chapitre I. Estimatio poctuelle Posos S = X + + X. Aisi S est le ombre de das l échatillo et S le ombre de 0. La vraisemblace et la log-vraisemblace s écrivet alors : L X,...,X θ) = θ S θ) S U calcul motre alors que le maximum est atteit e ˆθ = S. Par coséquet l estimateur de θ par maximum de vraisemblace est T = X i. qui est égalemet l estimateur de la moyee. ll X,...,X θ) = S lθ + S )l θ). 5.b. Cas à desité. O suppose doée ue observatio X tirée selo ue loi P θ, θ Θ. O supposera ici que P θ admet ue desité par rapport à la mesure de Lebesgue otée f θ. O appelle alors foctio de vraisemblace la foctio L X θ) = f θ X). Quad o dispose d u échatillo X,..., X ) o a la vraisemblace L X,...,X θ) = f θ X i ). Esuite, o procède comme das le cas discret. Exemple : s écrit : i= i= O cherche à estimer le paramètre θ icou d ue loi expoetielle. La vraisemblace L X,...,X θ) = exp Le maximum est atteit e u uique poit ˆθ = X. i= X i /θ)θ i= Xi

CHAPITRE II Estimatio par itervalle. Défiitio d ue régio de cofiace Soit α ]0, [ u iveau de risque fixé par le statisticie. Défiitio. Ue régio de cofiace de θ de iveau de cofiace α est u esemble dépedat de l observatio mais pas du paramètre icou θ), CX) Θ, telle que θ Θ, P θ θ CX)) α O dit alors qu o a ue régio par excès. Das le cas où o a égalité o parle de iveau exactemet égal à α. Lorsqu o a X = X,..., X ), o parle de régio de cofiace asymptotique de iveau α, si θ Θ, lim P θ θ CX,..., X )) α + Les valeurs usuelles de α sot %, 5% ou 0%. Das le cas uidimesioel, la plupart du temps, ue régio de cofiace s écrit sous la forme d u itervalle uilatère ou bilatère). U itervalle de cofiace de iveau de cofiace 95% a ue probabilité au mois égale à 0, 95 de coteir la vraie valeur icoue θ. Par passage au complémetaire, le iveau de risque α correspodat à ue majoratio de la probabilité que la vraie valeur du paramètre θ e soit pas das CX). A iveau de cofiace fixé, ue régio de cofiace est d autat meilleure qu elle est de taille petite. Avat d aller plus loi, rappelos la otio de quatile d ue loi de probabilité. Défiitio 2. Soit α ]0, [. O appelle quatile d ordre α d ue loi de probabilité P, la quatité z α = if {x, P], x]) α}. Par exemple pour la loi N 0, ), le quatile d ordre 97, 5% est.96, et celui d ordre 95% est.645. 2. Costructio de régios de cofiace Ue première méthode cosiste à appliquer l iégalité de Bieaymé-Tchebychev. Rappelos que si X est ue variable aléatoire ayat u momet d ordre 2, alors ε > 0, P X EX) > ε) VarX) ε 2 Appliquos cette iégalité das le cas de variables aléatoires idépedates X,..., X idetiquemet distribuées de loi de Beroulli Bθ), où l o souhaite estimer θ à l aide de X. O a θ θ) ε > 0, P X θ > ε) ε 2 4ε 2. O obtiet aisi ue régio de cofiace de iveau α e cosidérat [ X 2 α, X + ] 2. α

4 Chapitre II. Estimatio par itervalle Pour α = 5% et = 00, la précisio de l itervalle est 0.22. Il faut oter que la majoratio obteue par l applicatio de l iégalité de Bieaymé-Tchebychev est pas très précise. O obtiet u meilleur résultat e utilisat l iégalité de Hoeffdig Ouvrad, Probabilité 2, page 32). Propositio 3. Soit X,..., X ) ue suite de variables aléatoires idépedates telles que pour tout i, a i X i b i p.s., alors pour tout ε > 0, e posat S = i= X i, 2ε 2 2ε PS ES ) ε) exp ), 2 ) i= b PS i a i ) 2 ES ) ε) exp i= b i a i ) 2 et 2ε 2 P S ES ) ε) 2 exp ). i= b i a i ) 2 Appliquos cette iégalité à l exemple précédet. O a : ε > 0, P X θ ε) P S θ ε) 2 exp 2ε 2 ). O obtiet aisi l itervalle de cofiace de iveau α suivat : [ ] X 2 l 2/α), X + l 2/α). 2 Pour α = 5% et = 00, la précisio de l itervalle est 0.4 et 0.23 avec la première méthode. Il peut s avérer plus pratique de chercher u itervalle de cofiace asymptotique. Supposos que ous cherchios u itervalle de cofiace pour u paramètre θ à partir d u échatillo de taille de loi P θ. Lorsqu o dispose de suffisammet de doées et pour les modèles les plus classiques, le théorème cetral limite s avère être u très bo outil, pour obteir u itervalle de cofiace asymptotique. Par exemple si o souhaite estimer la moyee d ue variable aléatoire dot o coait la variace σ 2 =. O pred u -échatillo X,..., X ). L applicatio du TCL doe : L X m) N 0, ) + O obtiet alors l itervalle de cofiace asymptotique de iveau α suivat [ X q α/2, X + q ] α/2 où q α/2 est le quatile d ordre α/2 de la loi N 0, ). Ce est pas toujours aussi évidet. Si o part d ue variable aléatoire de Beroulli dot o veut estimer le paramètre θ. E cosidérat l estimateur du maximum de vraisemblace X, le TCL doe : L X θ) N 0, θ θ)) + Ici la loi limite déped de θ ce qui est gêat pour costruire u itervalle de cofiace. Das ce cas, o peut surmoter ce problème, e remarquat que θ θ) 0.25. O obtiet doc u itervalle de cofiace asymptotique : [ X q α/2 2, X + q ] α/2 2. Das le cas où o cosidère X,..., X ) u échatillo de loi de Poisso de paramètre θ > 0 à estimer, le TLC doe : X θ) L N 0, θ) + Des outils plus élaborés doivet être utilisés pour costruire u itervalle de cofiace si o e coaît pas de majorat de θ. Le lemme de Slutsky permet de surmoter certaies difficultés comme le motre l exemple suivat. Si o repred l exemple, e utilisat les propriétés de forte cosistace d estimateur, o obtiet : X θ) L N 0, ) X +

3. Exemples classiques d estimatio par itervalle 5 mais aussi avec S 2 = X i X ) 2 qui est u estimateur fortemet cosistat de la variace X θ) L N 0, ). S 2 + i= 3. Exemples classiques d estimatio par itervalle Soit X ue variable aléatoire de loi ormale N m, σ 2 ). 3.a. Estimatio de la moyee quad la variace est coue. Théorème 4. Lorsque σ 2 est cou u itervalle de cofiace au iveau α de m est [X q α/2 σ, X + q α/2 σ ] où q α/2 est le quatile d ordre α/2 F q α/2 ) = α/2) de la loi ormale cetrée réduite. Démostratio. O sait que X m)/σ suit la loi N 0, ). Par coséquet o a X m [ [ ] ] σ σ q α/2, q α/2 m X q α/2, X + q α/2 σ Exemple : puisque q 0,975 =.96 l itervalle de cofiace de m au iveau 95% est [X.96 σ, X +.96 σ ] ce qui sigifie que sur u grad ombre d expérieces cet itervalle cotiedra effectivemet m das 95% des cas e moyee. 3.b. Estimatio de la moyee quad la variace est icoue. Défiitio 5. Soiet X et Y deux variables aléatoires idépedates suivat respectivemet la loi ormale cetrée réduite et la loi du χ 2 à degrés de liberté. La variable aléatoire T = X Y/ suit la loi de Studet à degrés de liberté. La desité de cette loi est doée par : f T u) = Γ + )/2) π Γ/2) + u 2 /) +)/2 Cette variable a pas d espérace pour = et pas de variace pour 2. Sio o a ET ) = 0 et VarT ) = / 2).

6 Chapitre II. Estimatio par itervalle f Tk Théorème 6. Lorsque σ 2 est icou u itervalle de cofiace au iveau α de m est Ŝ X 2 Ŝ 2 t, α/2, X + t, α/2 où t, α/2 est le quatile d ordre α/2 de la loi de Studet à degrés de liberté. Cela proviet du résultat précédet et de l estimatio de σ 2 par Ŝ2. Exemple : pour = 0, avec u iveau de cofiace de 95% et u itervalle symétrique o obtiet l itervalle X 2, 26 Ŝ 2, X + 2, 26 Ŝ 2 L itervalle de cofiace est plus grad que celui obteu lorsqu o coaît la variace. 3.c. Estimatio de la variace quad la moyee est coue.

3. Exemples classiques d estimatio par itervalle 7 Théorème 7. Lorsque m est cou u itervalle de cofiace au iveau α de σ 2 est [ ] X k m) 2, X k m) 2 u u 2 où u et u 2 sot les quatiles d ordre α/2 et α/2 de la loi du χ 2 à degrés de liberté. Exemples d itervalles bilatères et uilatères pour la loi du χ 2 : Démostratio. Si X k suit ue loi N m, σ 2 ) alors X k m)/σ suit ue loi N 0, ) et par coséquet X k m σ ) 2 suit ue loi du χ 2 à degrés de liberté. O défiit alors u et u 2 tels que Pχ 2 u ) = α 2 et Pχ 2 u 2 ) = α 2, et doc o a P u σ 2 X k m) 2 u 2 ) = α.

8 Chapitre II. Estimatio par itervalle D où o e déduit le résultat. 3.d. Estimatio de la variace quad la moyee est icoue. Théorème 8. Lorsque m est icou u itervalle de cofiace au iveau α de σ 2 est [ X k X ) 2, ] X k X ) 2 u u 2 où u et u 2 sot les quatiles d ordre α/2 et α/2 de la loi du χ 2 à degrés de liberté. Démostratio. O estime m par X, puis Xk X ) 2 suit ue loi du χ 2 à degrés de liberté. Esuite o procède comme das la preuve précédete. σ Lorsqu o s itéresse à l écart-type o pred les racies carrées des bores des itervalles obteus pour la variace. 4. Comparaiso de moyees et de variaces Soiet X, X 2,..., X ) u échatillo d ue populatio suivat la loi ormale N m, σ 2 ) et Y, Y 2,..., Y 2 ) u échatillo d ue populatio suivat la loi ormale N m 2, σ 2 2) ; ces deux échatillos sot supposés idépedats. Nous souhaitos comparer les moyees, m et m 2, et les variaces, σ 2 et σ 2 2, à l aide de ces échatillos. Pour cela ous allos costruire des itervalles de cofiace pour m m 2 et pour σ 2 et σ 2 2. O pose 4.a. Itervalle de cofiace de la différece de deux moyee. X = X i, Y = 2 Y i, i= i= D = X Y Propositio 9. L estimateur D est u estimateur sas biais m m 2. Démostratio. Par défiitio X suit ue loi N m, σ/ 2 ) et Y suit ue loi N m 2, σ2/ 2 2 ) et par coséquet D suit la loi N m m 2, σ/ 2 + σ2/ 2 2 ), d où le résultat. Théorème 0. Si σ et σ 2 sot coues, u itervalle de cofiace de m m 2 au iveau α est ] [D q α/2 σ 2 / + σ 22 / 2, D + q α/2 σ 2/ + σ2 2/ 2 où q α/2 représete le fractile d ordre α/2 de la loi ormale cetrée réduite.

4. Comparaiso de moyees et de variaces 9 Démostratio. U itervalle de cofiace de m m 2 au iveau α est [D a, D + b] si α = PD a m m 2 D + b) = P b D m m 2 ) a) ) b = P σ 2 / + σ2 2/ D m m 2 ) a 2 σ 2 / + σ2 2/ 2 σ 2 / + σ2 2/ 2 = 2π u2 u O e déduit l itervalle aocé. exp x 2 /2)dx E gééral les variaces e sot pas coues. Il peut alors se préseter deux cas. Posos : Ŝ 2 =,X X i X) 2 Ŝ2 = 2 2,Y Y i Y ) 2 2 et i= ŜX,Y 2 = X i X) 2 + + 2 2 i= 2 i= Y i Y ) 2 ) i= = )Ŝ2,X + 2 )Ŝ2 2,Y + 2 2 Théorème. Si les variaces σ et σ 2 sot icoues mais égales, u itervalle de cofiace de m m 2 au iveau α est [ ] D t + 2 2, α/2 SX,Y 2 / + SX,Y 2 / 2, D + t + 2 2, α/2ŝ2 X,Y / + Ŝ2 X,Y / 2 où t + 2 2, α/2 représete le fractile d ordre α/2 de la loi de Studet à + 2 2 degrés de libertés. O aurait pu remplacer σ 2 et σ2 2 par Ŝ2 et,x Ŝ2 2,Y, mais e gééral o préfère predre u estimateur basé sur la réuio des deux échatillos. O a déjà vu que : ) 2 Xi X 2 ) 2 Yi Y Z = et Z 2 = i= σ suivet respectivemet ue loi du χ 2 à et 2 degrés de liberté. Par coséquet, comme Z et Z 2 sot idépedates, Z + Z 2 suit ue loi du χ 2 à + 2 2 degrés de liberté. O obtiet alors, e posat σ 2 = σ2 2 = σ 2, [ EZ + Z 2 ) = + 2 2 = ] σ 2 E 2 X i X) 2 + Y i Y ) 2 c est-à-dire que Ŝ2 X,Y est u estimateur sas biais de σ2. Démostratio. O va remplacer l écart-type de D, Ŝ2 X,Y / + Ŝ2 X,Y / 2 par O a i= i= σ 2 i= S 2 X,Y / + S 2 X,Y / 2. α = PD a m m 2 D + b) = P b D m m 2 ) a) b D m m 2 ) a = P Ŝ2 X,Y / + Ŝ2 X,Y / 2 Ŝ2 X,Y / + Ŝ2 X,Y / 2 Ŝ2 X,Y / + Ŝ2 X,Y / 2

20 Chapitre II. Estimatio par itervalle O pose D m m 2 ) T = = Ŝ2 X,Y / + Ŝ2 X,Y / 2 D m m 2) σ2 / +σ 2 / 2 Ŝ 2 X,Y σ 2 Ŝ 2 X,Y U Le umérateur suit ue loi ormale cetrée réduite. Au déomiateur o a σ 2 = + 2 2 où U suit ue loi du χ 2 à + 2 2 degrés de liberté. O e déduit que T suit ue loi de Studet à + 2 2 degrés de liberté, et doc o obtiet le résultat. Lorsqu o σ et σ 2 sot icoues mais o écessairemet égales, o utilise la méthode approchée suivate. Théorème 2. Si les échatillos ot des tailles importates et égales à = 2 = > 30, u itervalle de cofiace de m m 2 au iveau α est ] [D q α/2 Ŝ2,X + Ŝ22,Y )/ Ŝ2,X + Ŝ2 2,Y )/, D + q α/2 où q α/2 représete le fractile d ordre α/2 de la loi ormale cetrée réduite. Il suffit de remarquer que la variable réduite. D m m 2 ) Ŝ2,X + Ŝ22,Y )/ suit sesiblemet ue loi ormale cetrée 4.b. Itervalle de cofiace du rapport de deux variaces. Théorème 3. U itervalle de cofiace au iveau α de σ/σ 2 2 2 est Ŝ 2,X, f, 2, α/2 Ŝ 2 2,Y Ŝ 2,X f, 2, α/2 Ŝ 2 2,Y où les fractiles sot ceux de loi de Fisher-Sedecor F, 2 ). Le résultat s obtiet par les mêmes méthodes que pour les théorèmes précédets. La loi de Fisher-Sedecor peut être obteue comme le quotiet de deux lois du χ 2 időpedates : F, 2 ) = χ2 / ) χ 2 2 / 2 ) 5. Estimatio d ue proportio Das ue certaie populatio, la proportio d idividus ayat ue propriété doée est égale à p. Soit X le ombre d idividus d u échatillo de taille ayat la propriété.

5. Estimatio d ue proportio 2 5.a. Estimatio poctuelle. Théorème 4. U estimateur sas biais et cosistat de p est : T = X E effet, le ombre X d idividus de l échatillo ayat la propriété suit la loi biomiale B, p). O a : ET ) = EX) 5.b. Estimatio par itervalle. = p et VarT ) = VarX) p p) 2 = 0 O e sait pas détermier exactemet u itervalle de cofiace. O utilise des solutios approchées, qui foctioet lorsqu o dispose d échatillo de grade taille. Aisi, lorsque est grad ou/et p voisi de 0, 5 o peut approcher la loi biomiale par ue loi ormale. Rappel : Soit ue suite de variables aléatoires Z suivat la loi biomiale B, p) ; la suite des variables réduites Z = Z p coverge e loi vers la loi ormale cetrée réduite, et o a : p p) Pa Z b) b exp x 2 /2)dx 2π a Théorème 5. U itervalle de cofiace approché de p au iveau α est doée par [ ] T T ) T T ) T q α/2, T + q α/2 où q α/2 représete le fractile d ordre α/2 de la loi ormale cetrée réduite. Démostratio. D après le rappel, X p T p = p p) p p)/ suit approximativemet la loi ormale cetrée réduite. L itervalle [T a, T + b] est u itervalle de cofiace de p au iveau α si : ) b T p a α = PT a < p < T + b) = P < < p p)/ p p)/ p p)/ ) ) a b Φ Φ p p)/ p p)/ où Φu) = 2π u exp x 2 /2)dx E choisissat u itervalle symétrique o obtiet la quatile q α/2. Comme p p) est pas cou, o obtiet alors u itervalle de cofiace approché e remplaçat p par l estimateur T. O peut doer ue approximatio de l itervalle de cofiace u peu plus précise.

22 Chapitre II. Estimatio par itervalle U itervalle de cofiace approché de p au iveau α est doée par ) T + q2 α/2, T + q2 α/2 + q2 α/2 2 + q2 α/2 2 où = q α/2 cetrée réduite. T T ) + q2 α/2 4 Démostratio. O a : + ) et q α/2 représete le fractile d ordre α/2 de la loi ormale q α/2 < T p p p) < q α/2 T p) 2 < q α/2 2 p p) p 2 + q2 α/2 ) 2p T + q2 α/2 2 ) + T 2 < 0 Le paramètre p doit doc être compris etre les racies de l équatio du secod degré. O vérifie aisémet qu elle a deux racies réelles apparteat à l itervalle [0, ]. D où, o obtiet l itervalle de cofiace idiqué. 5.c. Méthode du Bootstrap. A partir d u échatillo X = X, X 2,..., X ) o détermie u estimateur poctuel sx) d u paramètre θ. Sauf das quelques cas particuliers sx) = X par exemple) le calcul de la variace est pas aisé, ce qui red problématique la détermiatio d itervalles de cofiace pour?. E 979 ue ouvelle méthode a été développé. Cette méthode s appuie sur des cocepts simples permettat, à partir d ue réalisatio x, x 2,..., x ) de l échatillo, d obteir ue estimatio de la variace de sx) et u itervalle de cofiace pour θ. O cosidère que la réalisatio de l échatillo x, x 2,..., x ) est représetative de la populatio et o tire parmi les x k, au hasard et avec remise, u échatillo bootstrapé X = X, X2,..., X) ; e pratique o tire ombres au hasard etre et et o associe au ombre tiré k la valeur X k. Sur cet échatillo bootstrapé o peut calculer u estimateur sx ) par le même algorithme que celui qui doe sx). O répète le tirage u grad ombre de fois, B, ce qui doe ue populatio de valeurs de sx ) S = s, s 2,..., s B que l o peut représeter par u histogramme. Sur cette populatio o peut calculer ue estimatio de la moyee et de l écart-type : s = B s k, B s k s) B B 2 La populatio S peut être triée par valeurs croissates ce qui permet de détermier u itervalle de cofiace e gardat ue certaie proportio des valeurs cetrales. Par exemple si B = 000 et si les valeurs triées de S sot α α 2 α 000, l itervalle de cofiace à 95% est [α 25, α 975 ].