CPP - la prépa des INP ( ème aée). Bordeaux, 6/04/04. Devoir de statistiques: CORRIGE durée h Doées: O rappelle que si Z suit ue loi N (0, ), o a P(Z.96) 0, 975 et P(Z.65) 0, 95. Exercice. θ et O cosidère ue variable aléatoire X de desité f θ avec f θ (x) θ si x [, 0[, + θ si x [0, ], 0 sio. Représeter f θ et justifier que f θ est bie ue desité de probabilité pour θ. f θ est positive et d itégrale ( et cotiue par morceaux doc bie itégrable).. Calculer l espérace et la variace de X. (Les résultats sot E[X] θ et Var(X) 3 θ ). E[X] R xf θ(x)dx θ, E[X ] R x f θ (x)dx /3 et Var(X) E[X ] E[X] 3 θ. O cosidère maiteat X,... X des variables aléatoires idépates et de même loi. O suppose que la loi commue est de desité f θ avec θ icou. O va chercher à estimer θ. 3. Proposer u esitmateur ˆθ de θ basé sur la méthode des momets. O pr ˆθ i X i. 4. Calculer so biais et so risque quadratique. Il est sas biais (E θ [ˆθ ] θ) et de risque quadratique: E θ [(ˆθ θ) ] Var θ (ˆθ ) Var(X ) 3 θ. O va maiteat s itéresser à l estimateur du maximum de vraisemblace de θ. 5. O ote N {Xi 0} et N {Xi <0}. Soiet x,..., x i [, ] et θ, écrire la vraisemblace du modèle au poit (x,..., x ; θ) e foctio de N, N et θ. i
E u tel poit la vraisemblace s écrit: ( ) ( {Xi <0} L(x,..., x, θ) f θ (x i ) θ + θ i ( θ i ) i {X i <0} ( + θ ) i {X i 0} ) {Xi 0} 6. Motrer que l estimateur du maximum devraisemblace existe et vaut: ˆθ MV N N (N + N ) N. O calcule l L(x,..., x, θ) N l ( θ) + N l ( + θ). Pour chercher, le maximum e θ (s il existe), o calcule la dérivée e θ. O a: θ ll N θ + N + θ Cette dérivée s aule si et seulemet si θ N N (N +N ). O vérifie que l o a bie u maximum local e ce poit. C est le seul extremum local, doc il s agit bie d u maximum global. 7. O pose Y i {Xi 0}, pour i. Calculer l espérace et la variace des variables aléatoires Y i. E déduire l espérace et le risque quadratique de ˆθ MV. Y i e pr que valeurs 0 et. Y i suit doc ue loi de Beroulli de paramètre: p P(Y i ) P(X i 0) + 0 f θ (x)dx / + θ. So espérace vaut p / + θ et sa variace p( p) /4 θ. 8. Quel estimateur vaut-il mieux utiliser etre ˆθ et ˆθ MV? Justifier. O a ˆθ MV N avec N i Y i. Les Y i état idépats, o calcule facilemet que E θ [ˆθ MV ] θ et ( ) N ( ) N θ + θ. E θ [(ˆθ MV θ) ] Var(Yi ) /4 θ. Les estimateurs sot sas biais mais le risque quadratique de ˆθ MV est plus petit que celui de ˆθ. Il vaut doc mieux utiliser ˆθ MV. 9. 0 veut maiteat tester : l hypothèse ulle: H 0 {θ 0} cotre l hypothèse alterative: H {θ > 0}. O suppose ici que la taille de l échatillo est suffisamet grade pour pourvoir utiliser le théorème cetral limite. Proposer u test de iveau
de cofiace asymptotique 0,95 basé sur l estimateur ˆθ ou ˆθ MV. O justifiera otammet la forme de la régio d acceptatio ou de rejet du test. O costruit ici le test avec ˆθ MV. Sous H 0, par la loi forte des grads ombres, ˆθ MV i Y i coverge presque sûremet vers E θ0 [Y ] lorsque +. De plus, vu que Var θ0(y ) /4, le théorème cetral limite doe la covergece e loi lorsque + : A : ( ) Y i L Z avec Z N (0, ). i Sous H, ˆθ MV i Y i coverge presque sûremet vers E θ [Y ] + θ >. Doc A t presque sûremet vers +. O choisit doc la règle de décisio suivate : o accepte (ou plutôt o e rejette pas) H 0 si A k et o rejette H 0 si A > k avec k u réel à détermier. La valeur de k est choisie de telle sorte que P(rejeter H 0 H 0 est vraie) 0, 05. O a P(rejeter H 0 H 0 est vraie) P 0 (A > k) P(Z > k) avec Z de loi N (0, ). Au vu des doées, o choisit doc: k, 65. Exercice. O cosidère (X,..., X ) des variables aléatoires idépates de loi géométrique de paramètre p icou (0 p ). O pose q p. O rappelle X est à valeurs das N et que pour k, P(X k) q k p.. Soit X ue variable aléatoire de loi géométrique de paramètre p. Motrer que E[X] p. Idicatio: O rappelle que pour x <, o a kx k x k k 0 k ( ) x Pour la suite, o admettra que Var(X) q p. E[X] k kp(x k) k kqk p ( x) p ( q) p. à l aide de la méthode des mo-. Proposer u estimateur ˆθ de θ p mets: ˆθ i X i. 3. Proposer u itervalle de cofiace asymptotique de iveau 0,95 à l aide du théorème cetral limite. Au vu de la questio suivate, o va le choisir cetré autour de θ. Le théorème cetral limite ous dit que: 3
B : Soit maiteat l > 0, ( ˆθ ) L Z avec Z N (0, ). q/p p P(θ [ˆθ l, ˆθ l]) P( l ˆθ θ l) ( P l p B l p ) q q ( P l p Z l p ) avec Z N (0, ). q q O veut que la probabilité ci-dessus soit (supérieure ou) égale à 0,95. O choisit doc l de telle sorte que: l p q, 96 soit l, 96 q p. 4. 0 veut maiteat tester l hypothèse ulle: H 0 {θ } cotre l hypothèse alterative: H {θ }. A l aide de la variable aléatoire Y ( i X i ), costruire u test de iveau asymptotique 0,95 pour θ. O remarque que sous H 0, p / et Y B coverge e loi vers ue loi N (0, ) (d après le TCL), tadis que d après la LFGN, sous H, o a soit Y +, soit Y presque sûremet. O choisit doc la règle de décisio suivate: o accepte (ou plutôt o e rejette pas) H 0 si Y k et o rejette H 0 si Y > k avec k u réel à détermier. La valeur de k est choisie de telle sorte que P(rejeter H 0 H 0 est vraie) 0, 05. O a P(rejeter H 0 H 0 est vraie) P θ ( Y > k) P( Z > k) avec Z de loi N (0, ). Au vu des doées, o choisit doc: k, 96. 5. Sur u échatillo de taille, o trouve que ˆθ i X i, 3. Que peut-o coclure si la taille de l échatillo est de 70? de 00? Pour 70, o trouve Y 35 0, 3, 77. O e rejette pas H 0. Pour 00, o trouve Y 00 0, 3, 3. O rejette H 0. 6. Proposer u script Matlab permettat de vérifier que l erreur de première espèce est bie de 0,05 et calculat la puissace du test lorsque (θ ) lorsque la taille de l échatillo est de 70. O cosiderera que la commade geometrique(n,p) a déjà été programmée et qu elle revoie N variables aléatoires idépates de loi géométrique de paramètre p. Programme pour tester l erreur de première espèce: O cherche à estimer P(rejeter H 0 H 0 est vraie). A chacu des N 4
passages das la boucle for, o simule u échatillo de taille 70 de loi géométrique de paramètre /. O compte le ombre de fois ou le test est rejeté (alors qu ici H 0 est vraie :p /). O lacera alors le programme avec u N suffisamet grad (N 000 par exemple.) fuctio Eerreur(N) c0 for i:n Ageometrique (70,/) Ssum(A) Y sqrt( 70/)* (S/70 -/) if abs(y) >,96, cc+ E c/n Programme pour tester la puissace du test: O fixe p /. A chacu des N passages das la boucle for, o simule u échatillo de taille 70 de loi géométrique de paramètre p. O compte le ombre de fois ou le test est H est accepté. Ici si o choisit p /, c est H qui est vraie). fuctio Ppuissace(N,p) c0 for i:n Ageometrique (70,p) Ssum(A) Y sqrt( 70/)* (S/70-/) if abs(y) >,96, cc+ P c/n 5