Exer ci ces Cor r i gé s

Documents pareils
TSTI 2D CH X : Exemples de lois à densité 1

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Probabilités III Introduction à l évaluation d options

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

BACCALAURÉAT GÉNÉRAL SESSION 2012 OBLIGATOIRE MATHÉMATIQUES. Série S. Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE

MATHS FINANCIERES. Projet OMEGA

Chapitre 1 : Évolution COURS

Simulation de variables aléatoires

Loi binomiale Lois normales

TESTS D'HYPOTHESES Etude d'un exemple

Moments des variables aléatoires réelles

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

MÉTHODE DE MONTE CARLO.

Probabilités sur un univers fini

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

3. Conditionnement P (B)

Feuille d exercices 2 : Espaces probabilisés

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Commun à tous les candidats

Amphi 3: Espaces complets - Applications linéaires continues

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Principe d un test statistique

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

INTRODUCTION. 1 k 2. k=1

Les devoirs en Première STMG

Chapitre 2 Le problème de l unicité des solutions

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Introduction à la Statistique Inférentielle

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

4 Distributions particulières de probabilités

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Le modèle de Black et Scholes

Variables Aléatoires. Chapitre 2

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Probabilités Loi binomiale Exercices corrigés

BTS Groupement A. Mathématiques Session Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

EXERCICE 4 (7 points ) (Commun à tous les candidats)

EXERCICES - ANALYSE GÉNÉRALE

Précision d un résultat et calculs d incertitudes

Ressources pour le lycée général et technologique

Que faire lorsqu on considère plusieurs variables en même temps?

Introduction à l approche bootstrap

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Travaux dirigés d introduction aux Probabilités

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M

Projet Etienne Marceau Méthodes statistiques en assurance non vie

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Suites numériques 4. 1 Autres recettes pour calculer les limites

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Limites finies en un point


MODELES DE DUREE DE VIE

3 Approximation de solutions d équations

Probabilités conditionnelles Loi binomiale

Correction du Baccalauréat S Amérique du Nord mai 2007

1 TD n 1:dénombrement

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #4-5

4. Martingales à temps discret

Lois de probabilité. Anita Burgun

TABLE DES MATIERES. C Exercices complémentaires 42

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Continuité et dérivabilité d une fonction

Statistiques Descriptives à une dimension

Corrigé des TD 1 à 5

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

3. Caractéristiques et fonctions d une v.a.

Probabilités sur un univers fini

Fonctions de plusieurs variables

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Analyse de la variance Comparaison de plusieurs moyennes

LES GENERATEURS DE NOMBRES ALEATOIRES

Cours de méthodes de scoring

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

CCP PSI Mathématiques 1 : un corrigé

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Estimation et tests statistiques, TD 5. Solutions

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Probabilités conditionnelles Exercices corrigés

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Correction du baccalauréat ES/L Métropole 20 juin 2014

Introduction au pricing d option en finance

Annexe commune aux séries ES, L et S : boîtes et quantiles

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

Première partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015

Cours 02 : Problème général de la programmation linéaire

GEA II Introduction aux probabilités Poly. de révision. Lionel Darondeau

Chapitre 2. Matrices

Circuits RL et RC. Chapitre Inductance

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Quantification Scalaire et Prédictive

Transcription:

Département de Mathématiques et Informatique Exer ci ces Cor r i gé s Abdelhamid El Mossadeq P rofesseur à l E H T P 2006-2007

A. El Mossadeq Juin 2006

TABLE DES MATIERES Structures Statistiques et Estimation 1 Les Procédures U suelles des Tests d Hypothèses : 1. Les Fréquences 45 Les Procédures U suelles des Tests d Hypothèses : 2. Les Tests du Khi-Deux 61 Les Procédures Usuelles des Tests d Hypothèses : 3. Moyennes et Variances 95

Structure Statistique et Estimation

A. El Mossadeq Structures Statistiques et Estimation Exercice 1 Déterminer et étudier les propriétés de l estimateur du maximum de vraisemlance d un r-échantillon pour : 1. le paramètre p d une loi de Bernouilli 2. le paramètre p d une loi géométrique 3. le paramètre p d une loi binomiale d ordre n 4. le paramètre α d une loi de Poisson 5. le paramètre λ d une loi exponentielle 6. les paramètres μ et σ 2 d une loi normale 7. le paramètre θ d une loi uniforme sur l intervalle [0,θ] Solution 1 1. Soit X une variable aléatoire de Bernouilli de paramètre p. Pour tout x {0, 1}, la probabilité élémentaire p (x) de x est : p (x) p x (1 p) 1 x de plus : E [X] p V [X] p (1 p) (a) Recherche du maximum de vraisemlance : Considérons un r-échantillon de cette structure. Sa fonction de vraisemblance est définie pour tout p [0, 1] et tout (x 1,..., x r ) {0, 1} r par : ry L (p; x 1,...,x r ) p (x i ) rp x i p (1 p) r P r x i d où : Ã rx! Ã! rx ln L (p; x 1,..., x r ) x i ln p + r x i ln (1 p) 3

Structures Statistiques et Estimation A. El Mossadeq Il en résulte que : d où : p ln L (p; x 1,..., x r ) rp x i p P r r 1 p p ln L (p; x 1,...,x r )0 p 1 r et comme : 2 p ln L (p; x 1,..., x 2 r ) < 0 donc l estimateur du maximum de vraisemblance d un r-échantillon d une structure de Bernouilli est : ˆp 1 rx X i r C est la fréquence empirique du r-échantillon. (b) Etude des propriétés de ˆp : Puisque : et : E [ˆp] E [X] p V [ˆp] V [X] r p (1 p) r On en déduit que ˆp est un estimateur sans biais et convergent du paramètre p d une loi de Bernouilli. rx x i x i 2. Soit X une variable aléatoire de géométrique de paramètre p. Pour tout x N, la probabilité élémentaire p (x) de x est : p (x) p (1 p) x 1 de plus : E [X] 1 p V [X] 1 p p 2 4

A. El Mossadeq Structures Statistiques et Estimation Considérons un r-échantillon de cette structure. Sa fonction de vraisemblance est définie pour tout p [0, 1] et tout (x 1,...,x r ) (N ) r par : ry L (p; x 1,..., x r ) p (x i ) d où : Il en résulte que : d où : p r (1 p) rp x i r à rx! ln L (p; x 1,..., x r )rln p + x i r ln (1 p) p ln L (p; x 1,...,x r ) r p rp x i r 1 p P r p r x i p (1 p) p ln L (p; x 1,..., x r )0 p rp r x i et comme : 2 p ln L (p; x 1,..., x 2 r ) < 0 donc l estimateur du maximum de vraisemblance d un r-échantillon d une structure géométrique est : ˆp rp r X i C est l inverse de la moyenne empirique du r-échantillon. 3. Soit X une variable aléatoire binomiale d ordre n et de paramètre p. pour tout x {0, 1,..., n}, la probabilité élémentaire p (x) de x est : p (x) C (n, x) p x (1 p) n x 5

Structures Statistiques et Estimation A. El Mossadeq de plus : E [X] np V [X] np (1 p) (a) Recherche du maximum de vraisemlance : Considérons un r-échantillon de cette structure. Sa fonction de vraisemblance est définie pour tout p [0, 1] et tout (x 1,..., x r ) {0, 1,..., n} r par : ry L (p; x 1,..., x r ) p (x i ) d où : ln L (p; x 1,..., x r )ln Il en résulte que : d où : " ry # C (n, x i ) p ry C (n, x i )+ rp x i (1 p) rn r P Ã rx x i ln p + rn p ln L (p; x 1,..., x r ) x i x i! rx x i ln (1 p) rp P rn r p 1 p rp x i rnp p (1 p) p ln L (p; x 1,...,x r )0 p 1 rn et comme : 2 p ln L (p; x 1,..., x 2 r ) < 0 donc l estimateur du maximum de vraisemblance d un r-échantillon d une structure de binomiale est : ˆp 1 rx X i rn rx x i x i 6

A. El Mossadeq Structures Statistiques et Estimation (b) Etude des propriétés de ˆp : Puisque : et : E [ˆp] 1 n E [X] p V [ˆp] V [X] rn 2 p (1 p) rn on en déduit que ˆp est un estimateur sans biais et convergent de p. 4. Soit X une variable aléatoire de Poisson de paramètre α. Pour tout x N, la probabilité élémentaire p (x) de x est : de plus : p (x) αx x! exp α E [X] α V [X] α (a) Recherche du maximum de vraisemlance : Considérons un r-échantillon de cette structure. Sa fonction de vraisemblance est définie pour tout α, α > 0, ettout (x 1,..., x r ) N r par : ry L (α; x 1,...,x r ) p (x i ) d où : rp ln L (α; x 1,..., x r ) ln (x 1!...x r!) + Il en résulte que : α ln L (α; x 1,..., x r ) x i α exp rα x 1!...x r! rp rx x i ln α rα x i α r 7

Structures Statistiques et Estimation A. El Mossadeq d où : α ln L (α; x 1,..., x r )0 p 1 r et comme : 2 α ln L (α; x 1,..., x 2 r ) < 0 donc l estimateur du maximum de vraisemblance d un r-échantillon d une structure de Poisson est : ˆα 1 rx X i r C est la moyenne empirique du r-échantillon. (b) Etude des propriétés de ˆα : Puisque : et : E [ˆα] E [X] α V [ˆα] V [X] r α r On en déduit que ˆα est un estimateur sans biais et convergent de α. rx x i 5. Soit X une variable aléatoire exponentielle de paramètre λ. Sa densité de probabilité f est définie par : 0 si x 0 f (x) λ exp λx si x > 0 de plus : E [X] 1 λ V [X] 1 λ 2 Considérons un r-échantillon de cette structure. 8

A. El Mossadeq Structures Statistiques et Estimation Sa fonction de vraisemblance est définie pour tout λ, λ>0, ettout(x 1,...,x r ) dans R r, tous strictement positifs, par : ry L (λ; x 1,..., x r ) f (x i ) d où : Il en résulte que : d où : λ r exp λ ln L (λ; x 1,..., x r )r ln λ λ λ ln L (λ; x 1,..., x r ) r λ rx rx rx λ ln L (λ; x 1,...,x r )0 λ x i x i rp r x i x i et comme : 2 λ 2 ln L (λ; x 1,..., x r ) < 0 donc l estimateur du maximum de vraisemblance d un r-échantillon d une structure exponentielle est : ˆλ rp r X i C est l inverse de la moyenne empirique du r-échantillon. 6. Soit X une variable aléatoire normale de paramètres μ et σ 2. Sa densité de probabilité f est définie pour tout x R par : f (x) 1 σ 2π exp 1 (x μ)2 2σ2 de plus : E [X] μ V [X] σ 2 9

Structures Statistiques et Estimation A. El Mossadeq (a) Recherche du maximum de vraisemlance : Considérons un r-échantillon de cette structure. Sa fonction de vraisemblance est définie pour tout μ R, toutσ>0et tout (x 1,..., x r ) R r par : ry L (μ, σ; x 1,..., x r ) f (x i ) d où : 1 σ 2π r exp 1 2σ 2 ln L (μ, σ; x 1,...,x r ) r ln 2π r ln σ 1 2σ 2 Il en résulte que : rx (x i μ) 2 rx (x i μ) 2 d où : μ L (μ, σ; x 1,..., x r ) 1 σ 2 rx (x i μ) σ L (μ, σ; x 1,..., x r ) r σ + 1 σ 3 rx (x i μ) 2 μ L (μ, σ; x 1,..., x r )0 σ L (μ, σ; x 1,...,x r )0 μ 1 r σ 2 1 r rx x i rx (x i μ) 2 Donc les estimateurs du maximum de vraisemblance d un r-échantillon d une structure normale est : ˆμ 1 rx X i r ˆσ 2 1 r rx (X i ˆμ) 2 10

A. El Mossadeq Structures Statistiques et Estimation (b) Etude des propriétés de ˆμ et ˆσ: On a : et : E [ˆμ] E [X] μ E ˆσ 2 r 1 V [X] r r 1 σ 2 r On en déduit que ˆμ est un estimateur sans biais et convergent de μ, mais ˆσ est un estimateur biaisé de σ. 7. Soit X une variable aléatoire uniforme sur l intervalle [0,θ]. Sa densité de probabilité f est définie pour tout x [0,θ] par : 1 si x [0,θ] f (x) θ 0 si x / [0,θ] de plus : E [X] θ 2 V [X] θ2 12 Considérons un r-échantillon de cette structure. Sa fonction de vraisemblance est définie pour tout θ, θ>0, ettout(x 1,...,x r ) [0,θ] r : ry L (θ; x 1,...,x r ) f (x i ) 1 θ r La fonction : θ L (θ; x 1,..., x r ) est strictement décroissante, donc elle atteint son maximum lorsque θ est minimum. Et comme : i {1,..., r} : θ x i 11

Structures Statistiques et Estimation A. El Mossadeq donc θ est minimum lorsque : θ max(x 1,..., x r ) Donc l estimateur du maximum de vraisemblance d un r-échantillon d une structure uniforme est : ˆθ max(x 1,..., X r ) Exercice 2 Soit X une variable aléatoire dont la densité de probabilité f est définie par : 1 f (x) θ exp x si x > 0 θ 0 si x 0 où θ est un paramètre réel strictement positif. 1. Déterminer l estimateur du maximum de vraisemlance ˆθ de θ d un r-échantillon de variable parente X. 2. ˆθ est-il un résumé exhaustif? 3. Calculer l espérance mathématique et la variance de ˆθ. Que peut-on conclure? 4. Calculer la quantité d information de Fisher. En déduire que ˆθ est efficace. Solution 2 Soit X une variable aléatoire exponentielle dont la densité de probabilité f est définie pour tout x, x>0, par: 1 f (x) θ exp x si x > 0 θ 0 si x 0 où θ est un paramètre réel strictement positif. On a : E [X] θ V [X] θ 2 12

A. El Mossadeq Structures Statistiques et Estimation 1. Considérons un r-échantillon de cette structure. Sa fonction de vraisemblance est définie pour tout θ, θ>0, ettout(x 1,...,x r ) R r, tous strictement positifs, par : ry L (θ; x 1,..., x r ) f (x i ) d où : Il en résulte que : d où : 1 θ r exp ln L (θ; x 1,..., x r ) r ln θ θ ln L (θ; x 1,...,x r ) r θ + θ ln L (θ; x 1,..., x r )0 θ 1 r rp x i rp θ x i θ rp x i θ 2 et comme : 2 θ 2 ln L (θ; x 1,..., x r ) < 0 donc l estimateur du maximum de vraisemblance d un r-échantillon d une structure exponentielle est : ˆθ 1 rx X i r C est la moyenne empirique du r-échantillon. 2. Pour tout θ, θ>0, ettout(x 1,...,x r ) R r, tous strictement positifs, on a : rp L (θ; x 1,..., x r ) x i rx x i 1 θ r exp θ 1 θ r exp rˆθ (x 1,..., x r ) θ 13

Structures Statistiques et Estimation A. El Mossadeq D aprèslethéorèmedefactorisation,ˆθ est un résumé exhaustif puisque : ³ L (θ; x 1,...,x r )g θ; ˆθ (x 1,..., x r ) h (x 1,..., x r ) où : et : 3. Comme : alors : ³ g θ; ˆθ (x 1,...,x r ) 1 θ r exp rˆθ (x 1,..., x r ) θ h (x 1,..., x r )1 i E hˆθ ˆθ 1 r rx X i E [X] θ et : hˆθi V V [X] r θ2 r On en déduit que ˆθ est un estimateur sans biais et convergent de θ. 4. Calculons la quantité d information de Fisher, I [X, θ], concernant θ. On a : 2 I [X, θ] E 2 ln f (θ, X) θ µ 2 E θ 2 ln θ X θ E 1 θ 2 + 2X θ 3 1 θ 2 Donc la quantité d information de Fisher, I [X 1,..., X r,θ], concernant θ fournie par le r-échantillon est : I [X 1,..., X r,θ] ri [X, θ] r θ 2 14

A. El Mossadeq Structures Statistiques et Estimation i Calculons l efficacité e hˆθ de.ˆθ. On a : donc, ˆθ est efficace. i e hˆθ 1 I [X 1,..., X r,θ] V 1 hˆθi Exercice 3 Soit X une variable aléatoire dont la densité de probabilité f est définie par : 0 si x 0 f (x) λ θ k xk 1 exp x si x > 0 θ où θ est un paramètre réel strictement positif, k un entier naturel non nul et λ une constante réel. 1. Déterminer la constante λ. 2. Déterminer l estimateur du maximum de vraisemlance ˆθ de θ d un r-échantillon de variable parente X. 3. ˆθ est-il un résumé exhaustif? 4. Calculer l espérance mathématique et la variance de ˆθ. Que peut-on conclure? 5. Calculer la quantité d information de Fisher. En déduire que ˆθ est efficace. Solution 3 La densité de probabilité de la variable aléatoire X est définie par : 0 si x 0 f (x) λ θ k xk 1 exp x θ si x > 0 Rappelons que pour tout k N : Z + 0 u k exp udu k! 15

Structures Statistiques et Estimation A. El Mossadeq 1. Ainsi : d où puisque : De plus : et : d où : Z + f (x) dx E [X] E X 2 Z + 0 Z + 0 λ (k 1)! λ Z + Z + Z + 0 kθ Z + Z + 0 1 (k 1)! f (x) dx 1 xf (x) dx λ θ k xk 1 exp x θ dx λu k 1 exp udu 1 (k 1)!θ k xk exp x θ dx x 2 f (x) dx k (k +1)θ 2 1 (k 1)!θ k xk+1 exp x θ dx V [X] E X 2 E [X] 2 kθ 2 2. Considérons un r-échantillon de cette structure. Sa fonction de vraisemblance est définie pour tout θ, θ>0,ettout(x 1,..., x r ) R r, tous strictement positifs, par : 16

A. El Mossadeq Structures Statistiques et Estimation d où : L (θ; x 1,..., x r ) ry f (x i ) 1 [(k 1)!] r θ (x 1...x rk r ) k 1 exp rp x i ln L (θ; x 1,...,x r ) r ln (k 1)! ln (x 1...x r ) k 1 rk ln θ Il en résulte que : d où : θ ln L (θ; x 1,..., x r ) rk θ + θ ln L (θ; x 1,..., x r )0 θ 1 rk rp x i θ 2 rx x i θ rp x i et comme : 2 θ 2 ln L (θ; x 1,..., x r ) < 0 donc l estimateur du maximum de vraisemblance d un r-échantillon de cette structure est : ˆθ 1 rx X i rk 3. Pour tout θ, θ>0, ettout(x 1,...,x r ) R r, tous strictement positifs, on a : rp L (θ; x 1,..., x r ) 1 [(k 1)!] r θ (x 1...x rk r ) k 1 exp x i 1 [(k 1)!] r θ (x 1...x rk r ) k 1 exp rkˆθ (x 1,..., x r ) θ D aprèslethéorèmedefactorisation,ˆθ est un résumé exhaustif puisque : ³ L (θ; x 1,...,x r )g θ; ˆθ (x 1,..., x r ) h (x 1,..., x r ) θ θ 17

Structures Statistiques et Estimation A. El Mossadeq où : et : 4. Puisque : alors : et : ³ g θ; ˆθ (x 1,..., x r ) 1 θ exp rkˆθ (x 1,...,x r ) rk θ h (x 1,..., x r ) 1 [(k 1)!] r (x 1...x r ) k 1 ˆθ 1 rk rx X i i E hˆθ 1 E [X] θ k V hˆθi V [X] rk 2 θ2 rk On en déduit que ˆθ est un estimateur sans biais et convergent de θ. 5. Calculons la quantité d information de Fisher, I [X, θ], concernant θ. On a : 2 I [X, θ] E 2 ln f (θ, X) θ µ 2 E θ 2 ln (k 1)! + (k 1) ln X k ln θ X θ E k θ 2 + 2X θ 3 k θ 2 Donc la quantité d information de Fisher, I [X 1,..., X r,θ], concernant θ fournie par le r-échantillon est : i Calculons l efficacité e hˆθ de.ˆθ. On a : I [X 1,..., X r,θ] ri [X, θ] rk i e hˆθ 1 I [X 1,..., X r,θ] V θ 2 hˆθi 1 18

A. El Mossadeq Structures Statistiques et Estimation donc, ˆθ est efficace. Exercice 4 Soit X une variable aléatoire dont la densité de probabilité f est définie par : 0 si x / [0,θ] f (x) 1 θ si x [0,θ] où θ est un paramètre réel. 1. Déterminer la fonction de répartition de X. 2. Calculer la quantité d information de Fisher. 3. Déterminer l estimateur du maximum de vraisemlance ˆθ de θ d un r-échantillon de variable parente X. 4. Calculer l espérance mathématique et la variance de ˆθ. Que peut-on conclure? 5. Dans le cas où ˆθ est biasé, proposer un estimateur sans biais de θ. Solution 4 1. La fonction de répartition F de X est définie pour tout x R par : d où : de plus : F (x) F (x) Z x f (t) dt 0 si x 0 x θ si 0 x θ 1 si x θ E [X] θ 2 2.PuisqueledomaineD θ : V [X] θ2 12 D θ {x R f (x) > 0} [0,θ] 19

Structures Statistiques et Estimation A. El Mossadeq dépend de θ, donc la quantité d information de Fisher n existe pas. 3. Considérons un r-échantillon de cette structure. Sa fonction de vraisemblance est définie pour tout θ, θ>0, ettout(x 1,...,x r ) [0,θ] r : ry L (θ; x 1,...,x r ) f (x i ) 1 θ r La fonction : θ L (θ; x 1,..., x r ) est strictement décroissante, donc elle atteint son maximum lorsque θ est minimum. Et comme : i {1,..., r} : θ x i Il en résulte que θ est minimum lorsque : θ max(x 1,..., x r ) Donc l estimateur du maximum de vraisemblance d un r-échantillon d une structure uniforme est : ˆθ max(x 1,..., X r ) 4. Pour déterminer la densité de probabilité de ˆθ, commençons d abord par calculer sa fonction de répartition. (a) Fonction de répartition de ˆθ : 20

A. El Mossadeq Structures Statistiques et Estimation Pour tout u R on a : i Fˆθ (u) P hˆθ <u P [max (X 1,...,X r ) <u] P [X 1 < u,..., X r <u] ry P [X k <u] k1 [F (u)] r 0 si u 0 ³ u r si 0 u θ θ 1 si u θ 21

Structures Statistiques et Estimation A. El Mossadeq (b) Densité de probabilité de ˆθ : Pour tout u R {0,θ} on a : fˆθ (u) d du Fˆθ (u) 0 si u / ]0,θ[ r ur 1 θ r si u ]0,θ[ (c) Espérance mathématique de ˆθ : i E hˆθ Z ufˆθ (u) du R Z θ r ur 0 θ r du r r +1 θ (d) Espérance mathématique de ˆθ 2 : E hˆθ2 i Z u 2 fˆθ (u) du (e) Variance de ˆθ : V hˆθi R Z θ 0 r ur+1 θ r du r r +2 θ2 E hˆθ2 i i 2 E hˆθ r (r +1) 2 (r +2) θ2 L estimateur ˆθ de θ est biaisé, mais il est asymptotiquement sans biais. 5. Considérons l estimateur : Alors : T r +1 ˆθ r E [T ] r +1 i E hˆθ r θ 22

A. El Mossadeq Structures Statistiques et Estimation et : V [T ] µ 2 r +1 hˆθi V r 1 r (r +2) θ2 T est donc un estimateur sans biais et convergent de θ. Exercice 5 Soit X une variable aléatoire dont la densité de probabilité f est définie par : 0 si x < θ f (x) exp (θ x) si x θ où θ est un paramètre réel. 1. Déterminer la fonction de répartition de X. 2. Calculer la quantité d information de Fisher. 3. Déterminer l estimateur du maximum de vraisemlance ˆθ de θ d un r-échantillon de variable parente X. 4. Calculer l espérance mathématique et la variance de ˆθ. Que peut-on conclure? 5. Dans le cas où ˆθ est biasé, proposer un estimateur sans biais de θ. Solution 5 1. La fonction de répartition F de X est définie pour tout x R par : d où : de plus : F (x) Z x f (t) dt 0 si x θ F (x) 1 exp (θ x) si x θ E [X] θ +1 V [X] 1 23

Structures Statistiques et Estimation A. El Mossadeq 2.PuisqueledomaineD θ : D θ {x R f (x) > 0} [θ, + [ dépend de θ, donc la quantité d information de Fisher n existe pas. 3. Considérons un r-échantillon de cette structure. Sa fonction de vraisemblance est définie pour tout θ R, ettout(x 1,..., x r ) ([θ, + [) r : La fonction : ry L (θ; x 1,..., x r ) f (x i ) exp rx (θ x i ) θ L (θ; x 1,..., x r ) est strictement croissante, donc elle atteint son maximum lorsque θ est maximum. Et comme : i {1,..., r} : θ x i Il en résulte que θ est maximum lorsque : θ min(x 1,..., x r ) Donc l estimateur du maximum de vraisemblance d un r-échantillon de cette structure est : ˆθ min(x 1,..., X r ) 4. Pour déterminer la densité de probabilité de ˆθ, commençons d abord par calculer sa fonction de répartition. 24

A. El Mossadeq Structures Statistiques et Estimation (a) Fonction de répartition de ˆθ : Pour tout v R on a : Fˆθ (v) i P hˆθ <v P [min (X 1,...,X r ) <v] 1 P [min (X 1,..., X r ) v] 1 P [X 1 v,..., X r v] ry 1 P [X k v] 1 k1 ry (1 P [X k <v]) k1 1 [1 F (v)] r 0 si v θ 1 exp r (θ v) si v θ (b) Densité de probabilité de ˆθ : Pour tout u R {θ} on a : d fˆθ (v) dv Fˆθ (v) 0 si v < θ r exp r (θ v) si v > θ (c) Espérance mathématique de ˆθ : i Z E hˆθ vfˆθ (v) dv R Z + rv exp r (θ v) dv θ θ + 1 r 25

Structures Statistiques et Estimation A. El Mossadeq (d) Espérance mathématique de ˆθ 2 : E hˆθ2 i Z v 2 fˆθ (v) dv (e) Variance de ˆθ : V hˆθi R Z + θ rv 2 exp r (θ v) dv µ θ + 1 2 + 1 r r 2 E hˆθ2 i i 2 1 E hˆθ r 2 L estimateur ˆθ de θ est biaisé, mais il est asymptotiquement sans biais. 5. Considérons l estimateur : T ˆθ 1 r Alors : et : i E [T ]E hˆθ 1 r θ V [T ]V hˆθi 1 r 2 T est donc un estimateur sans biais et convergent de θ. Exercice 6 Les éléments d une population possédent un caractère X qui suit une loi de P oisson de paramètre inconnu α. Une suite de r expériences a fourni les valeurs k 1,..., k r. 1. Déterminer l estimateur du maximum de vraisemlance ˆα de α et étudier les propriétés de cet estimateur. 2. ˆα est-il un résumé exhaustif? 3. On désire estimer la quantité : δ P [X 0] Déterminer l estimateur du maximum de vraisemlance ˆδ de δ. Que remarquez-vous? 26

A. El Mossadeq Structures Statistiques et Estimation Solution 6 1. Soit X une variable aléatoire de Poisson de paramètre α. pour tout x N, la probabilité élémentaire p (x) de x est : de plus : p (x) αx x! exp α E [X] α V [X] α (a) Recherche du maximum de vraisemlance : Considérons un r-échantillon de cette structure. Sa fonction de vraisemblance est définie pour tout α, α > 0, ettout (k 1,..., k r ) N r par : ry L (α; k 1,..., k r ) p (k i ) d où : rp ln L (α; k 1,...,k r ) ln (k 1!...k r!) + Il en résulte que : d où : α ln L (α; k 1,...,k r ) k i α exp rα k 1!...k r! rp rx k i ln α rα k i α r α ln L (α; k 1,..., k r )0 p 1 r et comme : 2 α ln L (α; k 1,..., k 2 r ) < 0 donc l estimateur du maximum de vraisemblance d un r-échantillon d une structure de Poisson est : ˆα 1 rx X i r C est la moyenne empirique du r-échantillon. rx x i 27

Structures Statistiques et Estimation A. El Mossadeq (b) Etude des propriétés de ˆα : Puisque : et : E [ˆα] E [X] α V [ˆα] V [X] r α r On en déduit que ˆα est un estimateur sans biais et convergent de α. 2. Pour tout α, α>0, ettout(k 1,..., k r ) N r on a : αrˆα(k 1,...,k r ) L (α; x 1,..., x r ) exp rα x 1!...x r! D aprèslethéorèmedefactorisation,ˆθ est un résumé exhaustif puisque : où : et : 3. On a : L (α; x 1,..., x r )g (α;ˆα (x 1,..., x r )) h (x 1,...,x r ) g (α;ˆα (x 1,..., x r )) α rˆα(k 1,...,k r) exp rα h (x 1,..., x r ) 1 x 1!...x r! δ P [X 0] exp α Pour tout δ, δ>0, ettout(k 1,..., k r ) N r par : ry L (δ; k 1,..., k r ) p (k i ) d où : ln L (δ; k 1,...,k r ) ln (k 1!...k r!) + rp ( ln δ) k 1!...k r! k i δ r rx k i ln ( ln δ)+rln δ 28

A. El Mossadeq Structures Statistiques et Estimation Il en résulte que : d où : δ ln L (δ; k 1,...,k r ) rp k i δ ln δ + r δ Ã δ ln L (δ; k 1 1,..., k r )0 δ exp r! rx k i et comme : 2 δ 2 ln L (δ; k 1,..., k r ) < 0 donc l estimateur du maximum de vraisemblance d un r-échantillon de cette structure est : Ã! 1 rx ˆδ exp X i r exp ˆα Exercice 7 Soit α un réel appartenant à ]1, + [ et X une variable aléatoire telle que : P [X k] 1 µ 1 1 k 1,k N α α 1. Calculer l espérance mathématique et la variance de X. 2. Déterminer l estimateur du maximum de vraisemlance ˆα de α d un r-échantillon de variable parente X et étudier ses propriétés. 3. ˆα est-il un résumé exhaustif? Solution 7 1. On a : E [X] α X kp [X k] k1 X k1 µ k 1 1 k 1 α α 29

Structures Statistiques et Estimation A. El Mossadeq et : E [X (X 1)] X k (k 1) P [X k] k1 X µ k (k 1) 1 1 k 1 α α k1 µ 2α 2 1 1 α d où : et : E X 2 E [X (X 1)] + E [X] α (2α 1) V [X] E X 2 E [X] 2 α (α 1) 2. Considérons un r-échantillon de cette structure. Sa fonction de vraisemblance est définie pour tout α ]1, + [ et tout (x 1,..., x r ) (N ) r par : ry L (α; x 1,..., x r ) p (x i ) d où : 1 α r µ 1 1 P r x i r α Ã rx! µ ln L (α; x 1,..., x r ) rln α + x i r ln 1 1 α Il en résulte que : α ln L (α; x 1,..., x r ) r α + rp x i r α (α 1) rp x i rα α (α 1) 30

A. El Mossadeq Structures Statistiques et Estimation d où : α ln L (α; x 1,..., x r )0 α 1 r et comme : 2 α ln L (p; x 1,...,x 2 r ) < 0 donc l estimateur du maximum de vraisemblance d un r-échantillon d une structure géométrique est : ˆα 1 rx X i r C est la moyenne empirique du r-échantillon. 3. Puisque : alors : et : ˆα 1 r rx X i E [ˆα] E [X] α V [ˆα] V [X] r α (α 1) r On en déduit que ˆα est un estimateur sans biais et convergent du paramètre α d une structure géométrique. rx x i Exercice 8 Soit X une variable aléatoire qui suit une loi de Pareto dont la densité de probabilité f est définie par : f (x) αa α x α+1 si x a 0 si x < a où X représente le revenu par habitant, a le revenu minimum et α, α>2, un coefficient dépendant du type du pays où l on se place. 31

Structures Statistiques et Estimation A. El Mossadeq 1. Vérifier que f est bien une densité de probabilité. 2. Calculer l espérance mathématique et la variance de X. 3. Calculer la fonction de répartition de X. 4. Déterminer l estimateur du maximum de vraisemlance â de a d un r-échantillon issu X. 5. Dans le cas où â est biasé, proposer un estimateur sans biais de a. Solution 8 1. La densité de probabilité de la loi de Pareto est définie par : αa α si x a f (x) x α+1 0 si x < a f est bien une densité de probabilité. En effet : Z f (x) dx 2. On a : et : d où : R E [X] E X 2 1 Z Z + a R Z + a αa α dx xα+1 xf (x) dx α α 1 a Z R Z + a αa α x α dx x 2 f (x) dx α α 2 a2 αa α dx xα 1 V [X] E X 2 E [X] 2 α (α 2) (α 1) 2 a2 32

A. El Mossadeq Structures Statistiques et Estimation 3. La fonction de répartition F de X est définie pour tout x R par : Z x F (x) f (t) dt 0 si x a Z x αa α dt si x a a tα+1 0 si x a 1 aα si x a x α 4. Considérons un r-échantillon de cette structure. Sa fonction de vraisemblance est définie pour tout a R et tout (x 1,..., x r ) (]a, + [) r,par: ry L (a; x 1,..., x r ) f (x i ) α r a rα (x 1...x r ) α+1 La fonction : a L (a; x 1,...,x r ) est strictement croissante, donc elle atteint son maximum lorsque a est maximum. Et comme : i {1,..., r} : a x i Il en résulte que θ est maximum lorsque : a min(x 1,..., x r ) Donc l estimateur du maximum de vraisemblance d un r-échantillon de cette structure est : â min(x 1,..., X r ) 5. Pour déterminer la densité de probabilité de ˆθ, commençons d abord par calculer sa fonction de répartition. 33

Structures Statistiques et Estimation A. El Mossadeq (a) Fonction de répartition de â : Pour tout x R on a : Fâ (x) P [â <x] P [min (X 1,..., X r ) <x] 1 P [min (X 1,..., X r ) x] 1 P [X 1 v,..., X r x] ry 1 P [X k x] 1 k1 ry (1 P [X k <x]) k1 (b) Densité de probabilité de ˆθ : Pour tout x R {a} on a : 1 [1 F (x)] r 0 µ si x a a α r 1 si x a d fâ (x) dv F â (x) 0 si x < a rαa rα x rα+1 si x > a (c) Espérance mathématique de â : Z E [â] vfâ (v) dv x α R Z + a rα rα 1 a rαa rα v dv rα (d) Espérance mathématique de â 2 : E â 2 Z v 2 fâ (v) dv R Z + a rα rα 2 a2 rαa rα dv vrα 1 34

A. El Mossadeq Structures Statistiques et Estimation (e) Variance de â : V [â] E â 2 E [â] 2 rα (rα 2) (rα 1) 2 a2 L estimateur â de a est biaisé, mais il est asymptotiquement sans biais. (f) Considérons l estimateur : T rα 1 rα â Alors : E [T ]a et : µ 2 rα 1 V [T ] V [â] rα 1 rα (rα 2) a2 T est donc un estimateur sans biais et convergent de a. Exercice 9 Soit X une variable aléatoire dont la densité de probabilité f est définie par : 0 si x θ f (x) 1 (θ x) exp si x > θ α α où θ est un paramètre réel et α un paramètre réel strictement positif. 1. Vérifier que f est bien une densité de probabilité. 2. Calculer l espérance mathématique et la variance de X. 3. Calculer la fonction de répartition de X. 4. On suppose θ connu et α inconnu. (a) Déterminer l estimateur du maximum de vraisemlance ˆα de α d un r- échantillon issu X. (b) Etudier les propriétés de ˆα. (c) Dans le cas où ˆα est biasé, proposer un estimateur sans biais de α. 5. On suppose α connu et θ inconnu. (a) Déterminer l estimateur du maximum de vraisemlance ˆθ de θ d un r- échantillon issu de X. (b) Etudier les propriétés de ˆθ (c) Dans le cas où ˆθ est biasé, proposer un estimateur sans biais de θ. 35

Structures Statistiques et Estimation A. El Mossadeq 6. On suppose que θ et α sont tous les deux inconnus. (a) Déterminer l estimateur du maximum de vraisemlance d un r-échantillon issu de³ X. (b) Etudier les propriétés de ˆα, ˆθ (c) Proposer un estimateur sans biais de (α, θ). ³ ˆα, ˆθ de (α, θ) Solution 9 1. f est bien une densité de probabilité. En effet : Z f (x) dx 2. On a : et : d où : R E [X] E X 2 1 Z Z + θ Z + 0 R Z + θ Z + 0 α + θ Z 1 α xf (x) dx R Z + θ Z + 0 x α (θ x) exp dx α exp tdt (θ x) exp dx α (αt + θ)exp tdt x 2 f (x) dx x 2 α (θ x) exp dx α (αt + θ) 2 exp tdt 2α 2 +2αθ + θ 2 (α + θ) 2 + α 2 V [X] E X 2 E [X] 2 α 2 36

A. El Mossadeq Structures Statistiques et Estimation 3. La fonction de répartition F de X est définie pour tout x R par : F (x) Z x f (t) dt 0 si x θ Z x 1 (θ t) exp dt si x θ θ α α 0 si x θ 1 exp 4. On suppose θ connu et α inconnu. (θ x) α si x θ (a) Considérons un r-échantillon de cette structure. Sa fonction de vraisemblance est définie pour tout α, α>0, θ R et tout (x 1,..., x r ) (]θ, + [) r par : ry L (α; x 1,..., x r ) f (x i ) d où : Il en résulte que : 1 rx α exp r ln L (α; x 1,..., x r ) r ln α + 1 α α ln L (α; x 1,..., x r ) r α 1 α 2 " 1 r 1 α α (θ x i ) α rx (θ x i ) d où : α ln L (α; x 1,..., x r )0 α 1 r α rx (θ x i ) # rx (θ x i ) " 1 r rx (x i θ) # rx x i θ 37

Structures Statistiques et Estimation A. El Mossadeq et comme : 2 α ln L (α; x 1,..., x 2 r ) < 0 donc l estimateur du maximum de vraisemblance d un r-échantillon de cette structure est : " # 1 rx ˆα X i θ r (b) On a : et : E [ˆα] E α V [ˆα] V "Ã 1 r "Ã 1 r V [X] r α2 r 5. On suppose α connu et θ inconnu.! # rx X i θ! # rx X i θ (a) Considérons un r-échantillon de cette structure. Sa fonction de vraisemblance est définie pour tout α, α>0, θ R et tout (x 1,..., x r ) (]θ, + [) r, tous strictement positifs, par : ry L (θ; x 1,..., x r ) f (x i ) 1 rx α exp r (θ x i ) α La fonction : θ L (θ; x 1,..., x r ) est strictement croissante, donc elle atteint son maximum lorsque θ est maximum. 38

A. El Mossadeq Structures Statistiques et Estimation Et comme : i {1,..., r} : θ x i Il en résulte que θ est maximum lorsque : θ min(x 1,..., x r ) Donc l estimateur du maximum de vraisemblance d un r-échantillon de cette structure est : ˆθ min(x 1,..., X r ) (b) Pour déterminer la densité de probabilité de ˆθ, commençonsd abordpar calculer sa fonction de répartition. (i) Fonction de répartition de ˆθ : Pour tout v R on a : i Fˆθ (v) P hˆθ <v P [min (X 1,..., X r ) <v] 1 P [min (X 1,..., X r ) v] 1 P [X 1 v,..., X r v] ry 1 P [X k v] 1 k1 ry (1 P [X k <v]) k1 1 [1 F (v)] r 0 si v θ µ θ v 1 exp r si v θ α (ii) Densitédeprobabilitédeˆθ : Pour tout v R {θ} on a : fˆθ (v) d dv Fˆθ (v) 0 si v < θ µ r θ v α exp r si v > θ α 39

Structures Statistiques et Estimation A. El Mossadeq (iii) Espérancemathématiquedeˆθ : i Z E hˆθ vfˆθ (v) dv R Z + µ r θ v θ α v exp r dv α Z + ³ α θ r t + exp tdt 0 α r + θ (iv) Espérancemathématiquedeˆθ 2 : E hˆθ2 i Z v 2 fˆθ (v) dv R Z + r θ α v2 exp r (θ v) dv ³ α r + θ 2 ³ α 2 + r (v) Variance de ˆθ : hˆθi V E hˆθ2 i i 2 E hˆθ ³ α 2 r L estimateur ˆθ de θ est biaisé, mais il est asymptotiquement sans biais. (c) Considérons l estimateur : Alors : T ˆθ α r i E [T ] E hˆθ α r θ et : hˆθi V [T ] V α r 2 T est donc un estimateur sans biais et convergent de θ. 40

A. El Mossadeq Structures Statistiques et Estimation 6. On suppose que θ et α sont tous les deux inconnus. (a) Considérons un r-échantillon de cette structure. Sa fonction de vraisemblance est définie pour tout α, α>0, θ R et tout (x 1,..., x r ) (]θ, + [) r, tous strictement positifs, par : ry L (α, θ; x 1,...,x r ) f (x i ) 1 rx α exp r (θ x i ) α Compte tenu des questions précedentes, la fonction : atteint son maximum pour : (α, θ) 7 L (α, θ; x 1,..., x r ) θ min(x 1,..., x r ) α " 1 r # rx x i θ d où, les estimateurs du maximum de vraisemblance donnés par : (b) On a : et : ˆθ min(x1,..., X r ) ˆα " 1 r # rx X i ˆθ i E hˆθ α r + θ i E [ˆα] E [X] E hˆθ r 1 α r Donc les estimateurs ˆα et ˆθ sont biaisés. ³ ˆα, ˆθ de (α, θ) sont 41

Structures Statistiques et Estimation A. El Mossadeq (c) Considérons les estimateurs T et S de α et θ respectivement définis par : T r r 1 ˆα S ˆθ 1 r 1 ˆα alors : E [T ]α E [S] θ Donc T et S sont des estimateurs sans biais de α et θ respectivement. Exercice 10 Soient X et Y deux variables aléatoires indépendantes, la première prenant les valeurs 1 et 0 avec les probabilités respectives α et 1 α, et la deuxième prenant les valeurs 1 et 0 avec les probabilités respectives P et 1 P.Onsupposeα inconnue et P connue, P>0.5. On définit la variable aléatoire Z par : Z 1 si X Y Z 0 si X 6 Y On considère un n-échantillon ((X 1,Y 1 ),..., (X n,y n )) de (X, Y ) et on définit Z i, 1 i n, à partir de X i et Y i comme on a défini Z àpartirdex et Y. 1. Montrer que (Z 1,..., Z n ) est un n-échantillon de Z. 2. Etudier les propriétés de l estimateur : T 1 n (Z 1 +... + Z n ) 3. Proposer alors un estimateur sans biais S de α. 4. Etudier la variance de S en fonction de P. 5. Indiquer un intervalle de confiance pour α lorsque n est grand, en supposant qu on dispose d une observation p de la variable : T 1 n (Z 1 +... + Z n ) 6. Voyez-vous une application de ce qui précède dans le domaine des sondages d opinion? 42

A. El Mossadeq Structures Statistiques et Estimation Solution 10 On a : P [X 0]1 α P [X 1]α et : P [Y 0]1 P P [Y 1]P X et Y deux variables aléatoires de Bernouilli de paramètres α et P respectivement. Déterminons la loi de probabilité de Z : et : P [Z 0] P [X 6 Y ] P [{(X, Y )(0, 1)} {(X, Y )(0, 1)}] P [X 0]P [Y 1]+P [X 1]P [Y 0] (1 α) P + α (1 P ) P [Z 1] P [X Y ] P [{(X, Y )(0, 0)} {(X, Y )(1, 1)}] P [X 0]P [Y 0]+P [X 1]P [Y 1] (1 α)(1 P )+αp Z est donc une variable aléatoire de Bernouilli de paramètre : de plus : θ (1 α)(1 P )+αp E [Z] θ V [Z] θ (1 θ) 1. Puisque (X 1,Y 1 ),..., (X n,y n ) sont indépentants et suivent la même loi que (X, Y ), on en déduit que (Z 1,..., Z n ) sont indépendants et suivent la même loi que Z, donc c est un n-échantillon de Z. 2. Soit l estimateur : T 1 n (Z 1 +... + Z n ) On a : E [T ] E [Z] (1 α)(1 P )+αp 43

Structures Statistiques et Estimation A. El Mossadeq et : V [T ] 1 n V [Z] 1 [(1 α)(1 P )+αp ][(1 α) P + α (1 P )] n 3. T est donc un estimateur biaisé de α sauf lorsque : ou : α 1 2 P 1 (a) Si : α 1 2 ou P 1 alors il suffit deprendre: (b) Si : S T α 6 1 2 et P 6 1 4. On a : alors il suffit deprendre: V [S] S 1 [T (1 P )] 2P 1 1 (2P 1) 2 V [T ] 1 2 [(1 α)(1 P )+αp ][(1 α) P + α (1 P )] n (2P 1) 44

T ests d H ypoth èses Les Fréquences

A. El Mossadeq Tests : Les Fréquences Exercice 1 A la veille d une consultation électorale, on a intérrogé cent électeurs constituant un échantillon au hasard. Soixante ont déclaré avoir l intention de voter pour le candidat C. En quelles limites, au moment du sondage, la proportion du corps électoral favorable à C se situe-t-elle? Solution 1 Construisons l intervalle de confiance correspondant à la fréquence f 0.6 du corps électoral favorable à C observée sur un échantillon de taille n 100. Au seuil α, cet intervalle est défini par : " r r f (1 f) f (1 f) f t 1 α/2,f + t 1 α/2 n n # Pour α 5%,ona: on obtient alors l intervalle : A 95%, le candidat C serait élu. t.975 1.96 [.504,.696] Exercice 2 Onsaitqueletauxdemortalitéd unecertainemaladieestde30%. Sur 200 malades testés, combien peut-on envisager de décès? Solution 2 Construisons d obord l intervalle de pari, pour un échantillon de taille n 200, correspondant à la probabilité de décès p 0.3. Au seuil α, cet intervalle est défini par : " r r p (1 p) p (1 p) p t 1 α/2,p+ t 1 α/2 n n # Pour α 5%,ona: t.975 1.96 47

Tests : Les Fréquences A. El Mossadeq on obtient alors l intervalle : [.24,.36] Il en résulte que sur les 200 malades, le nombre de décès à envisager serait compris, à 95%, entre48 et 72 décès. Exercice 3 Dans une pré-enquête, on selectionne, par tirage au sort cent dossiers. Quinze d entre eux sont incomplets. Combien de dossiers incomplets trouvera-t-on sur dix milles dossiers? Solution 3 Construisons l intervalle de confiance correspondant à la fréquence f 0.15 de dossiers incomplets observée sur un échantillon de taille n 100. Au seuil α, cet intervalle est défini par : " r r f (1 f) f (1 f) f t 1 α/2,f + t 1 α/2 n n Pour α 5%,ona: t.975 1.96 on obtient alors l intervalle : [.08,.22] Il en résulte que sur les 10000 dossiers, le nombre de dossiers incomplets serait compris, à 95%, entre800 et 2200 dossiers. # Exercice 4 Dans une maternité, on fait le point de la proportion de filles toutes les cent naissances. Comment peut varier cette proportion d une fois à l autre si l on admet qu il nait en moyenne 51% de filles? Solution 4 Construisons l intervalle de pari, pour un échantillon de taille n 100, correspondant à la probabilité d obtenir une fille p 0.51. 48

A. El Mossadeq Tests : Les Fréquences Au seuil α, cet intervalle est défini par : " r r # p (1 p) p (1 p) p t 1 α/2,p+ t 1 α/2 n n Pour α 5%,ona: t.975 1.96 on obtient alors l intervalle : [.41,.61] Il en résulte, qu à 95%, la proportion de filles varie d une fois à l autre, entre 41% et 61%. Exercice 5 Une machine à former des pilules fonctionne de façon satisfaisante si la proportion de pilules non réussies est de 1 pour 1000. Sur un échantillon de 10000 pilules, on a trouvé 15 pilules défectueuses. Que faut-il conclure? Solution 5 Ici on : Testons, au seuil α, l hypothèse nulle : Sous cette hypothèse, la quantité : n 10 4 f 15 10 4 p 10 3 H 0 : la machine est bien réglée f p t r p (1 p) n peut être considérée comme une réalisation d une variable aléatoire normale centrée réduite. Pour α 5%,ona: t.975 1.96 49

Tests : Les Fréquences A. El Mossadeq et comme : t f p r p (1 p) 1.58 on accepte donc l hypothèse nulle H 0 au seuil α 5%, c est à dire, qu au seuil α 5%, la machine fonctionne de façon satisfaisante. n Exercice 6 Sur un échantillon de 600 sujets atteints du cancer des poumons, on a trouvé 550 fumeurs. Que peut-on dire du pourcentage de fumeurs parmi les cancéreux? Solution 6 Construisons l intervalle de confiance correspondant à la fréquence f 11 12 des cancéreux parmi les fumeurs observée sur un échantillon de taille n 600. Au seuil α, cet intervalle est défini par : " r r f (1 f) f (1 f) f t 1 α/2,f + t 1 α/2 n n Pour α 5%,ona: t.975 1.96 on obtient alors l intervalle : [.9,.94] Il en résulte que parmi, les fumeurs, la proportion des atteints par le cancer des poumons est comprise, à 95%, entre90% et 94%. # Exercice 7 Avant de procéder au lancement d un produit, une entreprise a fait procéder à une enquête portant sur deux régions géographiques A et B. Sur 1800 réponses provenant de la région A, 630 se déclarent intéressées par le produit. En provenance de B, 150 réponses sur 600 se déclarent favorables. Tester, au seuil de 5%, l hypothèse de l identité des opinions des régions A et B quant au produit considéré. 50

A. El Mossadeq Tests : Les Fréquences Solution 7 Ici on : n A 1800 et f A 7 20 n B 600 et f B 1 4 Testons, au seuil α, l hypothèse nulle : H 0 : les opinions des régions A et B sont identiques Sous cette hypothèse, la quantité : f A f B t r fa (1 f A ) + f B (1 f B ) n A n B peut être considérée comme une réalisation d une variable aléatoire normale centrée réduite. Pour α 5%,ona: t.975 1.96 et comme : f A f B t r fa (1 f A ) + f B (1 f B ) n A n B 4.77 on rejette donc l hypothèse nulle H 0 à 95% (et même à 99.98%), c est à dire, les deux régions A et B ont des opinions différentes. Exercice 8 Dans un groupe de 200 malades atteints du cancer du col de l utérus, un traitement par application locale du radium a donné 50 guérisons. Unautregroupede150 sujets atteints de la même maladie a été traité par chirurgie, on a trouvé 50 guérisons. Que peut-on conclure? 51

Tests : Les Fréquences A. El Mossadeq Solution 8 Ici on : n 1 200, f 1 1 4 n 2 150, f 2 1 3 Testons, au seuil α, l hypothèse nulle : Sous cette hypothèse, la quantité : H 0 : les deux traitements sont équivalents f 1 f 2 t r f1 (1 f 1 ) + f 2 (1 f 2 ) n 1 n 2 peut être considérée comme une réalisation d une variable aléatoire normale centrée réduite. Pour α 5%,ona: t.975 1.96 et comme : f 1 f 2 t r f1 (1 f 1 ) + f 2 (1 f 2 ) n 1 n 2 1.69 on accepte donc l hypothèse nulle H 0 au seuil 5%, c est à dire, les deux méthodes sont équivalentes. Exercice 9 Aux guichets d une gare parisienne, sur les 350 billets vendus vendredi après-midi, 95 étaient des billets de 1ère classe. Sur les 250 billets vendus la matinée du lundi suivant, 55 étaient de 1ère classe. Peut-on considérer qu il y a une différence entre les proportions de vente de parcours en 1ère classe pour les fins et débuts de semaines? 52

A. El Mossadeq Tests : Les Fréquences Solution 9 Ici on : n 1 350, f 1 19 70 n 2 250, f 2 11 50 Testons, au seuil α, l hypothèse nulle : H 0 : les taux de billets de 1ère classe vendus en fin et début de semaines sont identiques Sous cette hypothèse, la quantité : f 1 f 2 t r f1 (1 f 1 ) + f 2 (1 f 2 ) n 1 n 2 peut être considérée comme une réalisation d une variable normale centrée réduite. Pour α 5%,ona: et comme : t.975 1.96 f 1 f 2 t r f1 (1 f 1 ) + f 1.45 2 (1 f 2 ) n 1 n 2 on accepte donc l hypothèse nulle H 0 au seuil 5%, c est à dire, les taux de billets de parcours en 1ère classe vendus en fins et débuts de semaines sont identiques et qu on peut estimer par : f n 1f 1 + n 2 f 2 n 1 + n 2 0.25 Exercice 10 On a lancé cent fois une pièce de monnaie et l on a obtenu soixante fois pile et quarante fois face. Tester au seuil de 5%, puis 1%, l hypothèse de la loyauté de la pièce. 53

Tests : Les Fréquences A. El Mossadeq Solution 10 Ici on : où f est la fréquence de pile. Testons, au seuil α, l hypothèse nulle : Sous cette hypothèse, on a : et la quantité : ½ n 100 f 0.6 H 0 : la pièce est loyale p 0.5 f p t r p (1 p) n peut être considérée comme une réalisation d une variable aléatoire normale centrée réduite. on a : f p t r p (1 p) 2 n (1) Pour α 5%,ona: t.975 1.96 on rejette donc l hypothèse nulle H 0 à 95%, c est à dire, qu à 95%, la pièce est truquée. (2) Pour α 1%,ona: 2.57 <t.995 < 2.58 on accepte donc l hypothèse nulle H 0 au seuil α 1%, c est à dire, qu au seuil α 1%, la pièce est normale. Exercice 11 Un échantillon de taille n a donné lieu au calcul d une fréquence observée f correspondant à l intervalle de confiance [.22.34] au seuil α 5%. 1. Calculer n. 2. Par rapport à la proportion p 0.3, l écart est-il significatif au seuil α 5%? 3. Déterminer l intervalle de confiance de f p au seuil α 5%. 54

A. El Mossadeq Tests : Les Fréquences Solution 11 1. Au seuil α, l intervalle de confiance correspondant à une fréquence f observée sur un échantillon de taille n est défini par : " r r # f (1 f) f (1 f) f t 1 α/2,f + t 1 α/2 n n On en déduit : f 0.22 + 0.34 2 Pour α 5%,ona: n t 2 f (1 f) 1 α/2 (f 0.22) 2 t 0.975 1.96 on obtient alors : ½ f.28 n 215 2. Testons, au seuil α, l hypothèse nulle : Sous cette hypothèse, la quantité : H 0 : l écart n est pas singificatif f p t r p (1 p) n peut être considérée comme une réalisation d une variable aléatoire normale centrée réduite. On a : f p t r p (1 p) n 0.64 Pour α 5%,ona: t.975 1.96 on accepte donc l hypothèse nulle H 0 au seuil α 5%. 3. Au seuil α : f p r t 1 α/2,t 1 α/2 p (1 p) n 55

Tests : Les Fréquences A. El Mossadeq donc, au seuil α : Pour α 5%,ona: d où : " r # p (1 p) f p 0,t 1 α/2 n t.975 1.96 f p [0, 0.06] Exercice 12 L étude du taux de défectuosités afférentes aux caractéristiques de traitements thermiques d une même pièce, traitée par deux fours différents, a donné lieu aux résultats suivants : *Pour le premier four,20 pièces défectueuses sur un échantillon de 200 pièces traitées. * Pour le second four, 120 pièces défectueuses sur un échantillon de 800 pièces traitées. Que peut-on conclure? Solution 12 Ici on : n 1 200, f 1 0.10 n 2 800, f 2 0.15 Testons, au seuil α, l hypothèse nulle : H 0 : les deux traitements thermiques sont équivalents Sous cette hypothèse, la quantité : t f 1 f 2 r f1 (1 f 1 ) n 1 + f 2 (1 f 2 ) n 2 peut être considérée comme une réalisation d une variable aléatoire normale centrée réduite. Pour α 5%,ona: t.975 1.96 56

A. El Mossadeq Tests : Les Fréquences et comme : f 1 f 2 t r f1 (1 f 1 ) + f 2 (1 f 2 ) n 1 n 2 2.03 on rejette donc l hypothèse nulle H 0 à 95%, c est à dire, les deux traitements ne sont pas équivalents. Exercice 13 Un questionnaire auquel on ne peut répondre que par oui ou par non, a été rempli par un échantillon de taille n. L intervalle de confiance de la fréquence observée f des réponses oui est (0.35 0.43) au seuil α 5%. 1. Quelle est la taille n de l échantillon. 2. Par rapport à la proportion p 0.4, l écart est-il significatif au seuil α 5%? 3. Déterminer l intervalle de confiance de f p au seuil α 5%. Solution 13 1. Au seuil α, l intervalle de confiance correspondant à une fréquence f observée sur un échantillon de taille n est défini par : On en déduit : " r r # f (1 f) f (1 f) f t 1 α/2,f + t 1 α/2 n n f 0.35 + 0.43 2 Pour α 5%,ona: on obtient alors : n t 2 f (1 f) 1 α/2 (f 0.35) 2 t 0.975 1.96 f 0.39 n 571 57

Tests : Les Fréquences A. El Mossadeq 2. Testons, au seuil α, l hypothèse nulle : Sous cette hypothèse, la quantité : H 0 : l écart n est pas singificatif f p t r p (1 p) n peut être considérée comme une réalisation d une variable aléatoire normale centrée réduite. On a : f p t r p (1 p) n 0.49 Pour α 5%,ona: t.975 1.96 On accepte donc l hypothèse nulle H 0 au seuil α 5%. 3. Au seuil α : f p r t 1 α/2,t 1 α/2 p (1 p) donc, au seuil α : Pour α 5%,ona: d où : n " r # p (1 p) f p 0,t 1 α/2 n t.975 1.96 f p [0, 0.04] Exercice 14 Parmi 470 sujets exposés à une infection, 370 n ayant pas été immunisés. Parmi ces derniers, 140 contractent la malidie ainsi que 25 sujets immunisés. Le traitement donne-t-il une protection significative? 58

A. El Mossadeq Tests : Les Fréquences Solution 14 Soient f 1 la fréquence de contracter la maladie pour un sujet non immunisé et f 2 la fréquence de contracter la maladie pour un sujet immunisé. Ici on : n 1 370 et f 1 14 37 n 2 100 et f 2 1 4 Testons, au seuil α, l hypothèse nulle : Sous cette hypothèse, la quantité : H 0 : le traitements n est pas efficace t f 1 f 2 r f1 (1 f 1 ) n 1 + f 2 (1 f 2 ) n 2 peut être considérée comme une réalisation d une variable aléatoire normale centrée réduite. Pour α 5%,ona: t.975 1.96 et comme : f 1 f 2 t r f1 (1 f 1 ) + f 2 (1 f 2 ) n 1 n 2 2.56 On rejette donc l hypothèse nulle H 0 à 95%, c est à dire, le traitement donne une protection significative. 59

Les Tests du Khi-deux

A. El Mossadeq Les Tests du Khi-Deux Exercice 1 Avant de procéder au lancement d un produit, une entreprise a fait procéder à une enquête portant sur deux régions géographiques A et B. Sur 1800 réponses provenant de la région A, 630 se déclarent intéressées par le produit. En provenance de B, 150 réponses sur 600 se déclarent favorables. Tester, au seuil de 5%, l hypothèse de l identité des opinions des régions A et B quant au produit considéré. Solution 1 La répartition observée est : T ableau des effectifs observées RégionÂOpinion favorable non favorable Total Région A 630 1170 1800 Région B 150 450 600 Total 780 1620 2400 Testons, au seuil α, l hypothèse nulle : H 0 : les régions A et B ont la même opinion Calculons, sous cette hypothèse, la répartition théorique : T ableau des effectifs théoriques RégionÂOpinion favorable non favorable Total Région A 585 1215 1800 Région B 195 405 600 Total 780 1620 2400 Sous l hypothèse nulle H 0,laquantité: 2X 2X χ 2 (o ij t ij ) 2 j1 t ij 63

Les Tests du Khi-Deux A. El Mossadeq est une réalisation d une variable du Khi-deux à : degré de liberté. Pour α 5%,ona: Et comme : χ 2 (2 1) (2 1) 1 χ 2 1;.95 3.84 2X 20.51 2X (o ij t ij ) 2 On rejette alors H 0 à 95% (et même à 99.5%), c est à dire, les deux régions ont des opinions différentes quant au produit considéré. j1 t ij Exercice 2 Dans un groupe de 200 malades atteints du cancer du col de l utérus, un traitement par application locale du radium a donné 50 guérisons. Unautregroupede150 sujets atteints de la même maladie a été traité par chirurgie, on a trouvé 54 guérisons. Que peut-on conclure? Solution 2 La répartition observée est : T ableau des effectifs observées TraitementÂRésultat guéri non guéri Total radium 50 150 200 chirurgie 54 96 150 Total 104 246 350 Testons, au seuil α, l hypothèse nulle : H 0 : les deux traitements sont équivalents 64

A. El Mossadeq Les Tests du Khi-Deux Calculons, sous cette hypothèse, la répartition théorique : T ableau des effectifs théoriques TraitementÂRésultat guéri non guéri Total radium 59.4 140.6 200 chirurgie 44.6 105.4 150 Total 104 246 350 Sous l hypothèse nulle H 0,laquantité: 2X 2X χ 2 (o ij t ij ) 2 j1 est une réalisation d une variable du Khi-deux à : degré de liberté. Pour α 5%,ona: Et comme : χ 2 t ij (2 1) (2 1) 1 χ 2 1;.95 3.84 2X 4.94 2X (o ij t ij ) 2 On rejette alors H 0 à 95%,c estàdire,les deux traitements ne sont pas équivalents. j1 t ij Exercice 3 Aux guichets d une gare parisienne, sur les 350 billets vendus vendredi après-midi, 95 étaient des billets de 1ère classe. Sur les 250 billets vendus la matinée du lundi suivant, 55 étaient de 1ère classe. Peut-on considérer qu il y une différence entre les proportions de vente de parcours en 1ère classe pour les fins et débuts de semaines? 65

Les Tests du Khi-Deux A. El Mossadeq Solution 3 La répartition observée est : T ableau des effectifs observées jourâclasse 1ère classe 2ère classe Total VendrediA.M 95 255 350 Lundi matin 55 195 250 Testons, au seuil α, l hypothèse nulle : H 0 : Total 150 450 600 les taux de billets de parcours en 1ère classe vendus en fin et début de semaines sont identiques Calculons, sous cette hypothèse, la répartition théorique : T ableau des effectifs théoriques JourÂClasse 1ère classe 2ère classe Total VendrediA.M 87.5 262.5 350 Lundi matin 62.5 187.5 250 Total 150 450 600 Sous l hypothèse nulle H 0,laquantité: 2X 2X χ 2 (o ij t ij ) 2 j1 est une réalisation d une variable du Khi-deux à : degré de liberté. Pour α 5%,ona: t ij (2 1) (2 1) 1 χ 2 1;.95 3.84 66

A. El Mossadeq Les Tests du Khi-Deux Et comme : χ 2 2X 2.06 2X (o ij t ij ) 2 On accepte alors H 0 au seuil α 5%, c est à dire, les taux de billets de parcours en 1 ère classe vendus en fins et débuts de semaines sont identiques. j1 t ij Exercice 4 On a lancé cent fois une pièce de monnaie et l on a obtenu soixante fois pile et quarante fois face. Tester au seuil de 5% puis 1%, l hypothèse de la loyauté de la pièce. Solution 4 Testons, au seuil α, l hypothèse nulle : Sous cette hypothèse, on a : d où les répartitions : H 0 : la pièce est loyale p 0.5 Côté Répartition Observée Répartition T héorique pile 60 50 face 40 50 Total 100 100 Sous l hypothèse nulle H 0,laquantité: 2X χ 2 (o i t i ) 2 t i 67

Les Tests du Khi-Deux A. El Mossadeq est une réalisation d une variable du Khi-deux à : degré de liberté. On a : χ 2 2 11 4 2X (o i t i ) 2 t i (1) Pour α 5%,ona: χ 2 1;.95 3.84 On rejette donc l hypothèse nulle H 0 à 95%, c est à dire, qu à 95%, la pièce est truquée. (2) Pour α 1%,ona: χ 2 1;.99 6.63 On accepte donc l hypothèse nulle H 0 au seuil α 1%, c est à dire, qu au seuil α 1%, la pièce est normale. Exercice 5 On veut savoir si la réussite (R) d un traitement est indépendantes du niveaux de la tension artérielle du malade (T ). On dispose pour cela de 250 observations réparties comme suit : Que peut-on conclure? T ÂR échec succès basse 21 104 élevée 29 96 68

A. El Mossadeq Les Tests du Khi-Deux Solution 5 La répartition observée est : Testons, au seuil α, l hypothèse nulle : T ableau des effectifs observées T ÂR Echec Succès Total Basse 21 104 125 Elevée 29 96 125 Total 50 200 250 H 0 : la réussite du traitement est indépendante du niveau de la tension artérielle Calculons, sous cette hypothèse, la répartition théorique, le tableau de cette répartition est donné ci-après. T ableau des effectifs théoriques T ÂR Echec Succès Total Basse 25 100 125 Elevée 25 100 125 Total 50 200 250 Sous l hypothèse nulle H 0,laquantité: 2X 2X χ 2 (o ij t ij ) 2 j1 est une réalisation d une variable du Khi-deux à : degré de liberté. Pour α 5%,ona: t ij (2 1) (2 1) 1 χ 2 1;.95 3.84 69

Les Tests du Khi-Deux A. El Mossadeq Et comme : χ 2 2X 1.6 2X (o ij t ij ) 2 On accepte alors H 0 au seuil α 5%, c est à dire, la réussite du traitement est indépendante du niveau de la tension artérielle. j1 t ij Exercice 6 On veut savoir s il y a une liason entre la localisation (L) du cancer du poumon (périphérique, non périphérique) et le côté (C) de la lésion (poumon gauche, poumon droit). L étude a porté sur 1054 malades : Que peut-on conclure? LÂC gauche droit périphérique 26 62 non périphérique 416 550 Solution 6 La répartition observée est : T ableau des effectifs observées Testons, au seuil α, l hypothèse nulle : H 0 : LÂC gauche droit Total périphérique 26 62 88 non périphérique 416 550 966 Total 442 612 1054 la localisation du cancer est indépendante du côté de la lésion Calculons, sous cette hypothèse, la répartition théorique. Le tableau de cette répartition est donnée ci-après. 70