COURS DE STATISTIQUES INFERENTIELLES Licence d économie et de gestion



Documents pareils
STATISTIQUE : TESTS D HYPOTHESES

Cours de Statistiques inférentielles

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

1 Mesure et intégrale

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

Chapitre 3 : Fonctions d une variable réelle (1)

Processus et martingales en temps continu

Statistique descriptive bidimensionnelle

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

Dénombrement. Chapitre Enoncés des exercices

CHAPITRE 2 SÉRIES ENTIÈRES

Limites des Suites numériques

Etude de la fonction ζ de Riemann

Principes et Méthodes Statistiques

Cours 5 : ESTIMATION PONCTUELLE

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

55 - EXEMPLES D UTILISATION DU TABLEUR.

c. Calcul pour une évolution d une proportion entre deux années non consécutives

EXERCICES : DÉNOMBREMENT

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Comportement d'une suite

SÉRIES STATISTIQUES À DEUX VARIABLES

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Suites et séries de fonctions

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

Statistique Numérique et Analyse des Données

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

Séries réelles ou complexes

4 Approximation des fonctions

Baccalauréat S Asie 19 juin 2014 Corrigé

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

STATISTIQUE AVANCÉE : MÉTHODES

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

Probabilités et statistique pour le CAPES

Séquence 5. La fonction logarithme népérien. Sommaire

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

Université Pierre et Marie Curie. Biostatistique PACES - UE

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

Introduction : Mesures et espaces de probabilités

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Chapitre 3 : Transistor bipolaire à jonction

Dares Analyses. Plus d un tiers des CDI sont rompus avant un an

Formation d un ester à partir d un acide et d un alcool

Comment les Canadiens classent-ils leur système de soins de santé?

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

Initiation à l analyse factorielle des correspondances

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Échantillonnage et estimation

20. Algorithmique & Mathématiques

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

PROBLEMES DIOPTIMISATION EN NOMBRES ENTIERS J. L. NICOLAS

Module 3 : Inversion de matrices

14 Chapitre 14. Théorème du point fixe

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

n tr tr tr tr tr tr tr tr tr tr n tr tr tr Nom:... Prénom :...

2 ième partie : MATHÉMATIQUES FINANCIÈRES

Exercices de mathématiques

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

Processus géométrique généralisé et applications en fiabilité

Terminale S. Terminale S 1 F. Laroche

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Chap. 5 : Les intérêts (Les calculs financiers)

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

Compte Sélect Banque Manuvie Guide du débutant

Chaînes de Markov. Arthur Charpentier

Les Nombres Parfaits.

UNIVERSITÉ DE SFAX École Supérieure de Commerce

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

La maladie rénale chronique

Risque de longévité et détermination du besoin en capital : travaux en cours

Les solutions mi-hypothécaires, mi-bancaires de Manuvie. Guide du conseiller

Les algorithmes de tri

RÈGLES ORDINALES : UNE GÉNÉRALISATION DES RÈGLES D'ASSOCIATION

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

Augmentation de la demande du produit «P» Prévision d accroître la capacité de production (nécessité d investir) Investissement

INTRODUCTION AUX MATRICES ALÉATOIRES. par. Djalil Chafaï

Protection de votre réseau d entreprise:

Tests non paramétriques de spécification pour densité conditionnelle : application à des modèles de choix discret

Options Services policiers à Moncton Rapport de discussion

Le Sphinx. Enquêtes, Sondages. Analyse de données. Internet :

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers.

16.1 Convergence simple et convergence uniforme. une suite de fonctions de I dans R ou C.

Le chef d entreprise développe les services funéraires de l entreprise, en


Faites prospérer vos affaires grâce aux solutions d épargne et de gestion des dettes

Donnez de la liberté à vos données. BiBOARD.

Transcription:

COURS DE STATISTIQUES INFERENTIELLES Licece d écoomie et de gestio Laurece GRAMMONT Laurece.Grammot@uiv-st-etiee.fr http://www.uiv-st-etiee.fr/maths/cvlaurece.html September 19, 003

Cotets 1 Rappels 5 1.1 Statistique descriptive........................ 5 1.1.1 Statistique descriptive uivariée............... 5 1.1. Statistique descriptive bivariée............... 7 1. Rappels de probabilité........................ 8 1..1 Espace probabilisable, espace probabilisé.......... 8 1.. Variables aléatoires...................... 9 1..3 Idépedace......................... 11 1.3 Notios de covergece de v.a.................... 11 1.4 Lois discrètes usuelles........................ 1 1.4.1 La loi biomiale B(, p)................... 1 1.4. La loi hypergéométrique H(N,, p)............ 13 1.4.3 La loi de Poisso P(m)................... 13 1.5 Lois cotiues usuelles........................ 14 1.5.1 La loi ormale (Laplace-Gauss) N (µ, σ).......... 14 1.5. La loi du Khi-deux à degrés de liberté (χ )....... 16 1.5.3 La loi de Studet à degrés de liberté (T )........ 17 1.5.4 La loi de Fischer-Sedecor (F( 1, ))........... 18 Itroductio à la statistique iféretielle 19.1 Gééralités sur l iférece statistique................ 19.1.1 Défiitios.......................... 19.1. Les problèmes à résoudre.................. 0.1.3 Echatillo, réalisatio d échatillo, statistiques..... 1. Quelques statistiques classiques................... 3..1 La moyee empirique et la variace empirique...... 3.. Lois de probabilité des statistiques X et S........ 4..3 Fréquece empirique F................... 7 3 Estimatio 9 3.1 Itroductio.............................. 9 3. Gééralités sur les estimateurs................... 30 3.3 Estimatio poctuelle des paramètres usuels............ 31 3.3.1 Estimatio de la moyee................. 31 3

4 CONTENTS 3.3. Estimatio de la variace d ue populatio Gaussiee. 31 3.3.3 Estimatio d ue proportio................ 33 3.4 Itervalle de cofiace........................ 34 3.4.1 Gééralités.......................... 34 3.4. Itervalle de cofiace pour ue moyee......... 34 3.4.3 Itervalle de cofiace pour la variace d ue variable gaussiee........................... 37 3.4.4 Itervalle de cofiace pour ue proportio........ 39 4 Tests de coformité 41 4.1 Gééralités sur les tests statistiques................. 41 4. Gééralités sur les tests de coformité............... 4 4.3 Tests de coformité sur ue moyee................ 4 4.3.1 Cas d ue variable Gaussiee............... 4 4.3. Cas d u échatillo de grade taille............ 46 4.4 Tests de coformité sur ue variace d ue v.a Gaussiee.... 46 4.5 Tests de coformité sur ue proportio............... 49 4.6 Tests de choix etre deux valeurs du paramètre.......... 50 5 Tests de comparaiso 51 5.1 Gééralités sur les tests de comparaiso.............. 51 5. Tests de comparaiso de deux moyees............. 51 5..1 Cas où σ 1 et σ sot cous................. 5 5.. Cas où σ 1 et σ sot icous avec σ 1 = σ et 1 et < 30............................. 53 5..3 Cas où σ 1 et σ sot icous et 1 et > 30...... 54 5.3 Tests de comparaiso de deux variaces............. 55 5.4 Tests de comparaiso de deux proportios............ 56 6 Tests du Khi-deux 59 6.1 Tests d adéquatio à ue loi théorique............... 59 6. Tests d idépedace de deux caractères.............. 61 6.3 Tests d homogééité (d ue v.a X)................. 6

Chapter 1 Rappels 1.1 Statistique descriptive C est ue méthode de descriptio et o ue théorie. Elle permet de décrire et o d expliquer. 1.1.1 Statistique descriptive uivariée Ω : esemble d idividus (populatio) M: esemble de modalités x : Ω M variable statistique ex : Ω = {ω/ω = étudiat e AES} M = {m, b, v, } x(ω) = couleur des yeux de ω Soit {C 1,..., C k } ue partitio de M e k classes. classes fréq. abs. fréq. rel. fréq. cumul. C 1 1 (b.id. C 1 ) f 1 = 1 F 1 = f 1 N C f = N. C k k f k = k N N = cardω F = F 1 + f F k = F k 1 + f k = 1 a) cas discret : C i = {x i } b) cas cotiu : C i = [e i 1, e i [ et l o pose x i = 1 (e i 1 + e i ) 5

6 CHAPTER 1. RAPPELS défiitio(mode): C j est la classe modale (mode) ssi i {1,..., k} défiitio (momets): a) momets d ordre p cetrés e 0: f j f i M p = x = M 1 = k f i x p i k f i x i moyee de x a) momets d ordre p cetrés e x: m p = V (x) = m = k f i (x i x) p k f i (x i x) variace de x (= M x ) défiitio (courbe de distributio): a) cas discret F (x) = {i/x i x} b) cas cotiu 0 si x e 0 f i F (x) = F i 1 + (x e i 1 ) si x [e i 1, e i [ e i e i 1 1 si x e k représetatio graphique fréqueces relatives : diagramme e bâtos pour les variables discrètes ou diagramme circulaire (secteurs proportioels aux fréqueces) ou diagramme à bades pour les variables qualitatives. histogramme pour les variables cotiues : (surface de l histogramme =1) f i f i [e i 1, e i [ h i = e i e i 1 défiitio (idices): a) idices cetraux (ou paramètres de la tedace cetrale)

1.1. STATISTIQUE DESCRIPTIVE 7 La moyee x = représete globalemet le caractère de x (résume e ue seule valeur la gradeur typique d u esemble de doées ; motre ue tedace cetrale). La médiae Me est défiie par F (Me) = 1/. Le mode M 0 est la valeur x i t.q. P (x = x i ) soit maximale. b) idices de dispersio σ = V (x) mesure de l étedue du caractère x. Quatiles: à l o associe l 1 quatiles Q 1,..., Q l 1 t.q. F (Q j ) = j/l, j = 1,..., l 1 c) γ 1 = m 3 σ 3 = idice de dissymétrie (< 0 si x cocetré à droite de x, > 0 si x cocetré à gauche de x) d) γ = m 4 σ 4 3 = idice d aplatissemet 1.1. Statistique descriptive bivariée variables statistiques x, y défiies sur Ω itérêt : si o peut expliquer y par x {C 1,..., C k } classes de x {D 1,..., D l } classes de y D 1 D... D l C 1 11 1... 1l 1 C 1... l C k k1 k... kl k 1... l ij = effectifs = card{ω Ω/x(ω) C i et y(ω) D j } = b. d idividus de C i D j f ij = fréqueces relatives effectifs margiaux i = j = l j=1 k f ij = ij N N = i,j ij fréqueces margiales ij (cardc i ) f i = i N ij (cardd j ) f j = j N

8 CHAPTER 1. RAPPELS défiitio (idices cetraux et de dispersio): x = k f i x i ȳ = V (x) = l f j y j j=1 k f i (x i x) V (y) = σ x = V (x) défiitio (idices de corrélatio): cov(x, y) = k j=1 cov(x, y) ρ(x, y) = σ x σ y y = ax + b, a = l f ij (x i x)(y j ȳ) l f j (y j ȳ) j=1 σ y = V (y) covariace coeff. de corrélatio cov(x, y), b = ȳ a x droite de régressio liéaire V (x) 1. Rappels de probabilité 1..1 Espace probabilisable, espace probabilisé Ue experiece aléatoire défiit u esemble d évèemets possibles Ω appelé uivers. défiitio : O appelle tribu sur Ω tout sous-esemble F de P(Ω) tel que (1) Ω F () Si A F alors Ā F (3) A F, o a A F (Ω, F) est u espace probabilisable. défiitio Soit (Ω, F) est u espace probabilisable. O appelle probabilité sur (Ω, F) toute applicatio P de F das [0, 1] telle que (1) P (Ω) = 1 () Pour toute famille (A ) IN d élémets deux à deux disjoits de F, o a P ( A ) = P (A ) (Ω, F, P ) est u espace probabilisé. P est appelée loi de probabilité. Si Ω est fii, la tribu F est le plus souvet égale à l esemble des parties de Ω (P(Ω)). Par cotre si Ω = IR, P(IR) possède beaucoup trop d élémets pour défiir ue axiomatique cohérete. Rappelos quelques propriétés élémetaires : A, B P(Ω) P (A B) = P (A) + P (B) P (A B) A, B P(Ω) P (A B) = P (A B) P (A)

1.. RAPPELS DE PROBABILITÉ 9 Formule de Bayes Soiet (B i ),.., ue partitio de Ω e élémets de F et A F, o a P (B j A) = P (A B j)p (B j ) i P (A B i)p (B i ) 1.. Variables aléatoires défiitio Soit (Ω, F, P ) u espace probabilisé. O appelle variable aléatoire X toute applicatio de Ω das (E, B) u espace probabilisable qui vérifie A B, X 1 (A) F défiitio Soit (Ω, F, P ) u espace probabilisé. O appelle loi de probabilité de la variable aléatoire X l applicatio P X défiie sur B par A B, P X (A) = P (X 1 (A)) Foctio de répartitio : F : IR [0, 1] x F (x) = P (X x) (F est ue foctio croissate) (elle associe à x la probabilité de trouver ue valeur iférieure à x) Das la suite v.a sera l abréviatio de variable aléatoire. Quelques gééralités sur les lois discrètes défiitio Ue variable aléatoire est discrète (v.a.d) si elle est umérique ( E = IR) et si l esemble de ses valeurs est déombrable X(Ω) = {x 1,..., x N } ou {x IN}. Ue variable aléatoire discrète est défiie par Ses valeurs {x 1,..., x N } ou {x IN} Ses probabilités p i = P (X = x i ) Espérace d ue v.a.d Variace d ue v.a.d i=n E(X) = p i x i i=n V (X) = p i x i E(X) Soiet X et Y des v.a.d. dot les valeurs sot respectivemet {x 1,.., x N } et {y 1,.., y M }. O otera p i = P (X = x i ) et q j = P (Y = y j ). défiitio O appelle variable coditioelle X sachat Y = y j otée X Y = y j la v.a.d dot les valeurs sot {x 1,.., x N } et les probabilités sot P (X = x i Y = y j ) O ote p ij = P (X = x i Y = y j ).

10 CHAPTER 1. RAPPELS défiitio L espérace coditioelle de X sachat Y = y j est la quatité N E(X Y = y j ) = x i P (X = x i Y = y j ) Théorème de l espérace coditioelle M E(X) = E(X Y = y j )P (Y = y j ) j=1 Quelques gééralités sur les lois cotiues Ue v.a est dite cotiue si sa foctio de répartitio est cotiue. ue loi de proba cotiue est totalemet défiie soit par sa foctio de répartitio, soit par sa foctio desité de probabilité. foctio desité de probabilité: f, positive, foctio de répartitio F (x) = Propriétés: E(X) = V (X) = + x + f(t)dt tf(t)dt t f(t)dt [E(X)] f(t)dt = 1 Soiet X et Y des v.a.c. dot les desités sot respectivemet f et g et dot la loi cojoite est défiie par la desité h (qui est ue foctio de deux variables ). défiitio La desité coditioelle de X par rapport à Y = y est la foctio défiie h(x, y) f X Y (x, y) = g(y) défiitio L espérace coditioelle de X par rapport à Y = y est la quatité E(X Y ) = + xf X Y (x, y)dx Si X est itégrable, E(X Y ) est ue variable aléatoire e y. Théorème de l espérace coditioelle E(X) == + E(X Y )g(y)dy

1.3. NOTIONS DE CONVERGENCE DE V.A 11 1..3 Idépedace défiitio Soiet (Ω, F, P ) u espace probabilisé et A, B F. A et B sot deux évèemets idépedats ssi P (A B) = P (A) P (B) Soiet X et Y deux v.a.d telles que X(Ω) = {x 1,..., x N }, Y (Ω) = {y 1,..., y M } X et Y sot idépedates si i, j P (X = x i Y = y j ) = P (X = x i ) P (Y = y j ). Soiet X et Y deux v.a.c de foctio desité respectivemet f et g et de foctio desité cojoite h. X et Y sot idépedates si x, y h(x, y) = f(x) g(y). 1.3 Notios de covergece de v.a défiitio Soit (X ) IN ue suite de v.a o dit que (X ) coverge e probabilité vers la v.a X (X X e probabilité) ssi ɛ, η, N, ( N) P ( X X > ɛ) < η ou plus simplemet lim P ( X X > ɛ) = 0. Loi faible des grads ombres Si 1 Soiet X 1,..., X, v.a idépedates, soiet µ i = E(X i ), σi 1 = V (X i ), X = X i µ i µ et 1 σi 0 quad alors X µ e probabilité (P [ X µ > ε] 0 quad ε). Corollaire de la loi faible des grads ombres Soiet X 1,..., X, v.a idépedates, de même loi Si µ = E(X i ) alors X µ e probabilité. défiitio o dit que (X ) coverge e loi vers la v.a X (X X e loi ) ssi x, F (x) F (x) F (x) et F (x) état les foctios de répartitio de X et X.

1 CHAPTER 1. RAPPELS La covergece e probabilité implique la covergece e loi mais la réciproque est fausse. Théorème de limite cetrale Soiet (X 1, X,..., X ) v.a. idépedates de même loi, de même espérace µ et de même écart type σ. Posos S = X 1 + X +... + X. Alors: E(S ) = µ V (S ) = σ S µ σ N (0, 1) e loi quad (S N (µ, σ ) quad ) Exemple: Covergece de la loi biomiale (somme de lois de Berouilli) vers la loi ormale. 1.4 Lois discrètes usuelles 1.4.1 La loi biomiale B(, p) La loi de Berouilli B(1, p) O réalise ue expériece aléatoire qui a deux résultats possibles : soit le succès qui a u probabilité p de se réaliser, soit l échec qui a ue probabilité q=1-p. La variable aléatoire X= ombre de succès obteus suit la loi de Berouilli otée B(1, p) et défiie par : P : {0, 1} [0, 1] P (X = 0) = 1 p et P (X = 1) = p Propriétés: si X B(1, p) alors E(X) = p V (X) = pq La loi biomiale B(, p) O réalise fois successivemet et d ue maière idépedate ue expériece aléatoire qui a deux résultats possibles, le succès ( associé au résultat pour lequel ous voulos détermier la probabilité) qui a ue probabilité p de se réaliser et l échec qui a ue probabilité q = 1 p de se réaliser. La v.a X = ombre de succès obteus au cours des épreuves suit la loi biomiale otée B(, p) défiie par: P : {0, 1,..., } [0, 1] k P (X = k) = C k p k (1 p) k, C k =! k!( k)! (qui représete la probabilité d obteir k succès e essais) ex: lacemet d ue pièce de moaie (pile ou face); qualité d u produit (bo ou défectueux); sodage électoral (pour ou cotre);...

1.4. LOIS DISCRÈTES USUELLES 13 Propriétés: si X B(, p) alors E(X) = p V (X) = pq si X 1 B( 1, p) et X B(, p) alors, si ces v.a. sot idépedates, Y = X 1 + X B( 1 +, p) remarque: Ue variable biomiale est la somme de variables de Berouilli idépedates. X B(, p); X = X 1 +... + X, X i B(1, p) 1.4. La loi hypergéométrique H(N,, p) Das ue populatio de taille N, o a deux types d élémets, N 1 élémets de type I et N élémets de type II. O effectue tirages sas remise (=prélèvemet d u seul coup de élémets). La v.a. discrète X = ombre d élémets de type I obteus après les tirages suit la loi hypergéométrique otée H(N,, p) avec p = N1 N, défiie par P : {0, 1,..., } [0, 1] k P (X = k) = Ck N 1 C k N Propriétés: C N avec N 1 = Np, N = Nq si X H(N,, p) alors E(X) = p V (X) = N N 1 pq Covergece de la loi hypergéométrique vers la loi biomiale Si N avec N 1/N et N /N restat fiis H(N,, p) B(, p) e loi. (e pratique /N < 10%). 1.4.3 La loi de Poisso P(m) Elle coviet à la descriptio d évèemets dot les chaces de réalisatio sot faibles. ex: b d occureces d u évèemet das u certai laps de temps ou das ue régio doée (b. d accidets/semaie sur ue autoroute; b. d appels téléphoiques das u itervalle de temps; b. de aissaces/ aée das ue petite muicipalité...)

14 CHAPTER 1. RAPPELS La probabilité d observer exactemet k occurreces d u certai évèemet das ue uité de temps ou de régio si X P(m), est doée par: P (X = k) = e m m k k! où m = b. moye d occureces. Propriétés: si X P(m) alors E(X) = m V (X) = m si X 1 P(m 1 ) et X P(m ), X 1, X idépedates, alors Y = X 1 + X P(m 1 + m ) gééralisatio: Z = X 1 + X +... + X P(m 1 + m +... + m ) exemple: Parmi la productio de pièces d ue machie, 4% sot défectueuses. O prélève u échatillo de 100 pièces. X= b. de pièces défectueuses das cet échatillo. a) P (X = 0) =? ; X H(N, 100, 0.04) B(100, 0.04) P(m), m = 100 0.04 = 4 P (X = 0) = 0.0183 b) P (X < 10) = P (X 9) = 0.9919 (tables) c) P (X > 5) = 1 P (X 5) = 1 0.785 = 0.148 Covergece de la loi biomiale vers la loi de Poisso Soit X B(, p) alors, si grad et p petit o peut approximer la loi biomiale par ue loi de Poisso P(m), m = p. (il s agit d ue covergece e loi) (e pratique > 50, p < 0.1) 1.5 Lois cotiues usuelles 1.5.1 La loi ormale (Laplace-Gauss) N (µ, σ) µ IR, σ IR + C est la plus importate des lois de probabilité cotiues. Des questios tat théoriques que pratiques fot appel à cette loi (souvet loi limite). Historiquemet elle apparaît vers 1773 comme la forme limite de la loi biomiale (Abraham de Moivre). Gauss e 1809 et Laplace e 181 lui doèret sa forme défiitive. défiitio (foctio desité): Ue v.a. suit ue loi de Laplace-Gauss de paramètres µ et σ si sa foctio desité est: f(t) = 1 1 σ π e (t µ σ ) pour t IR

1.5. LOIS CONTINUES USUELLES 15 X N (µ, σ) foctio de répartitio F (x) = x 1 1 σ π e (t µ σ ) dt Propriétés: si X N (µ, σ) alors E(X) = µ V (X) = σ La loi ormale cetrée réduite Soit X N (µ, σ) alors U = X µ N (0, 1) loi ormale cetrée réduite σ f U (t) = 1 e 1 t (X = σu + µ) π remarque: La loi ormale cetrée réduite est tabulée et la formule ci-dessus (U = X µ ) permet u calcul rapide des probabilités. σ b) Exemple: a) X N (µ, σ) P (a < X < b) = P ( a µ < X µ < b µ σ σ σ ) = P (a µ < U < b µ σ σ ) umérique : µ =, σ = 0.5, a = 1.7, b =.1 P (1.7 < X <.1) = P ( 0.6 < U < 0.) U N (0, 1) si P (U < a), a > 0 est coue, alors P (U < a) = 1 P (U < a); P ( a < U < a) = P (U < a) P (U < a) = P (U < a) [1 P (U < a)] = P (U < a) 1; umérique : a = 1.87 P (U < 1.87) = 0.9693; P (U < 1.87) = 1 0.9693 = 0.0307; P ( 1.87 < U < 1.87) = 0.9693 0.0307 = 0.9386 (= 0.9693 1 = 0.9386).

16 CHAPTER 1. RAPPELS Additivité ( v.a. idépedates) Soiet X 1 N (µ 1, σ 1 ) et X N (µ, σ ) idépedates, alors X 1 + X N (µ 1 + µ, σ1 + σ ) gééralisatio : a)x i N (µ i, σ i ), i = 1,..., idépedates X i N ( µ i, σi ) b) X i N (µ, σ), i = 1,..., idépedates 1 (X σ 1 +... + X ) N (µ, ) Covergece de la loi biomiale vers la loi ormale Soit X B(, p) alors X p N (0, 1) e loi quad pq ou bie B(, p) N (p, pq) ( ) Ceci sigifie que lorsque est assez grad, o peut approximer la loi biomiale par la loi ormale; e pratique p [0.1, 0.9], > 30. Das certais ouvrages, o trouve la coditio p(1 p) > 9 ou p, q > 5. Covergece de la loi de Poisso vers la loi ormale Soit X P(m) alors si m X m N (0, 1) e loi m L approximatio est très satisfaisate pour m > 18. 1.5. La loi du Khi-deux à degrés de liberté (χ ) elle joue u rôle importat das les tests statistiques. o obtiet ue valeur χ e additioat des ombres au carré, doc cette valeur e peut pas être égative l aspect de la courbe d ue distributio χ variera selo le ombre de degrés de liberté qui est le seul paramètre de cette distributio. défiitio: Soiet X 1,..., X v.a. idépedates t.q. X i N (0, 1) i. Alors X 1 +... + X χ remarque: la foctio desité de probabilité de χ est f χ (t) = c t / 1 e t/

1.5. LOIS CONTINUES USUELLES 17 où c sot t.q. IR f χ (t)dt = 1. si > alors le mode = (mode = valeur pour laquelle la courbe atteit so maximum) Propriétés: si X χ (mode =, > ) alors E(X) = V (X) = Covergece de la loi χ vers la loi ormale (approximatio) Soit X χ alors X N (0, 1) e loi quad ou bie χ N (, ) (e pratique > 30) Additivité ( v.a. idépedates) Soiet X 1 χ 1,..., X k χ k Alors Z = X 1 +... + X k χ idépedates avec = 1 +... + k 1.5.3 La loi de Studet à degrés de liberté (T ) Elle joue u rôle importat das l estimatio par itervalle de cofiace. Elle est symétrique, de moyee ulle et déped d u paramètre appelé ombre de degrés de liberté. L aspect de la courbe variera selo le ombre de degrés de liberté (de faço géérale, elle est plus aplatie que N (0, 1) et quad augmete ( > 30) les courbes se cofodet) défiitio: Soiet X N (0, 1), Y χ v.a. idépedates. Alors Z = X Y/ t remarque: la foctio desité de probabilité de t est où c sot t.q. Propriétés: IR f t (t)dt = 1. f t (t) = c (1 + t ) (+1)/ si X t alors E(X) = 0, > 1 V (X) =, >

18 CHAPTER 1. RAPPELS Covergece de la loi Studet vers la loi ormale (approximatio) Soit X t alors X N (0, 1) e loi quad (e pratique > 30) 1.5.4 La loi de Fischer-Sedecor (F( 1, )) loi cotiue défiitio: Soiet Y 1 χ 1 et Y χ, v.a. idépedates. Alors F = Y 1/ 1 Y / F( 1, ) (loi de Fischer-Sedecor à 1 et degrés de liberté) remarque: la foctio desité de probabilité de F( 1, ) est f F (t) = c 1, t 1/ 1 ( 1 t + ) (1+)/, t > 0 paramètres: 1, Propriétés: si F F( 1, ) alors E(F ) = 1, > V (F ) = ( 1 + ) 1 ( ) ( 4), > 4

Chapter Itroductio à la statistique iféretielle.1 Gééralités sur l iférece statistique.1.1 Défiitios populatio, échatillo populatio = esemble d uités statistiques (poulets, étudiats iscrits e AES e 1996, firmes commerciales...) recesemet = observer toutes les uités de la populatio échatillo = sous-esemble de la populatio étudiée (joueurs de foot = populatio équipe de St-Etiee = échatillo) sodage = observer les uités de l échatillo (il aboutit, o le verra plus tard, à ue distributio expérimetale) e statistique, o décrit ces groupes d uités (populatio ou échatillo) à l aide de mesures ou caractéristiques (effectif, moyee, écart-type, pourcetage...) mesures ou caractéristiques utilisées pour décrire ue populatio s appellet PARAMETRES. mesures ou caractéristiques utilisées pour décrire u échatillo s appellet réalisatios (ou observatios) de STATISTIQUES. 19

0CHAPTER. INTRODUCTION À LA STATISTIQUE INFÉRENTIELLE L iférece statistique C est l esemble des méthodes permettat de tirer des coclusios sur u groupe détermié à partir des doées proveat d u échatillo choisi das cette populatio..1. Les problèmes à résoudre Questio 1 exemple: Le resposable de la diffusio d u produit fait u sodage pour coaître la dépese moyee par différetes catégories socioprofessioelles de la populatio fraçaise pour ce type d achat. Il fera aisi ue estimatio de cette dépese moyee. Il peut aussi vouloir coaître la précisio de cette estimatio. Aisi, les statistiques sot utilisées pour ESTIMER les paramètres. U premier problème qui se pose est doc de faire des estimatios poctuelles estimatios par itervalle de cofiace et fera l objet du chapitre 3. Questio exemple: E matière de cotrôle de qualité, o souhaite lors de la réceptio d échatillos de pièces mécaiques comparer le taux de déchets observés par rapport à la orme fixée de maière à refuser le lot si so le taux de déchets dépasse la orme. Das la plupart des situatios réelles, la valeur du paramètre est icoue, mais il arrive que l o ait ue idée du paramètre et qu o puisse formuler ue HYPOTHESE cocerat la valeur de celui-ci. Les observatios peuvet cofirmer ou ifirmer l hypothèse formulée. Il arrive souvet que la différece etre la valeur de la statistique d échatillo et la valeur hypothétique du paramètre e soit i petite i grade, de sorte que la décisio à predre e s impose pas d elle même. Il faut doc défiir les critères qui permettet la prise de décisio. Ce sot les TESTS DE CONFORMITE (chapitre 4). Questio 3 Les persoes qui décidet sot souvet itéressées à détermier si deux populatios doées sot semblables ou ettemet différetes par rapport à ue caractéristique particulière. ex.1: u médeci peut vouloir détermier si la répose à u certai médicamet (expérimetal) diffère d u groupe à u autre.

.1. GÉNÉRALITÉS SUR L INFÉRENCE STATISTIQUE 1 ex.: u acheteur peut vouloir comparer la durée de vie d u certai produit proveat de fourisseurs. différets Ce sot les TESTS DE COMPARAISON (chapitre 5). Questio 4 D autres problèmes peuvet se poser, par exemple de savoir si ue populatio doée suit ue loi de probabilité particulière coue. Ce sot les TESTS D AJUSTEMENT (aalytique) qui permettet de vérifier la qualité de l ajustemet de la populatio étudiée à ue loi ormale, biomiale, de Poisso ou ecore uiforme. Ils ot pour but d établir s il est plausible que l échatillo (aléatoire) proviee d ue populatio dot la loi de probabilité aurait été celle spécifiée (chapitre 6). Questio 5 Il est itéressat de savoir, das certaies situatios, si caractères qualitatifs sot idépedats. Les TESTS D INDEPENDANCE serot traités das le chapitre 6. Questio 6 O peut vouloir savoir si plusieurs populatios sot homogèes par rapport à u certai caractère. Les TESTS D HOMOGENEITE serot traités das le chapitre 6)..1.3 Echatillo, réalisatio d échatillo, statistiques O veut, à partir d u échatillo de la populatio, déduire des iformatios sur cette populatio. Le problème qui se pose alors est le suivat: commet choisir ue partie de la populatio qui reproduit le plus fidèlemet possible ses caractéristiques. C est le problème de l échatilloage. Prélèvemet d u échatillo (échatilloage) 1. Echatilloages sur la base des méthodes empiriques La Méthode des quotas (respect de la compositio de la populatio pour certais critères) est la plus utilisée.. Echatilloages aléatoires Quad la probabilité de sélectio de chaque élémet de la populatio est détermiée avat même que l échatillo soit choisi. Il permet de juger objectivemet la valeur des estimatios. Echatilloage aléatoire simple o tire au hasard et avec remise les uités das la populatio cocerée.

CHAPTER. INTRODUCTION À LA STATISTIQUE INFÉRENTIELLE Echatilloage stratifié Subdiviser d abord la populatio e sous-esembles (strates) relativemet homogèes. Extraire de chaque strate u échatillo aléatoire simple. Regrouper tous ces échatillos. Echatilloage par grappes Choisir u échatillo aléatoire d uités qui sot elles-mêmes des sousesembles de la populatio (grappes). (ex : diviser la ville e quartiers; u certai ombre de quartiers sot choisis pour faire partie de l échatillo; o fait l equête auprès de toutes les familles résidat das ces quartiers). Modélisatio de l échatilloage aléatoire simple Das la suite, o traite le cas de l échatilloage aléatoire simple, car les cocepts fodametaux et les formules importates découlet de cette méthode. Ce type d échatilloage cosiste à extraire u échatillo de taille das ue populatio de taille N par des tirages aléatoires équiprobables et idépedats (tirages avec remise). O itroduit le modèle suivat : Soit Ω = {w 1,..., w N } la populatio costituée d élémets appelés uités d observatio. Soit X le caractère que l o voudrait étudier sur l esemble de cette populatio. X k, le résultat aléatoire du k ièm tirage, est ue v.a qui suit la même loi que X. O ote x k le résultat du k ièm tirage. O ote (X 1,..., X ) les résultats aléatoires de ces tirages. défiitio: (X 1,..., X ) sot v.a. idépedates et de même loi (celle de X); il est appelé -échatillo ou échatillo de taille de X. Après tirage au sort,(x 1,..., X ) pred les valeurs (x 1,..., x ) défiitio: La réalisatio uique (x 1,..., x ) de l échatillo (X 1,..., X ) est l esemble des valeurs observées. défiitio: Ue statistique Y sur u échatillo (X 1,..., X ) est ue v.a., foctio mesurable des X k ; Y = f(x 1,..., X ). Après réalisatio, la v.a. Y (statistique) pred la valeur f(x 1,..., x ). Les statistiques sot utilisées pour estimer les caractéristiques de la populatio totale. Les statistiques les plus utilisées sot la moyee empirique, la variace empirique, la fréquece empirique.

.. QUELQUES STATISTIQUES CLASSIQUES 3. Quelques statistiques classiques Rappels E(aX + b) = ae(x) + b E(X + Y ) = E(X) + E(Y ) V (ax + b) = a V (X) V (X) = E(X ) [E(X)] = E([X E(X)] ) si X, Y idépedates, V (X + Y ) = V (X) + V (Y )..1 La moyee empirique et la variace empirique Posos E(X) = µ, V (X) = σ (icoues) défiitio : O appelle moyee empirique de l échatillo (X 1,..., X ) de X, la statistique X = 1 X i. Sa réalisatio est x = 1 x i (qui est la moyee de l échatillo) aussi appelée moyee observée. (o verra plus tard que X estimera l espérace E(X)) Propriétés: Calculos { E( X) = µ V ( X) = 1 σ E( X) = E( 1 X i ) = 1 E(X i ) = 1 E(X) = E(X) = µ V ( X) = V ( 1 X i ) = 1 V ( X i ) = 1 V (X i ) = 1 V (X) V (X) = = 1 V (X) = 1 σ défiitio : O appelle variace empirique de l échatillo (X 1,..., X ) de X, la statistique S = 1 (X i X) = 1 ( Xi ) X.

4CHAPTER. INTRODUCTION À LA STATISTIQUE INFÉRENTIELLE Sa réalisatio est s = 1 (x i x) (qui est la variace de l échatillo), aussi appelée variace observée. Propriétés: { E(S ) = 1 σ Calculos E(S ) = E( 1 (X i X) ) = E( 1 Xi X ) = 1 E( Xi ) E( X ) = 1 E(Xi ) E( X ) = 1 [V (X i ) + (E(X i )) ] [V ( X) + (E( X)) ] = 1 [V (X) + (E(X)) ] 1 σ µ = V (X) + (E(X)) 1 σ µ = σ + µ 1 σ µ = (1 1 )σ = 1 σ.. Lois de probabilité des statistiques X et S Théorème limite cetrale (pour l échatillo) (rappel): Soit X ue v.a. t.q. E(X) = µ, V (X) = σ 0 Soit (X 1,..., X ) u - échatillo de X X = 1 (X 1 +... + X ) X µ Alors σ/ N (0, 1) pour (loi approximative) (ou bie X σ N (µ, ) pour ) cas à étudier: a) la taille de l échatillo est grade b) X suit ue loi gaussiee a) Taille grade (d après le thm. limite cetrale) 1) X µ σ/ suit approximativemet N (0, 1)

.. QUELQUES STATISTIQUES CLASSIQUES 5 X µ σ/ N (0, 1) pour ou bie X suit approximativemet N (µ, σ ) (e pratique > 30) exercice Soit u lot de 500 chocolats. Le poids d u chocolat est ue v.a. telle que µ = 5g et σ = 0.5g. Quelle est la probabilité qu ue boîte de 50 chocolats issus de ce lot ait u poids total supérieur à 60g? solutio L échatillo état grad ( = 50 > 30) et o peut appliquer la première formule: X N (5, 0.5 50 ) approximativemet o pose T = 50 X; cette ouvelle v.a. suit approximativemet: T N (50 5, 50 0.5 50 ) = N (50, 0.5 50) calculos P (T > 60) = P (U > 60 50 0.5 ) = P (U >.83) 50 = 1 P (U <.83) = 1 0.9977 b) Echatillo gaussie Soit X N (µ, σ) (d après l additivité pour des v.a. suivat des lois ormales) 1) X N (µ, σ ) ou bie X µ σ/ N (0, 1) Attetio!!!!! c est ue loi exacte et o ue approximatio comme das le cas d u échatillo de grade taille où la loi est pas coue. ) σ S χ 1 3) X µ S / 1 t 1

6CHAPTER. INTRODUCTION À LA STATISTIQUE INFÉRENTIELLE U = X µ σ/ Y = S σ N (0, 1) χ 1 et alors U Z = t 1 Y/( 1) calculos Z : Z = X µ σ/ 1 S σ ( 1) = X µ S 1 exercice O prélève 5 pièces das ue productio idustrielle. Ue étude préalable a motré que le diamètre de ces pièces suivait ue loi gaussiee de moyee 10mm et d écart-type mm. Etre quelles valeurs a-t-o 85% de chaces de trouver l écart-type de ces pièces? solutio pour commecer, il faut détermier α et β t.q. 0.85 = P (α < S σ = 1 P ( S σ = P ( S σ < β) = P ( S σ < β) P ( S σ < α) > β) [1 P ( S σ > α)] > α) P ( S σ > β) o sait que S χ 5 1 = χ 4 et alors o cherche das la table du σ χ à 4 degrés de liberté les valeurs α et β comme suit: { P ( S σ > α) = 0.90 P ( S σ > β) = 0.05 (choix du aux tables) o trouve: { α = 15.659 β = 36.415 et alors P (15.659 < 5S < 36.415) = 0.85 P (.5054 < S < 5.864) = 0.85 P (1.58 < S <.41) = 0.85 Attetio: il e faut pas cofodre l écart-type de l échatillo, oté s, valeur observée de la statistique S (les calculs ot été faits pour cette statistique S), avec le PARAMETRE écart-type sur la populatio, oté σ, de la loi ormale qui était cou das ce problème!

.. QUELQUES STATISTIQUES CLASSIQUES 7..3 Fréquece empirique F Soit ue populatio comportat deux modalités A et B. Soit π la proportio d idividus de la populatio possédat la modalité A. 1 π est doc la proportio des idividus de la populatio possédat la modalité B. O extrait de la populatio u échatillo de taille. Soit K la v.a qui représete le ombre d idividus das l échatillo ayat la modalité A. défiitio: La v.a. F = K s appelle fréquece empirique. Sa réalisatio f est la proportio d idividus das l échatillo ayat la modalité A. Propriétés: K B(, π) doc E(F ) = π π(1 π) V (F ) = Loi de probabilité pour F π(1 π) F N (π, ) dès que > 30, π [0.1, 0.9]. O trouve aussi π > 5, (1 π) > 5 ou les seules coditios π > 5, (1 π) > 5) (loi approximative). F π π(1 π) N (0, 1)

8CHAPTER. INTRODUCTION À LA STATISTIQUE INFÉRENTIELLE

Chapter 3 Estimatio 3.1 Itroductio La distributio exacte d ue variable X modélisat le caractère qui itéresse le statisticie (taux de pollutio d ue rivière, dépeses des méages pour le logemet...) est gééralemet partiellemet coue. Souvet la loi de X déped d u paramètre icou. O cherche à se faire ue idée sur ce paramètre à partir des doées observées sur l échatillo. Attribuer au paramètre ue valeur umérique uique est ue ESTIMATION PONCTUELLE. Pour ce faire, o choisit ue statistique dot la valeur est, après tirage aléatoire de l échatillo, l estimatio du paramètre. Cette statistique est l ESTIMATEUR. Mais quelles sot les chaces pour que cette estimatio poctuelle soit exacte? Plutôt que d estimer u paramètre à l aide d u seul ombre, il arrive fréquemmet que l o fasse l estimatio e doat u INTERVALLE de valeurs. U INTERVALLE D ESTIMATION (ou de CONFIANCE) est défii de telle sorte que l o puisse affirmer avec u degré de cofiace fixé que le paramètre visé se trouve das cet itervalle. Nous ous itéresseros das ce chapitre à l estimatio des pricipales caractéristiques (ou paramètres) d ue v.a das ue populatio, à savoir la moyee, la variace et la fréquece. Notatios les paramètres à estimer serot otés par des lettres grecques miuscules µ : moyee σ : écart-type σ : variace π : proportio les réalisatios d échatillo serot otées par des lettres laties miuscules 9

30 CHAPTER 3. ESTIMATION x 1,..., x : valeur de l échatillo x : moyee de l échatillo s : écart-type de l échatillo s : variace de l échatillo p : proportio das l échatillo les estimateurs ( v.a. ou statistiques) serot otés par des majuscules X S F 3. Gééralités sur les estimateurs Soit X ue v.a. dot la loi déped d u paramètre icou θ. Soit (X 1,..., X ) u -échatillo de X et (x 1,..., x ) sa réalisatio. Il s agit d estimer le paramètre θ. défiitio : U ESTIMATEUR de θ sera ue statistique T = f(x 1,..., X ) et sa réalisatio sera otée t = f(x 1,..., x ) Pour u même paramètre, il peut y avoir plusieurs estimateurs possibles (ex: Le paramètre λ d ue loi de Poisso admet comme estimateurs possibles la moyee empirique et la variace empirique). Pour pouvoir choisir, il faut défiir les qualités qui fot qu u estimateur sera meilleur. O appelle erreur d estimatio: T θ. Celle-ci peut se décomposer de la faço suivate: T θ = T E(T ) + E(T ) θ Le terme T E(T ) traduit la fluctuatio de T autour de so espérace et le terme E(T ) θ = B(T ) représete l erreur systématique et s appelle BIAIS de l ESTIMATEUR défiitio (estimateur sas biais): U estimateur T de θ est dit sas biais si E(T ) = θ, (ou bie B(T ) = 0) exemple : La moyee empirique est u estimateur sas biais du paramètre λ d ue loi de Poisso. La variace empirique est estimateur biaisé du même paramètre λ. E effet, E( X) = λ, E(S ) = 1 λ car E(X) = V (X) = λ.

3.3. ESTIMATION PONCTUELLE DES PARAMÈTRES USUELS 31 défiitio : U estimateur T de θ est dit asymptotiquemet sas biais si E(T ) θ pour. défiitio : U estimateur { sas biais asymptotiquemet sas biais } est dit coverget si V (T ) 0 pour. défiitio : Soiet T et T deux estimateurs sas biais de θ. T est dit plus efficace que T si V (T ) V (T ) défiitio : L estimateur sas biais et de variace miimale est appelé estimateur efficace. 3.3 Estimatio poctuelle des paramètres usuels 3.3.1 Estimatio de la moyee Soit X ue v.a dot o veut estimer la moyee (ou espérace) µ = E(X) à partir d u -échatillo (X 1,..., X ) de X. O e suppose rie sur la loi de X. de µ. théorème X = 1 (X 1 +... + X ), la moyee empirique, est u estimateur efficace car sas biais E( X) = µ et de plus V ( X) = V (X) 0 pour, et T, u autre estimateur de µ, V (T ) > V ( X). x est la réalisatio de X et doc ue estimatio efficace de µ 3.3. Estimatio de la variace d ue populatio Gaussiee Soit X ue v.a qui suit ue loi ormale N (µ, σ). O veut estimer la variace σ de X. a) µ coue théorème : T = 1 (X i µ) est u estimateur efficace de σ

3 CHAPTER 3. ESTIMATION e effet, E(T ) = E( 1 (X i µ) ) = E( 1 Xi 1 µx i + µ ) = 1 E( Xi ) µ 1 E(X i ) + µ = 1 E(Xi ) µ = 1 [V (X i ) + (E(X i )) ] µ = σ + µ µ = σ doc sas biais V (T ) = V ( 1 (X i µ) ) = 1 V ( (X i µ) ) = 1 V ((X i µ) ) = 1 [E((X i µ) 4 ) (E((X i µ) )) ] =... 0 b) µ icoue théorème : S = 1 (X i X), c est-à-dire la variace empirique, est u estimateur biaisé de σ, mais asymptotiquemet sas biais. e effet, E(S ) = 1 σ B(S ) = E(S ) σ = (1 1 )σ = 1 σ V (S ) 0 pour théorème : (S ) = 1 S = 1 1 (X i X) est u estimateur sas biais de σ e effet, doc sas biais E((S ) ) = 1 E(S ) = 1 1 σ = σ grad, E(S ) E((S ) ) et o préfère S petit, o préfère (S )

3.3. ESTIMATION PONCTUELLE DES PARAMÈTRES USUELS 33 3.3.3 Estimatio d ue proportio Soit ue populatio ayat des idividus possédat ue certaie caractéristique A. O veut estimer à partir d u échatillo de taille la proportio d idividus possédat cette caractéristique A. Soit K la v.a qui représete le ombre d idividus das l échatillo possédat la caractéristique A. théorème : La fréquece empirique F = K/ est l estimateur efficace de π. doc F est u es- E(F ) = E(X 1) +... + E(X ) π V (F ) = V (X 1) +... + V (X ) = timateur coverget de π = π doc F est u estimateur sas biais de π(1 π) π(1 π) = Exemples d estimatios poctuelles Exercice 1: (estimatio d ue moyee, d u écart-type) Lors d u cocours radiophoique, o ote X: le b. de réposes reçues chaque jour. O suppose X N (µ, σ). Durat 10 jours o a obteu: x i 00 40 190 150 0 180 170 30 10 10. Doer ue estimatio poctuelle de µ, σ. solutio = 10 X = 1 10 (X 1 +... + X 10 ) est u estimateur de µ sa réalisatio x = 1 10 (x 1 +... + x 10 ) = 000 = 00 est ue estimatio poctuelle, 10 efficace de µ o est das le cas où la moyee µ est pas coue (cas b)) S = 1 10 (X 1 +... + X 10) ( X) est u estimateur biaisé de σ sa réalisatio s = 1 10 (x 1 +... + x 10) x = 40700 40000 = 700 est ue estimatio poctuelle, biaisé de σ (S ) = 1 S = 10 9 S est u estimateur sas biais de σ sa réalisatio (s ) = 10 9 s = 10 700 = 778 est ue estimatio poctuelle, 9 sas biais de σ Exercice : (estimatio d ue proportio) Das ue populatio d étudiats AES, o a prélevé idépedammet échatillos de taille 1 = 10, = 150. O costate que 48 étudiats du 1-er échatillo et 66 du -ème ot ue formatio scietifique secodaire. Soit π la proportio d étudiats ayat suivi ue formatio scietifique. Calculer 3 estimatios poctuelles de π.

34 CHAPTER 3. ESTIMATION solutio F = K ; f 1 = 48 10 = 0.4, f = 66 150 = 0.44, f 48 + 66 3 = 10 + 150 = 0.4 3.4 Itervalle de cofiace 3.4.1 Gééralités Il est plus réaliste et plus itéressat de fourir ue estimatio du type t 1 < θ < t plutôt que d écrire sèchemet θ = t, car o sait que la valeur estimée t diffère toujours de la valeur exacte du paramètre recherché, θ. Il est doc souhaitable de doer la précisio de l estimatio e acceptat de faire ue erreur α sur celle-ci. défiitio: Soit X ue v.a. dot la loi déped d u paramètre icou θ; o appelle INTERVALLE DE CONFIANCE pour θ de iveau 1 α (ou de seuil α), u itervalle qui a la probabilité 1 α de coteir la vraie valeur de θ. [t 1, t ] est u itervalle de cofiace de iveau 1 α pour θ sigifie P (t 1 < θ < t ) = 1 α (plus le iveau de cofiace est élevé, plus la certitude est grade que la méthode d estimatio produira ue estimatio coteat la vraie valeur de θ) les iveaux de cofiace les plus fréquemmet utilisés sot 90%, 95%, 99% α est appelé le seuil (le risque); o choisira das la plupart des cas u itervalle à risques symétriques, c-a-d t.q. P (θ < t 1 ) = α, P (θ > t ) = α remarque: Si o augmete le iveau de cofiace 1 α, o augmete la logueur de l itervalle. 3.4. Itervalle de cofiace pour ue moyee a) cas où, la taille de l échatillo, est petite < 30 O suppose que X N (µ, σ). O distigue deux cas σ cou et σ icou. a-1) σ cou X N (µ, σ ) d après u résultat du chapitre

3.4. INTERVALLE DE CONFIANCE 35 u 1 α (ou bie X µ σ/ N (0, 1)) O se fixe le risque α et o cherche das la table de la loi ormale la valeur telle que u 1 α est le fractile d ordre 1 α P ( u 1 α < X µ σ/ < u 1 α ) = 1 α P ( X µ σ/ < u 1 α ) = 1 α/ de la loi ormale cetrée réduite. P ( u 1 α < X µ σ/ < u 1 α ) = 1 α P ( X u 1 α σ < µ < X + u 1 α σ ) = 1 α Coclusio : si x est ue réalisatio de X, l itervalle de cofiace de µ de seuil α est I = [ x u 1 α σ, x + u 1 α σ ] 15 exemple: = 15, σ = 3.75, α = 5%, x i = 400 alors x = 400/15 = 160, u 1 α = 1.96 car P (U < 1.96) = 0.05 o suppose X gaussiee et o obtiet l itervalle de cofiace: [160 1.96 3.75 15, 160 + 1.96 3.75 15 ] = [158.10, 161.90] a-) σ icou X µ S 1 t 1 d après le chapitre. O cherche das la table de la loi de Studet, t 1(1 α ) telle que α état fixé, la valeur P ( t 1(1 α ) < X µ S/ 1 < t 1(1 α ) ) = 1 α X µ P ( S/ 1 < t 1(1 α ) ) = 1 α/.

36 CHAPTER 3. ESTIMATION O a P ( t 1(1 α ) < X µ S/ 1 < t 1(1 α ) ) = 1 α P ( X S t 1(1 α ) < µ < X S + t 1(1 α 1 ) ) = 1 α 1 Coclusio : si x est ue réalisatio de X et s ue réalisatio de S, l itervalle de cofiace de µ de seuil α est I = [ x t 1(1 α ) s 1, x + t 1(1 α ) s 1 ] 30 exemple = 30, x 30 i = 1673, x i = 9885, α = 10% alors x = 55.77, s = 165.87, s = 1.88, t 9(10%) = 1.699 I = [55.77 1.699 1.88 9, 55.77 + 1.699 1.88 9 ] = [51.71, 59.83] b) cas où, la taille de l échatillo, est grade > 30 Il est plus écessaire de supposer que X est Gaussiee. b-1) σ cou D après le chapitre X µ σ/ La démarche est la même que das a-1) N (0, 1) pour Coclusio : Si x est ue réalisatio de X et si s ue réalisatio de S, l itervalle de cofiace de µ de seuil α est I = [ x u 1 α σ, x + u 1 α σ ] b-) σ icou O peut predre comme itervalle de cofiace celui de la sectio a-). O peut égalemet utiliser l approximatio suivate : X µ S N (0, 1). O se fixe l erreur α et o cherche das la table de la loi ormale la valeur

3.4. INTERVALLE DE CONFIANCE 37 u 1 α telle que P ( u 1 α < X µ S/ < u 1 α ) = 1 α O a P ( X µ S/ < u 1 α ) = 1 α/. P ( u 1 α < X µ S/ < u 1 α ) = 1 α P ( X u 1 α S < µ < X + u 1 α S ) = 1 α Coclusio : si x est ue réalisatio de X et s ue réalisatio de S, l itervalle de cofiace de µ de seuil α est I = [ x u 1 α s, x + u 1 α s ] remarque: Plus est grad, plus I est petit (car 1/ ou bie 1/ 1 est petit) et doc meilleure est la précisio de l estimatio. 3.4.3 Itervalle de cofiace pour la variace d ue variable gaussiee O suppose que X N (µ, σ). a) µ coue (peu fréquet) T = 1 (X i µ) est u estimateur efficace de σ (voir estimatio poctuelle); sa réalisatio est t = 1 (x i µ). Comme X i µ N (0, 1), σ T σ = ( X i µ ) est ue somme de v.a. idépedates qui suivet la loi σ ormale N (0, 1) et doc T σ χ L erreur α état fixée, o cherche das la table χ les valeurs k (1 α ) et k (1 α/) telles que P (k ( α ) < σ T < k (1 α ) ) = 1 α (1)

38 CHAPTER 3. ESTIMATION P ( T σ P ( T σ (1) P ( < k (1 α ) ) = 1 α/ < k ( α ) ) = α/ T k (1 α < σ < T ) = 1 α ) k ( α ) Coclusio : si t est ue réalisatio de T, l itervalle de cofiace de σ de seuil α est alors t t I = [, ] k (1 α ) k ( α ) l itervalle de cofiace pour σ au seuil α est exemple: b) µ icoue O a I = [t, t ] k (1 α ) k ( α ) = 10, µ = 6, 10 x i = 40, α = 5% t = 40. 36 = 4., k 10(0.05) = 0.5, k 10(0.975) = 3.5 I = [ 10 4. 0.5 10 4., ] = [.05, 1.9] 3.5 S σ χ 1 O cherche das la table χ 1 les valeurs k 1(1 α ) et k 1( α ) telles que P (k 1( α ) < σ S < k 1(1 α ) ) = 1 α (1) P ( S σ < k 1( α ) ) = α/ P ( S σ < k 1(1 α ) ) = 1 α/ (1) P ( S k 1(1 α k 1( α ) < σ < S ) ) = 1 α Coclusio : si s est ue réalisatio de S, l itervalle de cofiace de σ de seuil α est

3.4. INTERVALLE DE CONFIANCE 39 s s I = [, ] k 1(1 α ) k 1( α ) l itervalle de cofiace pour σ au seuil α est I = [s, s ] k 1(1 α ) k 1( α ) remarque: Si das les tables du χ ou de t vous e trouvez pas les valeurs correspodates à α/ et à 1 α/, o predra u risque asymétrique. ATTENTION à e pas cofodre S avec T et x avec µ exemple: = 30, 30 x i = 1683, 30 x i = 9895, α = 10% alors x = 55.77, s = 165.87, k 9(0.05) = 4.6, k 9(0.95) = 17.7 I = [ 30 165.87, 4.6 30 165.87 ] = [116.81, 81.14] 17.7 3.4.4 Itervalle de cofiace pour ue proportio o sait que F = K est u estimateur de π où π est la proportio de la populatio possédat le caractère cosidéré. ou bie π(1 π) F N (π, ) pour π, (1 π) > 5 ( ou les autres coditios citées e..3) F π π(1 π) N (0, 1) pour π, (1 π) > 5 O cherche das la table de N (0, 1) la valeur u 1 α P ( u 1 α < F π P ( F π π(1 π π(1 π < u 1 α ) = 1 α < u 1 α ) = 1 α/. telle que

40 CHAPTER 3. ESTIMATION O a P (F u 1 α P ( u 1 α < F π π(1 π) π(1 π problème: π(1 π) est icou!!! < π < F + u 1 α < u 1 α ) = 1 α π(1 π) ) = 1 α solutio 1 : méthode par estimatio de l écart-type π(1 π) f(1 f) o remplace par, f état la valeur observée de F (estimatio de π) et o a I = [f u 1 α f(1 f), f + u 1 α f(1 f) ] solutio : méthode de l ellipse (mois classique, mais plus rigoureuse) π(1 π π(1 π P ( u 1 α < F π < u 1 α ) = 1 α π(1 π P ( π F < u 1 α ) = 1 α P ((π F ) u π(1 π 1 α < 0) = 1 α P (π (1 + u 1 α ) π(f + u 1 α ) + F < 0) = 1 α O cherche les racies π 1 et π de l équatio (π F ) u 1 α e coaissat u 1 α et f, la valeur observée de F I = [π 1, π ] π(1 π = 0,

Chapter 4 Tests de coformité 4.1 Gééralités sur les tests statistiques U test statistique est u mécaisme visat à tracher etre deux hypothèses à partir de résultats observés sur u ou plusieurs échatillo(s). O formule ue hypothèse de départ, appelée hypothèse ulle et souvet otée (H 0 ) et il s agit de décider si o rejette ou o cette hypothèse par oppositio à u cotrehypothèse appelée hypothèse alterative et souvet otée (H 1 ). O e pourra jamais coclure avec certitude das u test statistique. Il y aura toujours des erreurs de décisio. Pour effectuer le test statistique, il faudra choisir u certai risque d erreur qui est la probabilité de se tromper e preat la décisio reteue. Il existe deux types d erreurs : O appelle erreur de première espèce ou erreur de type I, otée α, la probabilité de rejeter (H 0 ) alors qu elle est vraie. α est aussi appelé iveau ou seuil de sigificatio. O appelle erreur de deuxième espèce ou erreur de type II, otée β, la probabilité d accepter (H 0 ) alors qu elle est fausse. o appelle puissace du test pour (H 1 ) la probabilité de reteir (H 1 ) alors qu elle est vraie (= 1 β). Mécaisme des tests Il s agit d abord de formuler les hypothèses (H 0 ) et (H 1 ). O choisit e gééral le risque de type I, α. (souvet doé das l éocé). O détermie la variable de décisio Z (qui est ue statistique) dot o coaît la loi si (H 0 ) est vraie. O calcul la régio critique ou régio de rejet W qui est l esemble des valeurs de Z qui coduirot à rejeter (H 0 ). Aisi, si α est fixé, W est détermié par α = P [Z W avec (H 0 ) vraie ]. Le complémetaire de W est appelé régio d acceptatio. Les poits de joctio etre les deux régios sot les poits critiques. 41

4 CHAPTER 4. TESTS DE CONFORMITÉ O calcul la valeur de Z à partir de l observatio de l échatillo. Coclusio du test : acceptatio ou rejet de (H 0 ) selo que la valeur de Z est ou o das la régio d acceptatio. 4. Gééralités sur les tests de coformité Soit X ue v.a dot la loi déped d u paramètre icou θ. (H 0 ) θ = θ 0, θ 0 état ue valeur umérique. (H 1 ) peut être de 3 types : - (H 1 ) θ θ 0 test bilatéral - (H 1 ) θ > θ 0 test uilatéral à droite - (H 1 ) θ < θ 0 test uilatéral à gauche. Choix de la variable de décisio Z qui est l estimateur de θ ou ue foctio simple de l estimateur de θ. Calcul de la régio critique : α = P [décider (H 1 )alors que (H 0 ) est vraie] α = P [Z W alors que θ = θ 0 ]. a) tests bilatéraux O peut chercher W sous la forme ], z 1 [ ]z, [ ( W = [z 1, z ]). Aisi P [z 1 Z z avec θ = θ 0 ] = 1 α b) tests uilatéraux à droite O peut chercher W sous la forme ]z, [. Aisi P [Z > z avec θ = θ 0 ] = α c) tests uilatéraux à gauche O peut chercher W sous la forme ], z[. Aisi P [Z < z avec θ = θ 0 ] = α O traitera égalemet (das la sectio 4.6) les tests de choix etre deux valeurs du paramètre: (H 0 ) θ = θ 0 cotre (H 1 ) θ = θ 1 où θ 0 et θ 1 sot des valeurs umériques. 4.3 Tests de coformité sur ue moyee 4.3.1 Cas d ue variable Gaussiee O supposera que X N (µ, σ). O veut tester l hypothèse (H 0 ) µ = µ 0, µ 0 état ue valeur umérique cotre

4.3. TESTS DE CONFORMITÉ SUR UNE MOYENNE 43 (H 1 ) µ µ 0 ou µ > µ 0 ou µ < µ 0. O se fixe α, le risque de type I et o coaît la taille de l échatillo. a) cas σ cou O pred comme variable de décisio X [ou Z = X µ σ/ ]. Si µ = µ 0 alors X µ 0 σ/ N (0, 1) Calcul de la régio critique et coclusio du test. a-1) test bilatéral (H 1 ) µ µ 0 O cherche la régio d acceptatio sous la forme [x 1, x ], itervalle symétrique autour de µ 0. Soit u 1 α le réel détermié comme habituellemet das la table de la loi ormale (P ( u 1 α < U < u 1 α ) = 1 α avec U N (0, 1) ). Aisi, si µ = µ 0 alors P (µ 0 u 1 α (o remplace U par X µ 0 σ/ ). L itervalle d acceptatio pour X au risque α est I accept = [µ 0 u 1 α σ < X < µ 0 + u 1 α σ, µ 0 + u 1 α σ ] Coclusio : Si x, la réalisatio de X, I accept, o e peut rejeter (H 0 ), sio, o rejette (H 0 ). σ ) = 1 α Remarque Si o choisit comme variable de décisio Z, l itervalle d acceptatio pour Z au risque α est [ u 1 α ; u 1 α ]. Si z, la réalisatio de Z, [ u 1 α ; u 1 α ], o e rejette pas (H 0 ). Sio, o la rejette. a-) test uilatéral à droite (H 1 ) µ > µ 0 O cherche la régio critique sous la forme [x 1, + [. Soit u 1 α le réel détermié das la table de la loi ormale tel que P (U < u 1 α ) = 1 α avec U N (0, 1). Aisi, si µ = µ 0 alors P ( X > µ 0 + u 1 α σ ) = α (o remplace U par X µ 0 σ/ ) La régio critique (ou itervalle de rejet) pour X au risque α est σ I rejet = [µ 0 + u 1 α, + [

44 CHAPTER 4. TESTS DE CONFORMITÉ Coclusio : Si x, la réalisatio de X, I rejet, o rejette (H 0 ), sio, o e la rejette pas. Remarque Si o choisit comme variable de décisio Z, l itervalle d acceptatio pour Z au risque α est [u 1 α ; + ]. Si z, la réalisatio de Z, [u 1 α ; + [, o rejette (H 0 ). Sio, o e la rejette pas. a-3) test uilatéral à gauche (H 1 ) µ < µ 0 O cherche la régio critique sous la forme ], x 1 ]. Soit u 1 α le réel détermié das la table de la loi ormale tel que P (U < u 1 α ) = 1 α avec U N (0, 1). O a doc P (U < u 1 α ) = α. Aisi, si µ = µ 0 alors P ( X < µ 0 u 1 α σ ) = α (o remplace U par X µ 0 σ/ ) La régio de rejet pour X au risque α est I rejet =], µ 0 u 1 α σ ] Coclusio : Si x, la réalisatio de X, I rejet, o rejette (H 0 ), sio, o e la rejette pas. Remarque Si o choisit comme variable de d ] : u 1 α ]. Si z, la réalisatio de Z, ] : u 1 α ], o rejette (H 0 ). Sio, o e la rejette pas. b) cas σ icou O pred comme variable de décisio X [ou Z = X µ S/ 1 ]. X µ 0 Si µ = µ 0 alors S/ 1 t 1 Calcul de la régio critique et coclusio du test. b-1) test bilatéral (H 1 ) µ µ 0 O cherche la régio d acceptatio sous la forme [x 1, x ], itervalle symétrique autour de µ 0. Soit t 1(1 α ) le réel détermié comme habituellemet das la table de t 1 (P ( t 1(1 α ) < T < t 1(1 α ) ) = 1 α avec T t 1 ). Aisi, si µ = µ 0 alors P (µ 0 t 1(1 α ) S 1 < X < µ 0 + t 1(1 α (o remplace T par X µ 0 S/ 1 ). 1 ) = 1 α ) S

4.3. TESTS DE CONFORMITÉ SUR UNE MOYENNE 45 L itervalle d acceptatio pour X au risque α est I accept = [µ 0 t 1(1 α ) s 1, µ 0 + t 1(1 α ) s 1 ] Coclusio : Si x, la réalisatio de X, I accept, o e peut rejeter (H 0 ), sio, o rejette (H 0 ). Remarque Si o choisit comme variable de décisio Z, l itervalle d acceptatio pour Z au risque α est [ t 1(1 α ) ; t 1(1 α ) ]. Si z, la réalisatio de Z, [ t 1(1 α ) ; t 1(1 α ) ], o e rejette pas (H 0 ). Sio, o la rejette. b-) test uilatéral à droite (H 1 ) µ > µ 0 O cherche la régio critique sous la forme [x 1, + [. Soit t 1(1 α) le réel détermié das la table de t 1 tel que P (T < t 1(1 α) ) = 1 α avec T t 1. Aisi, si µ = µ 0 alors P ( X > µ 0 + t 1(1 α) S 1 ) = α (o remplace T X µ 0 par S/ 1 ) La régio de rejet pour X au risque α est s I rejet = [µ 0 + t 1(1 α), + [ 1 Coclusio : Si x, la réalisatio de X, I rejet, o rejette (H 0 ), sio, o e la rejette pas. Remarque Si o choisit comme variable de décisio Z, l itervalle de rejet pour Z au risque α est [t 1(1 α), + ]. Si z, la réalisatio de Z, ] : u 1 α ], o rejette (H 0 ). Sio, o e la rejette pas. b-3) test uilatéral à gauche (H 1 ) µ < µ 0 O cherche la régio critique sous la forme ], x 1 ]. O a P (T < t 1(1 α) ) = α. Aisi, si µ = µ 0 alors P ( X < µ 0 t 1(1 α) S 1 ) = α. La régio de rejet pour X au risque α est s I rejet =], µ 0 t 1(1 α) ] 1 Coclusio : Si x, la réalisatio de X, I rejet, o rejette (H 0 ), sio, o e la rejette pas.

46 CHAPTER 4. TESTS DE CONFORMITÉ Remarque Si o choisit comme variable de décisio Z, l itervalle de rejet pour Z au risque α est [ : t 1(1 α) ]. Si z, la réalisatio de Z, [ : t 1(1 α) ], o rejette (H 0 ). Sio, o e la rejette pas. 4.3. Cas d u échatillo de grade taille (Ce qui sigifie e pratique > 30) a) cas σ cou Quad est grad, o peut cosidérer que si µ = µ 0, X µ 0 σ N (0, 1). Tous les résultats du paragraphe 4.3.1 a) sot valables. b) cas σ icou Quad est grad, o peut cosidérer que si µ = µ 0, X µ 0 S N (0, 1). Il faut repredre les résultats du paragraphe 4.3.1 b) e remplaçat 1 par, t 1(1 α) par u 1 α et t 1(1 α ) par u 1 α. test bilatéral : L itervalle d acceptatio pour X au risque α est s s I accept = [µ 0 u 1 α/, µ 0 + u 1 α/ ] test uilatéral à droite : L itervalle de rejet pour X au risque α est s I rejet = [µ 0 + u 1 α, + ] test uilatéral à gauche : L itervalle de rejet pour X au risque α est s I rejet = [, µ 0 u 1 α ] 4.4 Tests de coformité sur ue variace d ue v.a Gaussiee O suppose X N (µ, σ). O veut tester l hypothèse (H 0 ) σ = σ 0, σ 0 état ue valeur umérique. cotre (H 1 ) σ σ 0 ou σ > σ 0 ou σ < σ 0. O se fixe α, le risque de type I et o coaît la taille de l échatillo. a) cas µ cou