BASES DE LA STATISTIQUE INFERENTIELLE

Documents pareils
STATISTIQUE : TESTS D HYPOTHESES

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

SÉRIES STATISTIQUES À DEUX VARIABLES

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

Cours de Statistiques inférentielles

Chapitre 3 : Fonctions d une variable réelle (1)

Statistique descriptive bidimensionnelle

Limites des Suites numériques

Principes et Méthodes Statistiques

Séquence 5. La fonction logarithme népérien. Sommaire

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

Comportement d'une suite

Cours 5 : ESTIMATION PONCTUELLE

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

Séries réelles ou complexes

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Dénombrement. Chapitre Enoncés des exercices

CHAPITRE 2 SÉRIES ENTIÈRES

1 Mesure et intégrale

Chapitre 3 : Transistor bipolaire à jonction

Etude de la fonction ζ de Riemann

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

Statistique Numérique et Analyse des Données

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

55 - EXEMPLES D UTILISATION DU TABLEUR.

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

14 Chapitre 14. Théorème du point fixe

Exercices de mathématiques

Échantillonnage et estimation

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Processus géométrique généralisé et applications en fiabilité

UNIVERSITÉ DE SFAX École Supérieure de Commerce

STATISTIQUE AVANCÉE : MÉTHODES

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

20. Algorithmique & Mathématiques

EXERCICES : DÉNOMBREMENT

c. Calcul pour une évolution d une proportion entre deux années non consécutives

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

4 Approximation des fonctions

Les Nombres Parfaits.

Chap. 5 : Les intérêts (Les calculs financiers)

Probabilités et statistique pour le CAPES

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

Processus et martingales en temps continu

2 ième partie : MATHÉMATIQUES FINANCIÈRES

Baccalauréat S Asie 19 juin 2014 Corrigé

Université Pierre et Marie Curie. Biostatistique PACES - UE

Formation d un ester à partir d un acide et d un alcool

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

Chaînes de Markov. Arthur Charpentier

Dares Analyses. Plus d un tiers des CDI sont rompus avant un an

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

Module 3 : Inversion de matrices

Suites et séries de fonctions

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers.

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Régulation analogique industrielle ESTF- G.Thermique

Comment les Canadiens classent-ils leur système de soins de santé?

Risque de longévité et détermination du besoin en capital : travaux en cours

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

Initiation à l analyse factorielle des correspondances

Terminale S. Terminale S 1 F. Laroche

INTRODUCTION AUX MATRICES ALÉATOIRES. par. Djalil Chafaï

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Solutions particulières d une équation différentielle...

Compte Sélect Banque Manuvie Guide du débutant

Des résultats d irrationalité pour deux fonctions particulières

La tarification hospitalière : de l enveloppe globale à la concurrence par comparaison

La fibre optique arrive chez vous Devenez acteur de la révolution numérique

RESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *)

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus

Introduction : Mesures et espaces de probabilités

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

Sommes de signaux : Décomposition de Fourier Spectre ondes stationnaires et résonance

La maladie rénale chronique

POLITIQUE ECONOMIQUE ET DEVELOPPEMENT

Sommaire Chapitre 1 - L interface de Windows 7 9

Les études. Recommandations applicables aux appareils de levage "anciens" dans les ports. Guide Technique

Le chef d entreprise développe les services funéraires de l entreprise, en

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

Neolane Message Center. Neolane v6.0

Augmentation de la demande du produit «P» Prévision d accroître la capacité de production (nécessité d investir) Investissement

Le Sphinx. Enquêtes, Sondages. Analyse de données. Internet :

Transcription:

Polytech Paris-UPMC Probabilités-statistiques Chapitre 4 BASES DE LA STATISTIQUE INFERENTIELLE Ue equête statistique est ue étude gééralemet réalisée sur u petit groupe d objets, d uités, de persoes que le statisticie omme idividu, le groupe costituat u échatillo d idividus A partir des résultats obteus sur cet échatillo, le statisticie essaie de porter des coclusios sur les variatios das u groupe plus vaste format la populatio à laquelle o s itéresse Au cours de cette étude, o observe les fluctuatios d u idividu à l autre, d u ou plusieurs paramètres, que l o appelle des caractères ou variables statistiques Relever et aalyser les valeurs prises par le (ou les paramètres étudié(s avec les fréqueces d observatio de ces valeurs ou modalités relève des statistiques descriptives (e aexe, otios simples qui e serot pas étudiées e cours E déduire des cojectures sur ce (ou ces paramètre(s das la populatio, das d autres échatillos, sur des comparaisos d échatillos, relève de la statistique iféretielle Pour faire ces prévisios (ou iféreces, pour passer de la descriptio au probable, o utilise la modélisatio et les résultats de la théorie des probabilités, vus das les trois premiers chapitres de ce cours Chapitre 4 1

BASES DE LA STATISTIQUE INFERENTIELLE 1 41 THÉORIE DE L ECHANTILLONAGE 3 411 Hypothèse fodametale de la théorie de l échatilloage 3 41 Statistiques d ordre : lois des valeurs extrêmes 3 41 Statistique X 4 413 Statistique S 5 413 Corrélatio etre X et S 5 414 Cas des échatillos gaussies 6 415 Echatillos artificiels, simulatio 7 416 Applicatio : Méthode de Mote Carlo 8 4 L ESTIMATION 8 41 Estimateur, défiitios 8 4 Exemples élémetaires d estimateurs 9 43 Applicatio : estimatio poctuelle 9 44 Estimatio par itervalle de cofiace 10 43 TESTS STATISTIQUES 17 431 Tests paramétriques 17 43 Tests d ajsutemet et tests d idépedace utilisat la loi du Khi-deux 5 Chapitre 4

41 THEORIE DE L ECHANTILLONAGE 411 Hypothèse fodametale de la théorie de l échatilloage Das le cas d ue étude statistique sur ue populatio, l échatillo est supposé être tiré selo des règles rigoureuses destiées à e assurer la représetativité de la populatio L hypothèse faite, das ce cas est que les valeurs observées sur les idividus d u échatillo sot réalisatios d ue même variable aléatoire X réelle sur la populatio, appelée variable aléatoire parete O itroduit le modèle suivat : à chaque idividu i tiré, o associe ue variable aléatoire X i dot o observe ue seule réalisatio Cette démarche peut se schématiser de la maière suivate Populatio Variable X Echatillo de idividus ( i 1,i,,i réalisatios de X X(i 1, X(i,, X(i ( modélisatio valeurs «idépedates» de X -uplet (X 1,X,, X var idépedates et de même loi que X 1 réalisatio de (X 1,X,, X (X 1 (ω,x (ω,,x (ω Défiitio O appelle échatillo le -uplet de variables aléatoires idépedates et idetiquemet distribuées (X 1,X,, X Défiitio Ue statistique T est ue variable aléatoire foctio de X 1, X,, X T = f (X 1, X,, X La théorie de l échatilloage se propose d étudier les propriétés du -uplet (X 1, X,, X et des statistiques le décrivat, à partir de la distributio supposée coue de la variable parete X O repred et complète les résultats du chapitre de ce cours 41 Statistiques d ordre : lois des valeurs extrêmes X variable aléatoire, supposée cotiue, de foctio de répartitio F et de desité f Chapitre 4 3

Défiitio Les valeurs extrêmes sot Y 1 = mi X 1,X,, X { } et Y = max{ X 1, X,, X } O sait : P(Y 1 y =1 P(Y 1 > y, i= et par idépedace P(Y 1 > y = P(X i > y et P(Y < y = P(X i < y E otat H 1 et h 1 les foctios de répartitio et de desité de Y 1 H et h les foctios de répartitio et de desité de Y i= O a alors H 1 (y =1 [ 1 F(y ] h 1 (y = 1 F(y [ ] 1 f (y et H (y = [ F(y ] h 1 (y = F(y [ ] 1 f (y 41 Statistique X Défiitio La statistique X ou moyee empirique de l échatillo est X = 1 i= X i Espérace et variace de X Soit m et σ l espérace et l écart-type de la variable parete ; o a E(X = m et V (X = σ Théorème limite pour X Théorème cetral limite : X m σ Applicatio : loi d u pourcetage L N(0;1 X état ue suite de variables aléatoires de Beroulli idépedates B(1, p, otos F (= X la fréquece empirique, moyee arithmétique de variables de Beroulli de paramètre p idépedates p(1 p O E(F = p et V (F = et si est grad (théorème de De Moivre-Laplace F suit approximativemet la loi N p; p(1 p Chapitre 4 4

413 Statistique S Défiitio La statistique S ou variace empirique d échatillo est : Propriété élémetaire Espérace de S S = 1 S = 1 i= ( X i X i= X i (X E(S = 1 σ Doc E(S σ O dit que S est ue statistique biaisée pour σ Variace de S O motre V (S = 1 ( 1µ 3 4 ( 3σ 4 4 de X Alors V (S µ σ 4 4 si + Théorème limite pour S [ ] avec µ 4 le momet cetré d ordre ce qui peut s écrire S σ µ 4 σ 4 S 1 V (S σ L N( 0;1 L N( 0;1 avec l approximatio précédete 413 Corrélatio etre X et S Das le chapitre 3, ous avos vu la défiitio de la covariace : ( = E ( X m S 1 σ ( = E( X S E( X E( S cov X,S et cov X,S La covariace est isesible à u chagemet pas traslatio, o peut supposer que m=0, c est à dire E(X i = 0 pour tout i D où cov( X,S = E( X S Chapitre 4 5

E( X S = E 1 i= X i 1 j = X j j =1 (X = 1 E i= X j = i X j j =1 E X 3 ( = 1 i= j = E X ix j j =1 E X 3 ( Les variables sot idépedates, pour i j : E(X ix j = E(X i E(X j = 0 = 1 E i= X 3 3 i E X = 1 E i= X 3 i E 1 = 1 E i= X 3 i 1 E 3 ( 3 i= 3 X i i= X i E coclusio : cov( X,S = µ 3 µ 3 = 1 µ 3 Si +, cov( X,S 0 X et S sot asymptotiquemet o corrélées Si µ 3 = 0 (o dit la distributio symétrique, X et S sot o corrélées pour tout Attetio : o corrélatio idépedace 414 Cas des échatillos gaussies ( O suppose la variable aléatoire parete ormale N m;σ X suit (exactemet la loi N m; σ O motre aussi les deux théorèmes suivats S suit la loi χ σ 1, loi du Khi-Deux de paramètre (-1 X et S sot idépedates O peut même démotrer ue sorte de réciproque : si X et S sot idépedates, alors X suit ue loi ormale Chapitre 4 6

Et o a aussi le résultat extrêmemet utile T 1 = X m S 1 est ue variable de Studet à (-1 degrés de liberté Cela viet du fait que T 1 = X m σ S ( 1σ Ce résultat est utile car il e déped pas deσ = X m S 1 Exemple : X suit la loi N( 10;, X 5 suit la loi N( 10;0,4 et 5S 5 4 suit la loi χ 4 Des calculs simples de probabilité doet P(9,34 < X 5 <10,66= 0,9 et P(1,49 < S 5 <,41=0,9 415 Echatillos artificiels, simulatio Das de ombreuses études, il est écessaire de pouvoir disposer d échatillos de variables de lois coues O peut recourir à la simulatio, c est à dire «fabriquer» à l aide d u programme de calcul ue suite de ombres x 1, x,,x chaque ombre état ue réalisatio d ue variable aléatoire suivat la loi voulue, les variables aléatoires état idépedates Das tous les cas, il est écessaire de disposer au départ d ue table de ombres aléatoires ou d u géérateur de ombres aléatoires U géérateur est u algorithme fourissat ue suite de ombre compris etre 0 et 1 (ullemet aléatoires, o parle de ombre pseudo-aléatoires mais ayat toutes les propriétés d u véritable échatillo aléatoire d ue loi uiforme sur [ 0;1] Voir les aides sur la foctio «alea» ou «radom» d ue calculatrice, d u logiciel de type excel Quelques idicatios : - Si X a ue foctio de répartitio F, dot la réciproque F 1 a ue forme aalytique simple, o peut utiliser la méthode «iversio de la foctio de répartitio» - Si X a ue desité borée à support boré, o peut utiliser la méthode «du rejet» - Si X suit ue loi de Beroulli, ue loi Gamma γ r, ue loi de Poisso, ue loi ormale, il existe des méthodes particulières O peut voir à ce sujet «Probabilités, Aalyse des Doées et Statistque» de G Saporta, Editios Techip, 1990, pages 76 à 83 Chapitre 4 7

416 Applicatio : Méthode de Mote Carlo Le terme «méthode de Mote-Carlo», ou «méthode Mote-Carlo», désige toute méthode visat à calculer ue valeur umérique e utilisat des procédés aléatoires, c'est-à-dire des techiques probabilistes Les méthodes de Mote-Carlo sot particulièremet utilisées pour calculer des itégrales e dimesios plus grades que 1 (e particulier, pour calculer des surfaces et des volumes Elles sot égalemet courammet utilisées e physique des particules, où des simulatios probabilistes permettet d'estimer la forme d'u sigal ou la sesibilité d'u détecteur 4 L ESTIMATION La plupart des expérieces aléatoires coduiset à l'étude de variables aléatoires obéissat à des lois dot le type est cou, mais qui dépedet de paramètres réels liés à l'expériece Ce paragraphe a pour objectif de doer u cadre théorique et des méthodes afi d'estimer la valeur umérique de ces paramètres 41 Estimateur, défiitios Si X est ue variable aléatoire dot la loi déped d'u paramètre θ, et (X 1, X,, X u -échatillo, ue statistique T, foctio de (X 1, X,, X est : - u estimateur si elle permet d évaluer le paramètre θ - u estimateur sas biais de θ si E(T = θ - u estimateur asymptotiquemet sas biais de θ si lim E(T = θ + - u estimateur coverget de θ si lim V (T =0 + U estimateur T est meilleur (plus efficace que l'estimateur T' si pour tout etier aturel assez grad, V(T V(T' La recherche d u «bo» estimateur pour u paramètre est pas chose facile O peut être ameé à chercher u estimateur sas biais de variace miimale, ce qui est très lié à l existece de «statistiques exhaustives», otio que ous aborderos pas das ce cours Chapitre 4 8

4 Exemples élémetaires d estimateurs E repreat les résultats du paragraphe 41, o a les résultats : - X est u estimateur sas biais et coverget de m - S est u estimateur, avec u biais, et coverget de σ U estimateur sas biais de σ * est S = 1 S - F est u estimateur sas biais et coverget de p 43 Applicatio : estimatio poctuelle Il s agit de doer ue estimatio poctuelle, par ue valeur umérique, d u paramètre d ue loi à partir d u échatillo Ce type de situatio se recotre fréquemmet das le mode idustriel car, le plus souvet, il est pas possible d étudier la populatio etière : cela predrait trop de temps, reviedrait trop cher ou serait aberrat comme, par exemple, das le cas d u cotrôle de qualité etraiat la destructio des pièces De maière géérale, o doe ue estimatio poctuelle d u paramètre, par la valeur d u estimateur de ce paramètre calculée à partir d u échatillo prélévé «au hasard» x 1,x,, x Il est d usage de oter l estimatio poctuelle par la lettre surmotée d u «^» Estimatios poctuelles usuelles : Si X est ue variable aléatoire de moyee m et d écart type σ et u échatillo prélévé «au hasard» x 1,x,, x - x e, la moyee de l échatillo est ue estimatio poctuelle de la moyee icoue m Soit m ˆ = x e - 1 σ (où σ e eest l écart-type de l échatillo est ue estimatio poctuelle de l écart type σ Soit ˆ σ = 1 σ e Chapitre 4 9

Remarques : - certaies calculatrices doet, pour u échatillo, les deux résultats σ e et 1 σ e il faut doc bie lire la otice L estimatio de l écart-type est la plus grade des deux valeurs - si est assez grad, est proche de 1, les deux valeurs sot proches et 1 parfois σ e est acceptée comme estimatio poctuelle de l écart-type Si X est ue variable aléatoire Beroulli B(1, p, f e la fréquece sur l échatillo est ue estimatio poctuelle de p Soit ˆ p = f e 44 Estimatio par itervalle de cofiace Les estimatios poctuelles dépedet doc de l échatillo Pour u paramètre θ, il est souvet plus réaliste et plus itéressat de fourir u reseigemet du type a < θ < b plutôt que d écrire θ ˆ = c 441 Pricipe La méthode des itervalles de cofiace est la suivate : Soit T u estimateur de θ, o predra le meilleur estimateur possible, dot o coaît la loi de probabilité pour chaque valeur de θ Etat doé ue valeur θ 0 de θ, o peut détermier u itervalle de fluctuatio de iveau 1-α (ou de risque α pour T, c est à dire deux bores t 1 et t telles que : P(t 1 < T < t θ = θ 0 =1 α E gééral α est petit, doc 1- α proche de 1 Ces bores dépedet évidemmet de θ 0 O choisira das la plupart des cas u itervalle de fluctuatio à risques symétriques α / et α /, c est à dire : P(T < t 1 θ = θ 0 = α / et P(t < T θ = θ 0 = α / O adopte alors la règle de décisio suivate : soit t e la valeur observée sur u échatillo de T : - si t e t 1,t - si t e t 1,t [ ] o coserve θ 0 comme valeur possible de θ [ ] o élimie θ 0 Chapitre 4 10

O lit doc selo ue verticale les itervalles de fluctuatio pour ue valeur θ 0 et, selo l horizotale issue de t, l itervalle de cofiace pour le paramètre θ O dit que [ a,b] est u itervalle de cofiace de iveau 1- α (qu o appelle coefficiet de cofiace, o dit aussi qu o pred le risque α, c est «le risque» d avoir tort [ ] est u itervalle aléatoire qui déped de t e - a,b a = t 1 - a et b s obtieet par : (t e b = t 1 1 (t e Remarques : - si l o augmete 1- α, o augmete la logueur de l itervalle de fluctuatio, les courbes s écartet - si augmete, comme T est supposé coverget, V(T dimiue, doc [ t 1,t ] dimiue et les courbes se rapprochet de la première bissectrice 44 Itervalle de cofiace pour la moyee d ue loi ormale N(m,σ m est doc le paramètre à estimer par u itervalle de cofiace A σ est cou X est le meilleur estimateur de m et X suit ue loi N(m, σ Chapitre 4 11

L itervalle de fluctuatio symétrique de X à 1 α est : m u α / σ < X < m + u σ α / d où l itervalle de cofiace : x e u α / σ < m < x e + u α / σ La valeur de u α / est lue sur la table des quatiles de la loi ormale cetrée réduite, c est le quatile d ordre α / Par exemple pour u itervalle de cofiace de iveau 95%, α = 5%, u 0,05 =1,96 Exemple : Das u cotrôle qualité, o prélève au hasard 36 pièces sur la productio jouralière de 500 O s itéresse à la masse des pièces O suppose (modélise que la masse suit ue loi ormale N(m,σ, et o suppose que l écart-type de la productio est cou et égal à 1,5g O mesure la masse de ces 36 pièces, o trouve comme masse moyee : x e = 774,7g O e déduit les estimatios de m : - estimatio poctuelle : m ˆ =774,7g - estimatio par itervalle de cofiace de iveau 95% : 770,6 ; 778,8 obteu par 774,7 1,96 1,5 1,5 < m < 774,7 +1,96 36 36 B σ est icou [ ] O utilise le fait que T 1 = X m de liberté S 1 suit ue loi de Studet à (-1 degrés L itervalle symétrique de fluctuatio pour T 1 est : t α / < X m S 1 < t α / D où l itervalle de cofiace : σ e x e t α / 1 < m < x e + t α / ou bie ˆ σ x e t α / < m < x + t e α / σ e 1 ˆ σ La valeur de t α / est lue sur la table de distributio de T (Loi de Studet, c est le quatile d ordre α / Chapitre 4 1

Par exemple pour u itervalle de cofiace de iveau 95%, α = 5%, Pour = 0 t 0,05 =,086, pour =30 t 0,05 =,04, pour =10 t 0,05 =1,98 Exemple : O repred l exemple précédet du cotrôle qualité O prélève das ue productio jouralière de 500 pièces u échatillo au hasard de 36 pièces O s itéresse à la masse des pièces O suppose (modélise que la masse suit ue loi ormale N(m,σ Sur l échatillo o obtiet : x e = 774,7g et σ e = 1,5g O e déduit les estimatios de m : - estimatio poctuelle : m ˆ =774,7g - estimatio par itervalle de cofiace de iveau 95% : [ 770,4 ; 779,0] itervalle obteu par : 774,7,03 1,5 < m < 774,7 +,031,5 35 35 E pratique, ces résultats sot très souvet utilisés Le théorème cetral-limite a pour coséquece que les itervalles précédets sot valables pour estimer m d ue loi quelcoque si est assez grad O a aussi, pour assez grad, u α / t α / Chapitre 4 13

443 Itervalle de cofiace pour la variace σ d ue loi ormale σ est doc le paramètre à estimer par u itervalle de cofiace A m est cou i= O utilise l estimateur V = 1 ( X i m qui est le meilleur estimateur de σ et V suit ue loi χ σ comme somme de carrés de N(0;1 idépedates Soit k 1 et k les bores d u itervalle de fluctuatio d u χ au iveau 1 α C est à dire P(k 1 < V σ < k =1 α Ce graphique repred la forme géérale de la desité d ue loi du Khi-deux Remarque : le couple ( k 1, k est pas uique Fréquemmet o choisit ces valeurs e répartissat le risque α de faço symétrique P( V σ < k 1 = P(k < V σ = α E otat v e la variace de l échatillo : L itervalle de cofiace est : v e k < σ < v e k 1 Chapitre 4 14

B m est icou O utilise S = 1 i= ( X i X et o sait que S suit ue loi χ σ 1 Soit l 1 et l les bores d u itervalle de fluctuatio d u χ 1 au iveau 1 α C est à dire P(l 1 < S σ < l =1 α L itervalle de cofiace est : v e l < σ < v e l 1 Exemple : =30 ; S e =1 ; 1 α =0,90 ; o choisit l itervalle de probabilité 90% avec les bores l 1 =17,708 ; l = 4,557, cela doe 8,46 < σ < 0,33 d où :,91 < σ < 4,51 Remarques : ces résultats e sot valables QUE pour des lois ormales 444 Itervalle de cofiace pour le paramètre d ue loi biomiale quad est grad C est le problème cou sous le om d u itervalle de cofiace pour ue proportio p icoue Etat doée ue populatio ifiie (ou fiie si tirage avec remise où ue proportio p des idividus possède u certai caractère, il s agit de trouver u itervalle de cofiace à partir de f e, proportio trouvée das u échatillo de taille O sait que f suit ue loi biomiale B(,p ; si est «petit» o utilisera des tables de loi biomiale ou l abaque Et si est «grad», F suit approximativemet la loi N p; L itervalle de fluctuatio symétrique est : p(1 p p u α / p(1 p < F < p + u α / p(1 p Les boes de l itervalle de fluctuatio sot doés par y = p ± u α / p(1 p ( = (u α / p(1 p Soit y p, ce qui est l équatio d ue ellipse passat par l origie, et le poit (1,1 pour lesquels les tagetes sot verticales Chapitre 4 15

Remarque : les parties de l ellipse extérieure au carré uité sot sas sigificatio; elles correspodet aux zoes où l approximatio ormale est pas pertiete Etat doée ue valeur f e observée, l itervalle de cofiace s obtiet e résolvat l équatio e p : ( f e p p(1 p = (u α / Après calculs et approximatio par u développemet limité e 1/, o obtiet p 1 et p et, doc, l itervalle de cofiace : f e u α / f e (1 f e < p < f e + u α / f e (1 f e Exemple : =400 ; f e =0,36 ; 1 α =0,95 : o a 0,31<p<0,41 444 Méthode pratique de costitutio d échatillos Pour u sodage, la maière de prélever ou de costituer l échatillo d idividus à observer est d importace, il existe plusieurs méthodes classiques pour cela : la méthode des quotas (ou sodage raisoé, la méthode des uités types, le sodage stratifié, sodage à probabilités iégales, etc Chapitre 4 16

43 TESTS STATISTIQUES 431 Tests paramétriques 4311 Pricipe La variable aléatoire X déped d u paramètre θ Costruire u test reviet à détermier u mécaisme décisioel, qui au vu d u échatillo, permet de predre ue décisio sur les valeurs possibles de θ E pratique, cela reviet à choisir etre deux hypothèses sur θ : la première hypothèse H 0, appelée hypothèse ulle, et ue autre hypothèse, H 1, appelée hypothèse alterative Souvet l hypothèse ulle correspod à ue égalité du paramètre θ à ue valeur doée, o dit que H 0 est «simple» Das ce cas, la plupart des tests paramétriques peuvet se rameer à u test du type, où θ 0 θ 1 : H 0 θ = θ 0 H 1 θ = θ 1 ou H 0 θ = θ 0 H 1 θ θ 0 ou H 0 θ = θ 0 H 1 θ > θ 0 H 0 θ = θ 0 ou H 1 θ < θ 0 Ce polycopié restera das ce cadre Les hypothèses H et H 0 1 e sot pas symétriques, le choix de l hypothèse ulle est celui qui costruit le test, l hypothèse alterative permet de costruire la règle de décisio 431 Procédure de décisio Accepter H 0, l hypothèse ulle, reviet automatiquemet à refuser H l hypothèse 1 alterative, et réciproquemet, refuser H 0 etraîe automatiquemet l acceptatio de H 1 Il y a doc u risque de se tromper de décisio O sythétise le problème par u tableau de probabilités vérité décisio H 0 H 1 H 0 1- α β H 1 α 1- β C est à dire P(choisir H 0 /H 0 vraie =1 α P(rejeter H 0 /H 0 vraie = α Das la pratique, o choisit α, les valeurs courates sot 10%, 5%, 1% Chapitre 4 17

α état fixé, β sera détermié comme résultat d u calcul (mais ceci est possible que si o coaît les lois de probabilités sous H 1 α et β variet e ses cotraire Si o dimiue α, o augmete 1- α (probabilité d accepter H si H 0 0 est vraie mais aisi o a ue règle de décisio plus stricte qui aboutit à abadoer H 0 que das des cas rarissimes, doc peut-être à coserver H 0 à tort Vocabulaire : - α s appelle le iveau du test c est aussi le risque de première espèce : probabilité de choisir H alors que H 1 0est vraie - β s appelle le risque de deuxième espèce : probabilité de choisir H 0 alors que H 1 est vraie - 1- β s appelle la puissace du test, c est la probabilité de choisir H alors 1 que H 1 est vraie - La régio critique W est l esemble des valeurs de la variable de décisio qui coduiset à écarter H 0 au profit de H 1 La forme de la régio critique est détermiée par la ature de H 1, sa détermiatio exacte se fait e écrivat : P(W /H 0 = α La régio d acceptatio est so complémetaire W, et l o a doc : P(W /H 0 =1 α et P(W /H 1 =1 β La costructio d u test est rie d autre que la détermiatio de la régio critique, sas coaître le résultat de l expériece, doc a priori E résumé, la costructio d u test reviet à : 1 Choix de H 0 et de H 1 Détermiatio de la variable de décisio 3 Allure de la régio critique e foctio de H 1 4 Calcul de la régio critique e foctio de α 5 Calcul évetuel de la puissace 1- β 6 Calcul de la valeur expérimetale de la variable de décisio 7 Coclusio : si la valeur expérimetale est das la régio critique, o rejette H 0 Das le cas cotraire, o accepte H 0, «faute de mieux» 431 Test de la moyee m d ue loi N(m,σ - cas où σ est cou, Le test repose sur la variable de décisio X qui suit ue loi N(m, σ H 0 m = m 0 Pour avec m H 1 m = m 1 > m 0, la régio critique est défiie par X >k 1 Chapitre 4 18

où U = X m 0 σ P(X > k /H 0 = P U > k m 0 = α σ suit ue loi ormale cetrée réduite H 0 m = 600 Exemple : O veut tester, et o sait que σ =100 H 1 m = 650 O a u échatillo de 9 mesures, o choisit le risque de 5% O calcule k = 600 + 100 1,64 = 655 3 La règle de décisio est doc la suivate : - Si la valeur moyee trouvée sur l échatillo est supérieure à 655, o refuse H 0, et doc o accepte H 1 - Si la valeur moyee trouvée sur l échatillo est iférieure à 655, o accepte H 0 Ue fois établie la règle de décisio, o calcule la moyee sur l échatillo Elle est de 610, : doc o accepte H 0 Remarque : ici β = 0,56, ce qui est cosidérable Le test est pas puissat - cas où σ est icou Le test repose sur la variable de décisio T = X m 1 Studet à (-1 degrés de liberté S 1 qui suit ue loi de Pour H 0 m = m 0, la régio critique est défiie par H 1 m m 0 T 1 > k avec P (" T 1 > k"/"m = m 0 " = α exemple : H 0 : m = 30 cotre H 1 : m 30 U échatillo de 15 observatios a doé x e = 37, et σ e = 6, C est u test bilatéral car o s occupe de la valeur absolue, et la variable cosidérée suit ue loi de Studet La valeur critique à α =5% pour u test bilatéral d u T 14 est,145 37, 30 O calcule la valeur t = 14 = 4,35 6, Coclusio : o rejette H 0, doc o accepte H 1 Pour les tests de moyee, si la variable parete e suit pas ue loi ormale, les tests précédets s appliquet ecore dès que est assez grad (>30 e gééral e raiso du théorème cetral-limite Chapitre 4 19

Das les deux exemples ci dessus, o a mis e place : - u test bilatéral pour H 1 :θ θ 0, la régio critique correspod à θ θ 0 sigificativemet o ul, - u test uilatéral pour H 1 :θ > θ 0 (respectivemet H 1 :θ < θ 0, si la régio critique correspod à (θ θ 0 sigificativemet positif (respectivemet égatif Le cas H 1 :θ = θ 1 se traite avec u test uilatéral suivat la positio de θ 0 et θ 1 O peut das ce cas faire le calcul de la puissace du test 4313 Test de la variace d ue loi N(m,σ - cas où m est cou (cas peu fréquet i= La variable de décisio est V = 1 ( X i m H 0 σ = σ 0 Aisi pour, avec σ H 1 σ = σ 1 > σ 0 la régio critique est défiie par 1 V = 1 i= ( X i m > k et k est détermié e cosidérat que V suit ue loi χ σ P(V > k = P χ > k = α σ 0 - cas où m est icou (cas usuel i= La variable de décisio est S = 1 ( X i X et o sait que S suit ue loi σ χ 1 - H 0 σ = σ 0 Aisi pour, avec σ H 1 σ = σ 1 > σ 0 la régio critique est défiie par 1 S > k et k est détermié e cosidérat que S suit ue loi χ σ 1 - P(S > k = P χ 1 > k = α σ 0 Exemple : O teste σ 0 = 3, avec 0 observatios, o a trouvé s e = 3,5, o choisit de faire u test au risque 5% La valeur critique est d u χ 19 pour 5% est 30,144 d où k = 30,1443 0 O a s e = 3,5 =1,5 O accepte doc H 0 Importat : ces résultats e sot valables QUE pour des lois ormales Ces tests utiliset la loi du χ =13,56 Chapitre 4 0

4314 Test de la valeur théorique d u pourcetage p pour u grad échatillo p(1 p La variable de décisio est F et, pour est grad, F suit la loi N p; H 0 p = p 0 Pour, la régio critique au risque α est défiie par : H 1 p p 0 p F p 0 > u 0 (1 p 0 α / p Soit le complémetaire de p 0 u 0 (1 p 0 p α / ; p 0 + u 0 (1 p 0 α / Exemple : Pour =00, o observe ue proportio de 45% ayat le caractère observé O teste p 0 = 0,5 au risque de 5% La régio critique correspod à F 0,5 >1,96 (0,5 = 0,07 00 Or l écart etre la valeur observée et la valeur théorique est de 0,05 O accepte doc H 0 Si est trop petit pour ue approximatio par ue loi ormale, o utilisera ue abaque elliptique (voir e aexe 4315 Tests de comparaiso de deux échatillos gaussies O a deux échatillos de taille 1 et, o veut tester si o peut admettre qu ils vieet d ue même populatio relativemet au caractère étudié, ces deux échatillos ayat été prélevés idépedammet l u de l autre Das ce polycopié, o e cosidère que le cas où le caractère étudié peut être modélisé par ue loi ormale Par exemple : taux de cholestérol de deux groupes de persoes ayat pris deux médicamets différets, taux e dioxie des résidus urbais après deux types de traitemet, etc O formalise le problème de la maière suivate : X 1 suit la loi N(m 1,σ 1 et X suit la loi N(m,σ O veut tester H 0 : m 1 = m et σ 1 = σ cotre H 1 : m 1 m ou σ 1 σ Le test va cosidérer d abord l égalité des variaces et, si elles e sot pas sigificativemet différetes, à tester esuite les espéraces e admettat σ 1 = σ A- Test des variaces par le test de Fisher-Sedecor E utilisat les résultats de la théorie de l échatilloage : Chapitre 4 1

1 S 1,1 suit ue loi χ σ 1 1et S, suit ue loi χ 1 σ 1 Das l hypothèse H 0 :σ 1 = σ, o a (o l admet : 1 S 1,1 F = 1 1 S, 1 suit ue loi de Fisher-Sedecor de paramètres ( 1 1, 1, usuellemet otée F( 1 1, 1 O peut iterpréter F comme le rapport de deux estimateurs de σ 1 et σ respectivemet Si σ 1 = σ, ce rapport e doit pas différer sigificativemet de 1 F sera la variable de décisio E pratique, o met toujours au umérateur la plus grade des deux quatités : S 1 1, 1 1 1 et S, 1 F>k avec k>1 et la régio critique est de la forme Si les deux échatillos ot même taille = 1 =, le calcul se simplifie F = S 1, S, Si le test de Fisher-Sedecor aboutit à la coclusio σ 1 = σ, o passe au test des moyees Exemple : 1 = 5; =13; s 1 = 0,05; s = 0,07; α = 0,05 13 0,07 5 0,05 Il faut permuter les idices 1 et car > 1 4 La régio critique pour ue loi de Fisher-Sedecor F(1;4au risque 5% est F>,18 Ici, la valeur est de 0,68, o accepte l hypothèse σ 1 = σ B- Test des moyees par le test de Studet Supposos désormais σ 1 = σ = σ O sait : X 1,1 suit ue loi N(m 1, et X, suit ue loi N(m, σ 1 σ 1 S 1,1 suit ue loi χ σ 1 1 S, suit ue loi χ σ 1 Comme les lois sot idépedates, S 1 1, 1 + S, suit ue loi χ σ 1 + X 1,1 X, suit ue loi N m 1 m,σ 1 + 1 1 et Chapitre 4

σ état icou, o utilise la loi de Studet O sait que : (X 1,1 X, (m 1 m T = σ 1 1 + 1 1 S 1,1 + S, σ ( 1 + suit ue loi T 1 + Ce qui, e élimiat σ, se ramèe à : T = (X 1, 1 X, (m 1 m ( 1 S 1,1 + S, 1 + 1 1 + suit ue loi T 1 + 1 Das l hypothèse H 0 : m 1 = m et la régio critique est de la forme T > k Exemple : o repred l exemple précédet 1 = 5; =13; x 1 =,7; x =,8; s 1 = 0,05; s = 0,07; α = 0,05, L hypothèse d égalité des variaces a déjà été acceptée La valeur calculée de la variable de décisio T vaut eviro -3,5 La valeur critique pour T 36 au risque 5 % est de,03 O rejette doc l hypotèse ulle : les échatillos sot sigificativemet différets, das leur moyee e l occurrece Remarque : l ordre des tests (test des variaces, et, si égalité acceptée, test des moyees est idispesable, l égalité des variaces est écessaire à l utilisatio d ue loi de Studet Si les échatillos sot o gaussies, le test de variace est plus valable, mais o a u résultat capital, qui peut tester l égalité des moyees Pour 1 et assez grads, o peut quad même tester les moyees e appliquat la formule de Studet que s 1 soit différet ou o de s O dit que le test de Studet est «robuste» car il résiste bie à u chagemet de la loi de X 1 et X 4316 Test de comparaiso de deux pourcetages (grads échatillos Das deux échatillos de grade taille 1 et, o relève les pourcetages f 1 et f d idividus présetat u certai caractère Soit p 1 et p les probabilités correspodates : il s agit de savoir si p 1 et p sot sigificativemet différets ou o H 0 p 1 = p = p O teste doc H 1 p 1 p Chapitre 4 3

Si H 0 est vraie, f 1 et f sot deux réalisatios idépedates de deux variables F 1 et F qui suivet des lois ormales F 1 suit la loi N p; p(1 p 1 F suit la loi N p; p(1 p Doc F 1 F suit la loi N p; p(1 p 1 + 1 1 1 O rejettera H 0, si, f 1 f > u α / p(1 p + 1 1 Si p est pas cou, o le remplace par so estimatio : Exemple : échatillo A : A = 96 ; f A = 0,18 échatillo B : B = 60 ; f B = 0,5 test au iveau 10 % ˆ p = 0,1 et p ˆ (1 p ˆ f 1 f 1 + 1 1 O e peut doc rejeter H 0 p ˆ = 1p 1 + p 1 + = 0,89 <1,68 4317 Test de comparaiso de moyees de deux échatillos appariés U même échatillo d idividus est soumis à deux mesures successives d u même caractère Exemples : copies soumises à ue double correctio, passage du même test d aptitude à deux istats différets d u cursus de formatio (problème de l appretissage O veut tester l hypothèse H 0 que les deux séries de valeurs sot semblables Soit X 1 (respectivemet X la variable correspodat à la première (respectivemet deuxième série O va tester E(X 1 = E(X e formalisat le problème de la maière suivate : X 1 X suit la loi N(m 1 m,σ Cela sous-eted que (X 1,X est u vecteur gaussie (toute combiaiso liéaire de composates suit ue loi ormale, voir chapitre 3 Le test de H 0 : m 1 = m cotre H 1 : m 1 m cosiste à former les différeces d i = x i,1 x i, et à faire u test de Studet sur la moyee des d i car σ est e gééral icou : Chapitre 4 4

D = d 1 = X 1, X, S d S d O rejettera H 0 si d > k 1 suit ue loi T 1 La différece avec le test de Studet d égalité de deux moyees étudié au paragraphe 4315 proviet du fait que les variables X 1 etx e peuvet être supposées idépedates 43 Tests d ajsutemet et tests d idépedace utilisat la loi du Khi-deux 431 Tests d ajustemet Ces tests ot pour but de vérifier qu u échatillo proviet ou o d ue variable aléatoire de distributio coue O ote F la foctio de répartitio de la variable échatilloée et F 0 la foctio de répartitio à laquelle o veut la comparer Il s agit de tester H 0 : F = F 0 cotre H 1 : F F 0 Avat de faire u test, il est obligatoire de faire quelques vérificatios simples : - allure de l histogramme (symétrie, etc - relatio coue etre les paramètres (par exemple : moyee=variace pour ue loi de Poisso - ajustemet graphique : la foctio de répartitio empirique pour u échatillo de grade taille doit peu différer de la foctio de répartio théorique Avec u papier adapté au modèle testé, cela peut se faire graphiquemet Par exemple : loi expoetielle et papier semi-logarithmique, droite de Hery pour ue loi ormale, etc Test du Khi-deux Soit X ue variable aléatoire discrète ou discrétisée, c est à dire divisée e k classes de probabilités théoriques p 1, p,, p k Soit u N-échatillo empirique de cette variable X, et 1,,, k les effectifs observés das ces k classes Cela correspod à u tableau du type : - cas discret X Effectif observé Probabilité théorique Effectif théorique x 1 1 P(X = x 1 = p 1 Np 1 x i i P(X = x i = p i Np i x k k P(X = x k = p k Np k total N 1 N Chapitre 4 5

- cas cotiu discrétisé X Effectif observé Probabilité théorique Effectif théorique ] x 1, x ] 1 P(x 1 < X < x = p 1 Np 1 ] x i,x i+1 ] i P(x i < X < x i+1 = p i Np i ] x k,x k +1 ] k P(x k < X < x k +1 = p k Np k total N 1 N O cosidère D N défiie par : i=k ( D N = i Np i Np i (effectifs observés effectifs théoriques D N = effectifs théoriques D N i ue «distace» etre les effectifs théoriques et les effectifs observés Si H 0 est vraie, o s atted, ituitivemet, à ce que cette distace soit faible D N déped de la somme de k termes, mais ils e sot pas idépedats il suffit i=k d e coaître k-1 car i = N O a u résultat théorique très importat, o motré das ce polycopié : Théorème Si N +, D N est asymptotiquemet distribué comme ue variable du χ k 1 et ceci quelle que soit la loi de X i=k ( D où le test du Khi-deux : o rejettera H 0 si d = i Np i est trop grad, Np i c est à dire supérieur à q, avec P(χ k 1 > q = α, pour u risque α Coditios d utilisatio du test : - Pour que la distace D N coverge vers ue loi du Khi-deux, lorsque l hypothèse H 0 est vérifiée, il est écessaire que le ombre d observatios i das chaque classe soit supérieur à 5 Si ce est pas le cas pour ue classe, il est écessaire de réuir cette classe avec ue classe adjacete - Si lors de la détermiatio de la loi théorique, il a été écessaire d estimer l paramètres, alors le ombre de degrés de liberté du Khi-deux doit être dimiué de l O a doc P(χ k l 1 > q = α Chapitre 4 6

Exemple : Das u atelier de réparatio automobile, o relève sur ue période de 100 jours le ombre jouralier d accidets du travail k= ombre d accidets das la jourée 0 1 3 4 5 6 k = ombre de jours cocerés 14 6 7 19 8 5 1 Les doées de l échatillo doet : x e = et σ e O propose de tester l ajustemet à ue loi de Poisso de paramètre k= ombre d accidets f k = fréquece observée p k = fréquece théorique 0 1 3 4 5 6 0,14 0,6 0,7 0,19 0,08 0,05 0,01 0,1535 0,707 0,707 0,1804 0,090 0,0361 0,0165 Il faut regrouper les deux derières valeurs pour que tous les effectifs soiet supérieurs à 5 k= ombre d accidets 0 1 3 4 k 5 f k = fréquece observée 0,14 0,6 0,7 0,19 0,08 0,06 p k = fréquece théorique 0,1535 0,707 0,707 0,1804 0,090 0,056 O a estimé la moyee, o va tester la distace avec la loi du χ 4 La lecture de la table doe q=9, 5 au risque 5% Doc o rejettera H 0 si la valeur calculée de d est supérieure à 9,5 i=5 ( d = i Np i 0,39 Np i Doc o accepte H 0 : la distributio observée correspod à ue loi de Poisso de paramètre au risque de 5% Remarque : il existe d autres tests (Kolmogorov-Smirov, Cramer-Vo Mises qui peuvet être plus appropriés suivat les cas 431 Tests d idépedace Pour u couple de variables aléatoires réelles (X,Y, o possède u tableau du ombre de réalisatios, au cours de N expérieces idetiques idépedates, pour chaque couple de valeurs (x i, y j (ou bie ] x i, x i+1 ], y j,y j +1 ( ] ] Chapitre 4 7

X Y y 1 y j y k Total x 1 x i ij i x r Total j N O repred les otatios de statistique descriptive : - ij est le ombre d observatios pour lesquelles X = x i et Y = y j - i = ij est le ombre d observatios pour les quelles X = x i j - j= ij est le ombre d observatios pour les quelles Y = y j i La questio qui est posée est la suivate : Au vu de l échatillo, peut-o cosidérer que les deux variables X et Y sot idépedates? O va tester H 0 : X et Y sot idépedates cotre H 1 : X et Y e sot pas idépedates Si les deux variables sot idépedates, alors la loi du couple est p ij = P(X = x i et Y = y j = P(X = x i P(Y = y j Les probabilités p ij sot icoues, o les estime de la maière suivate : O repred les otatios de statistique descriptive : - f ij = ij N est la fréquece cojoite de la modalité (x i,y j - f i = f ij est la fréquece de la valeur x i j - f j= f ij est la fréquece de la valeur y j i O fait les estimatios poctuelles : ˆ p i = f i, ˆ p j = f j et ˆ p ij = ˆ p i ˆ p j Le ombre théorique, si il y a idépedace, d observatios de la modalité (x i,y j pour le couple (X,Y est alors : N ˆ p ij Comme das u test d ajustemet, o costruit la «distace du Khi-deux» etre la loi théorique et la loi empirique observée par la quatité suivate : Chapitre 4 8

D N = i (effectifs observés effectifs théoriques D N = effectifs théoriques r k ( ij Nˆ p ij Nˆ p ij Sous H 0, D N suit a priori ue loi du Khi-deux χ rk 1 rk modalités j =1 car le couple est observé selo Mais o a estimé des paramètres, doc il faut dimiuer le ombre de degrés de liberté O a fait : - (r-1 estimatios de p ˆ i car la r-ième est doée par la cotraite p ˆ i =1 - (k-1 de ˆ p j car la k-ième est doée par la cotraite p ˆ j =1 Lors de la mise e place du test d adéquatio, il faut doc dimiuer le ombre de degrés de liberté du χ de (r 1 + (k 1 Le ombre de degrés de liberté est doc rk 1 (r 1 (k 1 = (r 1(k 1 La table du χ (r 1(k 1 permet de détermier la costate q tel que > q = α et doc de spécifier la régio critique du test P(χ (r 1(k 1 Exemple : Tester au seul de 5%, l efficacité d u ouveau vacci cotre la grippe, pour lequel u relevé statistique doe le tableau vacciés o vacciés total ot cotracté la grippe 13 6 39 ot pas cotracté la 107 94 01 grippe total 10 10 40 Quelques élémets de costructio du test : - 40 observatios, - probabilité théorique d être vaccié= 10/40=0,5 - probabilité théorique de cotracter la grippe = 39/40=0,165 Tableau «théorique» si idépedace vacciés o vacciés total ot cotracté la grippe 19,5 19,5 39 ot pas cotracté la 100,5 100,5 01 grippe total 10 10 40 La régio critique est détermiée par la loi du Khi-deux χ 1 Au seuil de 5% P(χ 1 > q = 0,05 avec q=3,841 Chapitre 4 9 j i

O calcule la «distace du Khi-deux» etre les valeurs observées et les valeurs théoriques (13 19,5 (6 19,5 (107 100,5 (94 100,5 + + + = 5,17 19,5 19,5 100,5 100,5 5,17>3,841 O rejette H 0 : le vacci est efficace Chapitre 4 30