Echantillonnage, estimation, intervalle de confiance, test statistique Cas d une ou de deux proportions

Documents pareils
Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

STATISTIQUE : TESTS D HYPOTHESES

Dénombrement. Chapitre Enoncés des exercices

Cours de Statistiques inférentielles

Échantillonnage et estimation

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

Limites des Suites numériques

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Comportement d'une suite

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

20. Algorithmique & Mathématiques

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

EXERCICES : DÉNOMBREMENT

Principes et Méthodes Statistiques

55 - EXEMPLES D UTILISATION DU TABLEUR.

CHAPITRE 2 SÉRIES ENTIÈRES

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

c. Calcul pour une évolution d une proportion entre deux années non consécutives

Statistique descriptive bidimensionnelle

Baccalauréat S Asie 19 juin 2014 Corrigé

Les Nombres Parfaits.

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

Terminale S. Terminale S 1 F. Laroche

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

Chapitre 3 : Fonctions d une variable réelle (1)

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

Séries réelles ou complexes

Etude de la fonction ζ de Riemann

1 Mesure et intégrale

STATISTIQUE AVANCÉE : MÉTHODES

UNIVERSITÉ DE SFAX École Supérieure de Commerce

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Cours 5 : ESTIMATION PONCTUELLE

Processus et martingales en temps continu

SÉRIES STATISTIQUES À DEUX VARIABLES

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

Séquence 5. La fonction logarithme népérien. Sommaire

Probabilités et statistique pour le CAPES

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

Suites et séries de fonctions

Université Pierre et Marie Curie. Biostatistique PACES - UE

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

14 Chapitre 14. Théorème du point fixe

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

Formation d un ester à partir d un acide et d un alcool

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

Statistique Numérique et Analyse des Données

Module 3 : Inversion de matrices

2 ième partie : MATHÉMATIQUES FINANCIÈRES

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

Chap. 5 : Les intérêts (Les calculs financiers)

4 Approximation des fonctions

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Comment les Canadiens classent-ils leur système de soins de santé?

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

Le chef d entreprise développe les services funéraires de l entreprise, en

Exercices de mathématiques

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Processus géométrique généralisé et applications en fiabilité

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

Chapitre 3 : Transistor bipolaire à jonction

Mécanismes de protection contre les vers

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Dares Analyses. Plus d un tiers des CDI sont rompus avant un an

Régulation analogique industrielle ESTF- G.Thermique

RECHERCHE DE CLIENTS simplifiée

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

Compte Sélect Banque Manuvie Guide du débutant

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

Risque de longévité et détermination du besoin en capital : travaux en cours

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

COMMENT ÇA MARCHE GUIDE DE L ENSEIGNANT 9 E ANNÉE

POLITIQUE ECONOMIQUE ET DEVELOPPEMENT

La maladie rénale chronique

Étude des formes de pratiques de la gymnastique sportive enseignées en EPS à l école primaire

Donnez de la liberté à vos données. BiBOARD.

RESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *)

MUTUELLE D&O MUTUELLE D&O. Copilote de votre santé. AGECFA-Voyageurs CARCEPT CARCEPT-Prévoyance CRC CRIS CRPB-AFB

Gérer les applications

Les nouveaux relevés de compte

Les algorithmes de tri

Sommaire Chapitre 1 - L interface de Windows 7 9

Le Sphinx. Enquêtes, Sondages. Analyse de données. Internet :

Initiation à l analyse factorielle des correspondances

n tr tr tr tr tr tr tr tr tr tr n tr tr tr Nom:... Prénom :...

PROBLEMES DIOPTIMISATION EN NOMBRES ENTIERS J. L. NICOLAS

Options Services policiers à Moncton Rapport de discussion

Introduction : Mesures et espaces de probabilités

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers.

Les études. Recommandations applicables aux appareils de levage "anciens" dans les ports. Guide Technique

Transcription:

S3 Maths et Ifo-MIAGE 2011-2012 Statistique et Probabilités Estimatio, itervalle de cofiace, tests - Proportio Uiversité de Picardie Jules Vere 2011-2012 UFR des Scieces Licece metio Mathématiques et metio Iformatique parcours MIAGE - Semestre 3 Statistique et Probabilités Echatilloage, estimatio, itervalle de cofiace, test statistique Cas d ue ou de deux proportios 1. Simulatios 1.1. Loi de Beroulli et simulatio Soit,A,P u espace probabilisé. Ue variable aléatoire X suit la loi de Beroulli de paramètre p 0,1, que l o otebp, si et seulemet si X est à valeurs das0; 1, et PX 1 p et PX 0 p. Ue telle variable aléatoire permet d idiquer si u évéemet A est réalisé (X 1) ou pas (X 0). Comme exemples d applicatio o peut citer : - lacer d ue pièce meat à Pile ou Face, A "obteir Pile" ; - tirer ue boule das ue ure coteat des boules blaches et oires, A "obteir ue blache" ; - choisir d u idividu das la populatio, A "l idividu est malade". Aisi, ue telle variable permet de représeter u caractère qualitatif à deux modalités. Simulatio 1 p état doé das0,1, o cosidère ue ure coteat ue proportio p de boules blaches. Plus précisémet, o cosidère l etier N plus petit multiple de 10 tel que Np soit etier, et aisi ue ure coteat N boules, dot Np boules blaches et N1p boules oires. Par exemple, pour p 0,42, o a N 100, Np 42 et N1p 58. O suppose que les N boules sot umérotées de 1 à N, de 1 à Np pour les boules blaches, de Np1à pour les oires. A l expériece aléatoire " tirer ue boule au hasard das l ure ", o peut associer l uivers 1,..., N et le muir de l équiprobabilité P. Das ce cotexte, l évéemet A "obteir ue boule blache" est A 1,...,Np, sa probabilité état alors PA card carda Np N p. Cosidérat la variable aléatoire X qui à chaque tirage d ue boule associe 1 si elle est blache et 0 sio, o a X 1 A et X 0 A, et doc PX 1 PA p et PX 0 PA 1PA 1p. Utilisatio du tableur Excel (voir fichier excel - feuille Beroulli simulatio 1) Le tirage d ue boule de l ure est simulé par l istructioalea.entre.bornes(1;n) à etrer das la cellule B8 (par exemple). La valeur correspodate de X est alors obteue par l istructiosi(b8np;1;0). Simulatio 2 A l expériece aléatoire "choisir u ombre au hasard das l itervalle 0; 1" o peut associer ue variable aléatoire Y suit la loi Uiforme sur l itervalle 0; 1 (loi à desité) ; Y idique le ombre obteu. O sait que pour tout y 0; 1, PY y y. p état doé das0,1, o a alors PY p p. Cosidérat la variable aléatoire X défiie par X 1 Y p et X 0 Y p Y p, X suit la loi de BeroulliBp. Utilisatio du tableur Excel (voir fichier excel - feuille Beroulli simulatio 2) Ue valeur de Y est simulée par l istructioalea() à etrer das la cellule B7 (par exemple). La valeur correspodate de X est alors obteue par l istructiosi(b7p;1;0). Stéphae Ducay 1

S3 Maths et Ifo-MIAGE 2011-2012 Statistique et Probabilités Estimatio, itervalle de cofiace, tests - Proportio 1.2. Loi biomiale et simulatio Repreos l exemple d ue ure coteat ue proportio p 0,42 de boules blaches. O tire ue boule au hasard das l ure : le ombre de "boule blache" obteu e u tirage est ue variable aléatoire X de loi de BeroulliBp : PX 1 p 0.42 et PX 0 1p 0,58. O a EX p 0,42 et VarX 0,2436. Si o effectue 50 tirages avec remise d ue boule, o observe la réalisatio de X 1, X 2,..., X 50, variables aléatoires idépedates de même loi que X. O dit que l o a u échatillo aléatoire simple de taille 50 de loi de Beroulli de paramètre p 0,42. La proportio de "boules blaches" obteue est ue variable aléatoire : où F X X i 1 X 2 X 50 50 X i représete le ombre de "boules blaches" obteues e 50 tirages. Ayat procédé par répétitios d expérieces idépedates, F X i est ue variable aléatoire de la loi Biomiale B50; 0, 42 B, p. O a doc EF EF p et 2 VarF VarF, d où EF p 0,42 et VarF 0,2436. O costate doc que lorsqu o augmete la taille de l échatillo, l espérace de F reste costate, égale à 0,42, alors que la variace dimiue. Utilisatio du tableur Excel (voir fichier excel - feuille Beroulli simulatio 1 et 2) O repred les simulatios 1 et 2 e répétat 50 les istructios précédetes sur 50 liges. Il suffit esuite de "sommer" les valeurs de X obteues pour avoir le ombre de boules blaches obteues, puis de diviser par 50 pour avoir la fréquece. 2. Echatilloage : cas d ue proportio 2.0. Quel cadre mathématique? Statistique et probabilités : Descriptio des observatios et modèle théorique. La Statistique cosiste à étudier u esemble d objets (o parle de populatio, composée d idividus ou uités statistiques) sur lesquels o observe des caractéristiques, appelées variables statistiques. Le calcul des Probabilités permet de proposer u modèle théorique d ue situatio cocrète afi de quatifier la fiabilité des affirmatios. Populatio et échatillo : Das certais cas o peut obteir les valeurs de ces variables sur l esemble de la populatio ; e appliquat les méthodes de la statistique descriptive il est possible, au moye de tableaux, graphiques, paramètres, d aalyser ces résultats. Exemples : Recesemet de la populatio fraçaise, otes obteues par tous les cadidats à u exame, salaires de tous les employés d ue etreprise, etc... Mais la populatio peut être trop vaste pour être étudiée das sa totalité, par maque de moyes, ou de temps. (C est le cas si o s itéresse aux itetios de vote des Fraçais pour ue électio). Elle peut même être cosidérée comme ifiie. C est le cas si l o ote la qualité (défectueuse ou o) des pièces produites par u certai procédé : le ombre de ces pièces est a priori illimité, et o e peut toutes les tester. De même, si l o s itéresse aux fréqueces d obtetios de "pile" et "face" avec ue pièce de moaie, le ombre de lacers de pièce à étudier est a priori ifii : o a ici ue populatio latete ifiie. Il arrive aussi que la mesure d ue variable soit destructrice pour l idividu : si o étudie la durée de vie de certais appareils, il serait absurde de les faire tous foctioer jusqu à la pae, les redat iutilisables. Das tous ces cas, o est ameé à étudier qu ue partie de la populatio, u échatillo, obteu par sodage, das le but d extrapoler à la populatio etière des observatios faites sur l échatillo. Stéphae Ducay 2

S3 Maths et Ifo-MIAGE 2011-2012 Statistique et Probabilités Estimatio, itervalle de cofiace, tests - Proportio Fluctuatio d échatilloage Lorsqu o étudie u caractère sur plusieurs échatillos d ue même populatio, o peut observer que les résultats e sot pas idetiques selo les échatillos. Plus la taille de l échatillo étudié est grade, plus les résultats obteus serot fiables. Cela s explique par la dimiutio de la variace, et aussi par la loi des grads ombres. La fluctuatio d échatilloage représete la fluctuatio etre les différets résultats obteus d ue même equête sur différets échatillos d ue même populatio. Ces différets résultats présetet ue certaie régularité, ce qui se traduit par la otio d itervalle de cofiace. 2.1. Caractère statistique et variable aléatoire Cosidéros ue populatiosur laquelle o défiit u caractère qualitatif à deux modalités A et B. O coviet de représeter la modalité A par 1 et la modalité B par 0. Le caractère est aisi représeté par ue applicatio X de dasqui, à tout idividu, associe u réel x X X X 0,1 esemble des "valeurs" du caractère. Cette applicatio modélise le caractère de faço détermiiste : si o coaît l idividu, o coaît aussitôt la valeur x. So étude relève de la statistique descriptive qui coduit, par exemple, au tableau des couplesx i,f i où x i est ue valeur observée et f i sa fréquece. Supposos maiteat que l o tire au hasard u idividudas cette populatiopour cosiger la valeur x du caractère. Ne pouvat pas prévoir quel idividu précis sera tiré, o e peut pas prévoir o plus la valeur précise de x qui sera cosiger. O aimerait doc disposer d u moye d attribuer ue probabilité aux élémets de X. Ici, X est ue variable aléatoire de loi de BeroulliBp où p est la proportio d idividus ayat la modalité A das la populatio : PX 1 p et PX 0 1p. 2.2. Echatilloage Lorsqu o a pas accès à l esemble de la populatio, la proportio p est icoue. O procède à u échatilloage, i.e. au choix de idividus das la populatio, sur lesquels o observe la valeur x du caractère X. Lorsque les tirages ot lieu avec (respectivemet sas) remise, l échatilloage est dit o-exhaustif (resp. exhaustif). Lorsque la taille de l échatillo est faible par rapport à celle N de la populatio (N 10), alors tout échatilloage est assimilable au cas o-exhaustif. Pour u premier échatilloage, o observera des valeurs x 1, x 2,..., x du caractère. Pour u deuxième échatilloage de même taille, o observera des valeurs x 1, x 2,..., x du caractère. Et aisi de suite. O peut alors cosidérer la suite x 1, x 1,... comme les valeurs observées d ue même variable aléatoire X 1, la suite x 2, x 2,... comme les valeurs observées d ue même variable aléatoire X 2,... Aisi, pour tout i 1,...,, la variable aléatoire X i correspod aux valeurs du caractère du i-ème idividu obteu par échatilloage, et aura doc la même loi de probabilité que X. De plus, l échatilloage état o-exhaustif (tirages avec remise), les variables aléatoires X i sot idépedates. Plus précisémet, les variables aléatoires X i sot des applicatios de das, qui à tout échatilloage 1, 2,..., associe x i X i 1, 2,..., X i O dira que X 1,X 2,...,X est u échatillo (aléatoire simple) de taille de X, et que x 1,x 2,...,x est ue observatio de l échatillo. Le terme d échatillo désige à la fois les idividus choisis et le -uple de variables aléatoires X 1,X 2,...,X. 2.3. Estimateur et estimatio d ue proportio Objectif : détermier p à l aide d iformatios obteues à partir d u échatilloage de taille extrait de la populatio. Impossible tat que N, mais la théorie de l échatilloage coduit à des estimatios p de p, d autat meilleures que est grad. Stéphae Ducay 3

S3 Maths et Ifo-MIAGE 2011-2012 Statistique et Probabilités Estimatio, itervalle de cofiace, tests - Proportio Estimateur du paramètre p : proportio (ou fréquece) d échatillo F le ombre d idividus de l échatilloage ayat la modalité A. X i, où X i représete Pour ue observatiox 1,x 2,...,x de l échatillo (e pratique o observe souvet directemet x i ), ue estimatio poctuelle de p est f 2.4. Proportio d échatillo x i p. U exemple sur la proportio U groupe de 4 efats, Alexis, Bejami, Cyril et David, d âges respectifs 12, 13, 14 et 15 as. O choisit u efat au hasard das le groupe, o peut cosidérer : - X, idicatrice du fait que l efat plus 14,5 as, variable aléatoire de loi de BeroulliB 1 : 4 PX 1 1 4 p et PX 0 3 4 1p. Cherchos à retrouver ou à approcher ces résultats à partir d échatillos o-exhaustifs (avec remise) de taille 3. Il y e a 4 3 64, ils formet u uivers, esemble des résultats possibles de l expériece aléatoire "choisir u échatillo". O peut muir de la tribu des évéemetsa P et de l équiprobabilité P sur,a. A chacu des résultats (échatillos), o peut associer la proportio F f d efats ayat plus de 14,5 as. O obtiet les résultats suivats : f A,A,A 0 A,A,B 0 A,A,C 0 A,A,D 1/3 A,B,A 0 A,B,B 0 A,B,C 0 A,B,D 1/3 A,C,A 0 A,C,B 0 A,C,C 0 A,C,D 1/3 A,D,A 1/3 A,D,B 1/3 A,D,C 1/3 A,D,D 2/3 f B,A,A 0 B,A,B 0 B,A,C 0 B,A,D 1/3 B,B,A 0 B,B,B 0 B,B,C 0 B,B,D 1/3 B,C,A 0 B,C,B 0 B,C,C 0 B,C,D 1/3 B,D,A 1/3 B,D,B 1/3 B,D,C 1/3 B,D,D 2/3 f C,A,A 0 C,A,B 0 C,A,C 0 C,A,D 1/3 C,B,A 0 C,B,B 0 C,B,C 0 C,B,D 1/3 C,C,A 0 C,C,B 0 C,C,C 0 C,C,D 1/3 C,D,A 1/3 C,D,B 1/3 C,D,C 1/3 C,D,D 2/3 f D,A,A 1/3 D,A,B 1/3 D,A,C 1/3 D,A,D 2/3 D,B,A 1/3 D,B,B 1/3 D,B,C 1/3 D,B,D 2/3 D,C,A 1/3 D,C,B 1/3 D,C,C 1/3 D,C,D 2/3 D,D,A 2/3 D,D,B 2/3 D,D,C 2/3 D,D,D 1 O défiit aisi ue variable aléatoire F, dot o peut obteir la loi de probabilité : x i 0 1/3 2/3 1 PF x i 27/64 27/64 9/64 1/64 O peut alors calculer : - EF 1 4 : o remarque que EF p EX. - VarF 1 16 : o remarque que VarF VarX. Stéphae Ducay 4

S3 Maths et Ifo-MIAGE 2011-2012 Statistique et Probabilités Estimatio, itervalle de cofiace, tests - Proportio X i Propriétés géérales de F. F X i suit la loi BiomialeB,p. O a alors EF EF p et 2 VarF VarF, d où EF p et VarF. O a aisi EF p et o dit que F est u estimateur sas biais de p. O a de plus lim VarF 0 et o dit que F est u estimateur coverget de p. Théorème. Loi faible des grads ombres Si les X i sot idépedates et admettet la même espérace p et la même variace 2, alors pour tout 0, lim P F p 0 ; cette covergece état uiforme e p. Cela sigifie que F coverge e probabilité vers p. Théorème cetral limite Si les X i sot idépedates, de même espérace mathématique et de même écart-type, et si X X i, alors Z X suit approximativemet la loi ormalen0; 1 ; autremet dit que X suit approximativemet la loi ormalen ;. De plus, si p 10 et 1p 10, o peut approcher la loi BiomialeB,p par la loi ormale N p ;. O e déduit que F suit approximativemet la loi ormalen p ;, et F doc F suit approximativemet la loi ormalen p ;. Aisi, U p suit approximativemet la loi ormalen0; 1. Commetaires de ces résultats F a toujours pour espérace p : la proportio das l échatillo est, "e moyee", celle de la populatio. La variace de F est d autat plus faible que est grad : la proportio das l échatillo varie d autat mois d u échatillo à l autre que la taille de cet échatillo est grade. A la limite, si ted vers l ifii, VarF ted vers 0 et doc F ted vers la costate p. Das la pratique, l approximatio de la loi de F par ue loi ormale est correcte dès que p 10 et 1p 10, ou dès que 18, ou sous d autres coditios proches, d autat plus que est grad et p proche de 0.5. Lorsque p est pas cou, o vérifie ces coditios sur la fréquece f observée. 3. Itervalle de fluctuatio et itervalle de cofiace pour ue proportio Cosidéros ue variable aléatoire X de loi de BeroulliBp, où p est la proportio d idividus de la populatio ayat ue propriété doée, u échatillox 1,X 2,...,X de taille de X et la proportio (ou fréquece) d échatillo F X i la propriété. O sait que si p 10 et 1p 10, alors U, où X i représete le ombre d idividus de l échatilloage ayat F p suit approximativemet la loi ormalen0; 1. O détermie comme le réel u tel que Pu U u 1grâce à la table 2. Pour 5%, o a u 1.96. Remarque. Lorsque est petit, o doit utiliser la loi exacte de F, à savoir la loi BiomialeB,p. Stéphae Ducay 5

S3 Maths et Ifo-MIAGE 2011-2012 Statistique et Probabilités Estimatio, itervalle de cofiace, tests - Proportio 3.1. Itervalle de fluctuatio de la fréquece F O suppose que l o coait p. O e déduit que P p u F p PF IF p 1, avec IF p p de F au iveau 1 0.95. u ; p u 1, et doc u itervalle de fluctuatio IF p 3.2. Itervalle de cofiace de la proportio p O suppose que l o e coait pas p mais que l o a ue observatio f de F à partir d u échatillo. O a P F u p F u 1, et doc Pp IC p 1, avec IC p F u ; F u itervalle de cofiace IC p de p au iveau 1 0.95. Comme F 1F est u estimateur sas biais de 1, o e déduit, si f 10 et 1f 10, u itervalle de cofiace de la proportio p au iveau 1: ic p f f 1f 1 u, f f 1f 1 Exemple d itervalle de cofiace Das ue certaie espèce de rogeur, o a compté 206 mâles sur 400 aissaces. O peut cosidérer la situatio suivate. Populatio : les rogeurs d ue certaie espèce. Variable : le sexe, à deux modalités (mâle et femelle), représeté par ue variable aléatoire de loi de BeroulliBp, où p est la proportio de mâles das la populatio ; o a aisi PX 1 p et PX 0 1p. EchatilloX 1,X 2,...,X de taille 400 de X. Observatio de l échatillo : x 1,x 2,...,x 1,1,0,1,...,0. X i u. Estimateur de la proportio p : F, proportio (ou fréquece) de mâles das l échatillo, où X i représete le ombre de mâles de l échatillo. Estimatio poctuelle de la proportio p : f mâles das l observatio de l échatillo. Itervalle de cofiace de la proportio p : f 206 10 et 1f 194 10 Pour 0,05 (i.e. 5%, o a u 1,96. ic p f f 1f 1 u ; f x i f 1f 1 206 400 0.515, fréquece (ou proportio) de u 0,466 ; 0,564. Exemple d applicatio de l itervalle de fluctuatio Repreos l exemple précédet et supposos savoir qu il y a équiprobabilité male/femelle à chaque aissace, autremet dit que p 0,5. Pour u échatillo de 400 aissaces, l itervalle de fluctuatio de F est 0.510.5 0.510.5 p u ; p u 0.5 1.96 ; 0.5 1.96 400 400 Aisi, 95 % des échatillos de 400 aissaces doerot ue fréquece d échatillo comprise etre 0.451 et 0.551. L échatillo étudié doe ue fréquece observée f 0.515 qui appartiet à l itervalle de fluctuatio : il est doc représetatif d ue populatio pour laquelle p 0,5. Stéphae Ducay 6

S3 Maths et Ifo-MIAGE 2011-2012 Statistique et Probabilités Estimatio, itervalle de cofiace, tests - Proportio 3.3. Itervalle de fluctuatio de la fréquece F et loi biomiale O cosidère ue populatio das laquelle o suppose que la proportio d u certai caractère est p. Pour juger de cette hypothèse, o y prélève, au hasard et avec remise, u échatillo de taille sur lequel o observe ue fréquece f du caractère. O rejette l hypothèse selo laquelle la proportio das la populatio est p lorsque la fréquece f observée est trop éloigée de p, das u ses ou das l autre. O choisit de fixer le seuil de décisio de sorte que la probabilité de rejeter l hypothèse, alors qu elle est vraie, soit iférieure à 5 %. Lorsque la proportio das la populatio vaut p, la variable aléatoire X correspodat au ombre de fois où le caractère est observé das u échatillo aléatoire de taille, suit la loi biomiale de paramètres et p. O cherche à partager l itervalle 0,, où X pred ses valeurs, e trois itervalles0,a1,a,b et b1, de sorte que X pree ses valeurs das chacu des itervalles extrêmes avec ue probabilité proche de 0,025, sas dépasser cette valeur. E tabulat les probabilités cumulées PX k, pour k allat de 0 à, il suffit de détermier le plus petit etier a tel que PX a 0,025 et le plus petit etier b tel que PX b 0,975, c est-à-dire PX b 0,025. Autremet dit, a est le plus grad etier tel que PX a 0.25. O observe aussi que a b. O a aisi PX a X b PX a PX b 0.05 et doc Pa X b P X a X b 0.95, e état "assez proche" de 0.95. Comme F X, o a aisi P a F b 0.95, e état "assez proche" de 0.95. La règle de décisio est la suivate : si la fréquece observée f appartiet à l itervalle de fluctuatio à 95 % a, b, o cosidère que l hypothèse selo laquelle la proportio est p das la populatio est pas remise e questio et o l accepte ; sio, o rejette l hypothèse selo laquelle cette proportio vaut p. Pour 30, p 5 et 1p 5, o observe que l itervalle de fluctuatio a, b est sesiblemet le même que l itervalle p 1, p 1 proposé das le programme de secode. Exemple d exercice Mosieur Z, chef du gouveremet d u pays loitai, affirme que 52 % des électeurs lui fot cofiace. O iterroge 100 électeurs au hasard (la populatio est suffisammet grade pour cosidérer qu il s agit de tirages avec remise) et o souhaite savoir à partir de quelles fréqueces, au seuil de 5 %, o peut mettre e doute le pourcetage aocé par Mosieur Z, das u ses, ou das l autre. 1. O fait l hypothèse que Mosieur Z dit vrai et que la proportio des électeurs qui lui fot cofiace das la populatio est p 0,52. Motrer que la variable aléatoire X, correspodat au ombre d électeurs lui faisat cofiace das u échatillo de 100 électeurs, suit la loi biomiale de paramètres 100 et p 0,52. 2. O doe ci-cotre u extrait de la table des probabilités cumulées PX k où X suit la loi biomiale de paramètres 100 et p 0,52. Détermier a et b tels que défiis précédemmet et comparer les itervalles de fluctuatio à 95 % a, b et p 1, p 1 3. Éocer la règle décisio permettat de rejeter ou o l hypothèse p 0,52, selo la valeur de la fréquece f des électeurs favorables à Mosieur Z obteue sur l échatillo. 4. Sur les 100 électeurs iterrogés au hasard, 43 déclaret avoir cofiace e Mosieur Z. Peut-o cosidérer, au seuil de 5 %, l affirmatio de Mosieur Z comme exacte?. k PX k 40 0,0106 41 0,0177 42 0,0286 43 0,0444... 61 0,9719 62 0,9827 63 0,9897 64 0,9941 Remarque : la recherche de l itervalle de fluctuatio peut-être illustrée par le diagramme e bâto de la loi biomiale de paramètres 100 et p 0,52. Utilisatio du tableur Excel Costruire la table des probabilités et des probabilités cumulées de la loi Biomiale de paramètres 100 et p 0,52. Costruire le diagramme e bâto de cette loi. Stéphae Ducay 7

S3 Maths et Ifo-MIAGE 2011-2012 Statistique et Probabilités Estimatio, itervalle de cofiace, tests - Proportio 4. Test de coformité pour ue proportio p O s itéresse à la questio suivate : état doée ue populatio das laquelle ue proportio p d idividu ot ue certaie propriéte, peut-o raisoablemet supposer que p est égal à ue certaie valeur p 0 doée a priori? Par exemple, des tests e laboratoire permettet d affirmer qu u certai médicamet est efficace sur ue proportio p 0 d idividus atteits d ue certaie maladie. Mais après sa mise sur le marché, le médicamet a-t-il la même efficacité sur l esemble des idividus malades? Commet savoir si la proportio p de malades guéris par le médicamet est bie égale à p 0? La répose à la questio est doée par la mise e place d u test de coformité. De faço géérale, u test statistique est ue procédure permettat de calculer la valeur d ue certaie foctio des observatios d u ou de plusieurs échatillo, qui coduit à rejeter ou o, avec u certai risque d erreur, ue hypothèse gééralemet appelée hypothèse ulle et otée H 0. Celle-ci porte sur la (ou les) populatio(s) d où est (sot) issu(s) le(s) échatillo(s). Elle s oppose à ue hypothèse dite alterative et otée H 1. Cosidéros ue variable aléatoire X de loi de BeroulliBp, où p est la proportio d idividus de la populatio ayat ue propriété doée, u échatillox 1,X 2,...,X de taille de X et la proportio (ou fréquece) d échatillo F X i propriété. O sait que si p 10 et 1p 10, alors U, où X i représete le ombre d idividus de l échatilloage ayat la F p suit approximativemet la loi ormalen0; 1. O détermie le réel u tel que Pu U u 1, i.e. u 1 1 2 (table 2). Test (bilatéral) de H 0 : p p 0 cotre H 1 : p p 0. f p O calcule u 0. O détermie u tel que Pu U u 1, et o décide que : p 0 1p 0 - si u u,u, alors o e peut rejeter H 0 ; - si u u,u, alors o rejette H 0 avec ue probabilité de se tromper. Test (uilatéral) de H 0 : p p 0 cotre H 1 : p p 0. O détermie u tel que PU u 1, i.e. u 1 1 u 2, et o décide que : - si u u, alors o e peut rejeter H 0 ; - si u u, alors o rejette H 0 avec ue probabilité de se tromper. Test (uilatéral) de H 0 : p p 0 cotre H 1 : p p 0. O détermie u tel que PU u 1, i.e. u 1 u 22 u 2, et o décide que : - si u u, alors o e peut rejeter H 0 ; - si u u, alors o rejette H 0 avec ue probabilité de se tromper. Exemple Repreos l exemple précédets sur les rogeurs. Sur u échatillo de 400 aissaces, o a observé 206 mâles, soit ue fréquece de mâles de f 206 400 0.515. O se demade s il y a autat de mâles que de femelles das la populatio ; autremet dit si la proportio de mâles das la populatio est p 0.5. O peut effectuer le test statistique de H 0 : p p 0 cotre H 1 : p p 0, avec p 0 0.5. O calcule u f p 0 p 0 1p 0 0.5150.5 0.510.5 400 0.6. Pour 0,05 (i.e. 5%, o a u 1,96. Comme u u,u, alors o e peut rejeter H 0 : il est doc possible que p 0.5. Stéphae Ducay 8

S3 Maths et Ifo-MIAGE 2011-2012 Statistique et Probabilités Estimatio, itervalle de cofiace, tests - Proportio 5. Comparaiso de deux proportios Das deux populatios P 1 et P 2 o étudie le même caractère avoir ou o ue propriété doée. Soiet X 1 et X 2 des variables aléatoires de loi de BeroulliBp 1 etbp 2 représetat le caractère das chaque populatio, où p 1 (respectivemet p 2 ) est la proportio d idividus ayat la propriété das P 1 (respectivemet das P 2 ). De P 1 et P 2 o extrait u échatillo E 1 X 1,1,X 1,2,...,X 1,1 de taille 1 de X 1 et u échatillo E 2 X 2,1,X 2,2,...,X 2,2 de taille 2 de X 2. Les fréqueces d échatillo sot alors F 1 1 X1,i 1 5.1. Cas d échatillos idépedats Les échatillos E 1 et E 2 sot supposés idépedats. et F 2 2 X2,i 2. Test (bilatéral) de H 0 : p 1 p 2 p cotre H 1 : p 1 p 2. Supposos que 1 f 1 5, 1 1f 1 5, 2 f 2 5, 2 1f 2 5. Sous l hypothèse H 0, U F 1 F 2 suit approximativemet la loi ormalen0; 1, et e regroupat les deux 1 1 1 2 échatillos, o peut estimer p par f 1,2 1f 1 2 f 2 f 1. O calcule u 1 f 2 2 1 2 f 1,2 1f 1,2. O détermie u tel que Pu U u 1, i.e. u 1 1 (table 2) et o décide que : 2 - si u u,u, alors o e peut rejeter H 0 ; - si u u,u, alors o rejette H 0 avec ue probabilité de se tromper. Test (uilatéral) de H 0 : p 1 p 2 cotre H 1 : p 1 p 2. O détermie u tel que PU u 1, i.e. u 1 1 u 2, et o décide que : - si u u, alors o e peut rejeter H 0 ; - si u u, alors o rejette H 0 avec ue probabilité de se tromper. Test (uilatéral) de H 0 : p 1 p 2 cotre H 1 : p 1 p 2. O détermie u tel que PU u 1, i.e. u 1 u 22 u 2, et o décide que : - si u u, alors o e peut rejeter H 0 ; - si u u, alors o rejette H 0 avec ue probabilité de se tromper. 5.2. Cas d échatillos appariés : test de McNemar Deux échatillos E 1 et E 2 sot dits appariés lorsque chaque observatio x 1,i de E 1 est associée à ue valeur x 2,i de E 2 (appariésassociés par paires). C est par exemple le cas lorsque E 1 et E 2 provieet d u même groupe de malades avat et après traitemet. Deux échatillos appariés ot doc la même taille 1 2. O utilise le tableau suivat des effectifs de présece ou absece de la propriété étudiée : P 1 \ P 2 préset abset totaux 1 1 préset abset a c b d ab c d totaux ac bd Le test de McNemar s appuie sur le calcul de u bc, et se poursuit de faço aalogue au cas bc d échatillos idépedats (paragraphe 2.3.1). O peut l utiliser dès que bc 10. 5.3. Exemple Das ue même catégorie sociale, u échatillo de 40 hommes a fouri 8 fumeurs et u échatillo de 60 femmes a fouri 18 fumeuses. O se demade si la proportio de fumeurs est la même pour les deux sexes. Stéphae Ducay 9

S3 Maths et Ifo-MIAGE 2011-2012 Statistique et Probabilités Estimatio, itervalle de cofiace, tests - Proportio O peut cosidérer la situatio suivate. Populatio 1 : hommes. Variable X 1 : être fumeur, représeté par ue variable aléatoire X 1 de loi de BeroulliBp 1, où p 1 est la proportio d hommes fumeurs. Echatillo de taille 1 40. Estimateur de p 1 : fréquece d échatillo F 1. Estimatio de p 1 : f 1 8 40 0,2. Populatio 2 : femmes. Variable X 2 : être fumeuse, représeté par ue variable aléatoire X 2 de loi de BeroulliBp 2, où p 2 est la proportio de femmes fumeuses Echatillo de taille 2 60. Estimateur de p 2 : fréquece d échatillo F 2. Estimatio de p 2 : f 2 18 60 0,3. Les échatillos E 1 et E 2 sot idépedats. Test (bilatéral) de H 0 : p 1 p 2 p cotre H 1 : p 1 p 2. Supposos que 1 f 1 8 5, 1 1f 1 32 5, 2 f 2 18 5, 2 1f 2 42 5. Sous l hypothèse H 0, U F 1 F 2 suit approximativemet la loi ormalen0; 1, et e 1 2 1 1 regroupat les deux échatillos, o peut estimer p par f 1,2 1f 1 2 f 2 1 818 0,26. E 2 4060 remplaçat p par f 1,2, o e modifie pas la loi approchée de U. f O calcule u 1 f 2 0,20,3 1,12. 1 1 1 1 2 f 1,2 1f 1,2 1 0,2610,26 40 60 O détermie u tel que Pu U u 1(table 2) : pour 0,05, o trouve u 1,96. Comme u u,u, o e peut rejeter H 0 : la proportio de fumeurs e diffère pas sigificativemet etre les deux sexes. Pour cette décisio de o-rejet, o e coait pas la probabilité de se tromper (erreur de deuxième espèce). 6. Exercices Exercice 1. U groupe d étudiats e Statistique réalise ue equête auprès d ue populatio d étudiats e sociologie e iterrogeat u échatillo de 135 idividus. Ils désiret coaître, etre autres, la proportio p d étudiats ayat suivi des études secodaires scietifiques. Pour accélérer le traitemet, ils partaget le dépouillemet e deux groupes. U groupe costate que sur 60 des étudiats iterrogés, 24 ot suivi des études secodaires scietifiques. L autre groupe costate que sur les 75 des étudiats iterrogés restat, 33 ot suivi des études secodaires scietifiques. 1) Détermier trois estimatios poctuelles de p. 2) A partir de l échatillo des 135 étudiats, détermier u itervalle de cofiace de p au seuil 5%. 3) O souhaite estimer p avec ue précisio de 0,05. Quelle devrait être la taille de l échatillo? Exercice 2. Pour obteir ue estimatio de la proportio d hyperglycémiques parmi les persoes âgées de plus de soixate as (populatio P), o choisit au hasard 170 persoes das P. O costate que parmi celles-ci, 31 sot hyperglycémiques. 1) Doez u itervalle de cofiace au iveau 95% pour la proportio p de persoes hyperglycémiques de P. 2) Si o effectuait 200 fois le tirage de 170 persoes de P, o pourrait costruire 200 itervalles de cofiace du type précédet. Parmi ces 200 itervalles, combie, e moyee, cotiedraiet la valeur de p? Exercice 3. U sodage effectué sur u échatillo de 400 électeurs doe 212 itetios de vote e faveur d u cadidat C. 1) Détermier u itervalle de cofiace au iveau 95% pour la proportio d électeurs, das l esemble de la populatio électorale, ayat l itetio de voter e faveur de C. 2) Quelle taille miimale de l échatillo faudrait-il predre pour que l itervalle (au même iveau 95%) e cotiee pas la valeur 0,50? Stéphae Ducay 10

S3 Maths et Ifo-MIAGE 2011-2012 Statistique et Probabilités Estimatio, itervalle de cofiace, tests - Proportio Exercice 4. Lors d ue précédete cosultatio électorale, le cadidat A avait obteu 51% des suffrages exprimés. A l approche de ouvelles électios, il réalise u sodage sur u échatillo de 400 électeurs choisis au hasard das sa circoscriptio. Il obtiet 196 itetios de votes. Peut-il coclure que sa cote de popularité est restée stable? Exercice 5. Ue agece de publicité affirme qu u produit d etretie est efficace à 90% pour déboucher éviers et lavabos e deux heures, quelle que soit la ature de l obstructio. Ue associatio de défese du cosommateur a fait ue equête qui relève que sur 100 lavabos bouchés, 80 seulemet sot débouchés e deux heures e utilisat le produit d etretie. Doit-o faire u procès à l agece de publicité? Faire u test au risque 5%, puis 1%. Exercice 6. O compare les effets d u même traitemet das deux hopitaux différets. Das le premier hopital, 70 des 100 malades traités motret des siges de guériso. Das le deuxième hopital, c est le cas pour 100 des 150 malades traités. Quelle coclusio peut-o e tirer? Exercice 7. D après exame de mars 2011 Afi d évaluer l impact d ue campage média ati-tabac, o s est itéressé à la proportio de fumeurs meat des actios pour essayer d arrêter de fumer (dimiutio de la cosommatio, achat de patchs ati-tabac, cosultatios médicales,...), c est-à-dire à la proportio de fumeurs "actifs" pour arrêter. U sodage "avat campage" a été effectué auprès de 3000 fumeurs, et u sodage "après campage" a été effectué auprès d u autre échatillo de 3000 fumeurs ; les deux échatillos sot doc idépedats. Le premier sodage doe ue proportio de 0,15 de fumeurs "actifs", alors que le deuxième sodage doe ue proportio de 0,17 de fumeurs "actifs". O veut savoir si la campage a été efficace ; autremet dit si la proportio de fumeurs "actifs" a augmeté après la campage. 1) a) Détermier u itervalle de cofiace au iveau 95% de la proportio de fumeurs "actifs" avat la campage. Préciser la populatio et le caractère étudié, la taille d échatillo, le(s) estimateur(s) mis e jeu. b) De faço aalogue, doer (sas détailler les calculs) u itervalle de cofiace au iveau 95% de la proportio de fumeurs "actifs" après la campage. c) Peut-o déduire de ces deux itervalles que la campage a été efficace? 2) a) Expliquer brièvemet ce que représetet les erreurs de première et deuxième espèce d u test statistique. b) Effectuer u test statistique au risque 5%, puis 10%, pour savoir si la campage a été efficace. E cas de décisios cotradictoires avec les deux risques 5% et 10%, préciser et justifier la décisio à reteir. Exercice 8. Sous forme de comprimé u médicamet est efficace das le traitemet d ue maladie das 80% des cas. Le pharmacie du laboratoire qui commercialise ce médicamet, essaie ue forme ijectable par voie itra-musculaire, de ce même médicamet. Il observe sur u échatillo de 50 malades, 35 guérisos. L efficacité de la forme itra-musculaire est-elle différete de celle e comprimé? Lui est-elle iférieure? (coclure au risque de 5%). Exercice 9. O sait qu ue maladie atteit 10% des idividus d ue populatio P doée. U chercheur a expérimeté u traitemet sur u échatillo de idividus : il a alors recesé 5% de malades. Détermier la valeur miimale de qui permette au chercheur de coclure à l efficacité du traitemet au risque de 5%. Exercice 10. Pour traiter u certai type de tumeur, o a utilisé deux schémas thérapeutiques : - sur 40 malades traités avec le schéma A, o a observé ue mortalité à 5 as de 15 % ; - sur 60 malades traités avec le schéma B, o a observé ue mortalité à 5 as de 25 %. Si l o cosidère la mortalité à 5 as, peut-o dire que les schémas A et B diffèret sigificativemet au risque 10 %? au risque 5 %? Stéphae Ducay 11

S3 Maths et Ifo-MIAGE 2011-2012 Statistique et Probabilités Estimatio, itervalle de cofiace, tests - Proportio Stéphae Ducay 12