Echantillonnage, estimation, intervalle de confiance, test statistique Cas d une ou de deux proportions

Documents pareils
Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

STATISTIQUE : TESTS D HYPOTHESES

Dénombrement. Chapitre Enoncés des exercices

Cours de Statistiques inférentielles

Échantillonnage et estimation

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

Limites des Suites numériques

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

Comportement d'une suite

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Principes et Méthodes Statistiques

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

55 - EXEMPLES D UTILISATION DU TABLEUR.

EXERCICES : DÉNOMBREMENT

c. Calcul pour une évolution d une proportion entre deux années non consécutives

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

CHAPITRE 2 SÉRIES ENTIÈRES

20. Algorithmique & Mathématiques

Terminale S. Terminale S 1 F. Laroche

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Chapitre 3 : Fonctions d une variable réelle (1)

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

Baccalauréat S Asie 19 juin 2014 Corrigé

SÉRIES STATISTIQUES À DEUX VARIABLES

1 Mesure et intégrale

Etude de la fonction ζ de Riemann

Statistique descriptive bidimensionnelle

Processus et martingales en temps continu

Les Nombres Parfaits.

Séries réelles ou complexes

STATISTIQUE AVANCÉE : MÉTHODES

UNIVERSITÉ DE SFAX École Supérieure de Commerce

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

2 ième partie : MATHÉMATIQUES FINANCIÈRES

Comment les Canadiens classent-ils leur système de soins de santé?

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

Séquence 5. La fonction logarithme népérien. Sommaire

Cours 5 : ESTIMATION PONCTUELLE

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

Chap. 5 : Les intérêts (Les calculs financiers)

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

Suites et séries de fonctions

Probabilités et statistique pour le CAPES

14 Chapitre 14. Théorème du point fixe

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Module 3 : Inversion de matrices

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Le chef d entreprise développe les services funéraires de l entreprise, en

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

Formation d un ester à partir d un acide et d un alcool

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

Statistique Numérique et Analyse des Données

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

4 Approximation des fonctions

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

RECHERCHE DE CLIENTS simplifiée

Compte Sélect Banque Manuvie Guide du débutant

Université Pierre et Marie Curie. Biostatistique PACES - UE

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

Dares Analyses. Plus d un tiers des CDI sont rompus avant un an

Chapitre 3 : Transistor bipolaire à jonction

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

MUTUELLE D&O MUTUELLE D&O. Copilote de votre santé. AGECFA-Voyageurs CARCEPT CARCEPT-Prévoyance CRC CRIS CRPB-AFB

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

POLITIQUE ECONOMIQUE ET DEVELOPPEMENT

LES MESURES CLÉS DU PROJET DE LOI ÉCONOMIE SOCIALE ET SOLIDAIRE

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers.

Risque de longévité et détermination du besoin en capital : travaux en cours

n tr tr tr tr tr tr tr tr tr tr n tr tr tr Nom:... Prénom :...

Régulation analogique industrielle ESTF- G.Thermique

Exercices de mathématiques

Processus géométrique généralisé et applications en fiabilité

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

Mécanismes de protection contre les vers

Sommaire Chapitre 1 - L interface de Windows 7 9

S-PENSION. Constituez-vous un capital retraite complémentaire pour demain tout en bénéficiant d avantages fiscaux dès aujourd hui.

La maladie rénale chronique

Options Services policiers à Moncton Rapport de discussion

Étude des formes de pratiques de la gymnastique sportive enseignées en EPS à l école primaire

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

One Office Voice Pack Vos appels fixes et mobiles en un seul pack

Les solutions mi-hypothécaires, mi-bancaires de Manuvie. Guide du conseiller

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

Gérer les applications

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

Les algorithmes de tri

Working Paper RETAIL RÉGIONAL RESPONSABLE

Donnez de la liberté à vos données. BiBOARD.

TARIFS BANCAIRES. Opérations bancaires avec l étranger Extrait des conditions bancaires au 1 er juillet Opérations à destination de l étranger

Lorsque la sécurisation des paiements par carte bancaire sur Internet conduit à une concurrence entre les banques et les opérateurs de réseau

Transcription:

S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio Uiversité de Picardie Jules Vere 2015-2016 IAE Amies Licece metio Gestio parcours Maagemet et Marketig Vete - Semestre 5 Statistiques appliquées Echatilloage, estimatio, itervalle de cofiace, test statistique Cas d ue ou de deux proportios 1. Simulatios 1.1. Loi de Beroulli et simulatio Soit,P u espace probabilisé. Ue variable aléatoire X suit la loi de Beroulli de paramètre p 0,1, que l o ote Bp, si et seulemet si X est à valeurs das0; 1, et PX 1 p et PX 0 p. Ue telle variable aléatoire permet d idiquer si u évéemet A est réalisé (X 1) ou pas (X 0). Comme exemples d applicatio o peut citer : - lacer d ue pièce meat à Pile ou Face, A "obteir Pile" ; - tirer ue boule das ue ure coteat des boules blaches et oires, A "obteir ue blache" ; - choisir d u idividu das la populatio, A "l idividu est malade". Aisi, ue telle variable permet de représeter u caractère qualitatif à deux modalités. Simulatio 1 p état doé das 0,1, o cosidère ue ure coteat ue proportio p de boules blaches. Plus précisémet, o cosidère l etier N plus petit multiple de 10 tel que Np soit etier, et aisi ue ure coteat N boules, dot Np boules blaches et N1p boules oires. Par exemple, pour p 0,42, o a N 100, Np 42 et N1p 58. O suppose que les N boules sot umérotées de 1 à N, de 1 à Np pour les boules blaches, de Np1à pour les oires. A l expériece aléatoire " tirer ue boule au hasard das l ure ", o peut associer l uivers 1,..., N et le muir de l équiprobabilité P. Das ce cotexte, l évéemet A "obteir ue boule blache" est A 1,...,Np, sa probabilité état alors PA card carda Np N p. Cosidérat la variable aléatoire X qui à chaque tirage d ue boule associe 1 si elle est blache et 0 sio, o a X 1 A et X 0 A, et doc PX 1 PA p et PX 0 PA 1PA 1p. Utilisatio du tableur Excel (voir fichier excel - feuille Beroulli simulatio 1) Le tirage d ue boule de l ure est simulé par l istructio ALEA.ENTRE.BORNES(1;N) à etrer das la cellule B8 (par exemple). La valeur correspodate de X est alors obteue par l istructiosi(b8np;1;0). Simulatio 2 A l expériece aléatoire "choisir u ombre au hasard das l itervalle 0; 1" o peut associer ue variable aléatoire Y suit la loi Uiforme sur l itervalle 0; 1 (loi à desité) ; Y idique le ombre obteu. O sait que pour tout y 0; 1, PY y y. p état doé das 0, 1, o a alors PY p p. Cosidérat la variable aléatoire X défiie par X 1 Y p et X 0 Y p Y p, X suit la loi de BeroulliBp. Utilisatio du tableur Excel (voir fichier excel - feuille Beroulli simulatio 2) Ue valeur de Y est simulée par l istructioalea() à etrer das la cellule B7 (par exemple). La valeur correspodate de X est alors obteue par l istructiosi(b7p;1;0). Stéphae Ducay 1

S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio 1.2. Loi biomiale et simulatio Repreos l exemple d ue ure coteat ue proportio p 0,42 de boules blaches. O tire ue boule au hasard das l ure : le ombre de "boule blache" obteu e u tirage est ue variable aléatoire X de loi de Beroulli Bp : PX 1 p 0.42 et PX 0 1p 0,58. O a EX p 0,42 et VarX 0,2436. Si o effectue 50 tirages avec remise d ue boule, o observe la réalisatio de X 1, X 2,..., X 50, variables aléatoires idépedates de même loi que X. O dit que l o a u échatillo aléatoire simple de taille 50 de loi de Beroulli de paramètre p 0,42. La proportio de "boules blaches" obteue est ue variable aléatoire : où F X X i 1 X 2 X 50 50 X i représete le ombre de "boules blaches" obteues e 50 tirages. Ayat procédé par répétitios d expérieces idépedates, F X i est ue variable aléatoire de la loi Biomiale B50; 0, 42 B, p. O a doc EF EF p et 2 VarF VarF, d où EF p 0,42 et VarF 0,2436. O costate doc que lorsqu o augmete la taille de l échatillo, l espérace de F reste costate, égale à 0,42, alors que la variace dimiue. Utilisatio du tableur Excel (voir fichier excel - feuille Beroulli simulatio 1 et 2) O repred les simulatios 1 et 2 e répétat 50 les istructios précédetes sur 50 liges. Il suffit esuite de "sommer" les valeurs de X obteues pour avoir le ombre de boules blaches obteues, puis de diviser par 50 pour avoir la fréquece. 2. Echatilloage : cas d ue proportio 2.0. Quel cadre mathématique? Statistique et probabilités : Descriptio des observatios et modèle théorique. La Statistique cosiste à étudier u esemble d objets (o parle de populatio, composée d idividus ou uités statistiques) sur lesquels o observe des caractéristiques, appelées variables statistiques. Le calcul des Probabilités permet de proposer u modèle théorique d ue situatio cocrète afi de quatifier la fiabilité des affirmatios. Populatio et échatillo : Das certais cas o peut obteir les valeurs de ces variables sur l esemble de la populatio ; e appliquat les méthodes de la statistique descriptive il est possible, au moye de tableaux, graphiques, paramètres, d aalyser ces résultats. Exemples : Recesemet de la populatio fraçaise, otes obteues par tous les cadidats à u exame, salaires de tous les employés d ue etreprise, etc... Mais la populatio peut être trop vaste pour être étudiée das sa totalité, par maque de moyes, ou de temps. (C est le cas si o s itéresse aux itetios de vote des Fraçais pour ue électio). Elle peut même être cosidérée comme ifiie. C est le cas si l o ote la qualité (défectueuse ou o) des pièces produites par u certai procédé : le ombre de ces pièces est a priori illimité, et o e peut toutes les tester. De même, si l o s itéresse aux fréqueces d obtetios de "pile" et "face" avec ue pièce de moaie, le ombre de lacers de pièce à étudier est a priori ifii : o a ici ue populatio latete ifiie. Il arrive aussi que la mesure d ue variable soit destructrice pour l idividu : si o étudie la durée de vie de certais appareils, il serait absurde de les faire tous foctioer jusqu à la pae, les redat iutilisables. Das tous ces cas, o est ameé à étudier qu ue partie de la populatio, u échatillo, obteu par sodage, das le but d extrapoler à la populatio etière des observatios faites sur l échatillo. Stéphae Ducay 2

S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio Fluctuatio d échatilloage Lorsqu o étudie u caractère sur plusieurs échatillos d ue même populatio, o peut observer que les résultats e sot pas idetiques selo les échatillos. Plus la taille de l échatillo étudié est grade, plus les résultats obteus serot fiables. Cela s explique par la dimiutio de la variace, et aussi par la loi des grads ombres. La fluctuatio d échatilloage représete la fluctuatio etre les différets résultats obteus d ue même equête sur différets échatillos d ue même populatio. Ces différets résultats présetet ue certaie régularité, ce qui se traduit par la otio d itervalle de cofiace. 2.1. Caractère statistique et variable aléatoire Cosidéros ue populatio sur laquelle o défiit u caractère qualitatif à deux modalités A et B. O coviet de représeter la modalité A par 1 et la modalité B par 0. Le caractère est aisi représeté par ue applicatio X de das qui, à tout idividu, associe u réel x X X X 0,1 esemble des "valeurs" du caractère. Cette applicatio modélise le caractère de faço détermiiste : si o coaît l idividu, o coaît aussitôt la valeur x. So étude relève de la statistique descriptive qui coduit, par exemple, au tableau des couplesx i,f i où x i est ue valeur observée et f i sa fréquece. Supposos maiteat que l o tire au hasard u idividu das cette populatio pour cosiger la valeur x du caractère. Ne pouvat pas prévoir quel idividu précis sera tiré, o e peut pas prévoir o plus la valeur précise de x qui sera cosiger. O aimerait doc disposer d u moye d attribuer ue probabilité aux élémets de X. Ici, X est ue variable aléatoire de loi de Beroulli Bp où p est la proportio d idividus ayat la modalité A das la populatio : PX 1 p et PX 0 1p. 2.2. Echatilloage Lorsqu o a pas accès à l esemble de la populatio, la proportio p est icoue. O procède à u échatilloage, i.e. au choix de idividus das la populatio, sur lesquels o observe la valeur x du caractère X. Lorsque les tirages ot lieu avec (respectivemet sas) remise, l échatilloage est dit o-exhaustif (resp. exhaustif). Lorsque la taille de l échatillo est faible par rapport à celle N de la populatio (N 10), alors tout échatilloage est assimilable au cas o-exhaustif. Pour u premier échatilloage, o observera des valeurs x 1, x 2,..., x du caractère. Pour u deuxième échatilloage de même taille, o observera des valeurs x 1, x 2,..., x du caractère. Et aisi de suite. O peut alors cosidérer la suite x 1, x 1,... comme les valeurs observées d ue même variable aléatoire X 1, la suite x 2, x 2,... comme les valeurs observées d ue même variable aléatoire X 2,... Aisi, pour tout i 1,...,, la variable aléatoire X i correspod aux valeurs du caractère du i-ème idividu obteu par échatilloage, et aura doc la même loi de probabilité que X. De plus, l échatilloage état o-exhaustif (tirages avec remise), les variables aléatoires X i sot idépedates. Plus précisémet, les variables aléatoires X i sot des applicatios de das, qui à tout échatilloage 1, 2,..., associe x i X i 1, 2,..., X i O dira que X 1,X 2,...,X est u échatillo (aléatoire simple) de taille de X, et que x 1,x 2,...,x est ue observatio de l échatillo. Le terme d échatillo désige à la fois les idividus choisis et le -uple de variables aléatoires X 1,X 2,...,X. 2.3. Estimateur et estimatio d ue proportio Objectif : détermier p à l aide d iformatios obteues à partir d u échatilloage de taille extrait de la populatio. Impossible tat que N, mais la théorie de l échatilloage coduit à des estimatios p de p, d autat meilleures que est grad. Estimateur du paramètre p : proportio (ou fréquece) d échatillo F X i, où X i représete le ombre d idividus de l échatilloage ayat la modalité A. Stéphae Ducay 3

S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio Pour ue observatio x 1,x 2,...,x de l échatillo (e pratique o observe souvet directemet x i ), ue estimatio poctuelle de p est f 2.4. Proportio d échatillo x i p. U exemple sur la proportio U groupe de 4 efats, Alexis, Bejami, Cyril et David, d âges respectifs 12, 13, 14 et 15 as. O choisit u efat au hasard das le groupe, o peut cosidérer : - X, idicatrice du fait que l efat plus 14,5 as, variable aléatoire de loi de BeroulliB 1 : 4 PX 1 1 4 p et PX 0 3 4 1p. Cherchos à retrouver ou à approcher ces résultats à partir d échatillos o-exhaustifs (avec remise) de taille 3. Il y e a 4 3 64, ils formet u uivers, esemble des résultats possibles de l expériece aléatoire "choisir u échatillo". O peut muir de la tribu des évéemets A P et de l équiprobabilité P sur,a. A chacu des résultats (échatillos), o peut associer la proportio F f d efats ayat plus de 14,5 as. O obtiet les résultats suivats : f A,A,A 0 A,A,B 0 A,A,C 0 A,A,D 1/3 A,B,A 0 A,B,B 0 A,B,C 0 A,B,D 1/3 A,C,A 0 A,C,B 0 A,C,C 0 A,C,D 1/3 A,D,A 1/3 A,D,B 1/3 A,D,C 1/3 A,D,D 2/3 f B,A,A 0 B,A,B 0 B,A,C 0 B,A,D 1/3 B,B,A 0 B,B,B 0 B,B,C 0 B,B,D 1/3 B,C,A 0 B,C,B 0 B,C,C 0 B,C,D 1/3 B,D,A 1/3 B,D,B 1/3 B,D,C 1/3 B,D,D 2/3 f C,A,A 0 C,A,B 0 C,A,C 0 C,A,D 1/3 C,B,A 0 C,B,B 0 C,B,C 0 C,B,D 1/3 C,C,A 0 C,C,B 0 C,C,C 0 C,C,D 1/3 C,D,A 1/3 C,D,B 1/3 C,D,C 1/3 C,D,D 2/3 f D,A,A 1/3 D,A,B 1/3 D,A,C 1/3 D,A,D 2/3 D,B,A 1/3 D,B,B 1/3 D,B,C 1/3 D,B,D 2/3 D,C,A 1/3 D,C,B 1/3 D,C,C 1/3 D,C,D 2/3 D,D,A 2/3 D,D,B 2/3 D,D,C 2/3 D,D,D 1 O défiit aisi ue variable aléatoire F, dot o peut obteir la loi de probabilité : x i 0 1/3 2/3 1 PF x i 27/64 27/64 9/64 1/64 O peut alors calculer : - EF 1 4 : o remarque que EF p EX. - VarF 1 16 : o remarque que VarF VarX. Stéphae Ducay 4

S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio X i Propriétés géérales de F. F X i suit la loi Biomiale B,p. O a alors EF EF p et 2 VarF VarF, d où EF p et VarF. O a aisi EF p et o dit que F est u estimateur sas biais de p. O a de plus lim VarF 0 et o dit que F est u estimateur coverget de p. Théorème. Loi faible des grads ombres Si les X i sot idépedates et admettet la même espérace p et la même variace 2, alors pour tout 0, lim P F p 0 ; cette covergece état uiforme e p. Cela sigifie que F coverge e probabilité vers p. Théorème cetral limite Si les X i sot idépedates, de même espérace mathématique et de même écart-type, et si X X i, alors Z X suit approximativemet la loi ormalen0; 1 ; autremet dit que X suit approximativemet la loi ormalen ; De plus, si p 10 et 1p 10, o peut approcher la loi Biomiale B,p par la loi ormale N p ;. O e déduit que F suit approximativemet la loi ormalen p ;, et doc F suit approximativemet la loi ormale N p ; approximativemet la loi ormalen0; 1... Aisi, U F p Commetaires de ces résultats F a toujours pour espérace p : la proportio das l échatillo est, "e moyee", celle de la populatio. La variace de F est d autat plus faible que est grad : la proportio das l échatillo varie d autat mois d u échatillo à l autre que la taille de cet échatillo est grade. A la limite, si ted vers l ifii, VarF ted vers 0 et doc F ted vers la costate p. Das la pratique, l approximatio de la loi de F par ue loi ormale est correcte dès que p 10 et 1p 10, ou dès que 18, ou sous d autres coditios proches, d autat plus que est grad et p proche de 0.5. Lorsque p est pas cou, o vérifie ces coditios sur la fréquece f observée. suit 3. Itervalle de fluctuatio et itervalle de cofiace pour ue proportio Cosidéros ue variable aléatoire X de loi de Beroulli Bp, où p est la proportio d idividus de la populatio ayat ue propriété doée, u échatillo X 1,X 2,...,X de taille de X et la proportio (ou fréquece) d échatillo F X i, où X i représete le ombre d idividus de l échatilloage ayat la propriété. F O sait que si p 10 et 1p 10, alors U p suit approximativemet la loi ormale N0; 1. O détermie comme le réel u tel que Pu U u 1 grâce à la table 2. Pour 5%, o a u 1.96. Remarque. Lorsque est petit, o doit utiliser la loi exacte de F, à savoir la loi BiomialeB,p. Stéphae Ducay 5

S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio 3.1. Itervalle de fluctuatio de la fréquece F O suppose que l o coait p. O e déduit que P p u F p PF IF p 1, avec IF p p de F au iveau 1 0.95. u ; p u 1, et doc u itervalle de fluctuatio IF p 3.2. Itervalle de cofiace de la proportio p O suppose que l o e coait pas p mais que l o a ue observatio f de F à partir d u échatillo. O a P F u p F u 1, et doc Pp IC p 1, avec IC p F u ; F u itervalle de cofiace IC p de p au iveau 1 0.95. F Comme 1F est u estimateur sas biais de 1, o e déduit, si f 10 et 1f 10, u itervalle de cofiace de la proportio p au iveau 1: ic p f f 1f 1 u, f f 1f 1 u. Exemple d itervalle de cofiace Das ue certaie espèce de rogeur, o a compté 206 mâles sur 400 aissaces. O peut cosidérer la situatio suivate. Populatio : les rogeurs d ue certaie espèce. Variable : le sexe, à deux modalités (mâle et femelle), représeté par ue variable aléatoire de loi de Beroulli Bp, où p est la proportio de mâles das la populatio ; o a aisi PX 1 p et PX 0 1p. EchatilloX 1,X 2,...,X de taille 400 de X. Observatio de l échatillo : x 1,x 2,...,x 1,1,0,1,...,0. X i Estimateur de la proportio p : F, proportio (ou fréquece) de mâles das l échatillo, où X i représete le ombre de mâles de l échatillo. Estimatio poctuelle de la proportio p : mâles das l observatio de l échatillo. Itervalle de cofiace de la proportio p : f 206 10 et 1f 194 10 Pour 0,05 (i.e. 5%, o a u 1,96. ic p f f 1f 1 u ; f f f 1f 1 x i 206 400 u 0,466 ; 0,564. 0.515, fréquece (ou proportio) de Exemple d applicatio de l itervalle de fluctuatio Repreos l exemple précédet et supposos savoir qu il y a équiprobabilité male/femelle à chaque aissace, autremet dit que p 0,5. Pour u échatillo de 400 aissaces, l itervalle de fluctuatio de F est 0.510.5 0.510.5 p u ; p u 0.5 1.96 ; 0.5 1.96 400 400 Aisi, 95 % des échatillos de 400 aissaces doerot ue fréquece d échatillo comprise etre 0.451 et 0.551. L échatillo étudié doe ue fréquece observée f 0.515 qui appartiet à l itervalle de fluctuatio : il est doc représetatif d ue populatio pour laquelle p 0,5. Stéphae Ducay 6

S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio 3.3. Itervalle de fluctuatio de la fréquece F et loi biomiale O cosidère ue populatio das laquelle o suppose que la proportio d u certai caractère est p. Pour juger de cette hypothèse, o y prélève, au hasard et avec remise, u échatillo de taille sur lequel o observe ue fréquece f du caractère. O rejette l hypothèse selo laquelle la proportio das la populatio est p lorsque la fréquece f observée est trop éloigée de p, das u ses ou das l autre. O choisit de fixer le seuil de décisio de sorte que la probabilité de rejeter l hypothèse, alors qu elle est vraie, soit iférieure à 5 %. Lorsque la proportio das la populatio vaut p, la variable aléatoire X correspodat au ombre de fois où le caractère est observé das u échatillo aléatoire de taille, suit la loi biomiale de paramètres et p. O cherche à partager l itervalle 0,, où X pred ses valeurs, e trois itervalles 0,a1, a,b et b1, de sorte que X pree ses valeurs das chacu des itervalles extrêmes avec ue probabilité proche de 0,025, sas dépasser cette valeur. E tabulat les probabilités cumulées PX k, pour k allat de 0 à, il suffit de détermier le plus petit etier a tel que PX a 0, 025 et le plus petit etier b tel que PX b 0, 975, c est-à-dire PX b 0,025. Autremet dit, a est le plus grad etier tel que PX a 0.25. O observe aussi que a b. O a aisi PX a X b PX a PX b 0.05 et doc Pa X b P X a X b 0.95, e état "assez proche" de 0.95. Comme F X, o a aisi P a F b 0.95, e état "assez proche" de 0.95. La règle de décisio est la suivate : si la fréquece observée f appartiet à l itervalle de fluctuatio à 95 % a, b, o cosidère que l hypothèse selo laquelle la proportio est p das la populatio est pas remise e questio et o l accepte ; sio, o rejette l hypothèse selo laquelle cette proportio vaut p. Pour 30, p 5 et 1p 5, o observe que l itervalle de fluctuatio a, b est sesiblemet le même que l itervalle p 1, p 1 proposé das le programme de secode. Exemple d exercice Mosieur Z, chef du gouveremet d u pays loitai, affirme que 52 % des électeurs lui fot cofiace. O iterroge 100 électeurs au hasard (la populatio est suffisammet grade pour cosidérer qu il s agit de tirages avec remise) et o souhaite savoir à partir de quelles fréqueces, au seuil de 5 %, o peut mettre e doute le pourcetage aocé par Mosieur Z, das u ses, ou das l autre. 1. O fait l hypothèse que Mosieur Z dit vrai et que la proportio des électeurs qui lui fot cofiace das la populatio est p 0, 52. Motrer que la variable aléatoire X, correspodat au ombre d électeurs lui faisat cofiace das u échatillo de 100 électeurs, suit la loi biomiale de paramètres 100 et p 0,52. 2. O doe ci-cotre u extrait de la table des probabilités cumulées PX k où X suit la loi biomiale de paramètres 100 et p 0,52. Détermier a et b tels que défiis précédemmet et comparer les itervalles de fluctuatio à 95 % a, b et p 1, p 1 3. Éocer la règle décisio permettat de rejeter ou o l hypothèse p 0,52, selo la valeur de la fréquece f des électeurs favorables à Mosieur Z obteue sur l échatillo. 4. Sur les 100 électeurs iterrogés au hasard, 43 déclaret avoir cofiace e Mosieur Z. Peut-o cosidérer, au seuil de 5 %, l affirmatio de Mosieur Z comme exacte?. k PX k 40 0,0106 41 0,0177 42 0,0286 43 0,0444... 61 0,9719 62 0,9827 63 0,9897 64 0,9941 Remarque : la recherche de l itervalle de fluctuatio peut-être illustrée par le diagramme e bâto de la loi biomiale de paramètres 100 et p 0,52. Utilisatio du tableur Excel Costruire la table des probabilités et des probabilités cumulées de la loi Biomiale de paramètres 100 et p 0,52. Costruire le diagramme e bâto de cette loi. Stéphae Ducay 7

S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio 4. Test de coformité pour ue proportio p O s itéresse à la questio suivate : état doée ue populatio das laquelle ue proportio p d idividu ot ue certaie propriéte, peut-o raisoablemet supposer que p est égal à ue certaie valeur p 0 doée a priori? Par exemple, des tests e laboratoire permettet d affirmer qu u certai médicamet est efficace sur ue proportio p 0 d idividus atteits d ue certaie maladie. Mais après sa mise sur le marché, le médicamet a-t-il la même efficacité sur l esemble des idividus malades? Commet savoir si la proportio p de malades guéris par le médicamet est bie égale à p 0? La répose à la questio est doée par la mise e place d u test de coformité. De faço géérale, u test statistique est ue procédure permettat de calculer la valeur d ue certaie foctio des observatios d u ou de plusieurs échatillo, qui coduit à rejeter ou o, avec u certai risque d erreur, ue hypothèse gééralemet appelée hypothèse ulle et otée H 0. Celle-ci porte sur la (ou les) populatio(s) d où est (sot) issu(s) le(s) échatillo(s). Elle s oppose à ue hypothèse dite alterative et otée H 1. Cosidéros ue variable aléatoire X de loi de Beroulli Bp, où p est la proportio d idividus de la populatio ayat ue propriété doée, u échatillo X 1,X 2,...,X de taille de X et la proportio (ou fréquece) d échatillo F propriété. X i O sait que si p 10 et 1p 10, alors U, où X i représete le ombre d idividus de l échatilloage ayat la F p N0; 1. O détermie le réel u tel que Pu U u 1, i.e. u 1 1 2 suit approximativemet la loi ormale (table 2). Test (bilatéral) de H 0 : p p 0 cotre H 1 : p p 0. f p O calcule u 0. O détermie u tel que Pu U u 1, et o décide que : p 0 1p 0 - si u u,u, alors o e peut rejeter H 0 ; - si u u,u, alors o rejette H 0 avec ue probabilité de se tromper. Test (uilatéral) de H 0 : p p 0 cotre H 1 : p p 0. O détermie u tel que PU u 1, i.e. u 1 1 u 2, et o décide que : - si u u, alors o e peut rejeter H 0 ; - si u u, alors o rejette H 0 avec ue probabilité de se tromper. Test (uilatéral) de H 0 : p p 0 cotre H 1 : p p 0. O détermie u tel que PU u 1, i.e. u 1 u 22 u 2, et o décide que : - si u u, alors o e peut rejeter H 0 ; - si u u, alors o rejette H 0 avec ue probabilité de se tromper. Exemple Repreos l exemple précédets sur les rogeurs. Sur u échatillo de 400 aissaces, o a observé 206 mâles, soit ue fréquece de mâles de f 206 400 0.515. O se demade s il y a autat de mâles que de femelles das la populatio ; autremet dit si la proportio de mâles das la populatio est p 0.5. O peut effectuer le test statistique de H 0 : p p 0 cotre H 1 : p p 0, avec p 0 0.5. O calcule u f p 0 p 0 1p 0 0.5150.5 0.510.5 400 0.6. Pour 0,05 (i.e. 5%, o a u 1,96. Comme u u,u, alors o e peut rejeter H 0 : il est doc possible que p 0.5. Stéphae Ducay 8

S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio 5. Comparaiso de deux proportios Das deux populatios P 1 et P 2 o étudie le même caractère avoir ou o ue propriété doée. Soiet X 1 et X 2 des variables aléatoires de loi de Beroulli Bp 1 et Bp 2 représetat le caractère das chaque populatio, où p 1 (respectivemet p 2 ) est la proportio d idividus ayat la propriété das P 1 (respectivemet das P 2 ). De P 1 et P 2 o extrait u échatillo E 1 X 1,1,X 1,2,...,X 1,1 de taille 1 de X 1 et u échatillo E 2 X 2,1,X 2,2,...,X 2,2 de taille 2 de X 2. Les fréqueces d échatillo sot alors F 1 1 X1,i 1 5.1. Cas d échatillos idépedats Les échatillos E 1 et E 2 sot supposés idépedats. et F 2 2 X2,i 2. Test (bilatéral) de H 0 : p 1 p 2 p cotre H 1 : p 1 p 2. Supposos que 1 f 1 5, 1 1f 1 5, 2 f 2 5, 2 1f 2 5. Sous l hypothèse H 0, U F 1 F 2 suit approximativemet la loi ormale N0; 1, et e regroupat les deux 1 1 1 2 échatillos, o peut estimer p par f 1,2 1f 1 2 f 2 f 1. O calcule u 1 f 2 2 1 2 f 1,2 1f 1,2. O détermie u tel que Pu U u 1, i.e. u 1 1 (table 2) et o décide que : 2 - si u u,u, alors o e peut rejeter H 0 ; - si u u,u, alors o rejette H 0 avec ue probabilité de se tromper. Test (uilatéral) de H 0 : p 1 p 2 cotre H 1 : p 1 p 2. O détermie u tel que PU u 1, i.e. u 1 1 u 2, et o décide que : - si u u, alors o e peut rejeter H 0 ; - si u u, alors o rejette H 0 avec ue probabilité de se tromper. Test (uilatéral) de H 0 : p 1 p 2 cotre H 1 : p 1 p 2. O détermie u tel que PU u 1, i.e. u 1 u 22 u 2, et o décide que : - si u u, alors o e peut rejeter H 0 ; - si u u, alors o rejette H 0 avec ue probabilité de se tromper. 5.2. Cas d échatillos appariés : test de McNemar Deux échatillos E 1 et E 2 sot dits appariés lorsque chaque observatio x 1,i de E 1 est associée à ue valeur x 2,i de E 2 (appariés associés par paires). C est par exemple le cas lorsque E 1 et E 2 provieet d u même groupe de malades avat et après traitemet. Deux échatillos appariés ot doc la même taille 1 2. O utilise le tableau suivat des effectifs de présece ou absece de la propriété étudiée : P 1 \ P 2 préset abset totaux 1 1 préset abset a c b d ab c d totaux ac bd Le test de McNemar s appuie sur le calcul de u bc, et se poursuit de faço aalogue au cas bc d échatillos idépedats (paragraphe 2.3.1). O peut l utiliser dès que bc 10. Stéphae Ducay 9

S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio 5.3. Exemple Das ue même catégorie sociale, u échatillo de 40 hommes a fouri 8 fumeurs et u échatillo de 60 femmes a fouri 18 fumeuses. O se demade si la proportio de fumeurs est la même pour les deux sexes. O peut cosidérer la situatio suivate. Populatio 1 : hommes. Variable X 1 : être fumeur, représeté par ue variable aléatoire X 1 de loi de BeroulliBp 1, où p 1 est la proportio d hommes fumeurs. Echatillo de taille 1 40. Estimateur de p 1 : fréquece d échatillo F 1. Estimatio de p 1 : f 1 8 40 0,2. Populatio 2 : femmes. Variable X 2 : être fumeuse, représeté par ue variable aléatoire X 2 de loi de BeroulliBp 2, où p 2 est la proportio de femmes fumeuses Echatillo de taille 2 60. Estimateur de p 2 : fréquece d échatillo F 2. Estimatio de p 2 : f 2 18 60 0,3. Les échatillos E 1 et E 2 sot idépedats. Test (bilatéral) de H 0 : p 1 p 2 p cotre H 1 : p 1 p 2. Supposos que 1 f 1 8 5, 1 1f 1 32 5, 2 f 2 18 5, 2 1f 2 42 5. Sous l hypothèse H 0, U F 1 F 2 suit approximativemet la loi ormale N0; 1, et e 1 2 1 1 regroupat les deux échatillos, o peut estimer p par f 1,2 1f 1 2 f 2 1 818 0,26. E 2 4060 remplaçat p par f 1,2, o e modifie pas la loi approchée de U. f O calcule u 1 f 2 0,20,3 1,12. 1 1 1 1 2 f 1,2 1f 1,2 1 0,2610,26 40 60 O détermie u tel que Pu U u 1(table 2) : pour 0,05, o trouve u 1,96. Comme u u,u, o e peut rejeter H 0 : la proportio de fumeurs e diffère pas sigificativemet etre les deux sexes. Pour cette décisio de o-rejet, o e coait pas la probabilité de se tromper (erreur de deuxième espèce). 6. Exercices Exercice 1. O admet que das la populatio d efats de 11 à 14 as d u départemet fraçais, le pourcetage d efats ayat déjà eu ue crise d asthme das leur vie est de 13%. U médeci d ue ville de ce départemet est surpris par le ombre importat d efats le cosultat pour des crises d asthmes. Il décide de meer ue étude statistique e choisissat de maière aléatoire 100 efats de 11 à 14 as de la ville. Il observe que 19 d etre eux ot déjà eu ue crise d asthmes. 1) Utiliser u itervalle de fluctuatio pour aider le médeci à décider s il y a plus d efats ayat des crises d asthmes das la ville que das le départemet. 2) Le médeci est pas covaicu par la décisio obteue et pese que le ombre d efats iterrogés était isuffisat. Combie d efats faudrait-il iterroger pour qu ue fréquece observée de 0,19 amèe à coclure qu il y a plus d efats ayat des crises d asthmes das la ville que das le départemet. Exercice 2. E mai 2006, le miistre de l Ecoomie des Fiaces et de l Idustrie a mis e place la déclaratio de reveus préremplie par l admiistratio. Les premiers cotrôles effectués sur u échatillo de 780 déclaratios d impositio préremplies motret que 12% des ces déclaratios présetet au mois ue erreur. Doer u itervalle de cofiace au iveau 95% pour la proportio p de déclaratios erroées. Exercice 3. Ue société mutuelle d assurace effectue tous les as ue equête pour évaluer le pourcetage d accidets domestiques parmi ses adhérets au cours de l aée atérieure. 1) Le résultat de l equête e 2005 (pourcetage d accidets domestiques e 2004) est égal à 5%. L equête a été effectuée auprès de 2000 persoes. E déduire l itervalle de cofiace pour u iveau de cofiace égal à 0.95. 2) Quelle est, pour le même iveau de cofiace, le pourcetage miimum? Le pourcetage maximum? Stéphae Ducay 10

S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio 3) O demade que l equête que l o effectuera e 2006 pour estimer ce pourcetage e 2005 doe ue fourchette limitée à 2%. Quelle est la taille de l échatillo qu il faudra choisir? Exercice 4. Ue etreprise automobile se préoccupe du ombre de cliets reouvelat leur voiture e achetat u modèle d u cocurret. Ue equête auprès de 1 000 cliets fait apparaître u pourcetage atioal égal à 35%. 1) Doer l itervalle de cofiace de ce pourcetage pour u iveau de cofiace égal à 0.99. 2) Quelle est la valeur maximale de ce pourcetage, pour le même iveau de cofiace? 3) Ce pourcetage, chez certais cocessioaires de la marque, atteit 40%. Cela sigifie-t-il que leurs performaces commerciales sot isuffisates? Exercice 5. U sodage effectué sur u échatillo de 400 électeurs doe 212 itetios de vote e faveur d u cadidat C. 1) Détermier u itervalle de cofiace au iveau 95% pour la proportio d électeurs, das l esemble de la populatio électorale, ayat l itetio de voter e faveur de C. 2) Quelle taille miimale de l échatillo faudrait-il predre pour que l itervalle (au même iveau 95%) e cotiee pas la valeur 0,50? Exercice 6. Lors d ue précédete cosultatio électorale, le cadidat A avait obteu 51% des suffrages exprimés. A l approche de ouvelles électios, il réalise u sodage sur u échatillo de 400 électeurs choisis au hasard das sa circoscriptio. Il obtiet 196 itetios de votes. Peut-il coclure que sa cote de popularité est restée stable? Exercice 7. Ue agece de publicité affirme qu u produit d etretie est efficace à 90% pour déboucher éviers et lavabos e deux heures, quelle que soit la ature de l obstructio. Ue associatio de défese du cosommateur a fait ue equête qui relève que sur 100 lavabos bouchés, 80 seulemet sot débouchés e deux heures e utilisat le produit d etretie. Doit-o faire u procès à l agece de publicité? Faire u test au risque 5%, puis 1%. Exercice 8. O compare les effets d u même traitemet das deux hopitaux différets. Das le premier hopital, 70 des 100 malades traités motret des siges de guériso. Das le deuxième hopital, c est le cas pour 100 des 150 malades traités. Quelle coclusio peut-o e tirer? Exercice 9. E 2009, ue etreprise a egagé 21 idividus pour ue foctio de cadre et 63 idividus pour ue foctio d employé. Sur les 21 idividus egagés pour u poste de cadre, 6 étaiet de sexe fémii. Sur les 63 idividus egagés pour u poste d employé, 31 étaiet de sexe fémii. Tester, au risque 5%, l hypothèse selo laquelle la proportio de postes de cadre attribués à ue femme est iférieure à la proportio de postes d employé attribués à ue femme. Exercice 10. Afi d évaluer l impact d ue campage média ati-tabac, o s est itéressé à la proportio de fumeurs meat des actios pour essayer d arrêter de fumer (dimiutio de la cosommatio, achat de patchs ati-tabac, cosultatios médicales,...), c est-à-dire à la proportio de fumeurs "actifs" pour arrêter. U sodage "avat campage" a été effectué auprès de 3000 fumeurs, et u sodage "après campage" a été effectué auprès d u autre échatillo de 3000 fumeurs ; les deux échatillos sot doc idépedats. Le premier sodage doe ue proportio de 0,15 de fumeurs "actifs", alors que le deuxième sodage doe ue proportio de 0,17 de fumeurs "actifs". O veut savoir si la campage a été efficace ; autremet dit si la proportio de fumeurs "actifs" a augmeté après la campage. Stéphae Ducay 11

S5 Gestio - Maagemet et Marketig 2015-2016 Statistiques appliquées Estimatio, tests - Proportio 1) a) Détermier u itervalle de cofiace au iveau 95% de la proportio de fumeurs "actifs" avat la campage. Préciser la populatio et le caractère étudié, la taille d échatillo, le(s) estimateur(s) mis e jeu. b) De faço aalogue, doer (sas détailler les calculs) u itervalle de cofiace au iveau 95% de la proportio de fumeurs "actifs" après la campage. c) Peut-o déduire de ces deux itervalles que la campage a été efficace? 2) a) Expliquer brièvemet ce que représetet les erreurs de première et deuxième espèce d u test statistique. b) Effectuer u test statistique au risque 5%, puis 10%, pour savoir si la campage a été efficace. E cas de décisios cotradictoires avec les deux risques 5% et 10%, préciser et justifier la décisio à reteir. Stéphae Ducay 12