Chapitre 3 Détermiatio de la taille de l'échatillo Lorsqu o prélève u échatillo pour estimer u paramètre, o court toujours le risque de découvrir u peu trop tard que l'échatillo prélevé est trop petit ou, au cotraire, trop grad. Il est trop petit si l'itervalle de cofiace qu il fourit est trop large, ou e permet pas de cofirmer ue hypothèse; il est trop grad si l'itervalle de cofiace est iutilemet court, c est-à-dire, plus précis et doc plus coûteux que écessaire. Nous discutos ici quelques faços d'estimer avat l'échatilloage la taille miimale de l'échatillo qui fourit la précisio voulue. Nous traiteros séparémet le cas d ue moyee ou d u total; et celui d ue proportio ou d u effectif. 3.1 Le cas d ue moyee ou d u total Nous traitos e détail le cas où le paramètre à estimer est la moyee µ; la solutio pour u total τ e découle immédiatemet. Tout d abord, us devos clarifier la questio, ce qui est pas évidet puisque la tedace aturelle est de la poser de faço simpliste, comme «est-ce qu u échatillo de taille 500 suffit pour ue populatio de 10 000?». Il est impossible, hélas! de répodre par oui ou par. U échatillo doit fourir ue estimatio aussi précise que possible de la moyee, et us savos que la précisio s'améliore idéfiimet lorsque la taille de l'échatillo augmete. Par coséquet, o e peut pas exiger «la meilleure précisio possible»: la meilleure précisio possible 'est atteite que lorsqu'o prélève la populatio etière. Voici commet o doit poser la questio : quelle est la taille de l'échatillo qui assure tel degré précisio? Avat de répodre, précisos la tio de «précisio». Nous exprimeros la précisio par sa marge d erreur: u estimateur est précis si la marge d erreur d u itervalle de cofiace est étroite. Il faut doc, avat de commecer, décider de la marge d erreur qu o est disposé à tolérer. Par exemple, si o tire u échatillo de méages afi d estimer le reveu moye des méages, o costruira u itervalle de cofiace qui predra la forme O pourrait aboutir à quelque chose comme Estimateur ± marge d erreur 40 000 $ ± 5 000 $ E d autres termes, o affirmerait que le reveu moye se situe etre 15 000 $ et 65 000 $. Maifestemet, u tel itervalle de cofiace est presque iutile, la marge d erreur est trop grade. Le jour où l o repredra cet échatilloage, o voudra s assurer que la marge d erreur soit plus étroite, disos 5 000 $ plutôt que 5 000 $. Il faudra alors détermier la taille de l échatillo qui doera
Chapitre 3 - Détermiatio de la taille de l échatillo 41 ue telle marge d erreur. Rappelos que la marge d erreur est doée par σ 1 y. Nous devos doc détermier la taille de l'échatillo écessaire pour que la marge d erreur soit égale à u mbre doé E : Exigé: σ = E y Puisque σ = y 1 f S, où f = N, us devos détermier la valeur de qui satisfait l'équatio 1 f S = E. Oublios pour l'istat le facteur de correctio 1 f, qui de toute faço est égligeable das la plupart des situatios réelles. L équatio à résoudre deviet ce qui doe la solutio provisoire o = (S/E). S = E, C est doc la règle que us allos suivre e gééral : Si N est assez grad, la valeur de pour laquelle σ y = E est approximativemet S o = E. Cette solutio correspod au cas où f = 0, c est-à-dire, lorsque la populatio est ifiie, et das la plupart des applicatios, la solutio provisoire o produit ue boe approximatio de la solutio réelle. Mais si, comme das l exemple traité das cette sectio, le facteur de correctio est importat (si N est pas très grad), il suffit d'u simple ajustemet pour obteir la solutio exacte. L ajustemet est : Lorsque N est pas très grad, il coviet d ajuster la taille estimée par l équatio = o 1 + o N 1 E pratique c est σˆ y qu o calcule. Mais idéalemet, o préférerait avoir σ y. E gééral, la marge d erreur est z α /σ y. Si α = 0,05, z α/, et das tout ce qui suit us predros, z α/ =. ÉchatilloageChap3 41 mardi, javier 15, 008
4 Chapitre 3 - Détermiatio de la taille de l échatillo Exemple 3.1.1 Taille d échatillo pour ue marge d erreur doée Cosidéros l échatillo préseté au tableau A.0 de l aexe et supposos qu o veuille estimer le motat total des salaires de 001. La populatio elle-même est costituée de N = 00 professeurs et l échatillo est de taille = 50. La moyee et l écart-type de la variable Y = salaire de 001 sot: y = 48 447,3 $ et s = 10 05,95 Supposos qu o ait l itetio de prélever l a prochai u deuxième échatillo de la même populatio afi d estimer le salaire moye des professeurs. Quelle doit être la taille de l échatillo pour que la marge d erreur soit de 1 000 $? Nous supposeros que le mbre de professeurs d uiversités l a prochai e chagera pas, doc N = 00; et que l écart-type S restera à peu près costat. Nous estimeros doc S par s = 10 05,95 $. Comme première approximatio, doc, us avos o = (s/1000) = 40,0789. Faisos l ajustemet: = o 40,0789 = = 134 1 + o 40,0789 N 00 O doit doc prélever u échatillo d eviro 134 professeurs pour que la marge d erreur de l estimateur soit de 1 000 $ Remarque Das l exemple que us ves de traiter, il a fallu faire deux suppositios: l ue est que N e chagera pas; l autre est que l écart-type e chagera pas. E gééral, la première suppositio e pose pas de problème, car N e joue pas u grad rôle: la populatio est rmalemet si grade qu ue petite erreur das l estimatio de N est sas effet. (L exemple qu o viet de traiter est pas typique e ce ses. La petitesse de la populatio là faisait qu il a été utile de bie estimer sa taille.) La deuxième suppositio est plutôt douteuse, et plus lourde de coséqueces. E gééral, si o s atted à ue augmetatio des salaires, o peut aussi s attedre à ue augmetatio de l écart-type S. Doc il est sage de majorer u peu l estimatio de S. E pratique il sera presque toujours écessaire de faire des suppositios à propos de la populatio afi d estimer la taille de l échatillo. Heureusemet, o est souvet mois démui das u cotexte réel que das ue situatio hypothétique comme celle-ci. Das tre exemple, o pourrait avoir de boes raisos de croire que les salaires augmeteros, disos, de 5 %. Das ce cas, o s atted à ce que l écart-type aussi augmete de 5%, et alors o estimera S par 1005,95 (1,05) = 1057,5. Avec cette uvelle estimatio, o trouvera = 94 au lieu de = 90. Remarque La marge d erreur est la demi-largeur d u itervalle de cofiace. Das ce cours, le iveau de cofiace est toujours de 95 %, et doc la marge d erreur dot il est questio ici est ue «marge d erreur à 95 %». Cette qualificatio est sous-etedue. Il faut se rappeler, cepedat, qu il est possible de détermier des itervalles de cofiace à d autres iveaux que 95 %. Quel est le ses de ce 95 %? O a ue marge d erreur, disos, de 5 000 $ das l estimatio de la moyee des salaires si la probabilité est de 95 % que l erreur d estimatio e dépassera pas 5 000 $; ou si la probabilité est de 5 % que l erreur d estimatio dépasse 5 000 $. La marge d erreur das le derier exemple est exprimée e dollars. Souvet, la marge d erreur est exprimée e pourcetage : ue marge d erreur de 1 000 $ est peut-être acceptable das ue populatio où la moyee est de 50 000 $, mais elle serait sûremet jugée excessive das ue populatio où la moyee est de 0 000 $. E d autres termes, c est plutôt la marge d erreur relative qui compte, c està-dire, la marge d erreur divisée par la moyee. O pourrait dire, par exemple, qu o souhaite estimer le reveu familial d ue populatio avec ue marge d erreur de 10 % o veut dire par là 10 % de la moyee. E d autres termes, o exige que σ y = 0,10 y U mardi, javier 15, 008 4 ÉchatilloageChap3
Chapitre 3 - Détermiatio de la taille de l échatillo 43 ou, plus gééralemet, σ y = R y U Algébriquemet, le problème a pas chagé : o a juste remplacé E par Rµ. Par coséquet, us avos déjà la formule : Si N est assez grad, la valeur de pour laquelle σ y = R y U est approximativemet S o = Ry U Remarque La coditio σ y = R y U est équivalete à Nσ y = RN y U = Rt x. Doc la valeur de o trouvée doera ue marge d erreur relative de R das l estimatio du total aussi. Exemple 3.1. Taille d échatillo pour ue marge d erreur relative doée Das l exemple précédet, supposos qu o veuille estimer la moyee de telle sorte que la marge d erreur soit de 5 %. Doc S S S/ y o = = = U RyU 0,05y U 0,05 O estime S par s et y U par y et doc S/ y U par 1005,95/48447,3 = 0,069455. Doc (0,069455) o = 0,05 = 68,58. L ajustemet porte ce chiffre à 68,58 = = 51. 68,58 00 Remarque Das le derier exemple, il a fallu estimer S et y U, deux paramètres disticts. O costate, cepedat, que c est le quotiet des deux qu il faut estimer puisque la formule de o e déped que du quotiet S/ y U (c est-à-dire, du coefficiet de variatio de la populatio) ( S/ y ) o = U 0,05 O a estimé le coefficiet de variatio de la populatio par celui de l échatillo s/ y = 0,069455. E pratique, il est souvet plus aisé d'estimer le coefficiet de variatio que l écart-type. Das l exemple ci-dessus, l écart-type aura peut-être chagé e u a sous l effet d ue augmetatio de salaire; mais si les salaires augmetet, disos, de 5%, la moyee et l écart-type augmeterot tous deux de 5%. Par coséquet, le coefficiet de variatio restera fixe Remarque Cotrairemet à ce qu o a tedace à croire, la taille de la populatio joue u rôle relativemet mieur das la détermiatio de la taille de l échatillo, à mois qu elle e soit très petite. Le tableau cidessous repred le problème préseté à l exemple 3.1.: quelle est la taille écessaire pour que la marge d erreur das l estimatio de la moyee soit de 5 %. O présete la répose e foctio de la taille de la populatio. ÉchatilloageChap3 43 mardi, javier 15, 008
44 Chapitre 3 - Détermiatio de la taille de l échatillo Taille de la populatio 100 00 300 400 500 800 1000 5000 10000 15000 0000 Taille d échatillo écessaire 41 51 56 59 60 63 64 68 68 68 68 69 O costate que dès que la populatio atteit 5 000, il est plus vraimet écessaire d augmeter la taille de l échatillo. Estimatio des paramètres icous Les problèmes présetés das cette sectio 'ot de solutio que si l'o coaît, ou si l o peut estimer, les valeurs de S ou de S/ y U, selo le cas. Das les exemples traités ici, o disposait d u échatillo qui permettait d estimer ces paramètres, du mois approximativemet. Que fait-o si o a pas d échatillo? O peut evisager plusieurs approches. Nous supposos das ce qui suit que la populatio est grade et doc qu il est pas écessaire de faire de distictio etre σ et S. Échatilloage prélimiaire O peut estimer S par s, y U par y et doc le coefficiet de variatio C = S/ y U par s/ y à l aide d u petit échatillo prélimiaire tiré à cette fi. La taille de cet échatillo prélimiaire sera gééralemet assez petite, puisque l'estimatio e doit pas écessairemet être très précise; elle dépedra surtout des ressources qu'o voudra bie lui accorder. Estimatio du coefficiet de variatio C Lorsqu o a pas d échatillo pilote, l'estimatio de C = est plus délicate que celle de S, puisqu'il y a deux paramètres à estimer. S y U U avatage, par cotre, du coefficiet de variatio est qu'il est plus stable d'ue populatio à l'autre que l'écart-type S. Deux populatios peuvet être sesiblemet différetes quat à leur écart-type, mais comparables quat à leur coefficiet de variatio. Car S et y U évoluet souvet das le même ses: lorsque les valeurs de la variable sot grades, S et y U ot toutes deux tedace à être grads; lorsqu'ils sot petits, S et y U sot tous deux petits. Par coséquet le quotiet S y U e sera pas très différet das les deux populatios. Toute expériece avec des populatios relativemet semblables peut doc servir à estimer C : la même populatio l'aée derière; ue populatio aalogue das ue autre compagie, ue autre divisio, ue autre succursale; ue autre variable das la même populatio, etc. 3. Le cas d ue proportio ou d u effectif La situatio avec l estimatio d ue proportio p est semblable à celle d ue moyee, sauf que le caractère u peu particulier de l écart-type de ˆp permet certaies estimatios qu o e peut pas faire mardi, javier 15, 008 44 ÉchatilloageChap3
Chapitre 3 - Détermiatio de la taille de l échatillo 45 das le cas de variables quatitatives. Le problème posé est le même: o exige que la marge d erreur de l estimateur soit égal à u certai mbre E : σ p ˆ = E, Doc il faut détermier la valeur de pour laquelle (1 ) p p N N 1 = E. Si l o églige provisoiremet le facteur de correctio (1 ) p p N, o a l équatio suivate à résoudre: N 1 = E. O a doc la solutio provisoire o = 4 p(1 p). E Cette solutio provisoire est gééralemet acceptable, à mois que la populatio e soit plutôt petite par comparaiso à l échatillo. Si la populatio est pas très grade, alors o effectue l ajustemet suivat: = 1 N N Pour e pas multiplier les formules iutilemet, us utiliseros toujours l expressio approximative N, puisqu elle est idetique à celle que us avos employée pour la moyee. Le fait que us e coaissios pas la valeur de p est mois grave qu o pourrait le croire, car il est possible de trouver ue bore au produit p(1-p). La bore la plus coservatrice (c est-à-dire, la plus grade) est celle-ci: p(1-p) 1/4. C est u fait que le produit p(1-p) est jamais supérieur à 1/4, ue valeur atteite seulemet lorsque p = ½. Doc l estimatio la plus pessimiste qu o puisse obteir de o est celle où l o remplace p par ½. O a alors: o = 1 E ÉchatilloageChap3 45 mardi, javier 15, 008
46 Chapitre 3 - Détermiatio de la taille de l échatillo Exemple 3..1 Taille d échatillo pour l estimatio d ue proportio avec marge d erreur doée Le resposable de marketig das ue compagie de boissos gazeuses veut estimer la proportio p de cosommateurs qui préfère u uveau produit destié à remplacer l acie. Quelle est la taille de l échatillo qu il doit prélever s il veut que la marge d erreur de so estimateur e soit pas supérieur à 0,04? La valeur de o est 1/E = 1/(0,04) = 65. Nous e feros pas d ajustemet, puisque la populatio est à toute fi pratique ifiie. Doc si o prélève u échatillo de taille 65, l écart-type de l estimateur pˆ e sera pas supérieur à 0,0. L estimatio que us avos faite das le derier exemple est correcte si de fait p = ½ : la marge d erreur serait alors égale à 0,04. Lorsque p 1/, l estimatio est pessimiste: elle doe ue valeur de o plus grade que écessaire. Le tableau suivat doe la taille de l échatillo écessaire sous plusieurs hypothèses cocerat p. O costate qu o e commet pas ue erreur très importate lorsque p est pas trop éloigée de 0,5. Mais lorsque p est petit, o surestime. p 0,01 0,05 0,10 0,0 0,30 0,40 0,50 o 5 119 5 400 55 600 65 Il est rare e pratique qu o soit à u tel poit démui qu o e peut estimer p qu e le remplaçat par 1/. O a souvet ue idée de la valeur de p, ce qui permet de fixer ue bore. Par exemple, das u sodage politique destié à estimer le pourcetage d électeurs qui voteros NPD, o sait d avace que ce pourcetage atteidra pas 50 %. O peut même dire, avec u peu d expériece, que ce pourcetage est iférieur à, disos, 30 %. Das ce cas, o sait que p(1-p) < (0,30)(0,70) = 0,1. La raiso pour cela est claire lorsqu o examie la foctio p(1-p). Le graphique de cette foctio est préseté à la figure ci-dessous. O voit das le graphique que si p est iférieure à u certai mbre p o < 1/, alors p(1-p) < p o (1-p o ). De même, si p est supérieure à u mbre p o > 1/, alors p(1-p) > p o (1-p o ). Exemple 3.. Taille d échatillo pour l estimatio d ue proportio Vous voulez estimer le pourcetage de pièces défectueuses das u lot de 5000 pièces. Vous savez que rmalemet, le taux de défectuosité est de l ordre de 5 %, et vous pesez qu il est ecore de cet ordre là. Il est possible qu il ait augmeté quelque peu, mais vous êtes sûr qu il est pas supérieur à 10%. a) Quelle est la taille de l échatillo que vous devriez tirer si vous voulez que votre estimateur ait ue marge d erreur de 0,04? b) Quelle est la taille de l échatillo que vous devriez tirer si vous voulez avoir ue marge d erreur relative de 5 %? Vous savez d avace que p e peux avoir baissé au-dessous de 3 %. Solutio a) Nous avos o = 4p(1-p)/(0,04), et puisque le umérateur pred au maximum la valeur (0,1)(0,9) = 0,09, o a o = 4(0,09)/0,0016 = 5. L ajustemet doe = 5/(5/5000) 16. Remarquez que si o avait pris la valeur 1/ pour p, us aurios obteu o = 65 et = 556, beaucoup plus élevé que écessaire. mardi, javier 15, 008 46 ÉchatilloageChap3
Chapitre 3 - Détermiatio de la taille de l échatillo 47 0,5 0, 0,15 p(1-p) 0,1 0,05 0 0 0,1 0, 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 p b) Ce que vous voulez, c est que σ p ˆ = 0,5p o = 4p(1-p)/(0,5p) 4(1 p) / p = 0,5. La 4(1 p) / p plus grade valeur de 0,5 est atteite lorsque p est à so miimum; ce miimum est, selo la descriptio de la situatio, 0,03. O predra doc o = 4(1 0,03) / 0,03 0,5 = 069. 3.3 Résumé 1 Marge d erreur absolue : Si N est assez grad, la valeur de pour laquelle σ y = E est approximativemet S o = E.. O ajuste cette estimatio provisoire à l aide de la formule = N 3 La marge d erreur est égale à E si la probabilité est de 95% (à peu près) que l erreur e sera pas supérieure à E. 4 Si N est assez grad, la valeur de pour laquelle σ y = R y U est approximativemet S o =. RyU 5 Pour estimer ue proportio p de telle sorte que σ p ˆ = E, la taille approximative de l échatillo qu il faut tirer est doée par o = 4 p(1 p). Pour ue populatio de taille N, o E ÉchatilloageChap3 47 mardi, javier 15, 008
48 Chapitre 3 - Détermiatio de la taille de l échatillo peut esuite faire l ajustemet habituel. Si p est iférieure à u certai mbre p o < N 1/, alors p(1-p) < p o (1-p o ). De même, si p est supérieure à u mbre p o > 1/, alors p(1-p) > p o (1-p o ). Lorsque la valeur de p est totalemet icoue, o peut remplacer p das la formule par ½. 3.4 Exercices 3.1 D'ue populatio de 1 640 étudiats, o veut prélever u échatillo pour estimer certais paramètres cocerat la variable y : motat dépesé quotidieemet e trasport. U échatilloage prélimiaire a doé ue estimatio de y U et de S y : y U 140, S y 5. Détermier la taille de l'échatillo qu'o doit prélever s'il faut que a) la marge d erreur de l'estimateur de la moyee soit de $. b) la marge d erreur de l estimateur de la moyee soit de 4 %. c) la marge d erreur de l estimateur du total soit de 000 $. d) la marge d erreur de l estimateur du total soit de 4 %. 3. D'ue populatio de taille 678 vous devez prélever u échatillo das le but d'estimer la moyee de la populatio avec ue marge d erreur de 10 %. Vous prélevez u échatillo prélimiaire de taille 1 et obteez les résultats suivats: 5,17 4,1 81,6 5,34 64,15 3,06 30,36 6,96 4,4 4,54 10,4 48,68 Estimez la taille de l'échatillo que vous devriez prélever. 3.3 [Tableau A.06]Vous êtes e 00, et vous disposez des doées du tableau A.06 obteues e 000 sur u échatillo de 58 villes du mode. Vous allez maiteat prélever u échatillo de villes afi d estimer le mbre moye d heures de travail des igéieurs e 001. Quelle est la taille de l échatillo qu il faudrait prélever si vous voulez estimer le mbre moye d heures de travail des igéieurs avec ue marge d erreur de 1 % si vous comptez estimer votre moyee par la moyee échatilloale? Vous supposerez que la populatio des villes est très grade. 3.4 [Tableau A.07] Le tableau A.07 présete des doées sur u échatillo de 10 maisos vedues e 001. Vous avez l itetio de meer ue étude comparable e 00 afi d estimer le prix moye des maisos. Vous supposerez que la populatio visée est très grade, et que le prix des maisos e 00 est probablemet supérieur à celui de 001 de quelque 15%. Détermiez la taille de l échatillo qu il faudrait prélever si vous voulez que votre marge d erreur à 95% soit d eviro 5 000 $. mardi, javier 15, 008 48 ÉchatilloageChap3
Chapitre 3 - Détermiatio de la taille de l échatillo 49 3.5 Vous voulez estimer le mbre d étudiats das ue certaie uiversité qui ot accès à l Iteret. Le mbre d étudiats das l uiversité est de 45 635. Sachat par expériece que la proportio d étudiats ayat accès à l Iteret se situe quelque part etre 15 % et 5 %, détermiez la taille de l échatillo que vous devriez prélever a) si vous teez à ce que votre marge d erreur soit d eviro 500 étudiats; b) si vous teez à ce que votre marge d erreur relative soit de 10 %. 3.6 Vous voulez estimer le mbre d étudiats das ue certaie uiversité qui possèdet u ordiateur. Le mbre d étudiats das l uiversité est de 45 635. Sachat par expériece que la proportio d étudiats qui possèdet u ordiateur se situe quelque part etre 40 % et 65 %, détermier la taille de l échatillo que vous devriez prélever a) si vous teez à ce que votre marge d erreur soit d eviro 1 000 étudiats; b) si vous teez à ce que votre marge d erreur relative soit de %. 3.7 Vous voulez estimer la proportio d étudiats das ue certaie uiversité qui ot accès à l Iteret. Le mbre d étudiats das l uiversité est de 45 635. Sachat par expériece que la proportio d étudiats ayat accès à l Iteret se situe quelque part etre 15 % et 5 %, détermiez la taille de l échatillo que vous devriez prélever a) si vous teez à ce que votre marge d erreur soit d eviro % (c est-à-dire, poits de pourcetage); b) si vous teez à ce que votre marge d erreur relative soit de 10 % (par rapport à la vraie proportio p). 3.8 Vous voulez estimer la proportio d étudiats das ue certaie uiversité qui possèdet u ordiateur. Le mbre d étudiats das l uiversité est de 45 635. Sachat par expériece que la proportio d étudiats qui possèdet u ordiateur se situe quelque part etre 40 % et 65 %, détermier la taille de l échatillo que vous devriez prélever a) si vous teez à ce que votre marge d erreur soit d eviro 1 %; b) si vous teez à ce que votre marge d erreur relative soit de 5 %. ÉchatilloageChap3 49 mardi, javier 15, 008