MQT1183 Méthodes statistiques

MQT1183 Méthodes statistiques Sébastien Blais Département des sciences administratives, UQO 20 mars 2017

Rappels Exercice 8.35.

Aujourd hui Chapitre 9: Test d hypothèses 1 Introduction 2 Hypothèses nulle et alternative 3 Erreurs de première et seconde espèce 4 Hypothèse sur la moyenne,σ connu (théorie) 5 Hypothèse sur la moyenne, σ inconnu 6 Hypothèse sur la proportion

La troisième partie du cours pour sur l inférence statistique, qui comporte deux types de problèmes 1 estimation ponctuelle (chapitre 7) par intervalle (chapitre 8) 2 décision test d hypothèse introduction, une population (chapitre 9) plusieurs populations, moyennes (chapitre 10) plusieurs populations, proportions (chapitre 11) Les problèmes de décision considérés dans ce cours: 1 sont binaires: on décide de faire, ou de ne pas faire, quelque chose. 2 repose sur l observation d un événement: on fait quelque chose si un certain événement est observé.

Exercice 4.60 Quelle décision doit être prise? Quelle est la règle de décision? Quelles sont les erreurs (mauvaises décisions) possibles?

La pièce est-elle truquée? Je lance la pièce de monnaie 10 fois: j obtiens 3 piles et 7 faces. Quelles sont les erreurs (mauvaises décisions) possibles? Quelle est la règle de décision? Quelle est la probabilité de faire une erreur?

Si p = 0, 5 P(X=x) P(X<=x) P(X>=x) 0 0,001 0,001 1,000 1 0,010 0,011 0,999 2 0,044 0,055 0,989 3 0,117 0,172 0,945 4 0,205 0,377 0,828 5 0,246 0,623 0,623 6 0,205 0,828 0,377 7 0,117 0,945 0,172 8 0,044 0,989 0,055 9 0,010 0,999 0,011 10 0,001 1,000 0,001

Problème de MaxFlight MaxFlight fabrique des balles de golf. Lorsque le processus de fabrication est bien réglé, les balles produites parcourent 295 verges en moyenne. Un programme d assurance qualité prévoit le prélèvement périodique de 50 balles pour évaluer le réglage du processus de fabrication et décider s il doit être ajusté. Problème de décision: 1 binaire: on ajuste le réglage, ou non. 2 événement: si la moyenne de l échantillon (une statistique de test) est inférieure à 290 verges (une valeur critique).

Hypothèses nulle et alternative Le problème de décision binaire se formule par l intermédiaire de deux hypothèses, qui prennent souvent la forme de conditions sur les paramètres de la population hypothèse nulle: comprend toujours une égalité Exemple: H 0 : µ=295 (le processus est bien réglé) Exemple: H 0 : µ 295 (le processus produit des balles dont la portée est d au moins 295 verges) hypothèse alternative: le complément de la nulle 1 Exemple: H 1 : µ 295 (le processus n est pas bien réglé) 2 Exemple: H 1 : µ < 295 (le processus produit des balles dont la portée est inférieure à 295 verges) Remarques: 1 Apprendre à bien formuler ces hypothèses demande de la pratique. 2 Le manuel utilise la notation H a pour l hypothèse alternative.

Idée générale - Problème de MaxFlight Supposons que nous avons calculé une moyenne d échantillon de 291 verges (σ = 12 connu). Puisque l hypothèse nulle (H 0 : µ 295) comprend une égalité, on peut calculer la distribution d une statistique de test sous cette égalité Exemple: Si µ = 295, x suit une loi normale d espérance 295 et d écart type 12/ 50 = 1, 7. On peut donc calculer la probabilité d observer une valeur plus petite que la valeur observée de la statistique ) de test. Exemple: P( X < 291) = P( X 295 1,7 < 291 295 1,7 = P(Z < 2, 35) = 0, 0094 Si cette probabilité est faible (on y reviendra), c est probablement l hypothèse nulle est fausse. Exemple: Si µ = 295, il y avait moins de 1% de chances d observer une moyenne d échantillon aussi faible que 291.

Idée générale - Problème de MaxFlight (suite) Si µ = 295, il y avait moins de 1% de chances d observer une moyenne d échantillon aussi faible que 291. De deux choses l une: 1 Vous avez observé un événement qui avait moins de 1 chance sur 100 de se produire 2 µ < 295 Remarque: Si µ > 295, la probabilité d observer une moyenne d échantillon aussi faible que 291 est encore plus faible.

Formes des hypothèses nulle et alternative Les trois formes possibles sont 1 unilatéral inférieur, H 0 : µ µ 0 et H 1 : µ<µ 0 On rejette la nulle lorsque x est assez petite. 2 unilatéral à supérieur, H 0 : µ µ 0 et H 1 : µ>µ 0 On rejette la nulle lorsque x est assez grande. 3 bilatéral, H 0 : µ = µ 0 et H 1 : µ µ 0 On rejette la nulle lorsque x est assez loin de µ 0. Remarques: La valeur de µ 0 est donnée (souvent µ 0 = 0; µ 0 = 295 dans le problème de MaxFlight) Dans plusieurs manuels, l hypothèse nulle prend toujours la forme d une égalité.

Rejet ou non de la nulle On n accepte jamais la nulle. Il est possible qu un échantillon permette de rejeter la nulle ou qu il ne permette pas de le faire. Exemple: Supposons que j ai une pièce de monnaie truquée avec P(pile) = 0, 25. Je lance la pièce deux fois et j obtiens {pile, face}. La probabilité de cet événement est 0, 375. Vous voulez tester H 0 : p = 0, 5 avant de jouer avec moi. Si p = 0, 5 (sous la nulle), l événement observé est vraisemblable: P(pile, face) = 0, 5. Vous ne rejetez pas la nulle. Ce serait par contre imprudent de l accepter...

Erreurs de première et seconde espèce Lorsqu on prend une décision, on peut faire deux types d erreur 1 première espèce: rejeter la nulle lorsqu elle est vraie 2 seconde espèce: ne pas rejeter la nulle lorsqu elle est fause Exemple (problème de MaxFlight): 1 On conclut que le processus est mal réglé alors que ce n est pas le cas. On procède alors inutilement au réglage. 2 On ne conclut pas que le processus est mal réglé alors que c est le cas. On fabrique alors des balles avec un processus mal calibré.

Seuil de signification La règle de décision est généralement choisie par l intermédiaire d un seuil de signification (α), soit la probabilité de faire une erreur de première espèce lorsque l hypothèse nulle est satisfaite avec égalité. Exemple: On choisit la règle de décision de sorte que la probabilité de rejeter la nulle par erreur (erreur de première espèce) est α = 0, 05. La probabilité de procéder inutilement à un réglage est de 0,05. Remarque: On ne connaît pas la probabilité de faire une erreur de deuxième espèce.

Comment choisir le seuil de signification Par défaut, on prend souvent 5%. En pratique, ça dépend du coût associé aux erreurs de première et seconde espèces: régler ou pas: coût du réglage / perte de réputation prêter ou pas: perte en cas de défaut / perte de revenus parapluie ou pas: encombrement / mouillé ceinture de sécurité ou pas: encombrement / blessures ou mort nouveau médicament:? /?

Deux méthodes équivalentes De manière générale, il y a deux manières de faire un test. Dans tous les cas, on commence par choisir le seuil de signification et calculer une statistique de test. Pour une hypothèse sur la moyenne, lorsque σ est connu, la statistique est z = x µ 0 σ/ n. On rejette H 0 lorsque l une ou l autre de ces conditions sont satisfaites: 1 valeur p: la probabilité d observer z est inférieur à α 2 valeur critique: z est inférieure et/ou (selon le cas) supérieure à une valeur critique.

Problème de Hilltop Hilltop vend du café dans des boîtes de 3 livres. Pour protéger les consommateurs, la Commission fédérale du commerce veut vérifier qu il y a au moins 3 livres de café par boîte, en moyenne, à partir d un échantillon de 36 boîtes. Des analyses antérieures permettent de considérer que l écart type de la population est 0, 18. Quelle est l hypothèse nulle? Quelle est l hypothèse alternative? Quelle est la statistique de test? Quelle est la distribution de la statistique de test sous la nulle? Quel est le seuil de signification du test?

1. Approche de la valeur p Supposons que la moyenne d échantillon est 2, 92. La statistique de test observée est z = x µ 0 σ/ n 2, 92 3 = 0, 18/ = 2, 67. 36 Quelle est la probabilité d observer z = 2, 67? Sous la nulle, z est une normale centrée réduite et la valeur p est P(Z 2, 67) = 0, 0038 Puisque 0, 0038 < 0, 01, on rejette la nulle en faveur de l alternative H 1 : µ < 3. On conclut que les boîtes contiennent moins de 3 livres de café, en moyenne.

2. Approche de la valeur critique (test unilatéral) On cherche la valeur (critique) z α telle que P(Z z α ) = α sous la nulle, et on rejette la nulle si z z α. Puisque Z est une normale centrée réduite sous la nulle, z 0,01 = 2, 33 et on rejette H 0 puisque 2, 67 < 2, 33

Test bilatéral Les hypothèses ont la forme H 0 : µ = µ 0 H 1 : µ µ 0 Pour le problème de MaxFlight H 0 : µ = 295 H 1 : µ 295

1. Approche de la valeur p Sous la nulle, z suit une loi normale centrée réduite. Supposons que la moyenne d échantillon (n = 50) est 297, 6. z = x µ 0 σ/ n = 297, 6 295 12/ 50 = 1, 53. Quelle est la probabilité d observer une valeur de Z aussi loin de 0 que 1, 53? 1 P( 1, 53 Z 1, 53) = P(Z 1, 53)+P(Z 1, 53) = 2 P(Z 1, 53) = 2 0, 0630 = 0, 1260. Au seuil de α = 0, 05, on ne peut pas rejeter la nulle puisque 0, 1260 > 0, 05. On ne peut pas conclure qu un réglage est requis.

2. Approche de la valeur critique (test bilatéral) On cherche la valeur (critique) z α/2 telle que P ( z α/2 Z z α/2 ) = 1 α sous la nulle, et on rejette la nulle si z z α/2 ou z z α/2. Puisque Z est une normale centrée réduite sous la nulle, z 0,025 = 1, 96 et on ne peut pas rejeter H 0 puisque 1, 53 < 1, 96. On conclut que la portée des balles n est pas significativement différente de 295 verges. Remarque: De manière équivalente, on peut rejeter la nulle lorsque z z α/2.

Relation avec l estimation par intervalle Une autre manière de faire un test bilatéral consiste à calculer un intervalle de confiance et de rejeter la nulle si l intervalle de confiance ne contient pas µ 0. Exemple: L intervalle de confiance à 95% autour de 297, 6 est 297, 6±1, 96 12 50 = 297, 6±3, 3 = 297, 6±3, 3 = [294, 3; 300, 9]. Puisque µ 0 = 295 est contenu dans cet intervalle, on ne peut pas rejeter la nulle et on conclut que la portée des balles n est pas significativement différente de 295 verges.

Hypothèse sur la moyenne, σ inconnu Rien de surprenant ici: La statistique est t = x µ 0 s/ n. Elle suit une loi t de Student avec n 1 degrés de liberté lorsque la population est normale.

Hypothèse sur la proportion Dans ce cas: On fait appel au TCL pour justifier une approximation normale de la distribution de la statistique de test. Sous la nulle H 0 : p = p 0, la variance de la population est p 0 (1 p 0 ) La statistique de test z = p p 0 p 0 (1 p 0 ) n suit donc une loi normale centrée réduite. Remarque: L erreur type n est pas la même que lorsqu on construit un intervalle de confiance.

Problème de Pine Creek Le club de golf de Pine Creek a mis en place une campagne publicitaire pour augmenter la proportion des femmes parmi les joueurs. Elle veut tester si cette campagne a été efficace avec un échantillon de 400 joueurs, avec un seuil de signification de 5%. L échantillon comptait 100 femmes. Quelles sont l hypothèse nulle et l hypothèse alternative? Quelle est la valeur observée de la statistique de test? Peut-on rejeter la nulle? 1 Quelle est la valeur p du test? 2 Quelle est la valeur p du test?