Chapitre 8 Tests d hypothèse
Introduction aux tests d hypothèse: dans quelles situations utiliserons-nous les tests d hypothèse? Le temps d attente moyen dans les cliniques médicales en 2001 était de 40 minutes. Est-ce toujours le cas en 2014? En 2000, l âge moyen des femmes canadiennes à la naissance du premier enfant était de 24,5 ans. A-t-il augmenté depuis? On sait qu en 2001, la consommation moyenne annuelle de tabac était de 2,1 kg par adulte canadien. En est-il de même pour les adultes québécois? La température moyenne sur la terre au 20 e siècle était de 13,9 C. Est-ce que la température a augmenté de façon significative après l an 2000?
Étapes d un test d hypothèse 1 Formuler les hypothèses du test et donner le seuil de signification. 2 Vérifier les conditions d application (TCL) 3 Trouver les points critiques avec une représentation graphique. 4 Énoncer la règle de décision 5 Prendre une décision et émettre une conclusion.
Étapes d un test d hypothèse 1 Formuler les hypothèses du test et donner le seuil de signification. 2 Vérifier les conditions d application (TCL) 3 Trouver les points critiques avec une représentation graphique. 4 Énoncer la règle de décision 5 Prendre une décision et émettre une conclusion.
Les hypothèses (p. 132) H 0 : Hypothèse nulle C est l hypothèse que l on teste et qui est considérée comme étant vraie (jusqu à preuve du contraire). C est la valeur de la moyenne de la population. H 0 : m = m 0 où m 0 est connue
Les hypothèses: H 1 : Hypothèse alternative C est ce qui devra remplacer la moyenne connue de la population si nous rejetons l hypothèse nulle H 0. Il y a 3 types d hypothèses alternatives: B D G 1) H 1 : m m 0 Est-ce qu il y a une différence significative? 2) H 1 : m > m 0 Est-ce qu il y a une augmentation significative? 3) H 1 : m < m 0 Est-ce qu il y a une diminution significative?
Le seuil de signification On le note a Représente la probabilité de rejeter H 0, alors que H 0 est VRAIE. H 0 H 0 vraie Suspect innocent H 0 fausse H 0 Suspect coupable Jury dit Accepte innocent H Bonne 0 décision Bonne décision β Jury dit Rejette coupable H 0 a Bonne Bonne décision décision Connu
p. 133 Test unilatéral à droite D H 0 : m = m 0 H 1 :m > m 0 Zone de rejet α m 0 c X
Test unilatéral à gauche G Zone de rejet α H H : m = m 0 0 : m < m 1 0 c m 0 X
Test bilatéral B H H : m = 0 0 : m m m 1 0 Zone de rejet α/2 Zone de rejet α/2 c 1 m 0 c 2
Étapes d un test d hypothèse 1 Formuler les hypothèses du test et donner le seuil de signification. 2 Vérifier les conditions d application (TCL) 3 Trouver les points critiques avec une représentation graphique. 4 Énoncer la règle de décision 5 Prendre une décision et émettre une conclusion.
Conditions d application: Ce sont les mêmes que pour les intervalles de confiance!!! Utilisation du théorème centrale limite (TCL) n 30 ou X suit une loi normale
Étapes d un test d hypothèse 1 Formuler les hypothèses du test et donner le seuil de signification. 2 Vérifier les conditions d application (TCL) 3 Trouver les points critiques avec une représentation graphique. 4 Énoncer la règle de décision 5 Prendre une décision et émettre une conclusion.
Les points critiques: Tests unilatéraux: 1 seul point critique c Test bilatéral: = m z 2 points critiques 0 c X G c = m z 1 0 c X B ou et c = m z 0 c X D c = m z 2 0 c X z c = c- m 0 s X c = m z 0 c X
Étapes d un test d hypothèse 1 Formuler les hypothèses du test et donner le seuil de signification. 2 Vérifier les conditions d application (TCL) 3 Trouver les points critiques avec une représentation graphique. 4 Énoncer la règle de décision 5 Prendre une décision et émettre une conclusion.
Règle de décision: Elle nous mène à rejeter ou à ne pas rejeter H 0. La règle de décision dépend du type de test et du seuil de signification. 1) Unilatéral droite Zone de rejet α m 0 c x On rejette H 0 si x > c
Règle de décision: 2) Unilatéral gauche Zone de rejet α x c m 0 On rejette H 0 si x < c
Règle de décision: 3) Bilatéral Zone de rejet α/2 Zone de rejet α/2 x c 1 m 0 c 2 x On rejette H 0 si x < c 1 ou x > c 2
Étapes d un test d hypothèse 1 Formuler les hypothèses du test et donner le seuil de signification. 2 Vérifier les conditions d application (TCL) 3 Trouver les points critiques avec une représentation graphique. 4 Énoncer la règle de décision 5 Prendre une décision et émettre une conclusion.
Décision et conclusion: La décision nous dit si l hypothèse nulle est rejetée ou pas. Rejetée: on pourra donc conclure avec l hypothèse alternative. Non rejetée: on ne peut donc pas conclure. Jusqu à preuve du contraire, H 0 reste la valeur considérée.
Exemple A p. 134 Lors d une étude sur l âge moyen à laquelle les femmes du Québec ont leur premier enfant, un enquêteur émet l hypothèse que les Québécoises ont leur premier enfant de plus en plus tard. Pour cela, il vérifie la moyenne d âge des nouvelles mères au Québec de 2000 qui était de 28,4 ans et la compare à la moyenne d âge d un échantillon de 121 femmes qui ont accouché en 2009. X: Âge auquel une femme a son premier enfant HYPOTHÈSES H 0 : m = 28,4 ans H 1 : m > 28,4 ans
Exemple B Un groupe de consommateurs se plaint à l Office de la protection du consommateur. Ils affirment que les pots de café qu ils achètent, de la marque «Réveille vite», ne contiennent pas la quantité indiquée de 1 kilo. X: Quantité de café, en kg, contenue dans un contenant produit par «Réveille vite». HYPOTHÈSES H 0 : m =1kg H 1 : m <1kg
Exemple C La compagnie «Veille tard» produit des boissons énergisantes dont le volume moyen devrait être de 250 ml. Afin de vérifier si la machine qui remplit les contenants est bien calibrée, on prélève 500 canettes au hasard pour en calculer le volume moyen de liquide. X: Volume de liquide dans une canette de la compagnie «Veille tard», en ml. HYPOTHÈSES H 0 : m = 250 ml H 1 : m ¹ 250 ml
Exemple D Une compagnie vendant des souliers désire savoir si le fait de mettre de la publicité dans le métro à Montréal a un effet sur leur volume de ventes. X: Volume de ventes de souliers de la compagnie HYPOTHÈSES H0 : m = m0 H : m > m 1 0
Exemple 8.1.1: Au Canada, l âge moyen des femmes qui accouche était de 29,3 ans en 2007. Doit-on accepter l hypothèse que l âge moyen auquel les femmes accouchent au Canada a diminué si l âge moyen des 49 femmes d un échantillon prélevé aléatoirement en 2010 est de 28,7 ans avec un écart-type corrigé de 0,3 an? Prenez un seuil de signification de 1 %.
1- Hypothèses et seuil X: Âge d une femme qui accouche, en années, au Canada. X : Âge moyen d un échantillon de 49 femmes qui ont accouché, en années, au Canada. H 0 : m = 29,3ans H1 : m < 29,3 ans a = 1% = 0, 01 N = grande x = 28,7 ans s= 0,3ans n= 49 femmes
2- Condition d application n = 49 > 30, donc par le TCL, nous avons que X 2 ~ N( mx, x) où m x = 29,3 ans s 0,3 x = = 0,0429 ans n 49 car N : grande et σ s
3- Point critique Recherche de la cote Z: P(Z<z c )= 1%, donc z c = 2,33 Zone de rejet α = 1% Point critique: 1 0 c z c ) ME 29,3 c = m ME = 29,3 2,33 0, 0429 29, 2000 ans X 0 Z
4- Règle de décision Zone de rejet Nous rejetons H 0 si x < 29, 2 ans. x 29,2 z c 5- Décision et conclusion 29,3 X 0 Z Puisque, x = 28,7 ans < 29,2 ans nous rejetons H 0. Nous avons 1% de chances de nous tromper en affirmant que l âge moyen auquel les femmes au Canada accouchent est inférieur à 29,3 ans en 2010.
Exemple 8.1.2 Le nombre moyen d heures de travail par semaine des étudiants de 15 à 29 ans était de 15,6 heures en 2005 au Québec. Est-il raisonnable de penser que cette moyenne a changé en 2010 si parmi un groupe de 100 étudiants du Collège, le nombre d heures moyen travaillées est de 15,78 heures avec un écart type corrigé de 0,25 heure, avec un seuil de signification de 2,5 %? À votre tour!
1- Hypothèses et seuil X: Nombre d heures de travail rémunéré par semaine des étudiants de 15 à 29 ans en 2010 au Québec. X : Nombre moyen d heure de travail rémunéré par semaine par un groupe de 100 étudiants de 15 à 29 ans en 2010 au Québec. H 0 : m =15,6 heures H 1 : m ¹15,6 heures On met le symbole car on a dans le texte les mots «a changé». N = grande x =15,78 heures s = 0,25 heure n =100 étudiants a = 2,5% = 0, 025
2- Condition d application n = 100 30, par le TCL, nous avons que X 2 ~ N( mx, x) où m =15,6 h x 0, 25 s x = = 0, 025 heures n 100 car N : grande (donc pas de correcteur) et s» s (car s inconnu)
3- Points critiques Recherche de la cote Z: P(Z > z c )=1,25%, donc -z c = 2,24 et z c = 2,24 Zone de rejet α/2=1,25% Zone de rejet α/2=1,25% Points critiques: c 1 z c 15,6 c 2 X 0 z Z c ) ) c 1 = m0 zc x = 15, 6 2, 24 0, 025 = 15,544 heures c = m + z = 15, 6 +2,24 0, 025 = 15, 656 heures 2 0 c ME x
4- Règle de décision Nous rejetons H 0 si x < 15,544 heures ou x > 15, 656 heures. 5- Décision et conclusion Puisque x = 15, 78 heures > 15, 656 heures, nous rejetons H 0. Nous avons 2,5% de chances de nous tromper en affirmant que le nombre moyen d heures de travail rémunérées par semaine des étudiants de 15 à 29 ans en 2010 au Québec est différent de 15,6 heures, soit la valeur de 2005.
b) (p. 137) Si la moyenne de l échantillon avait été de 15,63 heures (x = 15,63 h), quelle aurait été la décision et la conclusion dans cette situation? Décision Comme 15,63 est entre 15,544 et 15,656 x N ESP PAS dans la zone de rejet, donc on ne rejette pas H 0 Conclusion Rien ne porte à croire que le nombre d heures de travail par semaine des étudiants de 15 à 29 ans a significativement changé de 2005 à 2014. ou Jusqu à preuve du contraire, le nombre d heures de travail par semaine des étudiants de 15 à 29 ans n a significativement pas changé de 2005 à 2014.
Devoir Exercices 8,1 : #1 à 4 (p. 138) Finir l exemple 8.1.2