UNIVERSITE de NICE - SOPHIA ANTIPOLIS Institut Supérieur d Economie et de Management ANNÉE UNIVERSITAIRE : 2013-2014 REF. ANNÉE D ÉTUDE : L2 MATIÈRE : PROBABILITÉS, STATISTIQUES ENSEIGNANT : Julien BARRÉ THÈME DE LA SÉANCE : Tests d hypothèses : comparaison à une norme. Fiche TD 6 - L2 Économie-Gestion Exercice 1 : (Choix des hypothèses; Anderson) Un responsable d une concession automobile cherche à mettre en place un nouveau système de bonus, et souhaite étudier son effet sur le volume moyen des ventes. Avant la mise en place du bonus, chaque membre du personnel chargé de la vente vendait en moyenne 12 véhicules par mois. Un échantillon du personnel chargé de la vente applique le nouveau système de bonus pendant un mois. a. Déterminer les hypothèses nulle et alternative les plus appropriées pour cette recherche. On veut prouver que le nouveau système fait augmenter les ventes. On note µ le nombre moyen de véhicules vendus par membre du personnel. On choisit donc H 0 = le volume moyen des ventes n augmente pas avec les nouveau système : µ 12. H a = le volume moyen des ventes augmente avec les nouveau système : µ > 12. b. A quoi correspondent les erreurs de première et seconde espèce dans ce cas? Erreur de première espèce : on conclut que µ > 12 alors que µ 12 = on conclut à tort que le nouveau système fait augmenter le niveau moyen des ventes. Erreur de seconde espèce : on conclut que µ 12 alors que µ > 12 = on conclut à tort que le nouveau système est inefficace. c. Quelles sont les conséquences d une erreur de première espèce? De seconde espèce? Si on fait une erreur de première espèce, on mettra en place le nouveau système de bonus, alors qu il est inefficace, et peut-être coûteux. Si on fait une erreur de seconde espèce, on renoncera à le mettre en place, alors qu il aurait peut-être été intéressant. Exercice 2 : (Choix des hypothèses; Anderson) Une chaîne de production est conçue pour remplir un barril de lessive avec 3kg de produit. Un échantillon de barrils est périodiquement sélectionné, pour déterminer s il y a sur- ou sous-remplissage. Dans ce cas, la chaîne de production est fermée et ajustée. a. Déterminer les hypothèses nulle et alternative à utiliser. Hypothèse nulle : la quantité moyenne µ de lessive dans les barrils est 3kg (c est-à-dire : la chaîne est bien réglée). Hypothèse alternative : µ 3kg, la chaîne est mal réglée. b. A quoi correspondent les erreurs de première et seconde espèce dans ce cas? Erreur de première espèce : on conclut que la chaîne est mal réglée alors qu elle est bien réglée.
Erreur de seconde espèce : on conclut à tort que la chaîne est bien réglée. c. Quelles sont les conséquences d une erreur de première espèce? De seconde espèce? Si on fait une erreur de première espèce, on va arrêter la chaîne pour rien, ce qui coûte probablement de l argent. Si on fait une erreur de seconde espèce, on va produire un certain nombre de barrils avec une chaîne mal réglée. Exercice 3 : (Moyenne d une population, σ connu) H 0 : µ = 6 ; H a : µ 6 Un échantillon de taille n = 80 fournit une moyenne d échantillon de 5, 8. L écart-type de la population est connu, égal à 1. Effectuer le test, avec un seuil de signification α = 0.05, en expliquant les différentes étapes. L écart-type de la population est connu, on utilisera donc la loi normale pour calculer valeur p et valeur critique; la taille de l échantillon est suffisante pour qu on puisse effectuer un test. On calcule la statistique de test : z = 80(5.8 6)/1 1.79 Méthode de la valeur p : C est un test bilatéral, donc la probabilité d obtenir une statistique de test au moins aussi improbable que 1.79, en supposant que H 0 est vraie, est égale à P ( Z > 1.79), pour Z une va de loi N (0, 1). On obtient comme valeur p : 0.0734. Conclusion : on conserve H 0 au seuil de signification 0.05. Méthode de la valeur critique : On souhaite un seuil de signification 0.05, pour un test bilatéral. La valeur critique z c est donc définie par P ( Z > z c ) = 0.05, où Z est une va de loi N (0, 1). On en déduit que z c = 1.96.On rejette l hypothèse H 0 si la statistique de test z est inférieure à z c ou supérieure à z c (zone de rejet :], z c [ ]z c, + [). Dans ce cas, 1.79 n est pas dans la zone de rejet, on conserve donc H 0. Exercice 4 : (Moyenne d une population, σ connu) H 0 : µ 14 ; H a : µ < 14 Un échantillon de taille n = 120 fournit une moyenne d échantillon de 13.6. L écart-type de la population est connu, égal à 2. Effectuer le test, avec un seuil de signification α = 0.02, en expliquant les différentes étapes. L écart-type de la population est connu, on utilisera donc la loi normale pour calculer valeur p et valeur critique; la taille de l échantillon est suffisante pour qu on puisse effectuer un test. On calcule la statistique de test : z = 120(13.6 14)/2 2.19
Méthode de la valeur p : C est un test unilatéral inférieur, donc la probabilité d obtenir une statistique de test au moins aussi improbable que 2.19, en supposant que H 0 est vraie, est égale à P (Z < 2.19), pour Z une va de loi N (0, 1). On obtient comme valeur p : 0.0143. Conclusion : on accepte H a au seuil de signification 0.02. Méthode de la valeur critique : On souhaite un seuil de signification 0.02, pour un test unilatéral inférieur. La valeur critique z c est donc définie par P (Z < z c ) = 0.02, où Z est une va de loi N (0, 1). On en déduit que z c = 2.06.On rejette l hypothèse H 0 si la statistique de test z est inférieure à z c (zone de rejet :], z c [). Dans ce cas, on rejette donc H 0, et on accepte H a. Exercice 5 : (Moyenne d une population, σ inconnu) H 0 : µ 34 ; H a : µ < 34 On sait que la population a une distribution normale. Un échantillon de taille n = 16 fournit une moyenne d échantillon de 31, et un écart-type d échantillon de 5. Effectuer le test, avec un seuil de signification α = 0.05, en expliquant les différentes étapes. L écart-type de la population est inconnu, on utilisera donc une loi de Student pour calculer valeur p et valeur critique; l échantillon est petit, mais on sait que la population suit une loi normale; on peut donc tout de même effectuer un test. On calcule la statistique de test : t = 16(31 34)/5 2.4 Méthode de la valeur p : C est un test unilatéral inférieur, donc la probabilité d obtenir une statistique de test au moins aussi improbable que 2.4, en supposant que H 0 est vraie, est égale à P (T < 2.4), pour T une va de loi de Student à 15 degré de liberté. On obtient comme valeur p une probabilité comprise entre 0.025 et 0.01. Conclusion : on accepte H a au seuil de signification 0.05. Méthode de la valeur critique : On souhaite un seuil de signification 0.05, pour un test unilatéral inférieur. La valeur critique t c est donc définie par P (T < t c ) = 0.05, où T est une va de loi de Student à 15 degrés de liberté. On en déduit que t c = 1.753.On rejette l hypothèse H 0 si la statistique de test t est inférieure à t c (zone de rejet :], t c [). Dans ce cas, on rejette donc H 0, et on accepte H a. Exercice 6 : (Moyenne d une population, σ inconnu) H 0 : µ = 12 ; H a : µ 12 Un échantillon de taille n = 100 fournit une moyenne d échantillon de 12.25, et un écart-type d échantillon de 1.
Effectuer le test, avec un seuil de signification α = 0.01, en expliquant les différentes étapes. L écart-type de la population est inconnu, on utilisera donc a priori une loi de Student pour calculer valeur p et valeur critique. La taille de l échantillon est suffisante pour qu on puisse effectuer un test, même si la population ne suit pas une loi normale (n = 100). Pour n = 100, la différence entre loi de Student et loi normale est faible; on pourra donc aussi utiliser une loi normale pour calculer valeur p et valeur critique. On calcule la statistique de test : t = 100(12.25 12)/1 = 2.5 Méthode de la valeur p : C est un test bilatéral donc la probabilité d obtenir une statistique de test au moins aussi improbable que 2.5, en supposant que H 0 est vraie, est égale à P ( T > 2.5), pour T une va de loi de Student à 99 degré de liberté. On obtient comme valeur p une probabilité comprise entre 0.01 et 0.02 (en utilisant la table d une loi de Student à 100 degrés de liberté, proche de celle d une loi de Student à 99 degrés de liberté; en utilisant la loi normale, assez proche aussi d une loi de Student à 99 degrés de liberté, on obtient une valeur p de 0.0124) Conclusion : on conserve H 0 au seuil de signification 0.01. Méthode de la valeur critique : On souhaite un seuil de signification 0.01, pour un test bilatéral. La valeur critique t c est donc définie par P ( T > t c ) = 0.01, où T est une va de loi de Student à 99 degrés de liberté. On en déduit que t c 2.63 (table de la loi de Student à 100 ddl).on rejette l hypothèse H 0 si la statistique de test t est inférieure à t c ou supérieure à t c (zone de rejet :], t c [ ]t c, + [). Dans ce cas t = 2.5, on conserve donc H 0. Remarque : pour n = 100, on peut aussi dire que la loi de Student à 99 degrés de liberté est proche d une loi normale centrée réduite, et utiliser la table de la loi normale; on fera seulement une petite erreur; on obtiendrait t c = 2.58. Exercice 7 : (Proportion d une population) On considère le test d hypothèses suivant, où µ désigne la proportion d une population : H 0 : µ 0.6 ; H a : µ > 0.6 a. Un échantillon de taille n = 200 a fournit une proportion d échantillon de.67. Calculer la valeur p et conclure, pour un seuil de signification α = 0.05. L échantillon est assez grand pour qu on puisse effectuer le test (n 0.6 > 10, n 0.4 > 10). La statistique d échantillon est z = 200(0.67 0.6)/ 0.6 (1 0.6) 2.02 La valeur p est P (Z > 2.02), avec Z une va de loi normale centrée réduite. Donc la valeur p est environ 0.0217. On accepte donc l hypothèse H a. b. Même question pour une proportion d échantillon de 0.62. La statistique d échantillon est z = 200(0.62 0.6)/ 0.6 (1 0.6) 0.577
La valeur p est P (Z > 0.577), avec Z une va de loi normale centrée réduite. Donc la valeur p est environ 0.28. On ne rejette donc pas l hypothèse H 0. c. Même question pour une proportion d échantillon de 0.57. La statistique de test est négative, et on effectue un test unilatéral supérieur... Clairement, les données ne fournissent aucun support pour H a, et on ne rejette donc pas H 0 : on obtient cette conclusion sans calcul. Exercice 8 Une machine découpe des tiges en acier, d une longueur moyenne supposée d 1m. On souhaite vérifier si la machine est correctement réglée. 988 997 995 989 997 985 1000 995 1002 990 Qu en pensez-vous au vu des observations ci-dessus (en mm)? On supposera que la longueur d une tige suit une loi normale N (µ, σ 2 ). On note µ la longueur moyenne des tiges. On va effectuer un test bilatéral, avec un seuil de signification α = 0.05. H 0 : µ = 1000 H a : µ 1000 La moyenne d échantillon x = 993.8. L écart-type d échantillon est s 5.55. La statistique de test est donc t = 10(993.8 1000)/5.55 3.53 La valeur p (calculée à l aide d une distribution de Student à 9 degrés de liberté, puisque la variance de la population est inconnue) est donc P (T > 3.53) + P (T < 3.53) < 0.01. Au seuil de signification 0.05, on peut accepter H a, ie la machine est déréglée. Exercice 9 (Comparaison de moyennes) : On considère deux populations, d écarts-types connus σ 1 = 2.2 et σ 2 = 3.0. On donne les résultats issus de deux échantillons aléatoires indépendants, issus de deux populations : 1- taille n 1 = 50 ; moyenne d échantillon x 1 = 9.0. 2- taille n 2 = 70 ; moyenne d échantillon x 2 = 9.5. a. Quelle est l estimation ponctuelle de l écart entre les moyennes µ 1 et µ 2 des deux populations? L estimation ponctuelle de µ 1 µ 2 est x 1 x 2 = 0.5. b. On considère le test d hypothèses suivant : H 0 : µ 1 µ 2 0 ; H a : µ 1 µ 2 < 0. Calculer la valeur de la statistique de test, et la valeur p. Quelle est votre conclusion, au seuil α = 0.05? Les écarts-types des population sont connus. L estimateur X 1 X 2 suit une loi approximativement normale, d espérance µ 1 µ 2 et de variance connue σ 2 = σ 2 1/n 1 + σ 2 2/n 2 =.2254. On utilise donc comme statistique de test Z = ( X 1 X 2 )/σ, de loi normale centrée réduite. La statistique de test calculée à partir de l échantillon est z 1.05. La valeur p est la probabilité qu une va de loi normale centrée réduite soit inférieure à z. On trouve 0.1469. Au seuil α = 0.05, on ne rejette donc pas H 0. Exercice 10 (Comparaison de moyennes) : On considère deux populations, d écarts-types inconnus. On donne les résultats issus de deux échantillons aléatoires indépendants, issus de deux populations : 1- taille n 1 = 120 ; moyenne d échantillon x 1 = 21.5; écart-type d échantillon s 1 = 3.1. 2- taille n 2 = 100 ; moyenne d échantillon x 2 = 20.5; écart-type d échantillon s 2 = 2.5.
a. Quelle est l estimation ponctuelle de l écart entre les moyennes µ 1 et µ 2 des deux populations? Estimation ponctuelle de µ 1 µ 2 : x 1 x 2 = 1. b. On considère le test d hypothèses suivant : H 0 : µ 1 µ 2 0 ; H a : µ 1 µ 2 < 0. Calculer la valeur de la statistique de test, et la valeur p. Quelle est votre conclusion, au seuil α = 0.05? Les échantillons sont suffisamment grands (n 1, n 2 100) pour que l on puisse considérer que n 1 ( X 1 µ 1 )/ s 1 et n 2 ( X 2 µ 2 )/ s 2 suivent approximativement des lois normales centrées réduites. Alors X 1 X 2 suit approximativement une loi normale d espérance µ 1 µ 2 et de variance s 2 1/n 1 + s 2 2/n 2 0.1426; écart-type s 0.378. La statistique de test est z = ( x 1 x 2 )/ s 2.65. La valeur p est la probabilité qu une va de loi normale centrée réduite prenne une valeur plus petite que z. On obtient 0.996... Bien sûr, on conserve H 0. On pouvait obtenir ce résultat dès le début, puisque les données de l échantillon favorisent H 0. c. On considère maintenant le test d hypothèses suivant : H 0 : µ 2 µ 1 0 ; H a : µ 2 µ 1 < 0. Calculer la valeur de la statistique de test, et la valeur p. Quelle est votre conclusion, au seuil α = 0.05? La statistique de test est la même, z 2.65; cette-fois, la valeur p est la probabilité qu une va de loi normale centrée réduite prenne une valeur plus grande que z. On obtient 0.004. On accepte donc H a. Exercice 11 (Comparaison de proportions; Anderson) : Dans un test sur la qualité de deux publicités, chacune a été diffusée dans une zone test spécifique 6 fois en une semaine. La semaine suivante, une enquête téléphonique a identifié les personnes qui ont vu les publicités. On a ensuite demandé à ces personnes d énoncer le slogan de la publicité qu ils avaient vue. L enquête a fourni les résultats suivants : - Nombre de personnes ayant vu la publicité A : 150; nombre de personnes se souvenant du slogan 63. - Nombre de personnes ayant vu la publicité B : 200; nombre de personnes se souvenant du slogan 60. Tester l hypothèse selon laquelle il n y a pas d écart entre les proportions de personnes se souvenant du slogan des publicités, au seuil de signification 0.05. La proportion dans l échantillon A est p A = 0.42; dans l échantillon B : p B = 0.3 On définit le test : H 0 : p A = p B ; H a : p A p B Si H 0 est vraie, p A = p B = p; on estime p par p = (n A p A + n B p B )/(n A + n B ). l estimateur P A P B a une distribution proche de N (0, σ 2 ) (application du TCL), avec σ 2 = p(1 p)(n A + n B )/(n A n B ). On estime σ en remplaçant p par p. La statistique de test (qui est distribuée suivant une loi normale centrée réduite) est donc na n B PA Z = P B n A + n B p(1 p) Pour les données de l énoncé, on obtient z 2.326. Au seuil α = 0.05, pour un test bilatéral, la zone de rejet est ], z α/2 [ ]z α/2, + [=], 1.96[ ]1.96, + [
z est dans la zone de rejet, donc on rejette H 0.