5 APPLICATIONS SUR LES ANALYSES ASSOCIÉES AUX CHAPITRES 12 ET 13 (TESTS DE COMPARAISON ET D INDÉPENDANCE) Exercice 1 : test de comparaison de proportions (voir chapitre 12) Une entreprise souhaite lancer un nouveau produit. Pour cela, elle confie l étude du marché à une société de sondage. Lors du sondage, on demande à 1200 clients potentiels s ils sont prêts à acheter ce nouveau produit et on constate que 120 s y déclarent favorables. Trois mois après, et bien que la fabrication ait commencé, un nouveau sondage réalisé auprès de 1600 clients potentiels permet de constater que seulement 80 s y déclarent favorables. Tester avec un niveau de signification de 5 % l hypothèse H 0 «la proportion de clients potentiels favorables à l achat n a pas sensiblement évolué» contre H 1 «cette proportion a diminué». Autrement dit, p 1 et p 2 désignant respectivement la proportion à la date du premier puis du second sondage, tester H 0 «p 2 = p 1» contre H 1 «p 2 < p 1». Rappel (cf. p. 218) : sous l hypothèse H 0 «p 2 = p 1» (n 1 et n 2 étant grands), on sait que : T 0 = F 1 F 2 = N 0;1 où F = (n 1 F 1 + n 2 F 2 )/(n 1 + n 2 ). F(1 F) (1/n1 ) + (1/n 2 ) Corrigé de l exercice 1 F 1 et F 2 désignant respectivement les propositions aléatoires du premier et du second sondage, on sait que : n 1 F 1 B(n 1 ; p 1 ) et n 2 F 2 B(n 2 ; p 2 ) avec n 1 = 1200 et n 2 = 1600.
2 STATISTIQUES POUR LA GESTION Sous l hypothèse H 0 «p 2 = p 1» (n 1 et n 2 étant grands), on sait que : T 0 = F 1 F 2 = N 0;1 où F = (n 1 F 1 + n 2 F 2 )/(n 1 + n 2 ). F(1 F) (1/n1 ) + (1/n 2 ) Sous l hypothèse alternative H 1 «p 1 > p 2», on constate que F 1 F 2 pr p 1 p 2 > 0 lorsque n 1 et n 2, donc T 0 tend à prendre de grandes valeurs positives. Par suite, le domaine de rejet de H 0, noté δ 0,05, est du type [c α ; [ où c α est défini par la condition : 0,05 = P 0 (T 0 c α ) = P(N 0;1 c α ) = 1 (c α ). On constate que (c α ) = 0,95 c α = 1,65 (cf. p. 427) et donc : δ 0,05 = [1,65; [. F 1 prend la valeur f 1 = 120/1200 = 0,1 ; F 2 prend la valeur f 2 = 80/1600 = 0,05 ; F prend la valeur : f = (120 + 80)/(1200 + 1600) = 0,0714 et donc T 0 prend la valeur t = 0,1 0,05 0,0714 0,9286 (1/1200) + (1/1600) = 5,08. t δ 0,05 donc on rejette H 0 au profit de H 1 et ce avec un risque d erreur négligeable puisque P 0 (T 0 5,08) = P(N 0;1 5,08) = 0. Exercice 2 : test d indépendance du khi-deux (voir chapitre 13) Un dirigeant d une firme automobile offre, pour un certain type de véhicules, trois conditions de paiement à ses clients : un paiement immédiat avec une remise de 15 % (PP 1 ), un crédit gratuit de 12 mois prolongé par un crédit sur 5 ans à 10 % (PP 2 ), un crédit-bail sur 10 ans (PP 3 ). Les trois segments de marché considérés, notés respectivement C 1, C 2 et C 3 sont les 20-30 ans, les 30-55 ans et les plus de 55 ans. Le relevé des ventes des 3000 véhicules vendus au cours des dernières semaines est présenté ci-dessous : PP 1 PP 2 PP 3 C 1 276 548 176 C 2 358 877 265 C 3 166 275 59 À partir de ces données, tester l hypothèse H 0 «le choix du mode de paiement est indépendant de l âge de l acheteur» en utilisant le test du khi-deux avec un niveau de signification de 1 %.
Applications sur les analyses associées aux chapitres 12 et 13 3 Corrigé de l exercice 2 À partir de ces données, tester l hypothèse H 0 «le choix du mode de paiement est indépendant de l âge de l acheteur» en utilisant le test du khi-deux avec un niveau de signification de 1 %. PP 1 PP 2 PP 3 C 1 276 548 176 1000 C 2 358 877 265 1500 C 3 166 275 59 500 800 1700 500 X est partagé en 3 classes (h = 3) et Y en 3 classes (k = 3) ainsi que l indique le tableau ci-dessous. Les 3000 couples de valeurs sont donc répartis entre 6 classes C ij présentées ci-dessous : C 1 :PP 1 C 2 :PP 2 C 3 :PP 3 total n i C 1 effectifs observés n ij n 11 = 276 n 21 = 548 n 31 = 176 n 1 = 1000 effectifs théoriques n * ij n * 11 = 266,66 n 21 * = 566,66 n 31 * = 166,66 C 2 effectifs observés n ij n 12 = 358 n 22 = 877 n 32 = 265 n 2 = 1500 effectifs théoriques n * ij n * 12 = 400 n 22 * = 850 n 32 * = 250 C 3 effectifs observés n ij n 13 = 166 n 23 = 275 n 33 = 59 n 3 = 500 effectifs théoriques n * ij n * 13 = 133,33 n 23 * = 283,33 n 33 * = 83,33 total n j n 1 = 800 n 2 = 1700 n 3 = 500 n = 3000 Les effectifs théoriques : n 11 = n 1 n 1 /3000 = 800 1000/3000 = 266.66,...,n 32 = n 2 n 3 /3000 = 250. Statistique utilisée. Tous les effectifs théoriques nij = ni n j /n étant supérieurs à 5, 3 3 (N ij N i N j /n) 2 sous l hypothèse H 0 on a la propriété Z = = χ 2 4 car N i=1 j=1 i N j /n (h 1)(k 1) = 4 Règle de décision. Le domaine de rejet de H 0 est nécessairement de type [c α, [ où c α est défini par P 0 (Z c α ) = P(χ 2 4 c α) = α = 0,01 soit c = 13,28. La v. a. Z prend la valeur z = (276 266,66) 2 /266,66 + (548 566,66) 2 /566,66 +... +(59 83,33) 2 /83,33 = 22,986. La valeur z prise par Z étant supérieure à 13,28 on décide de rejeter l hypothèse d indépendance des variables X et Y.
4 STATISTIQUES POUR LA GESTION Exercice 3 : test d indépendance de Spearman (voir chapitre 13) Un chercheur s interroge sur l existence éventuelle d un lien entre la confiance des clients et leur satisfaction. Pour cela, il a été demandé à 8 clients d évaluer la confiance dans l entreprise et leur satisfaction en tant que client de celle-ci (ces échelles sont fondées sur la moyenne d items à sept points, c est-à-dire des valeurs de 1 à 7) : Satisfaction Confiance 4,2 1,3 4,8 2,4 6,9 6,5 5,3 2,3 6,2 1,1 4,1 4,2 5 2,7 6,5 2,8 Utilisez le test de Spearman pour tester l hypothèse H 0 «d indépendance entre X la satisfaction et Y la confiance dans la marque» contre l hypothèse «X et Y ne sont pas indépendantes» avec un risque d erreur de première espèce de 10 %. Corrigé de l exercice 3 Réécrivons les couples de valeurs (x i, y i ) prises par (X, Y ) dans l ordre croissant des valeurs prises par X : Valeur x i 4,1 4,2 4,8 5,0 5,3 6,2 6,5 6,9 Valeur y i 4,2 1,3 2,4 2,7 2,3 1,1 2,8 6,5 r i Rang de x i 1 2 3 4 5 6 7 8 s i Rang de y i 7 2 4 5 3 1 6 8 La valeur ρ = Cov(r,s)/σ(r) σ(s) prise par la variable de Spearman ρ S est le coefficient de corrélation des n = 8 couples de valeurs (r i, s i ). On sait que : ρ = 1 6d 2 /(n 3 n) où d 2 = i (r i s i ) 2 [cf. p. 234]. Ici, d 2 = (1 7) 2 + (2 2) 2 + (3 4) 2 + (4 5) 2 + (5 3) 2 + (6 1) 2 donc ρ = 1 6 68/84 = 4/21 = 0,1904. + (7 6) 2 + (8 8) 2 = 68
Applications sur les analyses associées aux chapitres 12 et 13 5 Page 434, on lit pour n = 8 : P 0 (ρ S 0,643) = 0,05 donc P 0 ( ρ S < 0,643) = 0,90. La valeur ρ = 4/21 prise par ρ S étant inférieure à 0,643, on décide d accepter l hypothèse d indépendance. Note. La qualité du test peut s évaluer à partir du niveau de signification observé : P 0 ( ρ S 4/21) = 0,651