8/07/01 Unversté Abdelmalek Essaâd Faculté Polydscplnare de Tétouan LEF Sc. éco. & Geston S6 Régresson Smple Exercces 1 Exercce1: (Mesure d effcactéde la force de vente) Au cours d un mos donné, le représntant d une socétécommercalsantdu matérelde bureau a vsté 56 entreprses répartes dans sept départements. Le tableausuvantndque, départementpar département, le nombre de vstes réalséesde mêmeque les commandesenregstréespendantla pérodecorrespondantemesuréesen mllersde drhams. 1
8/07/01 Département () Nombre de vstes (X) Commandes (Y) 1 4 5 6 7 5 9 10 1 15 7 8 9 9 45 51 Questons: 1. Représenter graphquement le nuage des ponts et donner le modèle de régresson yax+b par la méthode des mondres carrées. Interpréter le résultat.. Calculer les dfférents dsperson selon la lo des écarts.. Détermner le coeffcent de détermnaton et le coeffcent de corrélaton. 4. Représenter l analyse de la varance et le test F 5. S assurer à l ade d un test T de Studentque a est sgnfcatvement dfférente de zéro. 6. Détermner l ntervalle de confance du paramètre a. 7. Prévson de Y pour la valeur X0 et l ntervalle de confance de cette prévson. 4
8/07/01 Soluton 1: 1.- Relaton entre les commandes et le nombre de vstes de représentants Commandes (1000 DH) 60 50 40 0 0 10 0 0 5 10 15 0 Nombres de vstes 5 X Y X Y X X -X (X -X) Y -Y (X -X)(Y -Y) 1 4 5 6 7 5 9 10 1 15 7 8 9 9 45 51 46 81 140 51 90 540 765 4 9 5 81 100 144 5-6 -5-1 4 7 6 5 9 1 4 16 49-1 -9-8 9 15 78 45 4 6 6 105 Total: 56 5 1 588 0 140 0 97 Moy. 8 6 0,4 84 0 0 0 4,4 Les cnq premers colonnes du tableau détallent les calculs nécessares pour obtenr a qu s élève c à,1. En effet, 6
8/07/01 a XY nxy X nx ( X, Y ) Cov Var ( X ) 1 (7)(8)(6),1 588 (7)(64) σ σ XY X 4,4,1 0 b Y ax 6 (,1)(8) 19 Compte tenu de la valeur du paramètreb, égal à19, l équaton de la drote qu représente le meux les relatons entre le nombre de vstesxet le montant des commandes Y est: Y,1 X + 19 7 Ce résultat peut être nterprété de la façon suvante: en l absence de vste, le montant des commandes d un département s élèverat à 19 000 DH; chaquevste d unreprésentantamèneune massede commandes supplémentares d envron 10 DH. 8 4
8/07/01.-Losdes écarts: La lodes écartspermetde relerl erreurassocéeà l hypothèse nulle et l erreur assocée à l hypothèse Ydépendde X. L erreur attachée à l hypothèse nulle est mesurée par la dspersontotaledes Y, c est-à-drepar la sommedes carrésdes écartsdes Y par rapportà la moyenne Y: Dsperson totale ( ) Y Y 9 Dans le cas étudé, l erreur de l hypothèse nulle s élève à 68: Obser vaton X Y Ŷ Y -Y (Y -Y) Ŷ -Y (Ŷ -Y) Ŷ -Y (Ŷ -Y ) 1 4 5 6 7 5 9 10 1 15 7 8 9 9 45 51,7 5,9 9,64 8,1 40,4 44,49 50,85-1 -9-8 9 15 169 81 64 9 9 81 5-1,7-10,61-6,6,1 4,4 8,49 14,85 16 11,57 40,45 4,49 17,98 7,08 0,5 0,7-1,61 1,64-0,88 1,4-0,51-0,51 0,07,59,69 0,77 1,54 0,6 0,0 Total: 68 60,09 7,94 10 5
8/07/01 L erreur attachée à la seconde hypothèse, ou encoredspersonrésduelleestdonnéepar e, sommedes carrésdes écartsentre les observatons Y et les valeursestméesŷ par le modèle: dsperson résduelle Σ(Ŷ -Y ) Dans le tableau précédent, l apparaît que l erreur assocée au modèle est très fable avec e 7,9. 11 La dfférence entre la dsperson totale et la dsperson résduelle correspond à la dsperson explquée par le modèle de régresson, compte tenu du fat que (Y -Y) (Ŷ -Y) +(Ŷ -Y ) On en tre la décomposton suvante: (Y -Y) (Ŷ -Y) + (Ŷ -Y ) relaton connuesousle nom de lodes écarts, nous pouvons écrre: dsperson explquée Σ(Ŷ -Y) Doncon a: dsperson totaledsperson explquée+dsperson résduelle. Pour le problèmeconsdéré, la dsperson explquées élèveà 60,09. 1 6
8/07/01.- Coeffcentsde détermnatonet et de corrélaton: Un premer ndcateurde qualtéde la représentatonconsste à mettreen relatonla dsperson explquée par le modèle et la dsperson totale des données: le coeffcent de détermnaton R mesure le pouvorexplcatfdu modèleen évaluant le pourcentage de l nformaton resttuée par le modèlepar rapportà la qualté d nformaton ntale: R ( Yˆ Y ) ( Y Y ) dsperson exp lquée dsperson totale 1 Avec les données de l exemple précédent, R 60/680,987,l apparaît que le modèle Y,1X+19 resttue 98,7% de l nformaton totale. Le coeffcent de corrélaton est R, racne carré du coeffcent de détermnaton. C est l ndcateur le plus couramment employé. On peut le calculer à l ade de pluseurs formules dfférentes. 14 7
8/07/01 En premer leu, d après la défnton qu vent d être donnée, nous avons: R ( Yˆ Y ) ( Y Y ) Onmontreque R estobtenuégalementà l ade des formules suvantes, où σ X et σ Yreprésentent les écarts-typerespectvesdes X et des Y: R σ σ σ XY et X Y R a σ σ X Y 15 Racne carée de R, c est-à-dre d un chffre au plus égal à 1, Ra une valeur absolue également au plus égale à 1. Rest postf (covarance ou coeffcent de régresson a postfs) ou négatf (cas nverse). Donc -1 R 1. Un R très élevé en valeur absolue concrétseune relaton étrote entre X et Y, crossante s R est postf et décrossante, s R est négatf. 16 8
8/07/01 Dans l exemple étudé, R0,994 ce qu ndque une relaton lnéare presque parfate sur les données observées. Une valeur de Rfable en termes absolus caractérse une absence de relaton lnéare entre Xet Y, mas pas nécessarement l absence de lason entre les varables. 17 4.-Test F: La valeurdu coeffcentde correlatonestcalculéeà partr des données dsponbles, les résultats de sept départementsdansnotreexercce. Un coeffcent de correlaton très élevé, mas obtenu sur peu de données est mons sgnfcatf qu un coeffcent plus fable, mas détermnée sur un grand nombre de données. A la lmte, s nous n avons que deux observatons, R seratégalà 1, masaucuneconclusonnesauraten être dédute. 18 9
8/07/01 Obtenu sur un échantllon de talle rédute, R devrat être rectfé. La formule suvante est utlsée, ou kest le nombre de varables explcatves et n le nombre de données: R1- Dsperson résduelle n-1 Dsperson totale n-k-1 Dans l exemple, k1 et n le nombre d obseravtons est 7. 19 Le test F(analyse de la varance) permet d ntégrer la talle de l échantllon dans l apprécaton de la qualté de la représentaton: F ( Yˆ Y ) ( Yˆ Y ) k n k 1 Dsperson explquée moyenne Dperson résduelle moyenne Dans notre exemple, F95. Cette valeur dot être comparée à celle qu est lue dans une table de Fsher-Snédécor pour k1degré de lberté au numérateur et n-k-17-1-15au dénomnateur à un seul de confance α. 0 10
8/07/01 Pour α0,01, la valeur Fthéorque lue dans la table est de 16,6. Il n y a ans qu une chance sur 100de trouver un Fobservé supéreur à 16,6 lorsque, dans la polpulaton totale des observatons possbles, aucune relaton n exste entre X et Y. Nous sommes c parfatement en drot d admettre la relaton lnéare entre Xet Y, pusque le Fcalculé est largement supéreur au Fthéorque. (vor tableau suvant) 1 Analyse de la varance pour la régresson (test F) Degrés de lberté Somme des carrés Carrés moyens Régresson k1 60,09 Σ(Ŷ -Y) 60,09 9660/1, 59 Erreur n-k-15 7,94 Σ(Ŷ -Y ) 1,59 Total n-16 68 (Y -Y) F 0,01 16,6 F 11
8/07/01 5.- Valdtédes des coeffcents: Les tests précédents permettent d avor une dée de la valdté de la régresson dans son ensemble. Il mporte de connaître également la valdté des coeffcents du modèle, c est-à-dre de adans le cas de la régresson lnéare smple. Cette valdté est vérfée par le bas du test tet à travers le calcul d ntervalles de confance. On défnt l erreur standard sur a comme S a S XY X nx Où S XY est l écart-type des erreurs du modèle avec: S XY ( Y Yˆ ) n A partr des chffres de notre exemple, l apparaît que: 7,94 S XY 1,59 1,6 5 et S a 1,6/11,80,106 4 1
8/07/01 S l onadmetque les valeursà estmerà partr de dfférentséchantllonsd observatonssuventune lode Studentd écart-type S a, nouspouvons évaluer la probablté que la valeur a sot dfférente de zéro. a 0 t S a nousdonnele nombre d écarts-typequséparentla valeur observée de 0. tmesure ansle degréde rareté, dansune populaton où la valeur de a est 0, d échantllons d observatonspourlesquels aa 0 (c a 0,1). a S a 5 Dansnotreexemple, t,1 / 0,106 0, ce qucompré auchffrelusur la tablede Studentpour n-k-17-5degrésde lberté (,65avecun seulde confancede 0,01) paraît très sgnfcatf.(vor table) 6.- L ntervalle de confance de a est obtenu selonune procédurevosne. S t α estle nombre d écarts-types correspondant au seul de confanceα, ly a une probablté (1-α)que la valeur de a sot comprse dans l ntervalle [a-t α/ S a ; a+t α/ S a ]. 6 1
8/07/01 Il y a ans 99% de chances que la valeur de a de notre problème sot comprse dans l ntervalle, [,1-4(0,106);,1+ 4(0,106) ], pusque t 0,005 4 pour 5 degrés de lberté. 7 7.-Ils agratde prévorquelleseratl mportancedes commandes pour un nombre de vstes de représentants donné. Cec peutêtreréalséen donnantà X, dansle modèle, la valeurchose. Ans, X0 vstes devraentamener, selonle modèle, 61 400 DH de commandesen moyenne, pusque61,4,1(0)+19. 8 14
8/07/01 En fat, l faut tenr compte de ce que le modèle a été construt à partr d un échantllon de données et qu l exste de toute façon un certan aléa sur les relatons entre Xet Y. Yˆ La prévson de Ydot s accompagner de la défnton d un ntervalle de confance: à un seul de confance α, la valeur de Ypour XX 0 est comprse dans l ntervelle X t α S XY 1 + n ( X 0 X ) 1 ( X 0 X ) ; Yˆ + t S + X α XY 0 X nx n X n 0 X 9 Où, onle rappelle, S XY estl écart-typedes erreursdu modèle. L ntervalle de confance est d autant plus mportant que - S XY estélevé; - n est fable; - X estélognéde la moyenne. Pour X 0 0 et α0,01, Y61,4±4(1,6) Sot Y61,4±5,9. 1 7 140 La régressonlnéaresmple nous a permsde présenterles aspects prncpaux des technques de régresson qu peuvent être utlsées dans l élaboraton de modèles de prévson. + 1 0 15
8/07/01 Exercce : On s ntéresse dans un secteur de producton à la relaton entre les bénéfces réalsés par les entreprses et le budget annuel qu elles consacrent à la publcté. 15 observatons ont été réalsées: Budget de publcté 15 8 6 41 16 8 1 1 5 10 17 58 6 0 Bénéfces 48 4 77 89 50 40 56 6 100 47 71 58 10 5 60 1 Questons: a) On veut établr une régresson lnéare entre les deux varables, quelle dot être la varable endogène? b) On admet l exstence d une relaton lnéare de la forme y ax +b+εcalculez les estmatons des coeffcents a et b. c) Calculer r l estmaton du coeffcent de corrélaton R. d) Précsez l équaton d analyse de la varance, calculer ses valeurs et en dédure le coeffcent de détermnaton. e) Sachant que ˆ σ ε 10,155, procédez à l estmaton des varances de â et de bˆ. 16
8/07/01 Questons: (sute) f) Détermnez au seul de sgnfcaton de 0,05, un ntervalle de confance pour a, un ntervalle de confance pour b, et un ntervalle de confance pour σˆε. g) Peut-on affrmer que les coeffcents a et b sont sgnfcatvement dfférents de 0 pour α0,05? h) Détermnez un ntervalle de confance pour le bénéfce prévsble relatf à une entreprse qu consacre un budget de 48 à son programme publctare. (α0,05). Soluton : a) La varable endogène Y correspond aux bénéfces qu sont exprmés en foncton du budget de publcté X. b) Vor tableau aˆ ( X Y ) ( X ) nxy bˆ Y ax ˆ nx 4 17
8/07/01 X Y X Y X Y 15 48 5 04 70 8 4 64 1849 44 6 77 196 599 77 41 89 1681 791 649 16 50 56 500 800 8 40 64 1600 0 1 56 441 16 1176 1 6 441 844 10 5 100 809 10000 500 10 47 100 09 470 71 104 5041 7 17 58 89 64 986 58 10 64 10404 5916 6 5 6 15 10 0 60 400 600 100 6 98 1490 6496 747 5 n 15 X 6 4,1 X 58,6 15 Y 98 15 6,5 747 15 4,1 6,5 a ˆ 1,8 1490 15 58,6 b ˆ 6,5 1,8 4,1 1,67 Yˆ 1,8 X + 1,67 6 18
8/07/01 Y X X ( X X ) Y Y ( Y Y ) Yˆ Yˆ Y ( Yˆ Y ) Y Y ( Yˆ Y ) 15 48-9,1 8,6-14,5 11,1 50,87-11,66 15,96,87 8,4 8 4-16,1 60,18-19,5 81,4 41,91-0,6 45,18-1,09 1,19 6 77 11,87 140,90 14,47 09,8 77,75 15, 1,65 0,75 0,56 41 89 16,87 84,60 6,47 700,66 84,15 1,6 467,4-4,85,5 16 50-8,1 66,10-1,5 157,00 5,15-10,8 107,74,15 4,6 8 40-16,1 60,18 -,5 507,60 41,91-0,6 45,18 1,91,65 1 56 -,1 9,80-6,5 4,64 58,55 -,98 15,84,55 6,50 1 6 -,1 9,80-0,5 0,8 58,55 -,98 15,84 -,45 11,90 5 100 8,87 8,48 7,47 1404,00 99,51 6,98167,5-0,49 0,4 10 47-14,1 199,66-15,5 41,18 44,47-18,06 6,16 -,5 6,40 71 7,87 61,94 8,47 71,74 7,6 10,1 10,01 1,6,66 17 58-7,1 50,84-4,5 0,5 5,4-9,1 8,81-4,57 0,88 58 10,87 1147,18 9,47 1557,88 105,91 4,81881,8,91 15,9 6 5-18,1 8,70-7,5 757,90 9,5 -,18 57,1 4,5 18,9 X 0 60-4,1 17,06 -,5 6,40 57,7-5,6 7,67 -,7 7,45 6 98 75,7 669,7 6150,1 1,01 7 c) ( X Y ) R nσ σ X Y nxy σ X σ Y 75,7 ( X ) 15, 8 1 X n 15 669,7 ( Y ) 0, 44 1 Y n 15 R 0,989 8 19
8/07/01 d) Dsperson totale: Dsperson explquée: Dsperson résduelle: ( Y ) Y 669, 7 ( ˆ Y ) Y 6150, 1 ( ) Y ˆ Y 1, 01 669,76150,1+1,01 9 Le coeffcent de détermnaton est: R 617,7 669,7 0,9789 Ce coeffcent est proche de 1, on peut en dédure que la varablté explquée par drote de régresson est satsfasante. 40 0
8/07/01 e) On a ˆ 10,155 σ ε Alors, et S ( a) ˆ σ ε X ˆ aˆ Var Var ( bˆ ) ˆ σ ε ( X ) 1 X + n X ( X ) 0,007,56 41 f) Intervalle de confance pour σˆε ˆ ε ˆ σ ε La varable ( n ) σ sut une lo ε σ ε à (n-) degrés de lberté. Donc, on part de ˆ σ ε P A < ( n ) < B α σ 1 ε L ntervalle de confance pour χ σˆε est alors: I ˆ σ ˆ ( n ) ε σ ε ;( n ) B A [ 5,6; 6,5] 4 1
8/07/01 L ntervalle pour a: avec t lue sur la table de Studentà n-1 degré de lberté. (t,16). I [ 1,166; 1,91] Intervalle pour b: I [ 8,4; 4,916] [ aˆ t ˆ σ ; aˆ t σ ] aˆ ˆ 1 α + 1 α aˆ [ ] bˆ t ˆ σ ; bˆ t σ bˆ ˆ 1 α + 1 α bˆ 4 g) Le t emprque de Studentest donné par, ˆ σ aˆ on compare la valeur de ce rapport avec t,16. On trouve qu l est supéreur en valeur absolue à,16pour les deux paramètres aet b. Donc ces paramètres sont sgnfcatvement dfférents de 0. La varable exogène contrbue ben à explquer Y. (,16 < <,16 ) 0, 95 P t ( 1) aˆ 44
8/07/01 h) ( ax 1 ( x0 x) 1+ + n x ;( ax 1 ( x0 x) 1+ + n I( Y ) 0 + b) t1 0 + ) + 0 α S b t1 α S x I [(1,8 48+ 1,67),16 1,5;(1,8 48+ 1,67) +,16 1,5] ( Y 48 ) I ( Y 48 ) [ 85,45; 100,65] 45 Exercce 1: Références: Jean-Perre Vedrne, «Technques Quanttatves de Geston», Vubert geston. Exercce : Kamal Abdelllah, «Sondages et tests Statstques» Fédala, 1998 46