UE4 : Bostatstques Chaptre 8 Corrélato et régresso léare smple José LABARERE Aée uverstare 20/202 Uversté Joseph Fourer de Greoble - Tous drots réservés.
Pla I. Corrélato et régresso léare II. Coeffcet de corrélato III. Régresso léare smple Aexes
Pla I. Corrélato et régresso léare. Nature des varables 2. Corrélato versus régresso : exemples 3. Codtos d applcato II. Coeffcet de corrélato III. Régresso léare smple Aexes
I.. Nature des varables Le terme de corrélato est utlsé das le lagage courat pour désger la laso (relato / assocato) etre 2 varables quelcoques. E statstque, le terme de corrélato est réservé pour désger la laso etre 2 varables QUANTITATIVES (le plus souvet cotues). Corrélato / régresso : laso etre 2 varables quattatves
Pla I. Corrélato et régresso léare. Nature des varables 2. Corrélato versus régresso : exemples 3. Codtos d applcato II. Coeffcet de corrélato III.Régresso léare smple Aexes
I.2. Corrélato versus régresso Corrélato : Laso etre 2 varables quattatves X et Y Rôle symétrque (o peut permuter X et Y) Rôle asymétrque Régresso : Laso etre 2 varables quattatves X et Y Rôle asymétrque uquemet : X = varable explcatve / Y = varable explquée X = varable dépedate / Y = varable dépedate (o e peut pas permuter X et Y)
I.2. Corrélato versus régresso. Exemple : corrélato (postve) X = vetes de pares de luettes de solel e été Y = vetes de crèmes glacées e été Il exste ue laso etre X et Y : Quad X augmete, Y augmete (météo estvale) Quad X dmue, Y dmue (météo pluveuse) La laso est symétrque : X est lée à Y, et Y est lée à X mas X e déped pas de Y et Y e déped pas de X o peut permuter X et Y e abscsses et e ordoées Y e peut pas être prédte par X vetes luettes vetes glaces vetes glaces vetes luettes
I.2. Corrélato versus régresso 2. Exemple : corrélato (égatve) X = vetes de pares de luettes de solel e été Y = vetes de paraplues e été Il exste ue laso etre X et Y : Quad X augmete, Y dmue (météo estvale) Quad X dmue, Y augmete (météo pluveuse) La laso est symétrque : X est lée à Y, et Y est lée à X mas X e déped pas de Y et Y e déped pas de X o peut permuter X et Y e abscsses et e ordoées Y e peut pas être prédte par X vetes paraplues vetes luettes vetes luettes vetes paraplues
I.2. Corrélato versus régresso 3. Exemple : régresso X = âge (de 0 à 5 as) Y = talle (cm) Il exste ue laso etre X et Y : Quad l âge augmete, la talle augmete Quad l âge dmue, la talle dmue La laso est asymétrque : la talle déped de l âge mas l âge e déped pas de la talle o e peut pas permuter X et Y e abscsses et e ordoées O peut prédre la talle par l âge à l ade d ue équato de drote ou de courbe de régresso (cf caret de saté)
I.2. Corrélato versus régresso Varables Corrélato X = quattatve Y = quattatve Régresso X = quattatve Y = quattatve Symétre de la laso Exemples Ou / No Y lée à X X lée à Y Y = coso. caabs X = température moyee auelle No Y déped de X - Y= talle X = âge Prédcto No Ou (équato)
Pla I. Corrélato et régresso léare. Nature des varables 2. Corrélato versus régresso : exemples 3. Codtos d applcato II. Coeffcet de corrélato III. Régresso léare smple Aexes
I.3. Codtos d applcato de la corrélato et de la régresso léare smple Idépedace des observatos Laso léare etre X et Y Dstrbuto codtoelle ormale et de varace costate
I.3. Codtos d applcato de la corrélato et de la régresso léare smple. Idépedace des observatos Ne pas cofodre : - Idépedace des observatos (codto d applcato du test statstque) - Idépedace des varables (hypothèse à tester)
Observatos dépedates (et varables corrélées) Efat Efat 2 Efat 3 Efat 4 Efat 5 Efat 3 mos 60cm 3 mos 58cm 9 mos 70cm 8 mos 70cm 24 mos 85cm 6 mos 65cm Observatos corrélées (et varables corrélées) er ju 2 ju 3 ju 4 ju 5 ju er octobre 00hpa 30.5 C 03hpa 29.5 C 04hpa 30.5 C 00hpa 3 C 009hpa 29 C 002hpa 8 C
I.3. Codtos d applcato de la corrélato et de la régresso léare smple 2. Laso léare etre X et Y Avat d applquer le test du coeffcet de corrélato ou d estmer la drote de régresso, l faut vérfer - emprquemet (graphquemet) - que la laso etre les 2 varables est de ature léare. A défaut, l terprétato du test du coeffcet de corrélato ou du test de la pete de la drote de régresso peut être erroée.
Coeffcet de corrélato ul Pete de la drote de régresso ulle Cas La ature de la laso est léare (le uage de pots est résumé au meux par ue drote horzotale d équato y = a) La codto d applcato est vérfée Il est possble d utlser le coeffcet de corrélato et la régresso léare smple pour quatfer la laso etre les 2 varables (cocluso : X et Y sot dépedats [Y costat quelle que sot la valeur de X])
Coeffcet de corrélato ul Pete de la drote de régresso ulle Cas 2 Il exste ue laso etre X et Y mas cette laso est pas léare : Y vare avec les valeurs de X. Le uage de pots est pas résumé au meux par ue drote mas plutôt par ue focto quadratque. La codto d applcato est pas vérfée Il e faut pas utlser le coeffcet de corrélato la régresso léare smple pour quatfer la laso etre les 2 varables
Coeffcet de corrélato o ul Pete de la drote de régresso o ulle Cas 3 La ature de la laso est léare (le uage de pots est résumé au meux par ue drote d équato y = a+bx) La codto d applcato est vérfée Il est possble d utlser le coeffcet de corrélato et la régresso léare smple pour quatfer la laso etre les 2 varables (cocluso : l exste ue laso léare etre X et Y)
Coeffcet de corrélato o ul Pete de la drote de régresso o ulle Cas 4 La ature de la laso est pas léare (le uage de pots est pas résumé au meux par ue drote mas plutôt par ue focto expoetelle) La codto d applcato est pas vérfée Il e faut pas utlser le coeffcet de corrélato la régresso léare smple pour quatfer la laso etre les 2 varables
I.3. Codtos d applcato de la corrélato et de la régresso léare smple 3. Dstrbuto codtoelle ormale et de varace costate Dstrbuto de Y ormale et de varace costate pour chaque valeur de X (dffclemet vérfable e pratque)
La varace de Y est pas costate pour les dfféretes valeurs de X La dstrbuto de Y est pas ormale pour X = x4 La codto d applcato est pas vérfée
Pla I. Corrélato et régresso léare II. Coeffcet de corrélato. Covarace 2. Coeffcet de corrélato et terprétato 3. Estmato du coeffcet de corrélato 4. Test du coeffcet de corrélato III. Régresso léare smple Aexes
II.. Covarace X var N µ X N µ X µ X X,X cov N 2 X N X X N µ Y µ X X,Y cov N Y X Varace cojote de 2 varables X et Y Cas partculer : X = Y cov(x,y) = cov(x,x) = var(x)
II.. Covarace X et Y dépedates cas partculer Y costat quelle que sot la valeur de X cov X, Y N X µ Y µ X N Y 0 0 car Y = costate =µ Y
II.. Covarace y x y x X,Y cov x x X var 2 2 Equvalet de la formule de Huyghes pour la covarace Rappel :
Pla I. Corrélato et régresso léare II. Coeffcet de corrélato. Covarace 2. Coeffcet de corrélato et terprétato 3. Estmato du coeffcet de corrélato 4. Test du coeffcet de corrélato III. Régresso léare smple Aexes
II.2. Coeffcet de corrélato Le coeffcet de corrélato etre 2 varables quattatves X et Y est égal au rapport de la covarace de X et Y dvsé par le produt des écart-types de X et Y. Le coeffcet de corrélato est oté ρ das la populato. ρ covx,y varxvary - ρ +
II.2. Iterprétato du coeffcet de corrélato. X et Y dépedates : ρ = 0 ρ = 0 Y = fluctue autour d ue costate quelle que sot la valeur de X Nuage de pots horzotal cov(x, Y) = 0 ρ cov var X,Y XvarY 0
II.2. Iterprétato du coeffcet de corrélato 2. X et Y corrélées : ρ > 0 Laso léare crossate etre X et Y ρ > 0 cov(x, Y) > 0 ρ cov var X,Y XvarY 0 NB : s Y = X cov(x,y) = var(x) et var(y) = var(x) ρ =
II.2. Iterprétato du coeffcet de corrélato 2. X et Y corrélées : ρ < 0 ρ < 0 Laso léare décrossate etre X et Y cov(x, Y) <0 ρ cov var X,Y XvarY 0 NB : s Y = - X cov(x,y) = - var(x) et var(y) = var(x) ρ =-
Pla I. Corrélato et régresso léare II. Coeffcet de corrélato. Covarace 2. Coeffcet de corrélato et terprétato 3. Estmato du coeffcet de corrélato 4. Test du coeffcet de corrélato III. Régresso léare smple Aexes
II.3. Estmato du coeffcet de corrélato - m y m x X,Y cov y x échatllo r populato ρ - m x s 2 x 2 x - m y s 2 y 2 y Le coeffcet de corrélato estmé sur u échatllo ssu d ue populato est oté r. Il s terprète comme le coeffcet de corrélato ρ mesuré sur la populato. Il est calculé à partr des estmatos de la covarace et des varaces de X et de Y sur l échatllo.
II.3. Estmato du coeffcet de corrélato 2 y 2 x y x m y m x m y m x r Par smplfcato des (-) au déomateur de la covarace et de la varace de X et de la varace de Y, o obtet l expresso de l estmateur du coeffcet de corrélato r à partr d u échatllo.
II.3. Estmato du coeffcet de corrélato 2 2 2 2 y y x x y x y x r Par smplfcato des (-) au déomateur de la formule de Huyghes de la covarace et de la varace de X et de Y, o obtet ue autre expresso de l estmateur du coeffcet de corrélato r à partr d u échatllo.
Pla I. Corrélato et régresso léare II. Coeffcet de corrélato. Covarace 2. Coeffcet de corrélato et terprétato 3. Estmato du coeffcet de corrélato 4. Test du coeffcet de corrélato III. Régresso léare smple Aexes
II.4. Test du coeffcet de corrélato Après le calcul du coeffcet de corrélato r estmé sur u échatllo, l faut détermer s le coeffcet de corrélato ρ est sgfcatvemet dfféret de 0. populato ρ échatllo r r ρ H0 : ρ = 0 (absece de laso [léare] etre X et Y) H blatérale : ρ 0 (exstece d ue laso etre X et Y)
II.4. Test du coeffcet de corrélato Sous l hypothèse ulle (H0) : Le rapport de l estmateur du coeffcet de corrélato r sur so écarttype sut ue lo de Studet à (-2) degrés de lberté. est l effectf de l échatllo. r s r t (-2)ddl L estmateur de l écart-type du coeffcet de corrélato est égal à : s r r² 2
II.4. Test du coeffcet de corrélato Le test du coeffcet de corrélato cosste à calculer la gradeur to et à la comparer à la valeur seul tα sur la table de la lo de Studet à (-2) degrés de lbertés. r 2 t o r² Codtos d applcato dépedace des observatos laso léare etre X et Y dstrbuto codtoelle ormale et de varace costate
α (o-rejet de H0) α/2 (rejet de H0 = acceptato de H) α/2 (rejet de H0 = acceptato de H) r t 2 r² -t α 0 t α t o > t α t o t α t o > t α Abscsses : valeurs possbles de t sous H0 (ρ = 0) t o : valeur observée/calculée de t sur l échatllo
Détermato du degré de sgfcato assocé à t o (P-value) Exemple : to = 2.2 = 20 0.02 < P <0.05 P < α rejet de H0 (-2) = 8 ddl X Rappel : P-value = probablté d observer ue valeur plus grade que t o sous l hypothèse ulle H0
Pla I. Corrélato et régresso léare II. Coeffcet de corrélato III. Régresso léare smple. Régresso léare smple 2. Estmato par la méthode des modres carrés 3. Test de la pete de la drote de régresso Aexes
III.. Régresso léare smple La régresso s adresse à u type de problème où les 2 varables quattatves cotues X et Y ot u rôle asymétrque : la varable Y déped de la varable X. La laso etre la varable Y dépedate et la varable X dépedate peut être modélsée par ue focto de type Y = α + βx, représetée graphquemet par ue drote. Y X Y = α + βx Y : varable dépedate (explquée) X : varable dépedate (explcatve) α : ordoée à l orge (valeur de Y pour x = 0) β : pete (varato moyee de la valeur de Y pour ue augmetato d ue uté de X)
Pla I. Corrélato et régresso léare II. Coeffcet de corrélato III. Régresso léare smple. Régresso léare smple 2. Estmato par la méthode des modres carrés 3. Test de la pete de la drote de régresso Aexes
III.2. Estmato par la méthode des modres carrés Y (x, y ) X Chaque dvdu est caractérsé par u couple de coordoées (x, y) et est représeté par u pot sur le graphque. L esemble des dvdus forme u uage de pots.
III.2. Estmato par la méthode des modres carrés Y (x, y ) Y = α + βx (x, y^ ) y ^ = α + βx X La drote de régresso Y = α + βx est la drote qu résume le meux le uage de pots. Itutvemet, l s agt de la drote dot les pots du uage sot e moyee les plus proches (c est-à-dre la drote qu passe à la plus fable dstace de chaque pot du uage, e moyee).
III.2. Estmato par la méthode des modres carrés y (x, y ) -y^ Y Y = α + βx (x, y^ ) y ^ = α + βx La dstace d u pot à la drote est la dstace vertcale etre l ordoée du pot observé (x, y) et l ordoée du pot correspodat sur la drote (x, ^y). Cette dstace d u pot à la drote (y - ^y) peut être postve ou égatve et la somme des dstaces à la drote s aule. X
III.2. Estmato par la méthode des modres carrés y (x, y ) -y^ Y Y = α + βx (x, y^ ) y ^ = α + βx SCE = (y y ^ )² X Pour s affrachr du sge, o calcule la somme des carrés des dstaces de chaque pot à la drote. La drote de régresso est la drote qu mmse la somme des carrés des écarts. Elle est auss appelée drote des modres carrés.
III.2. Estmato par la méthode des modres carrés Y Y = α + βx m y m x X Ue partcularté de la drote de régresso est de passer par le pot moye théorque de coordoée (m x, m y ).
III.2. Estmato par la méthode des modres carrés Y Y = α + βx a et b sot les estmatos de l ordoée à l orge α et de la pete β de la drote de régresso. m y L estmato de la pete de la drote de régresso b est égale au rapport de la covarace de X et Y sur la varace de X. m x X b cov X,Y var X b x mx y m y x mx 2
III.2. Estmato par la méthode des modres carrés Y Y = α + βx m y m x X L estmateur de l ordoée à l orge a est dédut de la pete b et des coordoées du pot moye (m x, m y ) : a = m y b m x
Pla I. Corrélato et régresso léare II. Coeffcet de corrélato III. Régresso léare smple. Régresso léare smple 2. Estmato par la méthode des modres carrés 3. Test de la pete de la drote de régresso Aexes
III.3. Test de la pete de la drote de régresso b β populato β échatllo b La drote de régresso d équato Y = α + βx comporte 2 paramètres (α et β). L hypothèse ulle est que la pete β de la drote de régresso de Y e X est égale à 0 (sot Y est égal à α, c est-à-dre que la drote de régresso est horzotale et qu l y a pas de laso etre X et Y). H0 : β = 0 (drote de régresso horzotale : Y = α) H: β 0
III.3. Test de la pete de la drote de régresso Sous l hypothèse ulle (H0) : Le rapport de l estmateur de la pete b sur so écart-type sut ue lo de Studet à (-2) degrés de lberté. est l effectf de l échatllo. b s b t (-2)ddl L estmateur de l écart-type de la pete est égal à : s b s 2 y 2 sx b 2 2
III.3. Test de la pete de la drote de régresso Le test de la pete cosste à calculer la gradeur t o et à la comparer à la valeur seul t α sur la table de la lo de Studet à (-2) degrés de lbertés t o b 2 sy 2 sx b 2 2 Codtos d applcato dépedace des observatos laso léare etre X et Y dstrbuto codtoelle ormale et de varace costate
Corrélato et régresso Varables Corrélato Quattatves symétrques/asymétrques Régresso Quattatves asymétrques Test Coeffcet de corrélato - r Pete de la drote de régresso Prédcto o ou Codtos Idépedace des observatos Laso léare Dstrbuto codtoelle ormale et de varace costate
Aexe : varace et covarace Varace var(x) = E(X²) [E(X)]² 2 2 x x x var x x x var 2 2
Aexe : varace et covarace Covarace cov(x,y) = E(XY) [E(X) x E(Y)] y x xy y x, cov y x y x X,Y cov
Metos légales L'esemble de cette œuvre relève des légslatos fraçase et teratoale sur le drot d'auteur et la proprété tellectuelle, lttérare et artstque ou toute autre lo applcable. Tous les drots de reproducto, adaptato, trasformato, trascrpto ou traducto de tout ou parte sot réservés pour les textes as que pour l'esemble des documets coographques, photographques, vdéos et soores. Cette œuvre est terdte à la vete ou à la locato. Sa dffuso, duplcato, mse à dsposto du publc (sous quelque forme ou support que ce sot), mse e réseau, partelles ou totales, sot strctemet réservées à l uversté Joseph Fourer (UJF) Greoble et ses afflés. L utlsato de ce documet est strctemet réservée à l usage prvé des étudats scrts à l Uversté Joseph Fourer (UJF) Greoble, et o destée à ue utlsato collectve, gratute ou payate. Ce documet a été réalsé par la Cellule TICE de la Faculté de Médece de Greoble (Uversté Joseph Fourer Greoble ) e collaborato avec l Equpe Audovsuel et Producto Multméda (EAEPM) de l Uversté Stedhal de Greoble.