L ANCOVA But: Examiner des différences de moyennes en contrôlant pour des variables concomitantes Devis non-expérimentaux Examiner les moyennes qui existeraient si les groupes étaient semblables sur la covariable (avaient la même moyenne sur la covariable) Réduire le terme d erreur pour augmenter la puissance du test Devis expérimentaux Réduire le terme d erreur pour augmenter la puissance du test L erreur de mesure de la var. dép. 2 1
Noirs ou Blancs? Intelligence On sait que Pauvreté Intelligence Alors, lequel est-ce? Noirs ou Blancs Pauvreté Intelligence ou Intelligence Noirs ou Blancs Pauvreté 3 Noirs ou Blancs Intelligence Pauvreté Variable dépendante: Intelligence Variable indépendante: Betas standardisés et valeur de p Noirs ou Blancs β =.20, p <.05 Pauvreté β =.25, p <.05 Noirs ou Blancs ntelligence Pauvreté Variable dépendante: Intelligence Variable indépendante: Betas standardisés et valeur de p Noirs ou Blancs β =.02, p =.45 Pauvreté β =.35, p <.05 4 2
L analyse de variance (ANOVA) Intelligence a 1 a 2 Noirs Blancs Facteur A 5? Noirs ou Blancs Intelligence 6 3
L analyse de covariance (ANCOVA): Ajuste les moyennes Intelligence A 2 = Blancs a 1 = Noirs COV a1 40,000$ COV a1+a2/2 25,000$ COV a2 10,000$ Covariable: Pauvreté 7 L analyse de covariance (ANCOVA): Réduit l erreur a 2 a 1 Covariable 8 4
L analyse de covariance (ANCOVA): Réduit l erreur 9 L analyse de covariance (ANCOVA) a 2 a 1 Covariable Une large quantité d erreur est réduite si la covariable est fortement corrélée à la variable dépendante 10 5
L analyse de covariance (ANCOVA) 11 L analyse de covariance (ANCOVA) a 2 a 1 Covariable Une très faible quantité d erreur est réduite si la covariable n est pas corrélée à la variable dépendante 12 6
L analyse de covariance (ANCOVA) Source de variation Somme des carrés (SC) Degrés de liberté (dl) Carrés moyens (CM) F obtenu Covariable SC cov 1 CM cov CM cov CM S/A INTER (traitement A) SC A a-1 CM A CM A CM S/A INTRA (erreur S/A) SC S\A Σ(n-1) - 1 CM S/A TOTAL SC total N-1 La pente doit être estimée 13 Quand une covariable est-elle utile? A A COV A COV COV Scénario parfait: la covariable réduit le terme d erreur de sans réduire la différence entre les moyennes. A n a pas d effet au-delà de la covariable: la différence entre les moyennes est réduite au maximum. La covariable ne réduit pas la variabilité de, mais un degré de liberté est perdu. 14 7
Devis expérimental & l ANCOVA Attention a 2 = Chocolat a 1 = Pas de chocolat 8 heures Covariable: Heures de sommeil 15 Attention Si on pouvait contrôler le nombre d heures de sommeil a 2 = Chocolat a 1 = Pas de chocolat La covariable serait alors inutile 8 heures Covariable: Heures de sommeil 16 8
Devis expérimental & l ANCOVA: Faible ajustement des moyennes Attention a 2 = Chocolat a 1 = Pas de chocolat COV a1 COV a1+a2/2 COV a2 Covariable: Heures de sommeil 17 Devis expérimental & l ANCOVA: Réduction du terme d erreur Attention a 2 = Chocolat a 1 = Pas de chocolat Covariable: Heures 18 de sommeil 9
Devis expérimental & l ANCOVA 19 L analyse de covariance (ANCOVA) Devis expérimental A COV ou A COV Scénario parfait, la covariable réduit le terme d erreur sans réduire la différence entre les moyennes. La covariable ne réduit pas la variabilité de et un degré de liberté est perdu. 20 10
L analyse de covariance (ANCOVA) Devis non-expérimental A COV La covariable réduit le terme d erreur tout en ajustant la différence entre les moyennes. 21 Source de variation INTER (traitement A) INTRA (erreur S/A) Somme des carrés (SC) Degrés de liberté (dl) 16.99 2 161.32 401 Carrés moyens (CM) 8.50.402 Sans covariable F obtenu 21.13*** Avec covariable Source de variation Somme des carrés (SC) Degrés de liberté (dl) Carrés moyens (CM) F obtenu Covariable 38.84 1 38.84 126.86*** INTER (traitement A) 6.68 2 3.34 10.91*** INTRA (erreur S/A) 122.474 400.306 22 11
La puissance de l ANCOVA La différence entre les moyennes peut être accentuée ou réduite. Devis non-expérimental La variable que l on souhaite contrôler peut cacher ou créer une différence au niveau de la variable dépendante. Devis expérimental La correction des moyennes est souvent minime. Plus la corrélation entre la covariable et la variable dépendante sera élevée et plus l erreur sera réduite. Cela diminue le CM erreur, donc plus facile d obtenir un F significatif (on divise par un petit chiffre). S il n y a pas de corrélation entre la covariable et la variable dépendante, le terme d erreur reste pareil. MAIS! On perd un degré de liberté par covariable au niveau de l erreur: (n-1) - 1 vs (n-1). Cela augmente le CM erreur (on divise par un plus petit chiffre), donc plus difficile d obtenir un F significatif (on divise par un gros chiffre, le CM erreur ). Le F critique est plus élevé lorsque les degrés de liberté au niveau de l erreur diminuent. F(2,20) = 3.49, alors que F(2,10) = 4.10, p =.05. Coût/bénéfice, est-ce que les covariables justifient la perte d un degré de liberté? 23 L analyse de covariance (ANCOVA): Peut augmenter les différences a2 = Dépressifs Pensées suicidaires A 1 = Non dépressifs COV a1 COV COV a2 a1+a2/2 Covariable: Heures de thérapie 24 12
Postulats Étendue de la vd et cv adéquate (effets de plafond et de plancher) Indépendance des scores Normalité de la distribution de la vd et de la cv Homogénéité de la variance de la vd et de la cv Linéarité de la cv à la vd Homogénéité de la régression (vd et cv) 25 Étendue adéquate Les variabilités de la variable dépendante et de la covariable doivent être suffisantes. Covariable Covariable 26 13
Normalité des variables et de la distribution des résiduels Les erreurs de prédiction (ou les résiduels) doivent être distribuées normalement autour de la ligne de régression. 27 Le postulat de l homogénéité de la régression La relation entre la covariable et la variable dépendante doit être comparable d un niveau de la variable indépendante à l autre (d un groupe à l autre). VD groupe1 groupe2 groupe3 VD groupe1 groupe2 groupe3 CV CV 28 14
Le postulat de l homogénéité de la régression COV a1 COV a1+a2/2 COV a2 Covariable 29 Le postulat de l homogénéité de la régression Si le postulat de l homogénéité de la régression n est pas respecté, l utilisation de l ANCOVA est contre-indiqué. Faites plutôt une ANOVA factorielle, où la covariable est incluse comme un facteur. La covariable est utilisée pour créer des groupes. L interaction entre l effet de la variable indépendante et de la covariable sur la variable dépendante peut alors être étudiée directement. Ou une régression linéaire ou la variable indépendante discrète est dichotomisée (si trois groupes, deux variables 0 et 1). 30 15
Biais possibles Colinéarité Les covariables ne devraient pas être trop fortement corrélées entre elles. Les covariables r >.75 devraient être retirées du modèle. Absence d outliers dans chacun des groupes sur la vd et la cv Fidélité (reliability) de la covariable: la covariable se doit d être une mesure fiable et précise. Données manquantes Parfois non-réaliste de contrôler pour une covariable Le rationnel est de mise 31 Taille de l effet: R 2 partiel (aussi appelé eta-carré partiel ( 2 partiel)) R 2 = SC traitement ajusté SC traitement ajusté + SC erreur ajusté Recommandations R 2.01 «Petit effet» R 2.06 «Moyen effet» R 2.16 «Grand effet» SC = Somme des carrés Traitement ajusté = l effet du facteur ou de la VI lorsque la covariable est dans le modèle Erreur ajusté = l erreur du modèle avec covariable. 32 16
Exemple d ANCOVA a-t-il des différences de genre quant au stress perçu relatif à son emploi? Cette différence, s il y a lieu, est-elle éliminée/augmentée/ stable après avoir contrôlé pour l effet de la covariable mesurant le sentiment d obligation au travail des employés. 33 ANCOVA 34 17
Homogénéité de la régression IMPORTANT: Sélectionner la somme des carrées Type I. Ceci donnera priorité aux termes selon leur ordre d entrée dans le modèle Entrer dans l ordre chacun des effets: 1. L effet principal de chacune des covariables (main effect) 2. L effet principal du facteur à l étude (sex) 3. Les interactions de premier ordre: oblige*sex 35 Homogénéité de la régression Je ne regarde que ce tableau et son terme d interaction. S il y a un effet d interaction significatif = problème majeur. Je ne pourrai pas utiliser l ANCOVA ou je pourrais essayer de transformer la vd ou les cvs pour faire disparaître l interaction (Rosenthal & Rosnow, 2008) 36 18
Spécification du modèle de l ANCOVA en somme des carrées Type III 37 Homogénéité de la variance Si le test est nonsignificatif, il y a homogénéité de la variance et donc le postulat est respecté 38 19
Modèle 39 Contrastes, tests post hoc et tests des effets simples Ces différents tests suivent les mêmes règles que lors d un ANOVA one-way ou d un ANOVA factorielle. S il y a un effet principal significatif et que le facteur a plus de deux catégories, il faut procéder à l examen des différences entre les groupes pour savoir où se situent ces différences. S il y a une interaction significative (dans le cas d un problème à deux facteurs), il faut procéder à l examen des effets simples. 40 20
Présenter les résultats Afin de déterminer s il y avait des différences de genre quant au stress perçu et si cet effet se maintiendrait après avoir contrôlé pour l effet du sentiment d obligation au travail une ANCOVA a été effectuée. Le stress perçu agissait en tant que variable dépendante, le genre comme facteur et le sentiment d obligation a été inclus comme covariable. Les résultats ont indiqué qu après avoir contrôlé pour l effet du sentiment d obligation, F(1, 133) = 23.64, p <.01, R 2 =.15, il y avait une différence marginalement significative entre les hommes et les femmes quant au niveau de stress perçu, F(1, 133) = 3.40, p =.07, R 2 =.03. En effet, les femmes (M = 2.15, ES =.07) semblent rapporter un niveau de stress marginalement supérieur à celui des hommes (M = 1.97, ES =.07). 41 EXERCICE À partir de l exercice vu en classe, examiner ce qui advient des différences de genre sur le stress perçu lorsque le nombre d années d expérience dans l entreprise est utilisée comme covariable. Comparer vos résultats à ceux d une ANOVA one-way (sans covariable) et aux résultats obtenus en classe (i.e., lorsque le sentiment d obligation est utilisé comme covriable). Expliquer dans chaque cas ce qui explique ces résultats. 42 21