Corrigé de l examen du 22/01/2007 Cogmaster 2006 2007 Partie 1 (5 points) 1 point par réponse(s) correcte(s) à chaque question. 1. oui 2. non 3. oui 4. 0.7 2 = 0.49, soit 49 % 5. Si on note que µ i = µ + α i, les propositions 1, 2, 4 et 5 sont correctes. Partie 2 (3 points) 1. Identifiez les facteurs expérimentaux et précisez leur statut. (0.5 Il y a deux variables (1 seul facteur expérimental) : le type de médicament administré (variable indépendante provoquée, nominale), à 3 modalités ; le score total mesuré (variable dépendante, discrète), exprimé en points. 2. L expérimentateur souhaite vérifier si l administration du produit B a un effet significatif sur les performances de conduite des sujets. Décrivez en quelques lignes comment il devrait s y prendre, en précisant toutes les caractéristiques nécessaires à la mise en pratique du test correspondant (hypothèse nulle, choix du test et statistique de test associé, seuil de significativité retenu, etc.). (1.5 Il y a deux approches possibles : on peut utiliser une ANOVA à un facteur : dans ce cas, on pose comme hypothèse nulle l absence de différences entre les 3 conditions (i.e. pas d effet du type de médicament en comparaison du témoin, ni entre les médicaments) ; le modèle formulé pour la réponse (score total) inclut donc un terme fixe, l effet du facteur, et un terme modélisant les résidus ; le test à effectuer est bien entendu un test F de Fisher-Snedecor, et la statistique de test est le rapport de la variance expliquée par le 1
facteur et de la variance résiduelle ; on fixera le risque de première espèce à 5 % ; si la statistique de test est supérieure à la valeur critique d un F(77,2) à ce seuil (ou si la p-valeur observée est inférieure à 0.05), on rejettera H 0. on peut également travailler directement avec une procédure de comparaisons multiples, adaptée à la comparaison de groupes à un témoin (e.g. test de Dunnett, non vu en cours) ; dans ce cas, on conserve le même risque de première espèce, l hypothèse nulle se décompose en sous-hypothèses liées à chacune des comparaisons d intérêt (A vs. B, A vs. C et B. vs. C). Ce test est protégé contre l inflation du risque d ensemble. 3. A votre avis, pourquoi le groupe comporte-t-il plus de sujets? (1 Si l on souhaitait réellement vérifier l effet différentiel d un médicament psychostimulant vs. relaxant, il faudrait s assurer que les deux performances mesurées dans ces deux conditions diffèrent bien des performances du groupe contrôle (effet général de l administration d un médicament non-placebo) et que les performances se distinguent clairement entre ces deux témoins (positif/négatif). On voit alors que le groupe témoin doit supporter 2 comparaisons (A vs. B et A vs. C), alors qu il n y aura qu une comparaison contrastant les groupes B et C. Il est donc souhaitable d avoir un groupe contrôle dont l effectif est plus important (on peut montrer facilement que la taille de l effectif du groupe contrôle doit être N k/(k+ k) pour k groupes de traitement et un effectif total N). Partie 3 (12 points) 1. Précisez la nature et le statut des facteurs à inclure pour l étude des performances des animaux. (1 Pour étudier les performances des animaux, seules 3 variables sont à retenir : la zone d implantation (variable indépendante provoquée, nominale), à 3 modalités ; le moment de stimulation (variable indépendante provoquée, ordinale), à 3 niveaux ; la latence (variable dépendante, continue), en secondes. La distinction entre essai d apprentissage et essai de test n est pas vraiment pertinente car elle définie le protocole de conditionnement même. Les éventuels co-facteurs (poids, âge, lignée, etc.) n étant pas explicitement mentionnés à ce stade, on les omet tout simplement. 2. Rappelez les conditions d application de l ANOVA. (1.5 En les ordonnant par importance décroissante, on distingue : l indépendance des observations (doit être contrôlée a priori, au moment de l échantillonnage aléatoire des observations) ; 2
l homoscédasticité, autrement dit l homogénéité des variances (vérifiée a posteriori de l acquisition, en calculant les variances et/ou en représentant les données sous forme de boites a moustaches notamment, mais aussi tests de Bartlett ou de Cochran non vus en cours) ; la normalité des résidus (vérifiée a posteriori par analyse graphique des résidus, droite de Henry, ou test) ; 3. Commentez les résultats (taille et degré de significativité des effets testés) du test d ANOVA qui sont reportés sur la page suivante. (2 points) La table des effets indique les écarts à la moyenne générale des moyennes calculées pour chacune des modalités ou combinaison de modalités des 2 facteurs expérimentaux. A la lecture de ces résultats, on voit que la latence est plus élevée lorsque la stimulation est administrée dans une zone neutre (+3.98) en comparaison des deux autres zones, qui diffèrent peu entre elles. La latence est également plus élevée lorsque la stimulation a lieu 150 ms après avoir franchi la ligne (+2.8), alors qu elle diminue lorsque la stimulation est administrée dans une fenêtre de 100 ms ; l effet de la stimulation est plus modéré lorsque celle-ci est effectuée dans une fenêtre de 50 ms ( 0.96). L analyse des moyennes lorsque l on croise ces deux variables est plus intéressante car elle révèle que l effet de la zone de stimulation est dépendant du moment de la stimulation : pour la zone neutre, la latence n augmente que pour les conditions 50 et 100 ms, alors que pour la zone 1, la latence augmente pour les conditions 100 et 150 ms ; quant à la zone B, la latence diminue à 100 ms uniquement. On est donc en présence d une interaction croisée. Le tableau d ANOVA indique que cette interaction entre les deux facteurs est significative (p < 0.05) et que seul l effet du facteur Site est significatif (p < 0.01). La p-valeur associée au facteur Stimulation est à la limite des 5 % retenus pour la significativité des effets testés (cf. énoncé). En conclusion, le site de stimulation exerce une forte influence sur la latence avec laquelle animaux franchissent la ligne, mais cet effet est dépendant du moment de la stimulation : la diminution de la latence s observe essentiellement lorsque les zones A et B sont stimulées 150 et 100 ms (respectivement) post-franchissement de la ligne. 4. Au vu de ces résultats, l expérimentateur teste un nouveau modèle restreint sur le facteur Site, pour chaque niveau du facteur Stimulation. Il obtient les résultats suivants : [...] Ce choix est-il justifié? Si oui, expliquez en une phrase pourquoi. (1 Comme on l a vu, l interaction est significative ce qui signifie que l effet principal du facteur Site ne peut être dissocié des variations dûes au facteur Stimulation (l effet n est pas «pur»). Il est donc préférable de travailler avec des effets simples, en étudiant l effet du facteur Site sur chacun des niveaux du facteur Stimulation, ce qui peut être réalisé grâce à 3 ANOVA à 3
un facteur. 5. L expérimentateur poursuit son analyse en effectuant des comparaisons deux à deux sur l ensemble des conditions du facteur testé à l étape précédente, pour chaque niveau du temps de stimulation. Il utilise pour cela la méthode de Tukey. Les intervalles de confiance (95 %) obtenus sont résumés dans la figure ci-dessous (de gauche à droite, les niveaux 50, 100 et 150 ms du facteur Stimulation). [...] Ces derniers résultats sont-ils compatibles avec ceux observés pour le deuxième modèle d ANOVA? Que peut-on conclure de ces nouveaux résultats. Quel autre test aurait pu être utilisé pour effectuer de telles comparaisons? (1.5 Les trois graphiques indiquent que pour la stimulation 50, seules les conditions A vs. neutre et B vs. neutre peuvent être considérées comme différentes (l intervalle ne contient pas 0) ; pour la stimulation 100, seule la différence de moyennes B vs. neutre peut être considérée non nulle ; pour la stimulation 150, aucune des différences de moyennes ne semble significativement différente de 0. S agissant de comparaisons multiples de l ensemble des paires de traitement, on aurait également pu utiliser des tests t multiples protégés (peu puissants) ou un test de type Newman-Keuls. 6. Proposez une courte interprétation de l ensemble des résultats obtenus par l expérimentateur. (1.5 point ) Il s agit essentiellement de replacer l effet d interaction dans le contexte de l étude (effet différentiel du moment et de la zone de stimulation sur l effet conditionnant)... 7. Cette approche change-t-elle la structure des données? (0.5 La structure de données est bien évidemment modifiée puisque dans ce cas on introduit une structure d appariement, soit un facteur supplémentaire (à 2 modalités) : les mêmes animaux sont comparés entre eux à deux reprises. Il n y a donc plus indépendance totale entre les observations, et on devra distinguer des sources de variation intra-individus et inter-individus, en plus de la résiduelle. 8. L expérimentateur souhaite comparer les performances globales entre les deux sessions (tous facteurs confondus). Quel test serait approprié? (0.5 Puisque l on ne tient pas compte des facteurs expérimentaux, il suffit d effectuer un test t pour échantillons appariés (à 45 1 = 44 ddl), qui permet de comparer la latence moyenne entre les deux sessions. 4
9. La latence est représentée en fonction du poids de chaque animal dans la figure ci-après. Le coefficient de corrélation estimé est de 0.09. Que suggèrent ces résultats? (0.5 Ici on introduit une variable supplémentaire (variable indépendante invoquée, continue), qui est assimilée à un co-facteur. A la lecture du graphique, on constate qu il ne semble pas y avoir d association clairement marqué entre la latence et le poids de l animal (le nuage de poids ne présente pas de forme spécifiquement étirée selon un axe particulier), ce qui est confirmé par l absence de liaison linéaire (cf. coefficient de corrélation). Les performances des animaux semblent donc relativement indépendantes de leur poids. 10. Une régression linéaire donne les résultats suivants : [...] A quel type de test statistique sont associées les valeurs de probabilité observées (p-value) figurant dans le listing? Interprétez en une phrase la p-valeur associée au coefficient Poids (pente)? Quelle est la valeur de la variance résiduelle (estimée)? (1.5 Les tests effectués sur les coefficients du modèle linéaire (ici, ordonnée à l origine et pente) sont de simples tests t de Student qui comparent la valeur estimée à 0. On constate que la pente (qui indique de combien varie la latence lorsque le poids varie de 1 unité) ne peut être considérée comme significativement différente de 0 (p = 0.576 > 0.05). La résiduelle estimée est indiquée dans le bas du listing : elle vaut 6.747 2 = 45.5. 11. Le choix d un modèle de régression est-il pertinent ou auraiton dû se limiter à une simple étude de corrélation? Justifiez. (0.5 On peut avancer deux éléments de réponse. D une part, il ne semble pas y avoir d association linéaire entre les deux variables. D autre part, un modèle de régression suppose une relation causale entre la ou les variable(s) prédictrice(s) et la réponse mesurée. Dans le cadre de cette étude, il est tout à fait justifié de considérer que le poids de l animal peut influencer la vitesse avec laquelle il se déplace, encore que l influence du poids conditionnelement aux deux autres facteurs soit sans doute plus intéressante. Les résultats précédents pourraient être utilisés pour justifier du fait que les effets analysés dans la partie a) ne sont probablement pas biaisés par ce co-facteur. 5