Révision sur les plans expérimentaux Cours de Fabien Mathy La formalisation des plans expérimentaux a pour objectif de décrire la structure d'un plan expérimental (the design of an experiment). La structure du plan décrit l'organisation des conditions expérimentales (autrement appelées traitements expérimentaux; experimental conditions/treatments) associées à des groupes de sujets. Dans un plan d'expérience, on peut distinguer : - les mesures répétées (repeated measures or within-subjects designs) : les mêmes sujets passent plusieurs conditions expérimentales). Exemple : une étude longitudinale (longitudinal study). - les mesures couplées (randomized blocks designs) : n blocks de k sujets sont appariés en raison d'une ressemblance et assignés aléatoirement à k conditions expérimentales; il y a donc nk sujets différents, mais théoriquement seulement n et k sources de variations. Par exemple, on peut apparier les sujets sur leur QI. D'un point de vue pratique, les mesures couplées sont assimilées à des mesures répétées lorsqu'un test statistique est appliqué. Cette organisation réduit à la fois la grande variance propre aux plans indépendants et les problèmes d'ordre de passation des plans répétés. En revanche, l'organisation est aussi coûteuse en sujets que le plan indépendant et la procédure d'appariement peut être coûteuse en temps. - les mesures indépendantes (independant measures, randomized groups designs, or between-subjects designs). Exemple : une étude transversale (cross sectional study). - les plans complexes, dans lesquels on peut inclure les plans complètement indépendants ou les mesures complètement répétées à plusieurs facteurs, et les plans partiellement répétés (autrement appelés plans mixtes; mixed designs). Le plan conditionne le choix des tests statistiques et l'organisation du tableau de données en vue de son traitement par un logiciel statistique. Pour qu'un plan soit valide, l'expérimentateur doit : - procéder à une répartition aléatoire des sujets dans les groupes - appliquer un contrebalancement (counterbalancing), une permutation (permutation), ou une aléatorisation (ou randomisation; randomization) des ordres de passations, afin de contrôler les ordres de passation. Ces notions sont développées plus loin. - contrôler les variables non manipulées, soit en en les maintenant constantes (matching) ou en garantissant que leurs modalités sont mixées par un échantillonnage (sampling) correct des sujets. Certaines expériences demandent des soins supplémentaires pour contrôler les effets liés à l'expérimentateur (organisation en simple ou double aveugle, etc.) et les effets liés aux sujets (volonté de contribuer positivement à l'expérimentation, qu'on peut traduire par demand characteristics). Parmi les conditions expérimentales d'un facteur, on peut distinguer parfois une condition contrôle, qui est la condition dans laquelle le facteur intervient le moins. Lorsque le facteur est réduit à néant, la condition contrôle peut s'appeler condition témoin. 1
On peut distinguer plusieurs formalisations de base : 1) Plans simples à mesure répétées. Ils sont formalisés par un croisement. Par exemple : S 4! A 3. Dans ce cas, chaque sujet est soumis à trois conditions expérimentales du facteur A. L'indice 3 indique le nombre de modalités (the number of levels of treatment) du facteur. Le facteur sujet est un facteur dont les modalités sont les sujets, ce qui est logique puisque chacun des sujets est différent. Exemple de tableau pour S 4! A 3 a 1 a 2 a 3 Notes. i) Une croix indique qu une mesure est effectuée. ii) Il y a un tableau par VD. 2) Plans simples à mesure indépendantes. Formalisés par un emboîtement. Par exemple : S 2 <F 3 >. Chaque sujet est soumis à une condition expérimentale. Il faut par conséquent 3 fois plus de sujets pour obtenir le même nombre d'observations que dans un plan répété. Si le plan est équilibré, les sujets sont divisés aléatoirement en 3 groupes de 2 sujets. Dans la plupart des manuels, on considère par convention que S 2 <F 3 > signifie qu il y a 2 sujets par groupe et 6 au total en multipliant l'indice 3 par l'indice 2 1. On dit que les sujets sont emboîtés dans le facteur F. La structure d'emboîtement distingue le facteur emboîté du facteur emboîtant de la manière suivante : emboîté<emboîtant>. Par définition, chaque modalité du facteur emboîté correspond à une et une seule modalité du facteur emboîtant, l'inverse n'étant pas vrai. Exemple de tableau pour S 2 <F 3 > s 5 s 6 a 1 a 2 a 3 1 De mon point de vue, l écriture S 6 <F 3 > serait préférable car elle respecte la notion de divisibilité des 6 sujets dans le groupes et indique le nombre correct de modalités du facteur sujet. 2
Ou, si on utilise une variable catégorielle (comme requis dans SPSS) : Groupe Mesure a 1 a 1 a 2 a 2 s 5 a 3 s 6 a 3 3) Plans complexes. Cette classe inclut les plans factoriels (exemple à trois facteurs : les sujets sont soumis à une seule des k! k'! k'' conditions possibles : S<A k! B k'! C k'' > ; k! k'! k'' factorial design or k! k'! k'' between subjects experiment), les mesures complètement répétées (S! A k! B k' ), dans lesquelles les sujets passent chacune des k! k' conditions expérimentales résultant de la combinaison de facteurs. On trouve également l'ensemble des plans mixtes dont l'exemple le plus simple est le plan split-plot 2 (Dans l'exemple S 2 <A 3 >! B 3, il y a 6 sujets appartenant à trois groupes de 2 sujets d'âges différents, soumis chacun à trois conditions expérimentales. Appelation des groupes Tout terme numéroté doit porter une majuscule pour respecter les normes de l'apa 3 (e.g., Groupe 1, Groupe 2, etc.). En général, il est préférable de choisir une dénomination qui fait référence au type de manipulation elle-même: Groupe 10mg, Groupe Placebo, Groupe Adolescents, Groupe Adultes, etc. Effets d'ordre, et effets de rangs dans les mesures répétées Pour contrôler les effets d'ordre, on doit faire varier l'ordre de passation des conditions expérimentales. Il existe trois techniques, fondées sur des permutations d'ordre: le contrebalancement, qui permet de varier l'ordre de deux conditions (ab vs ba), la permutation, qui permet de varier systématiquement l'ordre de k conditions (abc, acb, bac, bca, cab, cba), la randomisation des ordres si le nombre de permutations est trop importantes (pour 5 conditions, il y a 5! = 120 ordres possibles, dont il faut faire une sélection aléatoire des ordres). Pour aller plus loin Exemple de mesures répétées SANS contrebalancement, avec 2 tâches pour lesquelles on mesure le nombre d'erreurs commises : 2 La dénomination évoque l'expérimentation agronomique. 3 APA, American Psychological Association. 3
Tâche A Tâche B 1 2 1 2 2 3 2 3 Moyenne 1.5 2.5 Ici, l'effet de la tâche est confondu avec l'ordre. La moyenne est supérieure dans la seconde condition. Cela peut être dû à l'effet de la tâche si B est plus difficile. Cela peut être dû également à l'ordre si l'expérimentation a conduit à une lassitude ou à de la fatigue dans la seconde condition. Cela peut-être dû à un effet de transfert de la première tâche sur la seconde, si les tâches présentent une certaine analogie. Dans ce cas, l'ordre parasite l'effet de la tâche puisque leurs effets peuvent être confondus. Exemple de mesures répétées AVEC contrebalancement, avec 2 tâches pour lesquelles on mesure le nombre d'erreurs commises : Moyenne 2 2.5 Pour le plan S! Tâche 2, on relève les moyennes suivantes : 2 v.5. Le contrebalancement garanti que la différence de moyenne n'est pas due à l'ordre de passation car l'ordre est contrôlé. Cela ne signifie pas non plus que l'ordre n'a pas d'effet. Ayant manipulé l'ordre, on peut distinguer également un plan S<Ordre 2 >, qui conduit aux moyennes respectives de 2.5 et 2. On peut en conclure que l'ordre 2 (Tâche B-Tâche A) a été plus bénéfique aux sujets, car en moyenne, ils ont commis moins d'erreurs sur les tâches. On remarque également que la réduction d'erreur est plus importante lorsque B est donnée en premier. On peut distinguer également un plan S! Rang 2, car chacun des sujets a été confronté à une première épreuve et une seconde. Relevons le nombre d'erreurs en fonction du rang de l'épreuve : 1 ère Tâche 2 nde Tâche 3 1 3 1 Moyenne 3 1.5 4
Le tableau indique que la première épreuve est plus difficile que la seconde (quelque soit la tâche). Les erreurs diminuent donc en fonction du rang de l'épreuve. On pourrait résumer cette situation complexe en disant que la Tâche A est globalement plus facile, principalement parce qu'elle bénéficie de l'apprentissage préliminaire de la Tâche B dans la condition Ordre 2. La notion d'interaction est centrale, mais ne peut être développée ici. Les effets d'ordre ne se contrôlent pas systématiquement. Ils peuvent être manipulés dans le but de connaître des effets de transferts d'apprentissage. Les effets peuvent être bénéfiques ou préjudiciables à l'apprentissage. Dans l'exemple précédent, on a remarqué plus de transfert de B vers A que vice-versa. Il est possible d'obtenir un effet de rang sans effet d'ordre. Par exemple, dans le tableau suivant, la complexité moyenne est de 2.5. Pour l'ordre 1, on observe 2.5 erreurs en moyenne (idem pour l'ordre 2). En revanche les rangs correspondent respectivement à 3.5 et 1.5 erreurs. On a donc une augmentation respective moyenne de +1 et -1 dans l'apprentissage de la première tâche et de la seconde. Il y a donc un simple effet de rang, sans effet d'ordre (sans effet de transfert d'une tâche à l'autre). Les effets se combinent simplement (additivement) ici : à partir d'une complexité moyenne de 2.5, on retranche.5 pour la Tâche A et on ajoute 1 lorsque A est donnée en premier. On obtient par conséquent : 2.5 -.5 + 1 = 3, comme indiqué dans le tableau. Idem pour les autres cas. 1 4 1 4 Moyenne 2.5 2 3 Par des effets complexes de combinaisons des facteurs, il est possible d'obtenir également un effet d'ordre sans effet de rang. Par exemple, dans le tableau suivant, la complexité moyenne est de 2.5. Dans l'ordre 1, on observe 2 erreurs en moyenne, contre 3 dans l'ordre 2. A chaque rang, en revanche, le nombre moyen d'erreurs est 2.5. L'Ordre 2 est ici préjudiciable à l'apprentissage des deux tâches, car l'apprentissage de B est difficile en premier et produit un effet négatif sur l'apprentissage de A. 2 4 2 4 Moyenne 2.5 1.5 3.5 5