Les résultats d un client à un test d intelligence constituent souvent un élément pertinent d un examen psychodiagnostique N = 1 orienté action. La traditionnelle échelle de Wechsler comprend notamment le WAIS-IV-NL (Pearson, avril 2012), qui succède au WAIS-III-NL (Swets Test Publishers, 2000), développée en vue de cinq objectifs: revoir la base théorique du WAIS-III-NL, tenir davantage compte de l évolution des fonctions cognitives au cours de la vie, améliorer la convivialité, optimiser l applicabilité clinique et enfin, progresser en termes de psychométrie. Dans cet article, nous nous concentrons sur les innovations ambitionnées cidessus et abordons la future pratique psychodiagnostique scientifique clinique du WAIS-IV-NL. Introduction du WAIS-IV-NL dans la pratique psychodiagnostique clinique scientifique Tim Bastiaens 1, Birgit Sebreghts 1, Leen Gielen 1, Mia Van Broekhoven 1, Marc De Hert 2, 3 1. Service de Psychodiagnostique clinique, UPC KU Leuven, campus Kortenberg 2. UPC KU Leuven, campus Kortenberg 3. Faculté de Médecine, KU Leuven L examen psychodiagnostique et la mesure de l intelligence Les données issues de plus de 125 méta-analyses sur la validité des tests et de 800 échantillons axés sur l évaluation multimodale indiquent ce qui suit: (a) la validité des examens psychologiques est très convaincante, (b) la validité des examens psychologiques est comparable à celle des tests médicaux et (c) l utilisation de plusieurs méthodes dans le cadre d un examen psychodiagnostique fournit des informations qui risqueraient d être négligées en cas d emploi d une méthode unique (1). L examen par test psychologique ne se résume pas à la collecte de résultats de tests isolés, mais combine de préférence une méthode de test d hypothèses se déroulant selon le cycle empirique (2) et une approche idéographique N = 1, ce qui implique une approche holistique finale sur mesure pour chaque patient (3). La plusvalue scientifique et clinique thérapeutique de la psychodiagnostique centrée sur le patient (et non sur les tests) a été clairement démontrée (4). Pour y parvenir, l une des conditions nécessaires (mais donc non suffisante) reste bien entendu l utilisation d instruments de «bonne pratique», autrement dit des tests qui mesurent ce qu ils sont censés mesurer (validité) et sont en mesure de fournir les résultats de manière fiable (fiabilité). N1895F Selon de nombreuses méthodes, les résultats d un patient à un test d intelligence peuvent constituer une partie intéressante de l examen psychodiagnostique décrit cidessus. Parmi les méthodes classiques, notons la simple schématisation du niveau de fonctionnement intellectuel global d une personne (ce que l on appelle le «facteur G») (5) ou la documentation des connaissances scolaires acquises (souvent appelées «intelligence cristallisée») (6, 7), par opposition à l évaluation du potentiel intellec- 1 l Neuron Vol 18 Nr 1 2013
Tableau 1: Structure de la WAIS-III-NL par rapport à la WAIS-IV-NL. WAIS-III-NL WAIS-IV-NL QIT QIT QIV QIP ICV IMT IOP IVT ICV IMT IRP IVT Subtests principaux Vocabulaire Vocabulaire Vocabulaire Vocabulaire Vocabulaire Similitudes Similitudes Similitudes Similitudes Similitudes Information Information Information Information Information Compréhension Compréhension Compréhension Subtests principaux Arithmétique Arithmétique Arithmétique Arithmétique Rekenen Séries de chiffres Séries de chiffres Séries de chiffres Séries de chiffres Séries de chiffres Mémoire des chiffres et des lettres Mémoire des chiffres et des lettres Subtests principaux Dessins avec blocs Dessins avec blocs Dessins avec blocs Dessins avec blocs Dessins avec blocs Matrice Matrice Matrice Matrice Matrice compléter compléter compléter Puzzle visuel Puzzle visuel compléter Balances Subtests principaux Recherche de symbole Recherche de symbole Recherche de symbole Arrangement d images Arrangement d images Barrage 2 l Neuron Vol 18 Nr 1 2013
tuel d une personne («intelligence fluide») (6, 7). Le modèle empirique hiérarchisé de Catell-Horn-Caroll (8), quant à lui, détaille des compétences (a) particulières et (b) spécifiques. L une des principales possibilités d application dans un contexte clinique consiste à étudier l influence de la souffrance psychique sur les résultats actuels, en tant que phénomène passager, ou en tant qu influence persistante ou, du moins, de longue durée. Songeons par exemple à des problèmes cognitifs spécifiques associés à certains syndromes psychiatriques (pathologies neurodégénératives, troubles de l apprentissage non verbal, troubles du développement et schizophrénie). La quantité de perspectives théoriques sur l intelligence implique également un large éventail d instruments, dont certains mesurent une compétence spécifique et d autres stimulent une vaste gamme de fonctions cognitives. Nous retrouvons un commentaire intéressant à ce sujet dans les travaux de Gottfredson et Saklofske (9). Dans le cadre de l échelle classique de Wechsler, Pearson a lancé en avril 2012 un nouvel instrument, le WAIS-IV-NL (10), qui succède au WAIS-III-NL (11). Dans les lignes qui suivent, nous résumons les principales nouveautés décrites dans le manuel (10) et la notice technique (12). WAIS-IV-NL Base théorique Maintien du QI total, suppression du QI verbal et de performance, indices organisés différemment La subdivision du WAIS-III-NL en quatre indices est maintenue. Dans le WAIS-IV- NL, tout comme dans le WAIS-III-NL, il est question (a) d un indice de compréhension verbale, (b) d un indice de mémoire de travail et (c) d un indice de vitesse de traitement. L indice d organisation perceptive du WAIS-III-NL a maintenant été rebaptisé (d) indice de raisonnement perceptif. Tout comme dans le WAIS-III-NL, les indices sont calculés en additionnant les scores échelonnés obtenus aux subtests concernés. Une différence notoire du WAIS-IV-NL par rapport à l ancienne version réside dans le fait que la subdivision entre QI verbal et QI de performance a été abandonnée. Le tableau 1 présente un aperçu global. Abandon et ajout de subtests, introduction de subtests principaux et de subtests facultatifs, introduction de scores de processus Deux subtests du WAIS-III-NL ne figurent plus dans le WAIS-IV-NL: arrangement d images» et «assemblage d objets». Trois nouveaux subtests ont été ajoutés: (a) «puzzles visuels», (b) «balance», tous deux faisant partie de l indice de raisonnement perceptif (IRP), et (c) «barrage», contribuant à l indice de vitesse de traitement (IVT). En outre, les subtests du WAIS-IV-NL sont répartis en (a) subtests principaux et (b) subtests facultatifs, par indice. Les subtests facultatifs apportent des informations cliniques complémentaires et, selon le manuel, servent de test parallèle pour remplacer un score inutilisable obtenu aux subtests principaux. Une autre nouveauté consiste en l introduction de scores de processus, qui permettent de détailler les différentes compétences cognitives impliquées dans les résultats à un subtest, par analogie à la Wechsler Intelligence Scale for Children, Fourth Edition Integrated (12, 13). Le WAIS-IV-NL prévoit un score de processus pour les «dessins avec blocs», six scores de processus pour les «séries de chiffres» et un pour la «mémoire des chiffres et des lettres». Le score de processus des «dessins avec blocs» permet d analyser les prestations du client sans devoir prévoir des points de bonus de temps. Les six scores de processus pour les séries de chiffres comprennent (a) la 3 l Neuron Vol 18 Nr 1 2013 prestation à la partie «séries de chiffres en ordre direct», (b) la prestation à la partie «séries de chiffres en ordre inverse», (c) la prestation à la partie «classement de séries de chiffres» et la série la plus longue correctement réalisée respectivement pour les séries de chiffres en ordre direct (d), les séries de chiffres en ordre inverse (e) et le classement de séries de chiffres (f). Le score de processus pour l épreuve de mémoire des chiffres et des lettres est obtenu en prenant la plus longue série correctement exécutée pour ce subtest. Plus grande prise en compte de l évolution des fonctions cognitives au cours de la vie Par rapport au WAIS-III-NL, beaucoup d efforts ont été fournis en vue de minimiser l influence négative que peuvent avoir les limitations visuelles, auditives et motrices. Ainsi, le test ne contient pas de chiffres (pour les séries de chiffres) et de lettres (pour l épreuve de mémoire des chiffres et des lettres) phonétiquement similaires, et les images du livre de stimuli (dessins avec blocs et dessins à compléter) ont été agrandies par rapport à celles du WAIS-III-NL. En outre, les stimuli des subtests de recherche de symbole et de substitution de ont eux aussi été agrandis et simplifiés. Pour plus de clarté, l ensemble de la batterie de tests utilise davantage la couleur. Les nouveaux subtests «puzzles visuels» et «balances», qui remplacent respectivement les épreuves «arrangement d images» et «assemblage d objets», réduisent l influence de la composante motrice au sein du raisonnement perceptif. Pour tenir compte de la diminution des capacités d attention avec l âge récemment démontrée par des études, les mêmes instructions (détaillées) sont fournies quel que soit le résultat aux items d exemple. Par ailleurs, la nouvelle version comprend davantage d items d exemple ou utilise un feedback correc-
tif, contrairement au WAIS-III-NL. Enfin, des efforts ont été consentis afin de limiter le nombre d items accompagnés d un bonus de temps, suivant les découvertes selon lesquelles le traitement cognitif ralentit avec l âge (12). Convivialité améliorée Les adaptations mentionnées ci-dessus, qui visent l épuration des compétences à mesurer (notamment l ajout de couleurs et l agrandissement des dessins du matériel de stimuli), contribuent certainement à améliorer la convivialité. La modification de la mise en page des livres de stimuli (dessins tournés vers le client) augmente également le confort d utilisation, tant pour le client que pour le praticien. Pearson vise également à réduire la durée de test pour la batterie principale, en la faisant passer de 80 minutes à environ 67 minutes, grâce à la mise en place de nouvelles règles d abréviation (10, 12). Les règles de réduction plus rapides diminueraient également la quantité d échecs vécus par le client, ce qui apporterait un effet considérable (favorable) sur sa motivation. Dans notre expérience clinique personnelle, nous n avons pas constaté de problématique au niveau des règles d abréviation du WAIS-III-NL (dans le sens où elles engendreraient trop d expériences d échecs et nuiraient à la motivation). Selon nous, dans le contexte actuel de pression au travail et d exigence d efficacité, il serait toutefois difficile de plaider contre une réduction de la durée du test, à moins d y perdre en précision et en profondeur. Amélioration de l applicabilité clinique? Voilà un bonus dans lequel nous plaçons beaucoup d espoir: des normes pour des sous-groupes cliniquement définis. Pearson met à notre disposition les résultats d un groupe de surdoués, de personnes présentant une déficience légère, de dyslexiques et de patients Alzheimer. Il est toutefois dommage de devoir émettre certaines objections sérieuses concernant cette section. Par exemple, nous ne trouvons qu une description sommaire des groupes cliniques. En outre, la «surdouance» n est pas clairement définie, l outil employé pour la constater n étant pas mentionné. Pearson n indique pas non plus comment le diagnostic de dyslexie a été posé. Enfin, on peut se poser la question de la définition utilisée pour la «déficience légère», étant donné que le critère d inclusion est un QI < 49. De plus, la taille du groupe de patients Alzheimer (N = 23) est des plus problématiques. L explication donnée pour la moyenne de QIT = 123 pour le groupe de surdoués selon le critère de QI > 129 est particulièrement singulière («régression vers la moyenne»). Notons également le fait que la régression vers la moyenne ne semble pas, selon nous, pouvoir expliquer la différence indiquée (à moins que les données mentionnées ci-dessus ne soient qu une simple description et non un phénomène statistique?). Ainsi, les résultats doivent à tout le moins donner lieu à un complément d études, vu l affirmation concernant une meilleure capacité de différenciation aux extrémités du continuum (12). Enfin, il manque des normes pour beaucoup d autres troubles psychiques fréquents. Il semble plus qu indiqué de poursuivre le travail de normalisation. Progrès en psychométrie 4 l Neuron Vol 18 Nr 1 2013 Les aspects importants d une évaluation psychométrique consistent en la qualité de l étude de normalisation, la fiabilité des scores obtenus et la validité du test. Par fiabilité, nous entendons la mesure dans laquelle l évaluation est exempte de facteurs arbitraires (qui n ont rien à voir avec le concept à évaluer). Par validité, nous entendons: l instrument mesure-t-il efficacement le concept visé dans ce cas, l intelligence? Au titre d instance officielle, la COTAN (COmmissie TestAangelegenheden Nederland commission des tests aux Pays-Bas), de l institut néerlandais des psychologues (NIP) formule des avis sur les nouveaux instruments psychodiagnostiques, qu elle inclut dans des livres de tests ainsi que dans sa base de données électronique (14). Dans les lignes qui suivent, nous essayons de résumer son avis sur le WAIS-IV-NL. Fort heureusement, le contenu de certains items de tests a été adapté à des situations et événements plus contemporains, certains items sont adaptés en vue d une meilleure différenciation pour les niveaux de scores les plus extrêmes et, surtout, des nouvelles normes ont été collectées pour être représentatives de la cohorte de population actuelle. L intérêt de ce dernier point a été démontré il y a quelques années par le fameux effet Flynn (voir encadré). Par rapport au WAIS-III-NL, la notice technique du WAIS-IV-NL est mieux documentée, autrement dit plus étendue, pour les études de normalisation, ce que confirme d ailleurs la COTAN. De nouvelles normes pour les néerlandophones ont été recueillies entre 2010-2011, stratifiées selon d importantes variables démographiques (âge, sexe, ethnie, formation, région) et traitées séparément pour la Flandre. L effet Flynn En 1994, Flynn a décrit une augmentation des scores de QI au fil des générations, soit le phénomène transgénérationnel par lequel les prestations individuelles aux tests augmentent à mesure que les données normalisées vieillissent. Jusqu à présent, les causes relèvent encore en grande partie de la spéculation (16). Le groupe de normalisation flamand est composé d un échantillon pondéré de 500 personnes, 50 par catégorie d âge, dont 25 hommes et 25 femmes. Un grand soin a été apporté à la description des groupes de normes en termes de variables contextuelles et de leur pondération afin d obtenir une bonne représen-
tativité, mais la sélection intrinsèque de l échantillon a été moins minutieuse. La description sommaire nous permet de conclure qu il ne s agit pas d un échantillon strictement randomisé. L inclusion de sujets dans les «groupes spéciaux» tels que la surdouance n est pas suffisamment précisée (12, 14). Afin de déterminer la fiabilité, il a été décidé de recourir à une méthode de bissection par subtest pour chaque cohorte (le test est divisé en deux et la corrélation entre les deux moitiés est calculée). Cette méthode est plutôt dépassée, comme l indique l avis de la COTAN. Elle offre des résultats moins précis que les alternatives plus récentes telles que le coefficient alpha. En outre, elle entraîne souvent une sous- ou une surestimation de la fiabilité (14). Les coefficients alpha indiqués dans l annexe du manuel sont heureusement d un niveau acceptable et permettent malgré tout une bonne fiabilité des scores de QI et d indices (calculés conjointement pour la Belgique et les Pays-Bas), ainsi que des scores échelonnés (calculés séparément pour la Belgique et les Pays-Bas) (les scores de processus ne sont pas échelonnés en raison de leur portée limitée et de leur inadaptabilité aux études de normalisation). Une analyse factorielle de confirmation afin de tester la validité des construits du WAIS-IV-NL est la plus indiquée pour une solution à quatre facteurs, établie conformément aux attentes. Notons en revanche la singularité suivante: le subtest d arithmétique n est pas davantage corrélé à son propre indice qu aux indices de compréhension verbale et de raisonnement perceptif. En ce qui concerne la validité convergente, nous observons de bonnes corrélations avec d autres tests d intelligence (12, 14). Pour résumer, le WAIS-IV-NL semble réussir à l examen psychométrique. Toutefois, il est étrange et regrettable que certaines explications de résultats d études anormaux, inattendus ou moins favorables ne soient pas explicitement signalées, très peu argumentées, voire postulées de façon incompréhensible (14). En outre, peu d explications alternatives sont fournies et elles sont par conséquent peu exploitées (14). Le tableau 2 résume l avis de la COTAN sur le WAIS-IV-NL; vous trouverez l intégralité de cet avis sur www.cotandocumentatie.nl. Pronostic pour la pratique psychodiagnostique clinique scientifique: encore un début difficile? La constitution de vastes groupes de normalisation stratifiés est un travail de longue haleine qui force le respect. Toutefois, nous craignons qu avec les échantillons actuels de 50 personnes par cohorte d âge pour la Flandre, l histoire ne se répète: l utilisation des normes néerlandophones initiales pour le WAIS III avait déjà soulevé de nombreuses interrogations dans la pratique clinique, qui n ont pas été totalement élucidées par la description de l effet Flynn. Finalement, les groupes de normalisation initiaux ont fait l objet d une révision et les résultats ont été transmis aux utilisateurs. Si cette adaptation concernait une trop grande proportion de personnes à haut degré de formation dans les normes néerlandophones initiales du WAIS-III (15) et que la constitution des groupes de normalisation de la WAIS-IV-NL retombe manifestement dans ce travers (14), nous craignons surtout pour la représentativité des groupes de normalisation flamands actuels par cohorte, étant donné la (faible) taille de l échantillon. Cela ne signifie pour autant pas que l instrument en lui-même en perde de son potentiel, ce qui donne de l espoir pour l avenir proche. Pour ce qui est de la Flandre, il est en outre essentiel de réfléchir aux modifications que l Agence flamande devra probablement apporter, en particulier la définition de ses critères d inclusion (actuellement liés au WAIS-III- Tableau 2: Avis de la COTAN sur la WAIS-IV-NL. Critères d appréciation Points de départ lors de l élaboration du test Qualité du matériel de test Qualité de la notice Normes Fiabilité Validité du concept Validité du critère Scores d indices et score total Subtests principaux et subtests complémentaires Scores de processus Appréciation Bon Bon Goed Insuffisant Insuffisant (aucune étude) 5 l Neuron Vol 18 Nr 1 2013
NL) concernant des groupes vulnérables spécifiques, pour lesquels il est possible de faire appel au soutien des autorités. Enfin, il faut insister sur le fait qu il n est pas possible de transposer directement un ancien score WAIS-III-NL individuel en un nouveau score WAIS-IV-NL simplement par le biais des différences repérées au niveau du groupe. Le résultat WAIS-IV-NL doit plutôt être considéré comme un meilleur indicateur (car renormalisé) du construit à mesurer. Conclusion Pour la psychométrie, le WAIS-IV-NL semble offrir des améliorations prometteuses par rapport à la version précédente. Toutefois, on peut à l heure actuelle émettre des critiques quant à l affirmation (basée pour le moment sur des données d études très limitées) d une plus grande utilité pour certains groupes cibles spécifiques. Il est également regrettable que pour le groupe cible global, l histoire du WAIS-III-NL, qui avait nécessité l extension et/ou la correction des données normalisées, risque de se répéter. Références 1. Meyer G, Finn SE, Eyde L, et al. Psychological testing and psychological assessment: A review of evidence and issues. Am Psychol 2001;56(2):128-65. 2. Ter Laak J, De Goede MPM. Psychologische diagnostiek. Inhoudelijke en methodologische grondslagen. Lisse: Swets & Zeitlinger; 2003. 3. Haynes S, Mumma GH, Pinson C. Idiographic assessment: conceptual and psychometric foundations of individualized behavior assessment. Clin Psychol Rev 2009;29:179-91. 4. Poston JM, Hanson WM. Meta-analysis of psychological assessment as a therapeutic intervention. Psychological Assessment 2010;22(2):203-12. 5. Spearman C. General intelligence : Objectively determined and measured. Am J Psychol 1904;15:201-93. 6. Catell RB. The measurement of adult intelligence. Psychol Bull 1943;38:153-93. 7. Catell RB. Theory of fluid and crystallized intelligence: A critical experiment. Journal of Educational Psychology 1963;54:1-22. 8. McGrew KS, Flanagan DP. The intelligence test deskreference (ITDR): Gf-Gc cross-battery assessment. Boston: Allyn & Bacon; 1998. 9. Gottfredson L, Saklofske DH. Intelligence: foundations and issues in assessment. Canadian Psychology 2009;50(3):183-95. 10. Wechsler D. WAIS-IV-NL, Nederlandstalige bewerking. Afname en scoringshandleiding. Amsterdam: Pearson Assessment & Information B.V.; 2012. 11. Wechsler D. WAIS III-NL, Nederlandstalige bewerking. Afname en scoringshandleiding. Lisse: Swets Test Publishers; 2000. 12. Wechsler, D. WAIS IV-NL, Nederlandstalige bewerking. Technische handleiding. Amsterdam: Pearson Assessment & Information B.V.; 2012. 13. Wechsler D, Kaplan E, Fein D, et al. Wechsler intelligence scale for children fourth edition integrated. San Antonio, TX: Harcourt Assessment; 2004. 14. Evers, A, Egberink, IJL, Braak, MSL, Frima, RM, Vermeulen, CSM, & Vliet-Mulder, JC van. COTAN Documentatie. Amsterdam: Boom test uitgevers; 2009-2012. 15. Tellegen P. De kwaliteit van de normen van de WAIS-III. De Psycholoog 2002;37:460-5. 16. Vertommen S, Jacobs T, Joos S. WAIS-3: Evidence based practice of practice based evidence? Tijdschrift voor Klinische Psychologie 2004;34(4):232-43. 6 l Neuron Vol 18 Nr 1 2013