N de cat. : PS3-1/2007-4F-PDF N ISBN : 978-0-662-09392-3

Documents pareils

Une échelle d évaluation semistructurée. B. Gravier

Modèle d évaluation et de réadaptation des délinquants fondé sur les principes du risque, des besoins et de la réceptivité.

La validité des évaluations du risque de violence envers la partenaire intime : une méta-analyse. R. Karl Hanson. Leslie Helmus.

d évaluation Objectifs Processus d élaboration

Établissement des taux d actualisation fondés sur la meilleure estimation aux fins des évaluations de provisionnement sur base de continuité

«Trajectoires criminelles et récidive des délinquants sexuels adultes : l hypothèse "statique" revue et corrigée»

CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE. Information importante : Ces conseils ne sont pas exhaustifs!

Commentaires sur le projet de lignes directrices (G3) pour l évaluation de la durabilité de la Global Reporting Initiative

Karine Côté, Ph.D. Professeure adjointe

Questionnaire du projet Innocence

Item 169 : Évaluation thérapeutique et niveau de preuve

Crédits d impôt pour la recherche scientifique et le développement expérimental («RS&DE»)

Activité des programmes de médicaments

Les homicides avaient été les plus fréquents dans les régions de l'ontario et des Prairies, qui

Le programme de maîtrise avec stage

Carrières. Une carrière au Service correctionnel du Canada : Joignez-vous à nous! Descriptif. Objectifs d apprentissage

BUREAU DU CONSEIL PRIVÉ. Vérification de la gouvernance ministérielle. Rapport final

Cinzia Grassi, Loredana Ceccacci, Anna Elisa D Agostino Observatoire pour le contraste de la pédophilie et de la pornographie enfantine

Protection des renseignements personnels, publicité ciblée et médias sociaux : Ampleur du problème : certaines observations déconcertantes

Fondements éthiques et domaines d'activités des services de probation en Suisse

Orientations. gouvernementales. en matière. d agression. sexuelle. Plan d action

NORME INTERNATIONALE D AUDIT 330 REPONSES DE L AUDITEUR AUX RISQUES EVALUES

«L évaluation de la validité prédictive du LS/CMI dans la prédiction des incidents disciplinaires en prison»

«La prison est la seule solution pour préserver la société.»

Sommaire. Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos»)

Les Américains, les Britanniques et les Canadiens ont une position sévère envers la criminalité

l L immense majorité des condamnations concernent des délits

Principes de bonne pratique :

Déclin des groupes visés par l équité en matière d emploi lors du recrutement. Étude de la Commission de la fonction publique du Canada

SURVEILLANCE ÉLECTRONIQUE

Vérification des procédures en fin d exercice

évaluations avec date de calcul à compter du 31 décembre 2014 (mais au plus tard le 30 décembre 2015).

Misereor a-t-elle besoin «d études de base»? Document d information à l intention des partenaires

Sondage de référence 2005 sur la satisfaction des clients du CRSH

NOTE D INFORMATION. Conseils sur l autoévaluation en matière de cybersécurité

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Votre outil pour vous démarquer sur le terrain de l interactivité. www. Moteurs de recherche. Médias Sociaux. Web. Mobilité. Assurance automobile

Réseau sur. Médicaments. l Innocuité et l Efficacité des. Document d orientation pour la présentation de requêtes au RIEM

COMMISSARIAT À LA PROTECTION DE LA VIE PRIVÉE DU CANADA. Vérification de la gestion des ressources humaines

Dans ce document, on décrit les indices des prix des biens de la TIC qui sont produits, ainsi que les sources de données et la méthodologie.

ASSOCIATION CANADIENNE DES COURTIERS DE FONDS MUTUELS

Réglementation des jeux de casino

Évaluation du risque de récidive : de la nécessité d une evidence-based expertise

Liste de vérification de la mise en œuvre d une équipe de santé familiale

Statistiques de finances publiques consolidées

Norme ISA 330, Réponses de l auditeur à l évaluation des risques

Liste de vérification pour la planification des services d approche

Statistiques sur les armes à feu Tableaux mis à jour

REGARDS SUR L ÉDUCATION 2013 : POINTS SAILLANTS POUR LE CANADA

Le référentiel RIFVEH La sécurité des personnes ayant des incapacités : un enjeu de concertation. Septembre 2008

Le handicap est plus fréquent en prison qu à l extérieur

Préparation du plan de réalisation d un projet

INTRODUCTION. Cadre d évaluation de la qualité des données (CEQD) (juillet 2003)

Prendre la mesure Étude comparative sur le commerce de détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Compte rendu de l examen par le BSIF des coefficients du risque d assurance

Écoutez ce qui se dit sur l épargne-retraite au Canada

LE PROBLÈME DE RECHERCHE ET LA PROBLÉMATIQUE

Rapport sur les droits à l égalité des. Autochtones

Brock. Rapport supérieur

2. Le placement sous surveillance. électronique mobile La rétention de sûreté 164

Lignes. directrices. droits. d enfants. d accès. Pour l expertise en matière de garde. et des. février 2oo6

BUREAU DE LA SÉCURITÉ DES TRANSPORTS DU CANADA

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

INSTITUT DE LA STATISTIQUE DU QUÉBEC SANTÉ. Vivre avec une incapacité au Québec

COMMENTAIRE. Services économiques TD

MÉTHODOLOGIE DE L ASSESSMENT CENTRE L INSTRUMENT LE PLUS ADÉQUAT POUR : DES SÉLECTIONS DE QUALITÉ DES CONSEILS DE DÉVELOPPEMENT FONDÉS

23. Interprétation clinique des mesures de l effet traitement

DÉCISION DU TRIBUNAL DE LA SÉCURITÉ SOCIALE Division générale Assurance-emploi

ANNEXE A LA CIRCULAIRE SUR LE CONTROLE INTERNE ET L AUDIT INTERNE TABLE DES MATIERES

PROJET PILOTE DE TRIBUNAL CHARGÉ DES CAUSES DE VIOLENCE CONJUGALE (TVC) MONCTON (NOUVEAU-BRUNSWICK)

HARCÈLEMENT CRIMINEL. Poursuivre quelqu un, ce n est pas l aimer!

Dictionnaire de données de la Base de données du Système national d information sur l utilisation des médicaments prescrits, octobre 2013

Nobody s Unpredictable

L obligation de déposer un rapport Guide à. l intention des employeurs, exploitants et infirmières

La fumée de tabac secondaire (FTS) en Mauricie et au Centre-du- Québec, indicateurs du plan commun tirés de l ESCC de

Directeur de la publication : André-Michel ventre, Directeur de l INHESJ Rédacteur en chef : Christophe Soullez, chef du département de l ONDRP

ISBN-13 : Dépôt légal : Bibliothèque et Archives nationales du Québec, 2009

Fonds d investissement Tangerine

«Une bonne thèse répond à une question très précise!» : comment l enseigner?

La supervision en soins infirmiers

LE PROGRAMME D APPRENTISSAGE ET DE LEADERSHIP DU PERSONNEL ENSEIGNANT Résumé : Rapport de recherche

à moyen Risque moyen Risq à élevé Risque élevé Risq e Risque faible à moyen Risq Risque moyen à élevé Risq

Fiche d information à l intention des parents. Volet 2 Les options résidentielles

Évaluation et recommandations

Bureau du surintendant des institutions financières. Audit interne des Services intégrés : Services de la sécurité et de l administration

Info-assurance Séance d information de l IASB du 19 mars 2015

Avant projet de texte légal portant régime de l intégration du genre dans les politiques nationales de croissance et de l emploi

Une nouvelle norme mondiale sur la comptabilisation des produits

Sondage public 2012 sur les services policiers

RETOUR AU TRAVAIL Stratégies de soutien du superviseur lorsque la santé mentale joue un rôle dans le retour de l employé au travail

INF6304 Interfaces Intelligentes

Violence au travail Un organisme national

SOMMAIRE. AVRIL 2013 TECHNOLOGIE ÉTUDE POINTS DE VUE BDC Recherche et intelligence de marché de BDC TABLE DES MATIÈRES

Norme ISA 510, Audit initial Soldes d ouverture

Document d orientation sur les allégations issues d essais de non-infériorité

ANNEXE 4. Réaliser un diagnostic de sécurité Principales méthodes de collecte d information. (Module 3, partie I, section 2.5)

Principes de mathématiques 12 SÉRIE DE PROBLÈMES. Septembre Student Assessment and Program Evaluation Branch

Résumé du projet (french) Karl Krajic Jürgen Pelikan Petra Plunger Ursula Reichenpfader

Transcription:

Évaluation de l utilité des outils d évaluation du risque et des mesures de la personnalité pour la prédiction de la récidive avec violence chez les délinquants adultes 2007-04 par Mary Ann Campbell, Ph.D. Sheila French, M.A. et Paul Gendreau, Ph.D. Centre for Criminal Justice Studies Université du Nouveau-Brunswick à Saint John Le présent rapport a été rédigé dans le cadre d un contrat conclu avec le ministère de la Sécurité publique et de la Protection civile. Les opinions exprimées n engagent que les auteurs et ne sont pas nécessairement celles du Ministère.

N de cat. : PS3-1/2007-4F-PDF N ISBN : 978-0-662-09392-3

Note des auteurs Mary Ann Campbell, Ph.D, est chargée d enseignement et directrice du Centre for Criminal Justice Studies, Département de psychologie, Université du Nouveau-Brunswick (campus de Saint John). Sheila French est étudiante au doctorat en psychologie sous la direction de M me Campbell. Paul Gendreau est chercheur invité à la Division of Criminal Justice de l Université de Cincinnati et professeur émérite au Département de psychologie de l Université du Nouveau-Brunswick (campus de Saint John). Les demandes de renseignements au sujet du manuscrit doivent être envoyées à Mary Ann Campbell au Centre for Criminal Justice Studies, Université du Nouveau-Brunswick, C. P. 5050, Saint John (Nouveau-Brunswick), Canada, E2L 4L5; adresse électronique : mcampbel@unbsj.ca. Les auteurs tiennent à rendre hommage à Laurie Green, qui a calculé le coefficient d objectivité du présent projet. Nous remercions Karl Hanson pour ses suggestions au sujet du taux de base et Paula Smith pour son aide concernant l établissement de la base de données. Enfin, nous remercions Delphine Gossner, Karl Hanson, Peter Raynor, Steve Van Dine, Glenn Walters et Steve Wormith, qui n ont ménagé ni leur temps ni leurs efforts pour nous aider et qui nous offert gracieusement des documents de référence et/ou des données non publiées. Une version antérieure du présent rapport a paru en 2007, mais elle a été révisée depuis en raison d erreurs statistiques. Cela n a à peu près pas entraîné de changements dans l interprétation, la conclusion ou les recommandations du rapport, mais pour plus de clarté et d exactitude, les citations devraient renvoyer au document actuel.

Table des matières Sommaire... i Introduction... 1 Prédicteurs du risque et principes procéduraux importants pour l évaluation du risque... 1 Variations des outils d évaluation du risque de violence... 2 Résumé... 7 Méthodes et procédure... 9 Échantillon d études... 9 Codage des études... 9 Calcul de la valeur de l effet...10 Hétérogénéité de la valeur de l effet...10 Estimation du nombre garantissant la certitude des résultats...11 Résultats...13 Description de la base de données...13 Mesures du risque : validité prédictive de la violence en établissement...14 Mesures du risque : validités prédictives de la récidive avec violence...15 Comparaison des valeurs de l effet selon la génération de l outil d évaluation du risque...16 Comparaisons fondées sur le contenu de l outil : statique par rapport à dynamique...17 Comparaisons fondées sur la méthode d administration des mesures...18 Comparaisons fondées sur la pertinence des outils d évaluation pour les services correctionnels...19 Discussion...21 Outils actuariels et structurés et échelle de psychopathie...21 Recommandations pour guider la sélection des outils d évaluation de la violence future...25 Autres questions qui pourraient faire l objet d études à l avenir...30 Conclusion...31 Bibliographie...33 Annexe A...47

Sommaire Malgré l existence d outils d évaluation du risque de violence [p. ex. le guide d évaluation du risque de violence (VRAG)], d outils généraux d évaluation du risque lié à la criminalité et à la violence permanentes [p. ex. inventaire du niveau de service révisé (INS-R)] et de mesures de la personnalité associée à l agression [échelle de psychopathie révisée (PCL-R)], relativement peu de méta-analyses comparatives de ces méthodes d évaluation ont été réalisées concernant leur validité prédictive et leur valeur limite pour l établissement d objectifs en matière d évaluation du risque de violence. Ces objectifs comprennent la prédiction du risque, la définition d objectifs de réduction du risque et la conception d un moyen de surveiller les variations du niveau de risque. Par conséquent, la présente étude visait à procéder à une évaluation méta-analytique de l utilité relative des outils d évaluation du risque et d autres mesures psychologiques comme moyen de contribuer à l établissement de normes de pratique pour la réalisation d évaluation du risque de violence. La présente méta-analyse a permis de comparer divers outils (p. ex. auto-évaluation, protocoles d évaluation du risque clinique actuariels/structurés) qui ont servi à l estimation du risque de violence. Afin de figurer dans la méta-analyse, une étude devait avoir été effectuée après 1980, être de nature prospective et comprendre un échantillon de cas de délinquants adultes bénéficiant de services de psychiatrie légale. De plus, il était essentiel que l étude présente une estimation statistique de la relation entre un outil d évaluation particulier et un résultat violent (non sexuel) ayant trait à la violence en établissement ou à la récidive avec violence qui pourrait être transformé en valeur de l effet. Les études sur la récidive devaient aussi comprendre une période de suivi après la mise en liberté d au moins six mois dont il fallait tenir compte dans l analyse alors qu aucune période de suivi minimale n était nécessaire pour les études portant sur la violence en établissement si elle était de nature prospective. On n a ménagé aucun effort pour recueillir des données publiées et non publiées. Un guide de codage a été conçu afin d obtenir des renseignements sur les caractéristiques de l étude et de l échantillon ainsi que le genre et la présentation des méthodes d évaluation du risque utilisées et de recueillir les données statistiques pour le calcul des estimations de la valeur de l effet. L interprétation des résultats était fondée sur la statistique Z +, qui est une estimation de la valeur de l effet ajustée en fonction de la taille de l échantillon. La statistique Z + a été calculée au moyen de r, qui est la corrélation entre un outil d évaluation et une variable des résultats après ajustement pour tenir compte du taux de violence de base de l échantillon. Lorsque les intervalles de confiance de 95 % entre deux valeurs de l effet moyennes se chevauchaient dans une proportion d au plus un quart de la longueur moyenne des deux intervalles, les deux valeurs de l effet moyennes ont été interprétées comme représentant deux paramètres de population différents et étaient statistiquement différentes les unes des autres [c.-à-d. que p 0,05; Cummings & Finch (2005)]. Le chevauchement des intervalles de confiance concernant la valeur de l effet qui excédait ce critère indiquait que les valeurs résultaient du même paramètre de population de l échantillon et qu elles n étaient donc pas statistiquement différentes les unes des autres. La méta-analyse a permis de faire un certain nombre de constatations significatives. En particulier, il y avait très peu de variation dans l ampleur de la validité prédictive de la récidive violente pour les outils d évaluation du risque actuariels/structurés utilisés et ayant fait l objet de recherche le plus souvent (c.-à-d. HCR-20, INS-R, échelle d ISR et PCL-R). Le nombre le plus élevé de valeurs de l effet a été obtenu pour l échelle PCL-R, mais les cinq outils ont produit des intervalles de confiance relativement précis pour leurs estimations du risque de violence dans la collectivité. Les valeurs de l effet variaient de 0,22 (pour l échelle d ISR et l échelle HCR-R) à 0,32 (pour le guide VRAG), ce qui témoigne de la validité prédictive généralement modérée de ces outils pour le résultat de la récidive violente. Les intervalles de confiance pour le guide VRAG, l INS-R et l échelle PCL-R se chevauchaient tous, ce qui i

indique que ces mesures étaient des prédicteurs égaux de la récidive violente. Les intervalles de confiance concernant la valeur de l effet de l échelle HCR-20 chevauchaient également l INS-R, l échelle PCL-R et l échelle d ISR tandis que le guide VRAG a donné de meilleurs résultats que l échelle HCR-20 et l échelle d ISR. On a obtenu beaucoup moins de valeurs de l effet pour la prédiction de la violence en établissement que pour la récidive violente. Seule l échelle HCR-20 excédait les critères minimums de 10 valeurs de l effet nécessaires pour une interprétation significative. Une forte variabilité était également évidente dans les intervalles de confiance pour les valeurs de l effet de chaque outil examiné (y compris l échelle HCR-20), ce qui a limité encore plus l interprétation de leur valeur prédictive. Compte tenu de ces limites, les données préliminaires donnent à penser que les estimatives prédictives les plus solides provenaient de l échelle HCR-20 (Z + = 0,28), de l INS-R (Z + = 0,24) et de l échelle PCL-VD (Z + = 0,22) et d une variable sur les antécédents criminels (Z + = 0,26). Même si seulement l échelle HCR-20 avait assez de valeurs de l effet pour permettre d avoir une confiance relative dans l interprétation de sa vraie validité prédictive, ces valeurs étaient surtout fondées sur des échantillons de délinquants bénéficiant de services de psychiatrie légale. Par conséquent, même l utilisation de l échelle HCR-20 comme prédicteur de la violence en établissement exige des recherches supplémentaires concernant son applicabilité aux milieux carcéraux généraux. D autres variables ont été examinées comme modérateurs possibles de la validité prédictive des outils utilisés pour évaluer le risque de violence. D après ces analyses, en tant que groupe, les outils d évaluation du risque de deuxième génération (conçus à partir de procédures statistiques, qui contenaient des éléments principalement statiques et étaient de nature non théorique) étaient les prédicteurs les plus solides de la violence en établissement. Par contre, les outils d évaluation du risque de troisième génération (axés sur la théorie, qui contenaient des éléments dynamiques et qui consistaient à mesurer les variations du risque) ont fourni ensemble les valeurs de l effet les plus fortes pour la prédiction de la récidive avec violence dans la collectivité. La variation de la validité prédictive des outils de deuxième et de troisième génération d évaluation des résultats de la récidive avec violence et de la violence en établissement peut être attribuable à la longueur des périodes de suivi. Les études sur la violence en établissement ont généralement une durée plus brève que les études sur la récidive. De plus, il y avait un lien plus étroit entre les outils qui avaient un contenu concernant la théorie criminologique et/ou ceux qui étaient spécialement conçus comme outils d évaluation du risque et la prédiction de la violence en établissement et la récidive avec violence qu avec ceux qui n avaient pas été conçus à l origine pour prédire le risque et/ou ceux qui mesuraient les concepts non pertinents ou faiblement associés au comportement criminel (p. ex. l estime de soi). En conclusion, la plupart des outils d évaluation du risque disponibles actuellement sont des prédicteurs modérés de la violence future. Les outils fondés sur des facteurs historiques peuvent fournir des estimations plus fiables du risque de violence pendant l incarcération (c.-à-d. prédictions à court terme), mais l inclusion de facteurs dynamiques du risque et des besoins est importante pour la prédiction de la violence après la mise en liberté (c.-à-d. prédictions à long terme). Comme la plupart de ces outils prédisent la violence à des degrés semblables de précision, le choix de l outil d évaluation du risque le plus approprié devrait être fondé sur : a) le but de l évaluation du risque, b) la capacité de l outil de définir adéquatement les facteurs criminogènes du risque de violence d un délinquant; c) la valeur informative de l outil pour les programmes de traitement afin de réduire le risque de violence; d) la capacité de l outil de mesurer les variations du niveau de risque. Chacun de ces facteurs facilite les pratiques de gestion des cas efficaces dans le cas des délinquants incarcérés ou sous surveillance dans la collectivité. ii

Évaluation de l utilité des outils d évaluation du risque et des mesures de la personnalité pour la prédiction de la récidive avec violence chez les délinquants adultes L évaluation du risque de violence future d un délinquant joue un rôle prépondérant dans les décisions prises concernant la peine à imposer à cet individu, la gestion du cas, la mise en liberté et les préoccupations en matière de sécurité publique [Andrews et Bonta (2003); Hoge et Andrews (1996)]. Ces évaluations devraient aussi aider à guider le choix des objectifs et des stratégies d intervention qui permettront de réduire le risque [Heilbrun (1997)]. La plus grande partie des connaissances actuelles concernant la prédiction du risque de violence ont été acquises par suite de la recherche de réponses à des préoccupations (surtout dans les années 50 et 60) concernant la validité des critères utilisés pour prendre des décisions en matière de risque [Andrews (1989); Heilburn (1997); Litwack et Schlesinger (1999); Monahan et Steadman (1994); Rice (1997)]. Plus précisément, les évaluations du risque de première génération au milieu du XX e siècle [Bonta (2002)] étaient fondées sur des jugements cliniques subjectifs du risque, qui étaient généralement formulés au moyen de méthodes d évaluation non structurées et non systématiques [Hoge et Andrews (1996)]. La plupart des études ultérieures ont montré que la précision des évaluations du risque non structurées est inférieure aux estimations du risque provenant de méthodes de prédiction objectives, structurées et fondées sur des données (actuarielles) [Bonta, Law et Hanson (1998); Grove, Zald, Lebow, Snitz et Nelson (2000)]. L essentiel, c est que la prédiction exacte de la dangerosité future s est révélée difficile pour les spécialistes [Hanson (2005); Quinsey, Harris, Rice et Cormier (1998)], mais elle peut être facilitée par l utilisation d outils d évaluation du risque structurés. Pour faciliter davantage la pratique de l évaluation du risque de violence, l étude actuelle présentera un examen méta-analytique des divers outils d évaluation utilisés pour guider ce processus. Afin d établir la base des résultats et de la discussion, la première section de l introduction décrira brièvement les facteurs importants pour la prédiction exacte du risque ainsi que les principes qui devraient guider le processus d évaluation et de réduction du risque. Nous examinerons ensuite les outils d évaluation contemporains du risque de violence et leurs variations sur le plan du résultat prévu, du contenu et de l administration. Prédicteurs du risque et principes procéduraux importants pour l évaluation du risque Une caractéristique nécessaire d une évaluation du risque efficace est la définition des variables qui contribuent au comportement criminel d un individu [Bonta (2002)]. Beaucoup d études ont été consacrées à cette tâche et ont fait ressortir un certain nombre de facteurs historiques et psychosociaux importants qui sont pertinents pour la prédiction de la dangerosité et la criminalité persistante [voir Andrews et Bonta (2003); Borum (1996)]. Pour résumer brièvement deux méta-analyses exhaustives sur les prédicteurs de la récidive, Bonta et coll. (1998) et Gendreau, Little et Goggin (1996) ont défini les attitudes antisociales, les pairs antisociaux, la toxicomanie, le dysfonctionnement familial, les conflits interpersonnels et les modes de vie négatifs ou instables ainsi que certaines variables démographiques (sexe masculin, célibataire et jeunes) comme prédicteurs utiles de la récidive générale et violente. En ce qui concerne la récidive avec violence, il existe d autres prédicteurs, notamment le diagnostic de trouble de la personnalité antisociale ou de psychopathie, les antécédents de comportement violent et des problèmes d emploi [Bonta et coll. (1998)]. De plus, ces prédicteurs importants du risque sont courants chez les populations carcérales générales et les délinquants souffrant de troubles mentaux [Bonta et coll. (1998); Phillips et coll., (2005)]. Il vaut également la peine de mentionner que bon nombre des facteurs cliniques traditionnels utilisés pour l évaluation du risque (p. ex. intelligence, troubles de l humeur, psychose, estime de soi) ont produit les validités prédictives les plus faibles pour la récidive avec violence et générale [Bonta et coll. (1998); Gendreau et coll. (1996)]. 1

L évaluation exacte du risque constitue une étape essentielle de la réduction efficace de celui-ci. Les principes directeurs à la base de l évaluation efficiente du risque ou de la réadaptation sont les principes du risque, du besoin et de la réceptivité décrits par Andrews et Bonta (2003). Selon leur modèle, le principe du risque est fondé sur l hypothèse qu il est possible de prédire le comportement criminel et que l intensité de l intervention visant à réduire ce risque doit correspondre au niveau de risque du délinquant. Deuxièmement, le principe du besoin reconnaît que certains facteurs de risque peuvent être changés de manière à réduire le risque. Ces «facteurs criminogènes» ont trait au mode de vie, aux cognitions et au comportement du délinquant (p. ex. attitudes antisociales, toxicomanie) et sont liés empiriquement au risque de violence et/ou à la criminalité générale. Les interventions visant à réduire le risque doivent permettre de faire face aux facteurs criminogènes plutôt qu aux facteurs qui ont de faibles liens avec la récidive (p. ex. estime de soi, dépression). Enfin, le principe de la réceptivité concerne le mode et la méthode d intervention utilisés pour cibler les facteurs criminogènes. Le choix du traitement doit essentiellement être fondé sur des programmes qui s appuient sur des données empiriques pour la réduction du comportement criminel comme les approches cognitivo-comportementales et d apprentissage social [c.-à-d. réceptivité générale; Andrews et Bonta (2003)]. L intervention doit également tenir compte du mode d apprentissage du délinquant et d autres facteurs qui peuvent nuire à sa capacité de répondre à l intervention, comme un trouble mental, la motivation de changer ou les déficiences physiques [c.-à-d. réceptivité particulière; Andrews et Bonta (2003)]. On a montré que l application des principes du risque, du besoin et de la réceptivité contribue plus à la réduction du risque que les interventions qui ne tiennent pas compte de ces principes ou qui en tiennent peu compte [Andrews et Bonta (2003); Dowden et Andrews (2000); French et Gendreau (2006); Gendreau, Goggin, French et Smith (2006)]. Les études poussées sur la prédiction du risque et les principes du risque, du besoin et de la réceptivité ont fourni des balises utiles permettant de concevoir des outils valides pour l évaluation du risque de violence. Variations des outils d évaluation du risque de violence Dans le but d améliorer la qualité, la validité et l efficience des décisions prises en matière de risque de violence, on a accordé beaucoup d attention à la conception d outils d évaluation du risque uniformisés, et un certain nombre d outils d évaluation du risque prometteurs fondés sur des données empiriques ont été élaborés [Borum (1996); Webster, Douglas, Eaves et Hart (1997a)]. Certains de ces outils sont conçus spécialement pour prédire la dangerosité comme le mécanisme de prédiction de la violence [VPS; Webster, Harris, Rice, Cormier et Quinsey (1994)], l échelle d évaluation du risque de violence [EERV; Wong et Gordon (2006)] et l échelle des variables historiques, cliniques et de gestion du risque [HCR-20; Webster, Douglas, Eaves et Hart (1997b)]. Dans quelques cas, les outils visent à prédire une forme particulière de violence comme la violence à l endroit d un partenaire intime [guide d évaluation du risque de violence conjugale ERVC; Kropp, Hart, Webster et Eaves (1995)] ou la récidive sexuelle [risque de violence sexuelle-20 SVR-20; Boer, Hart, Kropp et Webster (1997)]. Par conséquent, les spécialistes ont le choix des outils d évaluation pour la prédiction de la dangerosité générale ainsi que certains types de comportement violent. Même s ils ne sont pas considérés comme une mesure du risque, les traits de personnalité psychopathique évalués par l échelle de psychopathie révisée [PCL-R; Hare (1991); 2003] se sont révélés utiles pour la prédiction de la violence future [Gendreau, Goggin et Smith (2002); Hemphill, Hare et Wong (1998)]. De plus, on a montré que les mesures du risque de récidive générale [p. ex. inventaire du niveau de supervision révisé (INS-R); Andrews et Bonta (1995)] prédisent assez bien la violence future [Gendreau et coll. (2002); Harris, Rice et Quinsey (1993)]. L utilité des outils d évaluation du risque généraux pour 2

la prédiction de la violence est probablement attribuable au chevauchement des prédicteurs de risque pour la récidive avec violence et générale [Bonta et coll. (1998)]. Par conséquent, en plus des outils qui s appliquent à la violence, les mesures conçues à d autres fins peuvent aider à prédire la violence. Comme l a indiqué Bonta (2002), les méthodes d évaluation du risque comprennent les méthodes papiercrayon [p. ex. l échelle de sentiments criminels ESC, Andrews et Wormith (1984); le questionnaire d auto-évaluation QAE; Loza, Dhaliwal, Kroner et Loza-Fanous (2000)], les méthodes d examen des dossiers [p. ex. guide d évaluation du risque de violence VRAG; Harris et coll. (1993)], et les approches fondées sur des entrevues qui sont combinées aux examens des dossiers (p. ex. INS-R et HCR-20). Certaines de ces approches mesurent un seul concept relatif au risque [p. ex. les attitudes antisociales mesurées par l ESC modifiée, Simourd (1997)], tandis que d autres puisent à de multiples domaines associés à la récidive (p. ex. l INS-R évalue 10 domaines de risque et de besoin). Même si l administration et le contenu des outils d évaluation du risque sont diversifiés, la pratique consistant à combiner les outils d évaluation du risque pour produire une estimation consensuelle du risque peut présenter des problèmes. Mills et Kroner (2006) ont utilisé l échelle PCL-R, l INS-R, le VRAG et l information statistique générale sur la récidive [ISGR, Bonta, Harman, Hann et Cormier (1996); Nuffield (1982)] pour prédire la récidive avec violence et générale après la mise en liberté. Pour la plupart des délinquants, ils s entendaient sur les scores de risque uniformisés produits pour chacun de ces outils. Malheureusement, l exactitude prédictive était considérablement réduite dans les cas où il y avait un degré élevé de désaccord entre les scores de risque uniformisés de ces outils. Les défis liés aux évaluations du risque fondées sur l utilisation de plusieurs outils d évaluation du risque font ressortir la nécessité d effectuer des études qui indiquent l outil d évaluation du risque le plus approprié pour une population carcérale, une évaluation et un cadre médico-légal donnés. Production d outils d évaluation du risque. L utilité des renseignements que contiennent les outils d évaluation du risque pour l atteinte des objectifs de réadaptation et la surveillance des variations du risque au fil du temps varie en fonction de leur nature. Comme il est mentionné plus haut, les outils d évaluation du risque de première génération étaient fondés sur des évaluations cliniques non structurées, non systématiques et subjectives du risque et étaient sujets à des erreurs et à des biais [p. ex. Grove et coll. (2000)]. Compte tenu des limites des méthodes d évaluation de première génération, les outils d évaluation du risque de deuxième génération ont été conçus pour permettre d obtenir des prédictions du risque efficaces et uniformisées. Toutefois, le choix des éléments des méthodes de deuxième génération était basé sur des données purement statistiques [c.-à-d. actuarielles; Bonta (2002)]. Seuls les éléments qui permettaient une prédiction maximale de la récidive étaient inclus (p. ex. sexe masculin, groupe ethnique), sans égard à leur valeur théorique ou en matière de réadaptation. Le VRAG [Harris et coll. (1993)], l échelle des facteurs prépondérants [SFS; Hoffman (1983)] et l ISGR [Bonta et coll. (1996); Nuffield (1982)]. Malgré le fait que certains outils d évaluation du risque actuariels affichent une validité prédictive assez bonne [p. ex. de 0,30 à 0,35; Bonta et Yessine (2005); Glover, Nicholson, Hemmati, Berfeld et Quinsey (2002); Loza et Green (2003); Polvi (2001)], ils se composent surtout d éléments statiques [Andrews et Bonta (2003)]. Les facteurs de risque statiques sont de nature historique et/ou sont inchangeables (p. ex. sexe, âge, antécédents criminels). Parmi les facteurs statiques, les antécédents criminels constituent l un des prédicteurs les plus solides de la violence future et de la récidive générale [Bonta et coll. (1998); Gendreau et coll. (1996); Webster et coll. (1997a)]. Cependant, les prédicteurs fondés sur les infractions antérieures ont été critiqués parce qu ils ne permettent pas de saisir la complexité des facteurs qui contribuent à la récidive et de mesurer la variation du niveau de risque au fil du temps, et tous deux sont essentiels à la gestion des cas pour la réduction du risque 3

[Andrews, Bonta et Hoge (1990); Hoge et Andrews (1996)]. Les critiques des outils de deuxième génération soutiennent que le véritable objectif de l évaluation du risque devrait être de contribuer à la réduction du risque plutôt que de prédire seulement le risque [Wong et Gordon (2006)]. En réponse à ces critiques, les outils d évaluation du risque de troisième génération [Andrews, Bonta et Wormith (2006); Bonta (2002)] ont mis l accent sur la valeur informative des modèles de prédiction pour les décideurs de la gestion des cas (p. ex. agents de libération conditionnelle et de probation, commissions des libérations conditionnelles, psychologues médico-légaux). Tout comme pour les mesures de deuxième génération, ces outils comprenaient des facteurs de risque fondés sur des données empiriques; toutefois, le choix des éléments était basé sur la connaissance théorique de la criminalité et de la violence persistantes (c.-à-d. théories de l apprentissage social et de la cognition sociale, principes du risque, du besoin et de la réceptivité [Andrews et Bonta (2003) Gendreau et coll. (2006)]). De plus, les évaluations du risque de troisième génération comprenait des facteurs de risque dynamiques, qui de par leur nature varient et peuvent changer avec le temps ou sous l influence de facteurs sociaux, psychologiques, biologiques ou contextuels comme le traitement, par exemple les facteurs malléables comme la toxicomanie, les conflits interpersonnels et les attitudes antisociales [voir Douglas et Skeem (2005)]. Même si les facteurs de risque statiques et dynamiques se sont révélés aussi utiles pour la prédiction du risque [Gendreau et coll.(1996); Wong et Gordon (2006)], selon la théorie actuelle, les facteurs dynamiques sont plus pertinents lorsque l accent est mis sur la réduction du risque [Andrews (1989); Douglas et Skeem (2005); Heilbrun (1997)]. Dans le contexte de l évaluation du risque, les facteurs dynamiques sont souvent appelés «facteurs criminogènes» en raison de leurs liens empiriques avec le comportement criminel. Par conséquent, l utilisation d outils d évaluation des facteurs de risque dynamiques présente l avantage suivant : ils sont sensibles aux variations du niveau de risque qui pourraient se produire au fil du temps et/ou par suite des efforts de réadaptation [Andrews et Bonta (2003); Heilbrun (1997)]. La génération la plus récente d outils d évaluation du risque [c.-à-d. la quatrième génération; Andrews et Bonta (2003); Andrews et coll. (2006)] a été conçue expressément pour être intégrée : a) au processus de gestion du risque; b) à la sélection de modes d intervention et de cibles de traitement; c) à l évaluation des progrès du traitement. Ces outils sont administrés à de multiples occasions (c.-à-d. lors des réévaluations) et sont informatifs, parce qu ils documentent les variations de certains facteurs criminogènes et, en ce qui concerne le potentiel de risque général, qui pourraient se produire depuis le contact initial d un délinquant avec le système de justice pénale jusqu à sa sortie du système. Les outils de quatrième génération peuvent servir à définir les domaines de succès dans un plan de gestion des cas visant à réduire le risque et les domaines où des stratégies devraient être modifiées pour maximiser leur capacité de réduire le risque. Les formes dynamiques d outils d évaluation du risque ne sont pas très courantes en ce moment [Bonta (2002)], mais le niveau de service-inventaire de gestion des cas (NS-IGC) [Andrews, Bonta et Wormith (2004)] et l échelle de risque de violence (ERV) [Wong et Gordon, (2006)] constituent deux exemples prometteurs. De toute évidence, la pratique consistant à prédire la dangerosité et la criminalité futures s est beaucoup améliorée depuis l utilisation des évaluations du risque cliniques non structurées. Toutefois, il y a encore un manque d uniformité quant à savoir si et dans quelle mesure il faut introduire une évaluation clinique dans la procédure d évaluation du risque. Même si l objectif des outils de deuxième génération était de ne pas recourir, sinon très peu, à l évaluation clinique subjective, certaines mesures du risque encouragent une certaine souplesse clinique dans l établissement d estimations du risque (p. ex. NS-IGC, HCR-20, ERVC). Par exemple, plusieurs outils (p. ex. NS-IGC) permettent à l évaluateur de recourir au concept de la «primauté des interventions cliniques», ce qui signifie que l estimation actuarielle du risque peut être 4

ajustée d après les jugements subjectifs de l évaluateur concernant le rôle des facteurs de protection, les circonstances atténuantes ou d autres facteurs particuliers à un cas. La souplesse clinique est également prise en compte dans les outils qui dissuadent d utiliser les calculs purement actuariels des estimations du risque lorsqu ils sont utilisés à des fins cliniques. Par exemple, il n y a pas de scores-seuil cliniques ou de probabilités numériques du risque pour l échelle HCR-20 [Webster et coll. (1997b)]. L estimation du risque est plutôt fondée sur le jugement subjectif de l évaluateur qui détermine si le délinquant se classe dans la catégorie de risque «faible», «modéré» ou «élevé». Ce jugement est basé sur un examen systématique et attentif des facteurs de risque pertinents sur le plan théorique et empirique définis dans l échelle HCR-20. Pour tenir compte de la structure prévue dans l examen de chacun des facteurs de risque évalués, cette approche de l évaluation du risque est désignée sous le nom de «jugement prédictif structuré». Cependant, les outils fondés sur cette approche ont été critiqués parce qu ils sont trop subjectifs et qu ils souffrent des mêmes limites que les évaluations du risque cliniques non structurées [p. ex. Hilton, Harris et Rice (2006)]. Méthode d administration et pertinence du contenu des mesures d évaluation du risque. Pour le choix de l outil d évaluation du risque, il faut aussi se demander s il faut utiliser une mesure évaluée par l observateur et/ou une mesure d auto-évaluation. Comme l a indiqué Bonta (2002), les méthodes possibles d évaluation du risque comprennent les méthodes papier-crayon [p. ex. l échelle de sentiments criminels ESC, Andrews et Wormith (1984); le questionnaire d auto-évaluation QAE, Loza, Dhaliwal, Kroner et Loza-Fanous (2000)], les méthodes d examen des dossiers [p. ex. VRAG; Harris et coll. (1993)] et les approches fondées sur des entrevues qui sont combinées aux examens des dossiers (p. ex. INS-R et HCR-20). La majorité des outils de prédiction du risque sont fondés sur les évaluations par des spécialistes ayant reçu une formation des facteurs de risque statiques et/ou dynamiques individuels. Ces évaluations sont effectuées après un examen approfondi des renseignements auxiliaires et des renseignements provenant de dossiers correctionnels, qui peuvent aussi comprendre une entrevue semi-structurée avec le délinquant. Il s agit d une approche qui exige beaucoup de temps, mais qui permet de procéder à une évaluation exhaustive et valide du risque. Les mesures d auto-évaluation [p. ex. MMPI-2 Pd scale, Hathaway et McKinley (1967); le système de classification MMPI de Megargee, Megargee et Bohn (1979) et les caractéristiques antisociales et les sous-échelles d agression de l inventaire d évaluation de la personnalité, Morey (1991)] ont également été utilisés comme source d information pour l évaluation du risque que pose un délinquant (p. ex. Douglas, Hart et Kropp (2001); Magargee et Carbonell (1995); Morey et Quigley (2002); Osberg et Poland (2001)]. Même si l administration des mesures d auto-évaluation peuvent exiger peu de temps et être peu coûteuses, elles prêtent le flanc à une critique importante : elles n ont généralement pas été conçues pour servir à une évaluation du risque. Par conséquent, elles ne sont pas nécessairement représentatives des facteurs de risque et de besoins définis de façon empirique utiles pour la prédiction et la gestion du risque [Bonta (2002); Walters (2006)]. En réponse à cette critique, certains chercheurs ont conçu des outils d auto-évaluation qui visent expressément à évaluer les facteurs pertinents aux résultats du risque criminel. L échelle de sentiments criminels-modifiée [ESC-M; Simourd (1997); Simourd et Van de Ven (1999), le Psychological Inventory of Criminal Thinking Styles [PICTS, Walters (1995 et 1996)], et le questionnaire d auto-évaluation [QAE; Loza et coll. (2000)] sont des exemples d outils d auto-évaluation du risque. Afin de déterminer la valeur des outils d auto-évaluation pour la prédiction du risque, Walters (2006) a effectué une métaanalyse qui a servi à comparer certains outils d évaluation du risque structurés/actuariels [c.-à-d. HCR-20, INS-R, PCL-R, VRAG et le Lifestyle Criminality Screening Form LCSF créé par Walters, White et 5

Denney (1991)] à un certain nombre de mesures d auto-évaluation qui ont été utilisées pour effectuer des évaluations du risque dans les cas d inconduite en milieu carcéral, de récidive générale et de violence. Certaines des mesures d auto-évaluation s appliquaient expressément à la prédiction du risque (p. ex. PICTS, QAE), tandis que d autres correspondaient à des concepts cliniques généraux considérés comme applicables au risque ou au moins à la personnalité générale et au fonctionnement psychologique d un individu (p. ex. NEO Personality Inventory-Revised, répertoire multidimensionnel de la colère, échelle de désespoir de Beck; MMPI-Pd scale). Les conclusions de Walters corroboraient la validité prédictive des mesures d auto-évaluation du risque, mais seulement si ces outils étaient fondés sur des concepts liés empiriquement au risque (p. ex. les attitudes antisociales). Selon Walters, l intégration de mesures d autoévaluation applicables au contenu avec les outils d évaluation du risque actuariels/structurés pourrait ajouter à la validité de l évaluation du risque. Même s il s agit d une première étape informative, il y a plusieurs autres domaines d intérêt qui résultent de la méta-analyse de Walter (2006). Premièrement, seulement un certain nombre d outils d évaluation du risque structurés/actuariels ont été codés (HCR-20, INS-R, PCL-R, VRAG et LCFS). De plus, seules neuf valeurs de l effet étaient disponibles pour comparer la catégorie globale des méthodes structurées/actuarielles aux mesures d auto-évaluation sur le plan de leur capacité de prédire la récidive avec violence. Pour ces neuf valeurs de l effet, la valeur de l effet moyenne des mesures structurées/actuarielles (r = 0,24) était plus grande que pour la catégorie générale des mesures d autoévaluation (r = 0,17). Une base de données plus importante, comprenant plus de valeurs de l effet et une fourchette plus grande de mesures, est nécessaire pour reproduire les conclusions de Walter. De plus, Walters (2006) n a pas indiqué les validités prédictives respectives de chacun des outils figurant dans la catégorie actuarielle/structurée. Les renseignements de ce genre seraient utiles pour les spécialistes qui choisissent parmi les outils dont ils disposent ceux qui devraient figurer dans leurs évaluations du risque de violence. Quelques méta-analyses ont été réalisées à ce sujet. Gendreau et coll. (1996) ont comparé l INS-R, l échelle SFS et le système de classement des cas du Wisconsin [Baird (1981), Baird, Heinz et Bemus (1979)]. Chacun de ces outils était un prédicteur modéré de la récidive générale, mais l INS-R a produit la valeur de l effet moyenne pondérée la plus élevée (0,33). En outre, Gendreau et coll. ont évalué la valeur du MMPI pour la prédiction de la récidive générale. Même si le MMPI n était pas un prédicteur aussi solide que l INS-R ou l échelle PCL-R, il a tout de même produit une valeur de l effet pondérée importante de 0,21. Malheureusement, Gendreau et coll. n ont pas analysé ces outils par rapport aux résultats en matière de violence. Une méta-analyse antérieure de Gendreau, Goggin et Law (1997) sur la prédiction de l inconduite en milieu carcéral comprenait une comparaison de l INS-R, du MMPI, d autres mesures du risque et des mesures autres que le MMPI de la personnalité antisociale comme prédicteurs de l inconduite en établissement. À l instar de Gendreau et coll. (1996), les auteurs n ont pas présenté un rapport distinct sur les validités prédictives de ces mesures pour l inconduite non violente et l inconduite violente. Cette décision était fondée sur le manque de variation importante des valeurs de l effet entre ces deux résultats pour les nombreux autres prédicteurs examinés dans leur analyse. D après le résultat global, l INS-R a produit les validités prédictives les plus élevées (r = 0,23) et a surpassé les autres mesures. Enfin, une comparaison méta-analytique plus récente de Gendreau et coll. (2002) a permis d évaluer la violence comme critère distinct et de constater que l INS-R avait un léger avantage sur l échelle PCL-R pour la prédiction de la violence. Par conséquent, les méta-analyses existantes qui comparent les outils d évaluation du risque donnent à penser qu il peut y avoir des ressemblances dans la validité prédictive des outils d évaluation du risque en ce qui concerne la récidive avec violence et générale. 6

Résumé On a fait beaucoup de progrès dans l évaluation du risque général et de la dangerosité. Cependant, il reste une incertitude concernant les outils les plus appropriés de prédiction de la violence, étant donné les variations du contenu des éléments, de l échelle, du niveau de subjectivité de l évaluateur permis et de l utilité des outils d auto-évaluation en tant que composante des protocoles d évaluation du risque de violence. Même si plusieurs études primaires comparent l utilité des outils d évaluation du risque pour la prédiction de la violence [p. ex. Dahle (2006); Douglas, Yeomans et Boer (2005); Grann, Belfrage et Tengstöm (2000); Kroner et Mills (2001); Mills et Kroner (2006)], seules quelques méta-analyses [c.-à-d. Gendreau et coll. (1996); Gendreau et coll. (1997); Gendreau et coll. (2002); Walters (2006)] ont été effectuées pour faire la synthèse de cette littérature à l intention des spécialistes, et aucune de celles-ci n était assez exhaustive dans son estimation du risque de violence. Une synthèse de cette nature arrive à point nommé, car très peu de psychologues correctionnels disent utiliser des outils conçus expressément pour prédire le risque [ou qui sont au moins fondés sur des données empiriques pertinentes à l estimation du risque, voir Boothby et Clements (2000)]. Par conséquent, le principal objectif de la méta-analyse actuelle consistait à déterminer les outils les plus efficaces en tant que prédicteurs valides de la violence future (non sexuelle) en milieu carcéral et dans la collectivité. Au moyen de ces renseignements, il est possible d établir des lignes directrices concernant la sélection des outils d évaluation du risque ayant la capacité de produire les estimations du risque les plus valides et de contribuer à la gestion des cas et à la planification de la réadaptation. 7

Méthodes and procédures Échantillon d études Nous avons effectué une recherche documentaire concernant les études sur la prédiction pertinentes au moyen des bases de données EBSCO (Academic Search Elite, PsycARTICLES et PsycINFO). Les termes de recherche clés étaient : a) des termes ayant trait à l évaluation (p. ex. actuariel, clinique, prédiction, INS-R, PCL-R); b) des termes ayant trait à la population carcérale (p. ex. délinquant adulte, détenu, libéré conditionnel); c) des termes visant à classer le résultat sur le plan de la violence (p. ex. récidive, inconduite). Des données non publiées ont également été obtenues à la suite d une demande envoyée par courrier électronique à environ 33 chercheurs et 23 centres de recherche qui effectuent des recherches sur les risques que posent les délinquants. D autres études ont été ajoutées au moyen de la méthode traditionnelle (c.-à-d. examen des bibliographies d articles). La recherche s est limitée aux études réalisées de 1980 à 2006. Selon les critères d inclusion, les études primaires devaient a) être de nature prédictive (c.-à-d. que l évaluation précédait la mesure du résultat); b) porter sur un échantillon d adultes (c.-à-d. un échantillon moyen de personnes de 18 ans ou plus au moment de l évaluation) choisi dans une population générale ou une population de délinquants bénéficiant de services de psychiatrie légale; c) présenter assez de données pour permettre de calculer une valeur de l effet (p. ex. coefficient r de Pearson, coefficient Phi (Ф)) entre la mesure de prédiction et les résultats de l inconduite ou de la récidive violente. Les études sur l incarcération et la probation ont été prises en compte, peu importe la durée du suivi. Dans le cas des études sur la récidive après la libération, la période de suivi devait être d au moins six mois pour être incluse. Pour chaque étude, les données de l échantillon le plus important, la période de suivi la plus longue et le genre de critère le plus spécifique (c.-à-d. condamnation par rapport à arrestation) ont été enregistrés. Pour éviter la répétition de la méta-analyse récente de Hanson et Morton-Bourgon (2007) sur la validité prédictive des outils d évaluation du risque dans le cas des délinquants sexuels, dans l analyse actuelle, nous avons exclu les études pour lesquelles les données sur les résultats en matière de violence provenaient presque exclusivement d un échantillon de délinquants sexuels. De même, les outils conçus spécialement pour l évaluation de la récidive sexuelle n ont pas été inclus dans l analyse actuelle. Les études prises en compte figurent à l annexe A. Codage des études Les catégories de codage, assorties d exemples de leurs sous-éléments, étaient les suivantes : a) caractéristiques de l étude et de l auteur (p. ex. genre de publication, affiliation de l auteur, année de publication); b) variables de l échantillon (p. ex. groupe ethnique, sexe, genre de délinquant); c) descripteurs de l évaluation du risque (p. ex. mesure utilisée, méthode d administration, genre de prédicteurs évalués); d) descripteurs de la valeur de l effet (p. ex. genre de résultat, valeur de l effet calculée). Il est possible d obtenir des renseignements détaillés ou un exemplaire du manuel de codage en contactant la première auteure. Toutes les études ont été codées par S. French. Le coefficient d'objectivité a été établi au moyen d un échantillon tiré au hasard de 15 études, codé anonymement par un deuxième codeur d expérience. Selon la formule de Yeaton et Wortman (1993) : (nombre d accords) / (nombre d accords + nombre de désaccords), l indice d accord était de 0,82. La source des désaccords concernait les caractéristiques moins évidentes de l échantillon (c.-à-d. détermination du niveau de risque de l échantillon) et les aspects de la nature d un outil d évaluation du risque particulier (c.-à-d. genre de 9

contenu de l élément, production d un outil d évaluation du risque). Les désaccords résultaient la plupart du temps d un malentendu au moment de la lecture de l étude ou d une erreur de transcription au moment de l entrée des codes. Les deux évaluateurs ont discuté des désaccords et ils se sont entendus sur le codage de ces éléments avant l analyse. Calcul de la valeur de l effet Les coefficients Phi (Φ) ont été calculés pour la validité prédictive de chaque mesure au moyen des résultats concernant l inconduite et la récidive. Lorsque des statistiques autres que r ont été présentées (c.-à-d. F, t, χ 2, p, AUC), la formule appropriée de conversion de Φ a été utilisée [Rosenthal (1991); Swets (1986)]. Compte tenu des taux de base généralement faibles de l inconduite et de la récidive avec violence, il a fallu prendre en considération cette influence possible sur les valeurs de l effet. Les coefficients Phi ont été ajustés au moyen de la formule de Ley (1972) : r = [(r xy )(δ x /δ x )] / [1-r xy ² + (r xy ²)( δ x ²/ δ x ²)]½, où r xy était la corrélation observée, δ x était l écart-type observé du taux de base, δ x était l écart-type moyen fondé sur le taux de base moyen pour les études de l analyse et r xy était la corrélation corrigée. L écart-type du taux de base a été calculé au moyen de la formule δ = [pq/(n)(n-1)]½, où p était le nombre de participants qui étaient des récidivistes en milieu carcéral ou dans la collectivité, q était le nombre de participants qui étaient des non-récidivistes en milieu carcéral ou dans la collectivité et N était la taille totale de l échantillon. Les paramètres utilisés afin d estimer et d interpréter l ampleur de la relation entre chaque mesure du risque (p. ex. HCR-20) ou catégorie de prédicteur (p. ex. mesures de 2 e génération) et les valeur de l effet de l inconduite ou de la récidive étaient la valeur moyenne r (M r ) pondérée par la taille de l échantillon [Z +, voir Hedges et Olkin (1985)], ainsi que son intervalle de confiance associé de 95 % (CI Z+ ). L intervalle de confiance (CI) a servi à indiquer le degré d accord entre les variables de l étude. S il n y avait pas de chevauchement du tout entre les intervalles de confiance pour deux valeurs de l effet moyennes ou si les intervalles de confiance se rejoignaient, les valeurs étaient interprétées comme représentant des paramètres de population différents. Ce critère équivaut à la signification statistique de p < 0,006, pourvu que la taille de l échantillon soit 10 et que la largeur des intervalles de confiance ne varie pas plus d un facteur ou deux [Cumming et Finch (2005)]. Lorsque les intervalles de confiance entre deux comparaisons se chevauchaient dans une proportion d au plus un quart de la longueur moyenne des deux intervalles, les valeurs moyennes ont également été interprétées comme représentant deux paramètres de population différents et étaient statistiquement différentes, soit environ p 0,05 [voir Cummings et Finch (2005)]. Si le chevauchement des intervalles de confiance dépassait le critère susmentionné, cela signifiait que les valeurs de l effet moyennes résultaient probablement du paramètre de la population de l échantillon et, par conséquent, qu elles n étaient pas statistiquement différentes. Une autre utilisation des intervalles de confiance a consisté à indiquer la précision des estimations des valeurs de l effet, qu on a établie en notant la largeur de l intervalle de confiance [voir Cumming et Finch (2001); Gendreau, Goggin et Smith (2000); Schmidt (1996)]. Des intervalles plus étroits indiquent une estimation plus précise d un paramètre de la population que des intervalles plus larges. Hétérogénéité de la valeur de l effet Nous avons déterminé l'influence des observations aberrantes au moyen de la statistique Q [Rosenthal (1991)]. Pour chaque valeur de l effet, une valeur q a été calculée au moyen de la formule : (n - 3)(z r Z + ), où n était la taille de l échantillon total pour chaque valeur de l effet; z r correspondait à la valeur normalisée r pour chaque valeur de l effet et Z + était la valeur pondérée de l échantillon M r 10

pour chaque catégorie de prédicteurs. Ces valeurs q ont été ensuite additionnées pour chaque catégorie de prédicteurs, ce qui a donné Q, qui est une estimation de l hétérogénéité des valeurs de l effet dans cette catégorie. Pour évaluer sa signification, on a évalué la statistique Q au moyen de la valeur critique de χ 2 avec (k 1) degrés de liberté. Une statistique Q significative indique qu il y a plus de variabilité que ce que le hasard pourrait laisser supposer. Dans ces cas, les valeurs de l effet des observations aberrantes ont été examinées et n ont été éliminées que s il y avait une raison logique de les exclure : par exemple, une erreur de codage ou une caractéristique unique de l étude (p. ex. un échantillon restrictif). Estimation du nombre garantissant la certitude des résultats Nous avons eu recours à la méthode du nombre garantissant la certitude des résultats pour déterminer combien de valeurs de l effet supplémentaires il faudrait pour modifier une estimation de la valeur de l effet obtenue. Nous avons calculé l indice du nombre de valeurs de l effet (Z + = 0,00) nécessaire pour une mesure du risque donnée plus précise pour la prédiction de l inconduite ou de la récidive afin d obtenir une valeur de l effet égale à une valeur d exactitude moindre à l aide de la formule + + + + [( k B( Z B Z A))]/( Z A Z B= 0), où Z + B=0 indique une valeur de l effet nulle pour la mesure du risque la plus précise [voir Gendreau et coll. (2002)]. Aux fins de la présente méta-analyse, nous partons de la prémisse selon laquelle la valeur de l effet moyenne de la mesure A était de 0,30 (k = 50), et celle de la mesure B, de 0,35 (k = 40). Selon cette formule, on estime à sept le nombre de prédictions B avec un coefficient Z + = 0,00 qui devraient être nécessaires afin d infirmer la supériorité de la mesure B par rapport à la mesure A. En d autres termes, il faudrait trouver sept valeurs de l effet supplémentaires de la mesure B, dont chacune aurait une importance de Z + = 0,00 pour pouvoir conclure que les deux mesures ont une efficacité prédictive égale. 11