Études d observation : cas-témoins et cohorte

Documents pareils
Études épidémiologiques analytiques et biais

Docteur José LABARERE

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

L axe 5 du Cancéropole Nord Ouest

Item 169 : Évaluation thérapeutique et niveau de preuve

23. Interprétation clinique des mesures de l effet traitement

Principe d un test statistique

LIGNES DIRECTRICES CLINIQUES TOUT AU LONG DU CONTINUUM DE SOINS : Objectif de ce chapitre. 6.1 Introduction 86

I - CLASSIFICATION DU DIABETE SUCRE

CE QU IL FAUT SAVOIR PARTICIPATION À UN ESSAI CLINIQUE SUR UN MÉDICAMENT

MODELES DE DUREE DE VIE

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.

PLAC E DE L AN ALYS E TOXIC OLOG IQUE EN URGE NCE HOSP ITALI ERE

Migraine et céphalées de tension: diagnostic différentiel et enjeux thérapeutiques

Peut-on réduire l incidence de la gastroentérite et ses conséquences dans les écoles primaires à l aide de solution hydro-alcoolique?

Migraine et Abus de Médicaments

Données longitudinales et modèles de survie

Application des courbes ROC à l analyse des facteurs pronostiques binaires

COMPLICATIONS THROMBOTIQUES DES SYNDROMES MYÉLOPROLIFÉRATIFS: ÉVALUATION ET GESTION DU RISQUE

Référentiel Officine

e-santé du transplanté rénal : la télémédecine au service du greffé

Annexe commune aux séries ES, L et S : boîtes et quantiles

Format de l avis d efficience

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Recherche documentaire et autoformation. Lecture critique d un article médical. Recommandations pour la pratique. Les maladies orphelines

Modélisation aléatoire en fiabilité des logiciels

PROGRAMME (Susceptible de modifications)

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Révision des descriptions génériques Comment monter un dossier?

Analyse et interprétation des données

Livret des nouveaux anticoagulants oraux. Ce qu il faut savoir pour bien gérer leur utilisation

Statistiques Descriptives à une dimension

PARTICIPATION À UN ESSAI CLINIQUE SUR UN MÉDICAMENT CE QU IL FAUT SAVOIR

Prise en charge de l embolie pulmonaire

Une étude de différentes analyses réalisées par le BIT

Chapitre 2 Le problème de l unicité des solutions

EVALUATION DE L AUTOSURVEILLANCE DE

I. Une nouvelle loi anti-discrimination

ASSOCIATION MEDICALE MONDIALE DECLARATION D HELSINKI Principes éthiques applicables à la recherche médicale impliquant des êtres humains

TSTI 2D CH X : Exemples de lois à densité 1

27 ème JOURNEE SPORT ET MEDECINE Dr Roukos ABI KHALIL Digne Les Bains 23 novembre 2013

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Programme d assurance-invalidité de courte durée

Plan. Introduction. Les Nouveaux Anticoagulants Oraux et le sujet âgé. Audit de prescription au Centre Hospitalier Geriatrique du Mont d Or

Compte rendu de l examen par le BSIF des coefficients du risque d assurance

Probabilités sur un univers fini

Construction de bases biométriques pour l assurance dépendance. SCOR inform - Novembre 2012

Contraception après 40 ans

9.11 Les jeux de hasard et d argent

«Adaptation de la mise en œuvre des bonnes pratiques cliniques en fonction des caractéristiques de certaines recherches»

Conseil économique et social

Chapitre 1. L intérêt. 2. Concept d intérêt. 1. Mise en situation. Au terme de ce chapitre, vous serez en mesure de :

Association lymphome malin-traitement par Interféron-α- sarcoïdose

Tableau de bord des communautés de l Estrie DEUXIÈME ÉDITION INDICATEURS DÉMOGRAPHIQUES ET SOCIOÉCONOMIQUES

Chapitre 3. Les distributions à deux variables

Structure typique d un protocole de recherche. Préparé par Johanne Desrosiers dans le cadre d une formation au réseau FORMSAV

SOMMAIRE I. INTRODUCTION 4 II. SOURCES D INFORMATION 5

Les ateliers de pratique réflexive lieu d intégration des données probantes, moteur de changement de la pratique

Evidence-based medicine en français

ALTO : des outils d information sur les pathologies thromboemboliques veineuses ou artérielles et leur traitement

Les nouveaux anticoagulants ont ils une place aux Urgences?

Les nouveaux anticoagulants oraux sont arrivé! Faut il une surveillance biologique?

Le parcours professionnel des chômeurs de longue durée en Suisse

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

«Cours Statistique et logiciel R»

Les principales méthodes d évaluation

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Le système d information (bases de données) l évaluation de la qualité des soins.

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Les défibrillateurs cardiaques implantables

Grossesse et HTA. J Potin. Service de Gynécologie-Obstétrique B Centre Olympe de Gouges CHU de Tours

LES NOUVEAUX ANTICOAGULANTS

Déclarations européennes de la pharmacie hospitalière

LECTURE CRITIQUE 1 ER PAS

Le RIVAROXABAN (XARELTO ) dans l embolie pulmonaire

Analyse des coûts. 1 ère année DUT GEA, 2005/2006 Analyse des coûts

Chapitre 2 LE CAS PRATIQUE

Télé-expertise et surveillance médicale à domicile au service de la médecine générale :

afférent au projet de décret relatif aux obligations indexées sur le niveau général des prix

Les débats sur l évolution des

La recherche clinique de demain ne se fera pas sans les paramédicaux

Une forte dynamique des prescriptions de ces nouveaux anti-coagulants oraux

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Fibrillation atriale chez le sujet âgé

Ischémie myocardique silencieuse (IMS) et Diabète.

ARRÊTÉ du. Projet d arrêté fixant le programme d'enseignement de santé et social en classe de seconde générale et technologique

Supplément du BDK 24 : Aide à la recherche bibliographique

Associations Dossiers pratiques

COMMISSION NATIONALE D EVALUATION DES DISPOSITIFS MEDICAUX ET DES TECHNOLOGIES DE SANTE. AVIS DE LA COMMISSION 08 février 2011 CONCLUSIONS

Les usagers de drogues âgés de 40 ans et plus pris en charge dans les structures de soins pour leurs problèmes d addiction

L hôpital de jour ( HDJ ) en Hôpital général Intérêt d une structure polyvalente? Dr O.Ille Centre hospitalier Mantes la Jolie, Yvelines

Validation clinique des marqueurs prédictifs le point de vue du méthodologiste. Michel Cucherat UMR CNRS Lyon

FONDEMENTS MATHÉMATIQUES 12 E ANNÉE. Mathématiques financières

La migraine. Foramen ovale perméable. Infarctus cérébral (surtout chez la femme)

Comparaison des enjeux énergétiques de la France et de l Allemagne

eduscol Santé et social Enseignement d'exploration

Votre Réseau est-il prêt?

Assurance Arrêt de Travail

Transcription:

Études d observation : cas-témoins et cohorte Emmanuel Nowak, Emmanuel Oger, Dominique Mottier Inserm CIC 0502 EA 3878, Hôpital de la Cavale Blanche, 29609 Brest cedex <dominique.mottier@chu-brest.fr> doi: 10.1684/met.2008.0148 mt Tirés à part : E. Nowak Les deux principaux types d études d observation sont l étude cas-témoins et l étude de cohorte. Certaines expositions sont impossibles à affecter expérimentalement par tirage au sort et la connaissance dans ces domaines passe par des observations bien conduites. Les résultats d une étude cas-témoins seront d autant plus crédibles qu ils ne paraissent pas être dus à une différence dans la sélection des cas et des témoins (biais de sélection), à une distorsion de l effet par un facteur inconnu ou non mesuré mais lié à l exposition (biais de confusion), ni à une différence dans le recueil de l information entre les cas et les témoins (biais d information). Les études de cohorte sont également exposées à des biais de sélection, de classement et de confusion. Les résultats d une étude de cohorte ne sont pas nécessairement plus valides que ceux issus d une étude cas-témoins bien conduite. La qualité du suivi des sujets et l analyse des données sont deux points qui méritent un examen attentif. Mots clés : étude d observation, étude cas-témoins, étude de cohorte Qu est-ce qu une étude observationnelle? Lorsque l on se fixe comme objectif d évaluer la relation entre une exposition (délétère ou protectrice) et la survenue d un événement (maladie), plusieurs méthodes sont possibles. Il existe d une part les études d observation et d autre part les études d études d intervention, comme l essai thérapeutique randomisé. Cet article décrit les deux principales études d observation dites étiologiques : l étude cas-témoins et l étude de cohorte. Nous allons utiliser comme exemple pour illustrer notre propos l étude de la maladie veineuse thromboembolique (MVTE). Notre premier objectif est d identifier les facteurs de risque de survenue d un premier épisode de MVTE et leurs interactions. Une étude cas-témoins est mise en place : un cas étant un patient hospitalisé dans notre hôpital pour une MVTE, son témoin est recruté parmi les patients hospitalisés dans les mêmes services pour une autre cause. Notre deuxième objectif est de rechercher des facteurs de risque de récidive après un premier épisode survenu sans circonstance favorisante (cas idiopathique) : la cohorte des cas idiopathiques est suivie pour atteindre ce deuxième objectif. L objectif est d estimer l association entre une exposition et la survenue d un événement. L exposition (E) peut être génétique ou environnementale. Le contrôle de l exposition est parfois possible (médicament, action de santé), ailleurs difficile, voire impossible (polluant, toxique, tabac, alcool, etc.). Dans le premier cas (médicament, action de santé), l investigateur peut décider qui est exposé et qui ne l est pas, par tirage au sort par exemple (contrôle). Dans le dernier cas (polluant, toxique...), l investigateur ne peut imposer le niveau d exposition. L événement d intérêt (M) est un état pré-morbide, une maladie symptomatique ou le 37

Tableau 1. Les questions à se poser à la lecture d une étude d observation Validité interne : absence de biais? Existe-t-il un biais de sélection? Existe-t-il un biais d information? Existe-t-il un biais de confusion? décès. Nous nous limiterons volontairement aux expositions binaires (présentes ou absentes), la prise en compte de variables d exposition quantitatives ou qualitatives à plusieurs classes étant une problématique à part entière, non spécifique des études observationnelles, que nous ne développerons pas. Dans notre exemple, nous avons recherché si l homocystéine est un facteur de risque de MVTE. Il s agit d un critère quantitatif, que nous avons rendu binaire ( 15 ou<15lmol l 1 ) après avoir constaté un phénomène du type «effet seuil» pour cette variable (le risque est augmenté lorsque le taux d homocystéine dépasse 15 lmol l 1 et reste stable pour les valeurs supérieures à 15 lmol l 1 ). S il existe une association, les arguments qui vont étayer sa causalité doivent être identifiés. On peut les séparer en deux groupes : ceux qui vont étayer la validité interne et ceux qui vont étayer la validité externe. La validité interne signifie que l étude apporte un résultat fiable et non biaisé. En effet, les études d observation sont sujettes à des biais qui sont minimisés dans les études d intervention. La validité externe signifie que les résultats sont cohérents avec l ensemble des connaissances disponibles. Enfin, dernier point, la pertinence clinique et la généralisation des résultats doivent être appréhendées. Le tableau 1 présente les éléments à examiner ou les questions à se poser à la lecture d une étude d observation. Le tableau 2 liste les éléments de jugement de la causalité d une association. Etude de cohorte Les exposés et les non-exposés sont-ils semblables pour tous les autres aspects importants à considérer hormis l exposition? L information sur la survenue de la maladie est-elle obtenue d une façon similaire chez les exposés et les non exposés? Etude cas-témoins Les cas et les témoins sont-ils semblables pour tous les autres aspects importants à considérer hormis la maladie? L information sur la survenue de l exposition est-elle collectée d une façon similaire chez les cas et les témoins? Les résultats peuvent-ils être expliqués par un facteur associé à la fois à l exposition et à la maladie sans qu il soit cependant directement impliqué dans le chemin causal? Validité interne : réalité statistique du résultat? Le résultat est-il le fruit de la chance? Quelle est la valeur du risque relatif? Quelles sont les bornes de l intervalle de confiance à 95 %? Validité externe Cohérence? Quelle est la valeur du rapport de cotes (odds-ratio)? Quelles sont les bornes de l intervalle de confiance à 95 %? Le résultat est-il statistiquement significatif? Quelle était la puissance de l étude? Est-elle suffisante pour détecter une différence cliniquement pertinente? Avec les connaissances biologiques, physiologiques Avec les résultats d autres études d observation (de type différent), réalisées dans d autres populations Avec les résultats d essais cliniques Pertinence et généralisation? Quelle est l implication pratique de ce résultat? Le résultat est-il applicable aux patients dont je m occupe? Pourquoi des études d observation? Pourquoi chercher à détecter des associations dont la validité n est pas certaine? Ne devrions-nous pas nous focaliser sur les essais cliniques où les biais sont minimisés et le lien de causalité par conséquence convaincants? Certaines expositions (non médicamenteuses par exemple) sont difficiles voire impossibles à affecter expérimentalement par tirage au hasard : expositions environnementales, toxiques, polymorphismes génétiques... La connaissance dans ces domaines passe par des observations bien conduites. S agissant des thérapeutiques (dont les médicaments), l essai clinique ne répond pas à toutes nos questions et laisse donc une place à la pharmacoépidémiologie : celle-ci à pour finalité d évaluer les bénéfices et les risques des thérapeutiques médicamenteuses Tableau 2. Éléments de jugement de la causalité d une association Antériorité Une cause précède la conséquence : indispensable Force de l association Une association forte est plus vraisemblablement causale Consistance des résultats Même résultat dans d autres populations Relation dose-réponse Augmentation de l effet avec l augmentation de la dose d exposition Plausibilité biologique Hypothèse biologique explicative Cohérence avec les connaissances Sur l histoire naturelle de la pathologie et la biologie 38

utilisées en population (et non dans le cadre restrictif d un essai clinique) ; évaluation des effets adverses, description de l usage réel du médicament... Les études cas-témoins et de cohorte ne devraient pas être opposées l une à l autre. Même si le niveau de preuve d une étude de cohorte est considéré comme plus élevé que celui d une étude cas-témoin, chacun de ces deux types d enquête possède des avantages et des inconvénients et doit être choisi en conséquence. L enquête de cohorte permet d avoir un suivi longitudinal des patients, d estimer un risque, une incidence, un risque relatif, d effectuer une analyse de survie... mais elle peu adaptée si la maladie est rare, imposant alors un temps d observation très long. L étude cas-témoin est beaucoup plus rapide mais ne permet pas d estimer un risque, une incidence ou un risque relatif (il faut alors avoir recours à l utilisation d un odds-ratio). Elle est recommandée lorsque la maladie est rare, mais peu adaptée si l exposition est rare : cohorte d une part et cas-témoins de l autre sont donc en un sens complémentaires. Dans le cadre de la MVTE, l incidence annuelle de la maladie dans la population générale est faible (de l ordre de 1 ), ce qui justifie, pour l identification des facteurs de risque, une étude cas-témoins (l odds-ratio peut être interprété comme un risque relatif du fait de la «rareté» de la maladie). Par contre, pour la recherche des facteurs de risque de récidive, la cohorte des cas est adaptée car l incidence de récidive est de l ordre de 5 à 10%par an. Les problèmes communs aux études cas-témoins et aux études de cohorte : exposés ou non exposés, malades ou non malades? Que ce soient des malades et des sujets témoins inclus dans une étude cas-témoins ou bien des sujets recrutés dans une cohorte, tous devront être classés exposés ou non exposés pour la variable d intérêt, mais aussi pour toutes les autres variables connues pour être des facteurs de risque potentiels. Ce classement peut soulever des questions difficiles à résoudre, très souvent liées au temps : le classement pose peu de problème lorsque l exposition est invariable dans le temps : c est le cas des facteurs génétiques. Il peut néanmoins exister des erreurs de mesure, ce que nous développerons dans le chapitre suivant. Le sexe est un exemple de facteur d exposition tout simple... Dans notre exemple, 3 polymorphismes génétiques ont été mesurés : la mutation Leiden du gène du facteur V, le variant G20210A du gène de la prothrombine et le variant thermolabile du gène codant pour l enzyme méthylène-tétrahydrofolate réductase (MTHFR). Il s agit d une exposition constante dans le temps Lorsque l exposition varie avec le temps, tout se complique. Cela implique en particulier un début et une fin d exposition. Définir le début et la fin d une exposition sera souvent arbitraire mais au mieux basé sur la connaissance physiopathologique. L exposition à une contraception orale par exemple pourrait être définie comme débutant le jour de la première prise et se terminant le jour de la dernière prise. Elle pourrait aussi être définie comme débutant quelques semaines après la première prise (existence d une période de latence) et se terminant quelques semaines après la dernière prise (existence d une période de rémanence). Dans notre exemple, le mécanisme physiopathologique sous-tendant la relation entre la contraception orale et la survenue d une thrombose implique des modifications de l équilibre de la coagulation qui ne sont pas immédiates. Ainsi, une thrombose survenant le lendemain de la première prise d une contraception doit-elle être «classée» comme liée à cette «exposition»? Par ailleurs, le déséquilibre de la coagulation induit par la contraception orale ne disparaît pas dès la minute suivant la dernière prise. Ainsi, une thrombose survenant quelques semaines après l arrêt de la contraception pourrait être «classée» comme liée aux conséquences encore présentes de cette «exposition». Ces limites doivent être définies clairement en connaissant l arbitraire d une telle décision, même si elle est justifiée par des éléments de preuve biologiques. Une attitude possible en l absence d argumentaire solide est de faire varier la période dite d exposition (prise en compte d une période de latence et de rémanence) et d estimer les risques liés à ces différentes définitions de l exposition afin de vérifier la robustesse de l association. Lorsque l exposition est permanente mais à un niveau variable dans le temps, l arbitraire peut jouer un rôle simplificateur. Prenons l exemple d une variable biologique mesurée à un instant donné unique : définir l exposition par la valeur faible ou élevée pour rester binaire de cette variable à cet instant, suppose implicitement qu elle reflète un «état» stable, du moins temporairement. Dans notre exemple, une mesure de la concentration plasmatique en acide folique a eu lieu au moment du diagnostic de thrombose pour les cas et au cours de l hospitalisation pour les patients témoins. Cette mesure reflète donc un niveau d exposition à un moment donné. Connaissant la cinétique de cette variable, nous pouvons extrapoler les valeurs possibles dans les semaines précédentes : si un patient au jour J a une valeur basse traduisant un état de carence, nous faisons l hypothèse que cette carence n est pas apparue en un jour mais s est installée «progressivement». Le risque de thrombose estimé est donc interprété comme celui-ci lié à un état de carence durant «quelques semaines». Nous avons par ce moyen «déplacé» une mesure concomitante à l événement thrombotique comme reflétant un état antérieur à cet événement. L antériorité est un élément majeur nécessaire 39

mais non suffisant à considérer pour évaluer la causalité de la relation entre exposition et maladie. Le problème de la mesure d une exposition variable dans le temps n est pas totalement résolu par des mesures itératives comme dans une étude de cohorte. Ces mesures restent discrètes (espacées) dans le temps et le passage du statut de «non exposé» à celui d «exposé» est donc dépendant de l intervalle entre deux mesures. La seule chose «certaine» est qu au temps T le sujet est classé «non exposé» et qu au temps T+1 le sujet est classé «exposé» ; mais à quel moment entre T et T+1 le sujet est-il devenu exposé? On comprend que si l intervalle entre T et T+1 est grand, l approximation est grande... l essentiel étant que tous les sujets soient classés selon la même règle (dans ce cas le plus simple est de définir le début de l exposition au milieu de l intervalle). Le sujet ayant été classé exposé ou non au temps T+1, son statut malade ou non malade est évalué au même temps d observation... avec la même difficulté à préciser le moment auquel le patient a «déclaré» sa maladie : symptômes? Dépistage d une atteinte infraclinique? Malgré ces approximations liées aux mesures discrètes espacées dans le temps (et comment faire autrement!), un patient sera néanmoins classé comme ayant déclaré la maladie pendant une période d exposition ou en dehors d une période d exposition. Le recueil d une information juste concernant un sujet n est pas toujours chose aisée. En théorie, on connaît les caractéristiques (malade ou non, exposé ou non) de chaque sujet. En pratique, ce n est pas si simple : erreur de mesure de l exposition, imprécision de la mesure ou erreur de diagnostic... Ces situations peuvent conduire à un mauvais classement des sujets : exposé en non exposé ou malade en non malade (et inversement). Elles ne sont hélas pas exceptionnelles et il est essentiel d en connaître les conséquences sur l estimation du risque, que l on supposera mesuré par un odds-ratio. Si les erreurs de classement de la maladie ne sont pas les mêmes dans les groupes des exposés et des non-exposés, et/ou si les erreurs de classement de l exposition ne sont pas les mêmes dans les groupes des malades et des non-malades, on parle alors d erreur différentielle. Dans ce cas, l estimation de l odds-ratio est biaisée ; la force de l association est souvent surestimée, mais elle peut aussi être sous-estimée. Sinon il s agit d erreur non différentielle et dans ce cas, l odds ratio tend à être ramené vers 1, sous-estimant la force de l association. Il y a donc perte de puissance. À titre d exemple, voici deux situations classiques d erreurs différentielles : dans les études cas-témoins, une sous-évaluation de l exposition chez les témoins entraînera une surestimation de l association entre l exposition et la maladie. Dans les enquêtes de cohorte, un sousdiagnostic de la maladie chez les non-exposés entraînera également une surestimation de l association. Un cas classique d erreur non différentielle est celui d une exposition déterminée par un test diagnostic dont la sensibilité et la spécificité ne sont pas toutes deux égales à 1. La conséquence est toujours la même : l odds-ratio est ramené vers 1. Les questions spécifiques aux études cas-témoins Le choix des témoins Premier principe : minimiser le biais de sélection Le groupe témoin doit pouvoir servir de référence concernant la fréquence d exposition dans la population dont sont issus les cas. Le premier principe est de se dire qu un sujet indemne est un «bon témoin» si, dans l hypothèse où il avait été malade, il aurait été sélectionné comme cas. Deux options sont alors à envisager : Si on dispose de la base dite primaire, c est-à-dire de l intégralité de la population surveillée définie géographiquement et temporellement, alors tous les cas doivent être recensés de façon exhaustive et les témoins sont choisis par simple tirage au sort. Le défi majeur de ce schéma est la nécessité de recenser les cas de façon exhaustive ; la sélection des témoins est en revanche plus facile... Si on ne dispose pas de la base primaire, il faut d abord définir les cas. La base d étude, dite secondaire, n est alors que la source des cas, définie cette fois a posteriori. Le défi réside ici dans cette définition de la source des cas. Définir ensuite si un sujet appartient à cette base et peut donc être un témoin potentiel n est pas toujours évident... Dans une étude où les cas sont des sujets adressés à un hôpital de référence, la base secondaire est classiquement définie par les sujets qui auraient été adressés à cet hôpital s ils avaient développé la maladie. Dans notre exemple, les cas de MVTE recrutés sont les patients adressés dans notre hôpital pour prise en charge (diagnostique et/ou thérapeutique). Nous avons choisi comme témoins des patients hospitalisés au CHU pour une pathologie autre qu une maladie veineuse thromboembolique. Notre hypothèse est que si leur médecin traitant avait suspecté chez eux une thrombose veineuse, il les aurait adressés aussi à l hôpital. Nous aurions pu choisir comme témoins des patients adressés pour une suspicion de thrombose veineuse mais pour lesquels le diagnostic a été éliminé. Cependant, la suspicion diagnostique a pu reposer sur la présence de facteurs de risque, comme par exemple un antécédent de thrombose veineuse. Une surestimation de la fréquence de ces facteurs de risque est à craindre dans ce groupe de témoins. Ceux-ci ne sont plus représentatifs de la base d étude (ici une base secondaire) mais d un sous-ensemble constitué des patients ayant des symptômes conduisant à une suspicion de thrombose veineuse. 40

Deuxième principe : minimiser le biais de confusion Un second principe qui guide le choix des témoins est celui de minimiser le biais de confusion. Un biais de confusion peut être lié à une sélection de témoins qui dépendrait de variables non mesurées, sources de confusion. Une variable est une source de confusion potentielle si elle est à la fois associée à la variable d exposition principale et à la maladie (en d autres termes, elle est un facteur de risque de la maladie). Une manière, théorique, d éliminer une source de confusion est de supprimer toute variabilité sur ce facteur : en incluant que des hommes, on élimine un biais de confusion liée au sexe! L appariement sur ce facteur est un moyen de contrôler la confusion... sans l éliminer complètement. Apparier veut dire que les cas et les témoins ont la même valeur du facteur en question : on peut ainsi créer des paires, des triplets ou des n-uplets appariés sur le sexe ; tous les sujets d un même n-uplet ont le même sexe : il ne peut donc y avoir de confusion due à ce facteur. Cependant, l uniformisation à outrance (on parle alors de surappariement) des cas et des témoins n est pas une stratégie effective pour détecter une association : il faut qu il reste de la variabilité entre cas et témoins! L appariement sur des variables qui ne sont pas des facteurs de risque n a aucun intérêt... mais plutôt des inconvénients! Par ailleurs, il ne faut pas oublier que l effet d une variable ayant servie à l appariement ne pourra être estimé, puisque l on aura uniformisé les cas et les témoins sur cette variable. Dans notre étude cas-témoins, afin d éviter des phénomènes de confusion des effets, les cas et les témoins ont été appariés sur l âge et le sexe. Troisième principe : éviter le caractère différentiel du biais de classement L erreur de mesure étant quasi inévitable, le troisième principe repose sur une évaluation comparable des cas et des témoins. Le mécanisme générant les erreurs ne doit pas être influencé par la maladie évaluée. Dans notre étude, de nombreuses variables sont collectées lors d un interrogatoire direct au cours de l hospitalisation. La remémoration de faits antérieurs peut être influencée par l hospitalisation ou le fait d être malade. Le choix de patients malades et hospitalisés comme témoins est une manière de tenter d égaliser le contexte dans lequel l effort de remémoration est demandé. L analyse d une association et interprétation des résultats Odds ratio ou risque relatif? Le critère de jugement est ici la survenue (M+) ou non (M ) de l événement considéré. Si on s intéresse à un facteur de risque binaire, les sujets peuvent être exposés (E+) ou non exposés (E ). Par exemple, le fait d avoir un taux d homocystéine supérieur à 15 lmol l -1 est-il associé à un plus grand risque de MVTE? Dans ce cas, les données Odds-ratio dans la population totale : cote de l'exposition chez les malades OR = = cote de l'exposition chez les non malades cote de la maladie chez les exposés cote de la maladie chez les non-exposés Estimation de l OR à partir de l échantillon de la population totale choisi pour notre étude cas-témoin : 299 299 OºR = 156 = 252 = 252 156 189 189 RR = < 15 (E ) Cas (M+) 299 156 Risque relatif dans la population totale = 1,44 risque de maladie chez les exposés risque de maladie chez les non-exposés Estimation NON VALIDE du RR à partir de l échantillon de la population totale choisi pour notre étude cas-témoin : 299 551 RºR = 156 345 Témoins (M ) 252 189 L estimation ainsi obtenue du RR est biaisée, même s il n y a pas de biais d échantillonnage. La valeur du RR dans la population totale est en réalité proche de l OR, estimée par l étude cas-témoins, la maladie étant rare. Figure 1. Analyse d une association : odds-ratio ou risque relatif? peuvent se résumer à un tableau à 4 cases (figure 1) qui reprend les résultats de notre étude cas-témoins. L erreur consisterait ici à vouloir estimer le risque de MVTE chez les exposés et chez les non-exposés : le quota M+/M étant fixé, cette estimation serait biaisée. Le risque relatif de E+ vs E n est donc pas directement estimable. En revanche, il est possible d estimer la prévalence de l exposition chez les cas et les témoins : 66 % chez les premiers et 57 % chez les seconds. Ce sont ces deux pourcentages qui sont comparés lorsqu on effectue un test du Khi-2, mettant en évidence une exposition plus fréquente chez les cas (p = 0,01). On peut également calculer les cotes de l exposition chez les cas (299/156) et les témoins (252/189), puis en faire le rapport : on obtient le rapport de cotes ou odds ratio, que l on présente toujours accompagné de son intervalle de confiance. Il vaut ici 1,44 (IC 95 % : 1,09-1,90) et mesure la force de l association entre l exposition et la maladie. Cette valeur est aussi celle que l on obtient en faisant le rapport des cotes de la maladie chez les exposés et les non-exposés. L odds-ratio possède une propriété qui explique son succès : son estimation n est pas biaisée, même dans les études cas-témoins, contrairement au risque relatif qu il ne faut pas utiliser ici. Pour s en convaincre, supposons que le nombre de témoins soit trois fois plus important, tout en respectant la proportion d exposition (figure 2). L odds-ratio estimé vaut toujours 1,44 alors que l estimation du risque relatif passerait de 1,20 à 1,31. L interprétation d un odds-ratio peut cependant paraître moins intuitive qu un risque relatif : il signifie que la cote de la maladie est 1,44 fois plus élevée chez les exposés que 41

Cas (M+) Témoins (M ) Homocystéine Thrombose 15 (E+) 299 756 Exposition Maladie < 15 (E ) 156 567 Estimation (valide) de l odds-ratio 299 567 OºR = = 1,44 156 756 Estimation (non valide) du risque relatif 299 1055 RºR = = 1,31 156 723 Figure 2. Exemple d une estimation non valide du risque relatif. chez les non-exposés. Toutefois, lorsque la pathologie est rare dans la population, l odds-ratio constitue une bonne approximation du risque relatif et peut être interprété comme tel. Pour fixer les idées, disons que l approximation est acceptable dès que le risque chez les non-exposés est inférieur ou égal à 1 %, quelle que soit la valeur du risque relatif inférieure à 10. Pour un risque chez les non-exposés allant jusqu à 5 %, le risque relatif doit être au plus égal à 3. Confusion et interaction Les problèmes de confusion et d interaction ne sont pas spécifiques aux études cas-témoins, mais il nous a paru important de faire ici le point sur ces notions, qui prêtent parfois à confusion... Nous avons précédemment calculé l odds ratio brut (on dit aussi marginal), c est-àdire ne tenant compte de la présence d aucun autre facteur de risque. C est traditionnellement la première étape réalisée, souvent qualifiée d analyse univariée. Généralement, d autres facteurs de risque peuvent et doivent être pris en compte : même s ils ne constituent pas la source d intérêt principale, la présence d un facteur peut modifier l association d un autre avec la pathologie. C est l analyse dite multivariée. Un phénomène de confusion peut intervenir si le facteur d intérêt est associé à un tiers facteur lui-même associé à la maladie. Dans notre exemple de la maladie thromboembolique veineuse (figure 3), une diminution de la quantité de folates augmente le risque de MVTE. Par ailleurs, le taux d homocystéine est corrélé négativement à celui des folates. Dans ce cas, l association entre l homocystéine et la maladie mesurée par l odds-ratio brut est-elle une réelle association ou est-elle due au fait que l homocystéine est liée aux folates qui sont facteur de risque? Pour répondre à cette question et éliminer un éventuel effet de confusion, Figure 3. Facteur de confusion. Folates Facteur de confusion? il est nécessaire de calculer un odds-ratio ajusté, qui va mesurer l association entre l homocystéine et la maladie, toutes choses égales par ailleurs. Un seuil de 4,9 nmol l 1 ayant été fixé pour le taux de folates, deux strates sont ainsi définies dans lesquelles on peut calculer un odds ratio mesurant l association entre l homocystéine et la maladie. On obtient 1,49 (1,11-1,98) lorsque le taux de folates est faible et 1,46 (0,34-6,23) lorsqu il est élevé. L odds ratio ajusté vaut 1,48 (1,12-1,97) et peut être vu comme un odds-ratio «moyen», bien que le calcul soit un peu plus compliqué qu une simple moyenne... Les folates ne sont donc pas facteur de confusion, puisque l odds-ratio ajusté est très proche de l odds ratio brut. Il apparaît alors que le calcul d un odds ratio ajusté n a de sens que si les odds-ratio obtenus dans chaque strate du facteur de confusion sont semblables, ce qui est le cas dans notre exemple : que signifierait un OR ajusté égal à 1,48 si l odds-ratio était de 2,3 lorsque le taux de folates est faible et 1,1 lorsque celui-ci est élevé, ou pire encore si l odds ratio était de 2,5 dans un cas et 0,8 dans l autre? On aurait alors affaire à un phénomène d interaction (souvent qualifiée respectivement de quantitative ou qualitative) entre l homocystéine et les folates : la relation entre le taux d homocystéine et la maladie est différente selon les niveaux de folates et il ne serait pas licite de calculer un OR ajusté, particulièrement dans le cas d une interaction qualitative. Il faut dans ce cas donner les résultats pour chaque strate. En pratique lors de l analyse, on commence par tester une éventuelle interaction entre le facteur d intérêt et le facteur potentiel de confusion. En l absence d interaction, on pourra estimer un OR ajusté avec intervalle de confiance afin de mettre en évidence une association non entachée d un éventuel biais de confusion. L OR ajusté peut être obtenu par la méthode de Mantel-Hanszel lorsqu il n y a qu un facteur potentiel de confusion, ou par régression logistique lorsqu il y en a plusieurs. Il est bien sûr indispensable d avoir prévu le recueil des éventuels facteurs de confusion lors de la planification de l enquête afin de pouvoir les prendre en compte dans l analyse... (figure 4). 42

Exposition (E) OR brut En présence d un tiers facteur (F) séparant la population en deux strates dans chacune desquelles on peut calculer un odds-ratio : OR 1 = OR 2 ou OR 1 OR 2? (recherche d interaction entre E et F vis-à-vis de M) OR 1 OR 2 Faire une analyse séparée pour chacune des strates du facteur F OR 1 OR 2 OR 1 = OR 2 Les OR sont les mêmes dans les strates. La valeur commune est celle de l OR ajusté. OR a OR brut OR a F est facteur de confusion Maladie (M) Figure 4. Odds-ratio brut et odds-ratio ajusté. OR brut = OR a F n est pas facteur de confusion Une alternative souvent utilisée dans les enquêtes cas-témoins est de procéder à un appariement individuellors de la constitution de l échantillon : pour chaque cas est choisi un ou plusieurs témoins ayant les mêmes caractéristiques pour les variables que l on souhaite contrôler. Les sujets n étant alors pas indépendants, cette façon de faire nécessite d utiliser des techniques statistiques particulières comme la régression logistique conditionnelle. Dans notre exemple, les cas et les témoins ont été appariés sur l âge et le sexe. Les valeurs obtenues pour les odds ratios diffèrent alors légèrement de celles obtenues classiquement, puisqu on raisonne conditionnellement au fait que pour chaque paire (il s agit ici d un appariement 1-1), le nombre d événements (MVTE) est fixé (égal à 1!). En tenant compte du facteur supplémentaire qu est le taux de vitamine B12, on obtient les résultats du tableau 3. Les questions spécifiques aux études de cohorte Le suivi Le processus de suivi est basé classiquement sur des observations itératives. Ces visites restent espacées (discrètes) dans le temps et le passage du statut de non malade à celui de malade est donc dépendant de l intervalle entre Variables Tableau 3. Odds-ratio brut et odds-ratio ajusté Homocystéine, lmol l 1, ( 15 vs < 15) Taux de folates, nmol l 1, ( 4,9 vs > 4,9) Taux de vitamines B12, pmol l 1, ( 253 vs > 253) OR brut a OR ajusté a (ICà95%) (ICà95%) 1,58(1,15-2,16) 1,48(1,05-2,08) 3,22(1,52-6,81) 3,14(1,35-7,32) 1,52(1,12-2,07) 1,42(1,03-1,98) a Les OR sont obtenus ici par des méthodes permettant de prendre en compte l appariement (régression logistique conditionnelle). deux observations. À quel moment exactement le sujet est-il devenu malade? Ces observations sont-elles systématiques? Un patient symptomatique n a-t-il pas plus de chance d être diagnostiqué? Le principe de la comparabilité du suivi est là encore primordial : les exposés et les non exposés doivent avoir un suivi comparable. La connaissance du statut d exposition ne doit pas influencer le processus de diagnostic. Dans une étude sur le risque de récidive thrombotique après un premier épisode de maladie veineuse thromboembolique survenu sans circonstance favorisante, il s agit d évaluer si la connaissance de certaines caractéristiques (nature du premier épisode, âge, sexe, antécédent familial, etc.) ne va pas influer sur le recours à des examens complémentaires diagnostiques face à une même symptomatologie et induire ainsi un biais de détection. Au cours du suivi, le patient peut être perdu de vue (refus de continuer à être suivi, changement de domicile,...). On ne connaît alors que son statut à la date de la dernière observation. Le sujet est dit «censuré» à droite. Des événements concurrents peuvent empêcher la survenue de la maladie (par exemple décès pour une autre cause) et sont souvent (à tort!) pris en compte par la censure. L observation du sujet est «arrêtée» à cette date. Ces deux types de censure sont en fait très différents. Dans le cas des perdus de vue, il n est pas totalement déraisonnable de penser que le phénomène est indépendant de l exposition et de la survenue de la maladie. S agissant en revanche d une censure par événement concurrent, l indépendance entre cette censure et la maladie qui nous intéresse est plus hypothétique. Or cette indépendance est une des conditions de validité des modèles classiques d analyse de survie. À la date fixée comme date de point, c est-à-dire la date après laquelle aucune information n est prise en compte, certains sujets ont été observés et n ont pas exprimé la pathologie : ils sont dits «exclus vivants» en référence au principe général de l étude de survie. L analyse d une association et interprétation des résultats La possibilité de suivi des patients au cours du temps permet d introduire la notion d incidence, en plus de celle de risque. Un risque est une probabilité, une incidence ne l est pas : c est une vitesse d apparition de nouveaux cas. On parle d incidence, d incidence instantanée, de taux d incidence, d incidence cumulée, de risque, de risque instantané, de prévalence... cette terminologie peut parfois paraître floue, probablement à cause du fait que sous certaines hypothèses, certaines de ces mesures sont équivalentes (tableau 4). En toute rigueur, on devrait parler de taux d incidence sur une période [t,t+dt[. C est par définition le nombre de nouveaux cas rapporté au nombre de personnes-temps à risque (susceptibles d être malades) pendant cette 43

Tableau 4. Quelques définitions Prévalence à l instant t : Proportion de malades à un instant t donné. Incidence sur une période [t,t+dt[ : Nombre de nouveaux cas par unité de temps rapporté à la taille de la population. Incidence instantanée à l instant t : Valeur limite de l incidence lorsque Dt tend vers zéro. Risque à l instant t : Risque de devenir malade entre les instants 0 et t. Fonction de survie à l instant t : Probabilité de ne pas devenir malade avant l instant t. Incidence cumulée à l instant t : Fonction mathématique de l incidence instantanée, approximativement égale au risque lorsque l incidence instantanée est constante et petite. Risque instantané : Terme souvent utilisé dans les études de survie : il s agit du taux d incidence instantané. période. L unité de temps étant généralement l année, le taux d incidence s exprime la plupart du temps en nombre de cas par personnes-années. Par exemple, un patient suivi dans le cadre de l étude de la récidive de TVP et présentant un événement thrombotique après 30 mois comptera dans le calcul du taux d incidence pour 1 cas au numérateur et 2,5 personnesannées au dénominateur. Dans ce calcul du taux d incidence, un patient suivi pendant un an et ne présentant pas d événement thrombotique équivaut à deux patients suivis chacun pendant 6 mois et ne présentant pas d événement thrombotique. Le taux d incidence, souvent réduit au simple terme incidence, est bien une vitesse et non une probabilité : le nombre de nouveaux cas par unité de temps dépend de la taille de la population et de la «vitesse de production» des nouveaux cas (le taux d incidence), de même que le débit d un fleuve dépend de sa taille et de la vitesse de l eau. En réalité, il s agit d une vitesse moyenne sur [t, t+dt[ et il convient donc de choisir une période sur laquelle cette vitesse peut être considérée comme constante. Dans l étude de la récidive de TVP, on peut faire l hypothèse qu un patient ayant présenté un événement thrombotique idiopathique est à risque élevé de récidive lors des toutes premières années, puis ce risque diminue après avoir passé cette période «critique», pour enfin augmenter progressivement avec l âge. Intervient alors la notion de taux d incidence instantané à l instant t : c est la valeur du taux d incidence lorsque Dt est très petit (en théorie tend vers zéro). L incidence instantanée n est estimable qu à l aide d une modélisation. Une autre solution consiste à découper la période de temps étudiée en intervalles suffisamment petits. Le risque est la probabilité pour un sujet non malade de devenir malade au cours d une période donnée. On doit donc également préciser de quelle période il s agit. En général, il s agit du risque sur [0,t[ : on parle aussi de risque cumulé à l instant t ; c est une fonction qui dépend du temps. Le risque est une fonction mathématique de l incidence instantanée, faisant intervenir dans le cas général un calcul d intégrale. Dans le cas le plus simple mais sous certaines hypothèses cependant pas anodines (dont la constance de l incidence instantanée et la stabilité de la population), le risque à l instant t peut être estimé par le nombre de nouveaux cas sur [0,t[ rapporté au nombre de sujets présents initialement. Lorsqu on souhaite mesurer l association entre un facteur de risque et la maladie, on dispose principalement de deux choix si on raisonne en terme de risque : la différence de risque (D) ou le rapport des risques (risque relatif RR) entre les exposés et les non exposés. D autres indices existent, comme la différence relative mais ce n est rien d autre que RR-1, ou encore comme l odds-ratio mais qui a moins d intérêt ici puisque le risque relatif est directement estimable. Le choix de la différence D correspond à celui d un modèle additif : on suppose alors que l excès de risque associé à l exposition conjointe à deux facteurs de risque A et B est égal à la somme des excès de risque associés à chacun des facteurs : D AB = D A + D B. Le choix du risque relatif RR correspond à celui d un modèle multiplicatif : on suppose alors que le risque relatif associé à l exposition conjointe de A et B est égal au produit des risques associé à chacun des facteurs : RR AB =RR A RR B. Le choix d un modèle (additif ou multiplicatif) se fait en général sur des considérations liées à l adéquation aux observations. On choisira par exemple le risque relatif si celui-ci reste stable lorsqu on change de population d étude (régions différentes par exemple) et la différence de risque si c est elle qui reste stable (figure 5). On pourrait également penser raisonner en terme de différence ou de rapport d incidence instantanée. Si la différence est constante au cours du temps, il faut privilégier le modèle additif. Si c est le rapport qui est constant, il faut privilégier le modèle multiplicatif. Si l incidence instantanée est constante et que la maladie est rare, le rapport des incidences instantanées est (approximativement) égal au rapport des risques, ce qui explique qu on ne parle bien souvent que de risque relatif. L interprétation d une différence de risque ou d un risque relatif est simple. Dans la première situation, le fait d être exposé augmente le risque de maladie, dans la seconde il le multiplie. Dans tous les cas, la mesure de l association choisie doit être accompagnée de son intervalle de confiance. Cela permet non seulement de quantifier la force de l association, mais aussi de la tester : un intervalle de confiance contenant la valeur 1 (resp. 0) indique une association non significative si on utilise un risque relatif (resp. une différence). 44

Non-exposé Exposé Population 1 : R 0 = 5 % R 1 = 15 % = 10 % Population 2 : R 0 = 10 % R 1 = 20 % = 10 % RR = 3 RR = 2 Quelle que soit la population, le risque est augmenté de 10 % lorsqu on est exposé : modèle additif. Population 1 : Population 2 : Non-exposé R 0 = 5 % R 0 = 10 % Exposé R 1 = 10 % R 1 = 20% = 5 % = 10 % RR = 2 RR = 2 Quelle que soit la population, le risque est multiplié par 2 lorsqu on est exposé : modèle multiplicatif. Figure 5. Modèle additif, modèle multiplicatif. Modèles de survie La prise en compte du temps constitue une difficulté supplémentaire : on veut non seulement savoir si un sujet a présenté l événement étudié mais aussi à quel moment. Dans notre exemple concernant l étude de la récidive de maladie thromboembolique veineuse, on cherche à mesurer le délai entre le premier événement thrombotique et la récidive, si récidive il y a. Certains patients pourront être perdus de vue avant qu on ait pu constater une récidive, ou être suivis jusqu à la fin de l étude sans récidiver. Le délai de récidive ne peut être observé : il s agit d une censure. Exclure ces patients consisterait à perdre de l information : une censure intervenant après 10 mois indique que le sujet a été indemne pendant 10 mois, c est mieux que de ne rien savoir... et cela modifie l estimation du risque. Des outils ont été développés pour répondre à cette situation. Ils portent usuellement le nom de modèle de survie mais s appliquent à l étude de l apparition de tout événement, qui peut être autre que le décès. On continue cependant à employer le terme de données de survie pour désigner l étude de l apparition de l événement en question. Dans notre exemple il s agit de la récidive : on cherche à mesurer le temps de survie sans récidive... Différentes approches sont possibles pour expliquer la survie, que l on peut classer en trois catégories : les méthodes non paramétriques qui ne font aucune hypothèse sur la loi de distribution du temps d apparition (ex : la méthode de Kaplan-Meier ou la méthode actuarielle), les méthodes paramétriques pour lesquelles il faut avoir un a priori sur cette distribution (ex : le modèle exponentiel correspondant à un risque instantané constant), et enfin le modèle de Cox qualifié de semi-paramétrique car il comporte une partie qui n est pas donnée sous forme paramétrique. La démarche classique est la suivante : on procède tout d abord à une analyse univariée à l aide de la méthode de Kaplan-Meier. La survie S(t), c est-à-dire la probabilité de ne pas encore avoir présenté l événement à l instant t, est estimée à chaque fois qu un événement se produit, en tenant compte des éventuelles censures. La représentation graphique est alors une fonction en escalier, partant de la valeur 1 et décroissant vers 0. Le test du Log-Rank permet de comparer deux ou plusieurs groupes, l hypothèse testée étant qu il n y a pas de différence entre les groupes. Dans notre exemple, supposons que l on souhaite étudier chez les femmes le rôle du traitement hormonal initial (lors du premier épisode thrombotique) dans la récidive. La représentation graphique du taux de survie sans récidive, estimé par la méthode de Kaplan-Meier, suggère un meilleur pronostic chez les femmes ayant été initialement sous traitement hormonal (les cercles représentent les temps de censure), ce qui est confirmé par le test du log-rank (p < 0,05) (figure 6). Taux de survie sans récidive (%) 1,00 0,75 0,50 0,25 0,00 0 Durée d'observation depuis l'arrêt du traitement anti-vitamine K (mois) GROUPE : Nombre de sujets à risque avec traitement 77 sans traitement 76 10 20 30 40 74 58 69 45 Test du Log-Rank : p = 0,0122 Figure 6. Courbe de survie actuarielle. FEMME AVEC TRAITEMENT HORMONAL INITIAL FEMME SANS TRAITEMENT HORMONAL INITIAL 62 33 47 25 45

Tableau 5. Facteur de confusion : le modèle de Cox Variable Estimation du paramètre Ecart-type Chi-carré p Risque relatif Intervalle de confiance à 95 % TH 0,54629 0,69868 0,6114 0,4343 0,579 0,147 2,278 AGE 0,06039 0,03209 3,5423 0,0598 1,062 0,998 1,131 SITE 0,60038 0,61783 0,9443 0,3312 1,823 0,543 6,118 Comme pour les études cas-témoins, d autres facteurs peuvent entrer en jeu ; des problèmes de confusion et d interaction peuvent intervenir. Il faut en tenir compte dans l estimation du risque : c est l analyse multivariée. Comme pour le modèle logistique, il convient de rechercher préalablement une éventuelle interaction entre le facteur d intérêt et le facteur de confusion. Si on s intéresse au rôle du traitement hormonal dans la récidive de TVP chez les femmes, l âge peut être un facteur confondant : on peut craindre qu il soit indépendamment facteur de risque et que les femmes âgées soient moins souvent sous traitement hormonal. Le modèle de Cox, permettant de relier le risque instantané à un ensemble de facteurs pronostiques, joue ici un rôle privilégié. Il porte souvent le nom de modèle des risques proportionnels car sa forme implique que le rapport des risques instantanés de deux sujets est indépendant du temps. Plusieurs variables d ajustement, quantitatives ou qualitatives, peuvent être prises en compte dans le modèle de Cox. Pour évaluer le rôle du traitement hormonal (TH) présent ou absent lors du premier épisode sur la récidive, à âge égal et site de thrombose identique lors du premier épisode, ces trois variables ont été introduites dans un modèle de Cox. Après ajustement, l effet du traitement hormonal n est plus significatif, l explication venant du fait que les femmes sous traitement hormonal sont beaucoup plus jeunes que les autres et que l âge est par ailleurs un facteur de risque : c est un facteur de confusion (tableau 5). Conclusion Les résultats d une étude cas-témoins seront d autant plus crédibles qu ils ne paraissent pas être dus à une différence dans la sélection des cas et des témoins (biais de sélection), à une distorsion de l effet par un facteur inconnu ou non mesuré mais lié à l exposition (biais de confusion), ni à une différence dans le recueil de l information entre les cas et les témoins (biais d information). Les études de cohorte sont également exposées à des biais de sélection, de classement et de confusion. Les résultats d une étude de cohorte ne sont pas nécessairement plus valides que ceux issus d une étude cas-témoins bien conduite. La qualité du suivi des sujets et l analyse des données sont deux points qui méritent un examen attentif. 46