(Introduction à l ) Introduction aux diagrammes causaux (Directed Acyclic Graphs) Loïc Desquilbet



Documents pareils
BIG DATA : PASSER D UNE ANALYSE DE CORRÉLATION

Participez aux ateliers de prévention de l UPA

Études épidémiologiques analytiques et biais

RNV3P Recherche de pathologies émergentes

HACCP Évolutions réglementaires et normatives

Page 1 Quelques méthodes et outils de la qualité

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

Contenu attendu des guides nationaux de bonnes pratiques d hygiène GBPH

PHP 2 Pratique en santé publique fondée sur des données probantes

Contradicting Beliefs and Communication. J.-M. Tallon, J.-C. Vergnaud, & S. Zamir CNRS-EUREQua

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Docteur José LABARERE

Cancer bronchique primitif: données épidémiologiques récentes

- Le Diagramme de Gantt. - Le Diagramme de Pert - La Méthode QQCQCCP - La Méthode MOSI - Cahier des charges fonctionnel

FICHE PEDAGOGIQUE 17

Économétrie, causalité et analyse des politiques

LES CIGARETTES LÉGÈRES SONT-ELLES MOINS NOCIVES?

A.-M. Cubat PMB - Import de lecteurs - Généralités Page 1 Source :

LECTURE CRITIQUE 1 ER PAS

LIVRET DE COMPETENCES

Statistiques Canadiennes sur le Cancer, et HMR sur le poumon

Les pratiques des 9-16 ans sur Internet

Statistiques avec la graph 35+

Projet de loi n o 102. Loi modifiant la Loi sur les régimes complémentaires de retraite

GOL502 Industries de services

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

S initier aux probabilités simples «Question de chance!»

Modélisation de la réforme des pensions

Un environnement sans fumée pour vos enfants. Comment y parvenir?

Guidance de Statistique : Epreuve de préparation à l examen

Université de Bangui. Modélisons en UML

AVIS N 118 DU 13 FEVRIER 2009 DU BUREAU DU CONSEIL DE L EGALITE DES CHANCES ENTRE HOMMES ET FEMMES, RELATIF A LA PROPOSITION DE DIRECTIVE PORTANT

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Emissions des moteurs diesel : Nouveau classement par le Centre International de Recherche sur le Cancer (CIRC)

COMMENT EVALUER UN RISQUE

Dimensionnement d une roue autonome pour une implantation sur un fauteuil roulant

PEUT- ON SE PASSER DE LA NOTION DE FINALITÉ?

clef primaire ; clef étrangère ; projection ; restriction ; jointure ; SQL ; SELECT ; FROM ; WHERE

TABLE DES MATIÈRES. Votre partenaire pour la gestion et règlement des sinistres

«Cours Statistique et logiciel R»

DISQUE DUR. Figure 1 Disque dur ouvert

Innovations thérapeutiques en transplantation

1

Croissance et vieillissement cellulaires Docteur COSSON Pierre Nb réponses = 81 sur 87. Résultats des questions prédéfinies

25 / 06 / 2008 APPLICATION DE LA RÉFORME BÂLE II

mesurer le ROI des médias sociaux : rêve ou réalité?

TD 1 - Structures de Traits et Unification

Régression linéaire. Nicolas Turenne INRA

GERER SON BUDGET 1- LE BUDGET

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

Resolution limit in community detection

À l attention des parents (Le conseil étudiant travaillera à produire un questionnaire pour les élèves de l école.)

Pour un usage plus sûr du téléphone portable

Modèle de plan d action pour le sondage en ligne

Surveillance épidémiologique de la mortalité et investigation d agrégats spatio-temporels en entreprise PRINCIPES GÉNÉRAUX ET DONNÉES NÉCESSAIRES

Le quizz des stats. Xavier Paoletti. Sce de biostatistiques / Inserm U900 Institut Curie

Webinaire ICCA/RBC : Tendances conjoncturelles Les opérations de change : un risque ou une occasion d affaires?

Manuel de recherche en sciences sociales

EXEMPLE DE LETTRE DE PLAINTE

Faculté de Médecine Comité des thèses Année 2012 Séminaire-Atelier n 1

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Cancer et environnement

L essentiel du tableau de bord

Gestion de Projet. Génie Logiciel. Renaud Marlet. LaBRI / INRIA. (d'après A.-M. Hugues) màj 19/04/2007

Cours d Analyse. Fonctions de plusieurs variables

Dérivés Financiers Contrats à terme

Brevet fédéral. Examen final à blanc. Informaticien-ne - Tronc commun. Version 1.1.0

Analyse de grandes bases de données en santé

Évaluations aléatoires : Comment tirer au sort?

Calcul élémentaire des probabilités

Exposition «Etre parent aujourd hui» Livret de présentation

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Épilation au laser Fiche client (e) / Questionnaire. Nom du client : Adresse : Ville : Province : Code postal : Téléphone au domicile : Au travail :

7. Recherche des essais

Manuel d utilisation. Notes. Page 9-10

académique academic adversaire opponent arguments arguments, contentions auxiliaire visuel prop, visual aide besoin need

Chaque étape est à prendre en considération. Recommandation pour une meilleure approche de l'attribution

LES GAZ D ECHAPPEMENT DES MOTEURS DIESEL CANCEROGENES

ALTO : des outils d information sur les pathologies thromboemboliques veineuses ou artérielles et leur traitement

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

MIS 102 Initiation à l Informatique

LES INDICATEURS CLÉ DE PERFORMANCE : DÉFINIR ET AGIR

Chapitre 3. Les distributions à deux variables

Monitoring e-commerce et médias sociaux

Information génétique

L évaluation de la performance de la communication media

Logiciel XLSTAT version rue Damrémont PARIS

SIG ET ANALYSE EXPLORATOIRE

FICHE TECHNIQUE #36 LÉGISLATION ET INTERVENANTS EN SANTÉ ET EN SÉCURITÉ DU TRAVAIL

Les outils graphiques d expression pour l analyse fonctionnelle des systèmes Domaine d application : Représentation conventionnelle des systèmes

LIVRET D ACCUEIL DU STAGIAIRE AU MULTI-ACCUEIL

Français, 9 e année (FRA1D) Introduction aux affaires, 9 e et 10 e année (BBI10/BBI20) 2 périodes de 70 minutes

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Le parcours d achat des Français

RDP : Voir ou conduire

Exercices de génétique classique partie II

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

RESOLUTION OIV-VITI GUIDE D APPLICATION DU SYSTÈME HACCP (HAZARD ANALYSIS AND CRITICAL CONTROL POINTS) A LA VITICULTURE DE L OIV

Consortium de recherche Value Stream Mapping Formation

Transcription:

(Introduction à l ) Introduction aux diagrammes causaux (Directed Acyclic Graphs) Loïc Desquilbet

Contexte et représentation des diagrammes causaux Contexte Recherche de facteurs de risque d une maladie Approcher au maximum la relation de causalité entre une exposition et une maladie Représentation générale E 1 E 2 M Où E 1, E 2, et E 3 sont des expositions, et M la maladie E 3 2

Objectifs des diagrammes causaux Aider l épidémiologiste à résumer visuellement les hypothétiques relations entre les différentes expositions et la maladie («variables») Obliger l épidémiologiste à se poser la question de la temporalité des relations entre les variables Repérer et éviter les biais de classement, confusion, et sélection Permettre d identifier de «faux» facteurs de confusion avant de construire et de «faire tourner» un modèle de régression 3

Rappel sur les biais de confusion (1) Contexte - Soit E une exposition d intérêt principal, X une autre exposition, et M la maladie - On cherche à quantifier la relation entre E et M Définition d un biais de confusion L association entre E et M est biaisée par du biais de confusion si E et M partage une cause commune 4

Rappel sur les biais de confusion (2) Définition d un facteur de confusion X est un facteur de confusion si la non prise en compte de X dans les analyses statistiques introduit un biais dans la relation entre E et M (X peut aussi être appelée «tiers facteur») Prise en compte des facteurs de confusion dans les analyses statistiques - Standardisation - Sélection - Stratification - Ajustement dans un modèle multivarié 5

Rappel sur les biais de confusion (3) Exemple (1) - Un étudiant un peu naïf veut étudier la relation entre le risque de fracture de la hanche (M) et la présence de cheveux gris (E) - On suppose (mais l étudiant ne le sait pas) qu il n y a aucune relation causale entre les cheveux gris et la fracture - L étudiant trouvera une association brute entre le fait d avoir des cheveux gris et celui d avoir une fracture de la hanche : Pr(cheveux gris / fracture) > Pr(cheveux gris / pas de facture) 6

Rappel sur les biais de confusion (4) Exemple (2) - L association brute entre «cheveux gris» et «fracture» est biaisée (confusion) car ces variables possèdent une cause commune (ici, l âge) - A âge égal, il n y a plus d association (statistique) entre cheveux gris et fracture - La prise en compte de l âge a permis d éliminer le biais qui existait dans la relation entre la présence de cheveux gris et celle d une fracture 7

Utilisation des diagrammes causaux Définition Un «diagramme causal» est un «Directed Acyclic Graph» (DAG) : - Graphe qui possède des flèches qui sont dirigées, reliant des expositions et la maladie - Graphe qui ne doit pas être cyclique (pas de retour à la case départ possible) Direction de chaque flèche - La flèche unidirectionnelle signifie qu il existe un lien hypothétiquement causal entre les deux variables qu elle relie - Pas de flèches bi-directionnelles 8

Utilisation des diagrammes causaux Illustration et terminologie - M est la maladie, X, E, et U sont trois expositions - X et E sont mesurées, et U est non mesurée X E M (unknown exposure) U - M est une conséquence de X, E, et U - U est une cause commune de X et M - E est sur le chemin causal entre X et M - X a un lien direct sur M, et un lien indirect passant par E 9

Repérer un biais avec les DAGs Méthode - Placer l exposition d intérêt principal E et la maladie M sur la feuille de papier - Placer toutes les autres expositions qui pourraient éventuellement avoir un lien avec E et/ou M - NE PAS METTRE de flèche entre E et M - Placer les flèches reliant les expositions entre elles, et/ou avec la maladie - Vérifier visuellement (voir méthode plus loin) si la non prise en compte d une exposition autre que E conduit à une association (fallacieuse) entre E et M 10

DAGs et biais de confusion (1) Situations de biais de confusion 1) E et M ont une cause commune (X) X E M 2) E et M ont une cause commune (U), X étant sur le X chemin causal entre U et M U E M 3) E et M ont une cause commune (U), X étant sur le U chemin causal entre U et E X E M 4) E et M ont une cause commune (U), X étant une U conséquence de U X E M 11

DAGs et biais de confusion (1) Commentaires - Dans les 3 dernières situations, la cause de confusion est U, mais X est considérée comme un facteur de confusion - Dans ces 4 situations, X doit être prise en compte pour diminuer le biais de confusion dû à X (1 ère situation) ou dû à U (2 ème, 3 ème, et 4 ème situations) - Dans la 4 ème situation, prendre en compte X n éliminera pas complètement le biais de confusion dû à U (contrairement aux 3 autres situations), sauf si U et X sont extrêmement liées entre elles U X E M 12

Le «collider», un vrai danger épidémiologique! (1) Définition Un collider de 2 expositions est une conséquence commune de ces 2 expositions (Un collider peut aussi être une conséquence d une exposition et de la maladie) E 1 E 2 X X est un collider de E 1 et E 2 Pourquoi est-ce un danger? Prendre en compte un collider de E 1 et E 2 dans une analyse statistique comme si c était un facteur de confusion (sélection, stratification, ajustement) va créer une association entre E 1 et E 2! 13

Le «collider», un vrai danger épidémiologique! (2) Illustration Présentation Tabac Facteur génétique + + Cancer du poumon On suppose qu il n existe aucun lien entre «tabac» et «facteur génétique» Stratifions sur «cancer du poumon» - Parmi les sujets sans cancer, les sujets qui fument ont moins de chance d avoir le facteur génétique que ceux qui ne fument pas (association négative) - Parmi les sujets avec cancer, les sujets qui ne fument pas ont plus de chance d avoir le facteur génétique que ceux qui fument (association négative) 14

Le «collider», un vrai danger épidémiologique! (3) Illustration Conséquence de prendre en compte un collider Tabac - Facteur génétique + + Cancer du poumon Création d une association (négative) entre «tabac» et «facteur génétique» quand on stratifie sur une conséquence (collider) de ces deux expositions (le cancer du poumon) 15

Un collider n est PAS un facteur de confusion (1) Situations simples où l on ne doit pas prendre en compte X dans les analyses 1) E et M ont une conséquence commune (X) E M X 2) U et M ont une conséquence commune (X), et U est une cause de E E M X U Remarque : situations simples à éviter en interdisant de prendre en compte une conséquence de M 16

Un collider n est PAS un facteur de confusion (2) Situations plus compliquées où l on ne doit pas prendre en compte X dans les analyses E X M X est une conséquence de E, et éventuellement une cause de M (X est alors appelé un facteur intermédiaire dans la relation causale entre E et M) Cas de figure qui pourrait arriver lorsque l on veut évaluer l effet direct de E sur M, effet ne passant pas par X U E X M U Remarque : prévenir des dangers si prise en compte d un facteur intermédiaire pour évaluer l effet direct de E sur M 17

Un collider n est PAS un facteur de confusion (3) Situation très compliquée où l on ne doit pas prendre en compte X dans les analyses U 2 X est un indicateur de risque de maladie, et partage une cause commune avec E (U 2 ) X E M U 1 Remarques : - Situation difficile à prévoir - Raison pour laquelle X n a pas été prise en compte dans les analyses encore plus difficile à justifier dans les parties méthodes des articles! 18

En conclusion (de l introduction) sur les DAGs Les DAGs (ou diagrammes causaux) permettent - de poser le problème (exposition d intérêt, expositions dont on veut tenir compte, maladie) - de réfléchir aux hypothèses que l on fait quant à la temporalité des relations - de vérifier la pertinence de la prise en compte de variables (facteurs de confusion, conséquences de la maladie, facteurs intermédiaires, collider, ) Les DAGs ne permettent pas - de quantifier la force des associations, réelles ou créées par des prises en compte non recommandées de certaines variables - de savoir de combien on réduit ou augmente les biais par des prises de compte de variables 19

Bibliographie Pearl J. Causal Diagrams for Empirical Research. Biometrika 1995,82:669-688. Greenland S, Pearl J, Robins JM. Causal diagrams for epidemiologic research. Epidemiology 1999,10:37-48. Hernan MA, Hernandez-Diaz S, Werler MM, Mitchell AA. Causal knowledge as a prerequisite for confounding evaluation: an application to birth defects epidemiology. Am J Epidemiol 2002,155:176-184. Hernan MA, Hernandez-Diaz S, Robins JM. A structural approach to selection bias. Epidemiology 2004,15:615-625. Hernan MA, Cole SR. Invited Commentary: Causal Diagrams and Measurement Bias. Am J Epidemiol 2009,170:959-962; discussion 963-954 20