Epidémiologie: quelques outils D.U Santé Précarité Lille 16/02/2012 B. Tilmont 1
Qu est-ce que l épidémiologie? Etude de la distribution et des déterminants des problèmes de santé dans les populations humaines (M. Gregg) Savoir pourquoi les individus deviennent malades et quels sont les déterminants qui affectent la santé des individus 2
Formulation des questions en épidémiologie Quelle est l importance d un problème de santé dans une population donnée? = répondre aux questions: quoi? combien? quand? où? qui? épidémiologie descriptive Quelle est la cause d une maladie ou quels sont les facteurs de risque?= expliquer pourquoi épidémiologie analytique 3
Différents types de variables Variable quantitative: que l on mesure : on peut toujours répondre à la question combien? ex: âge, pression artérielle, taux de sucre dans le sang Variable qualitative: que l on observe : caractéristique ayant un certain nombre de catégories exhaustives et mutuellement exclusives ex: groupe sanguin, sévérité de la douleur (aucune douleur/douleur minime/douleur modérée/douleur sévère) 4
Variables quantitatives: quelques éléments de description (1) 5 Moyenne= somme des valeurs / nombre de valeurs Ex: 5 personnes : 24,17, 35, 37,32 ans Moyenne d âge=145/5=29 ans Médiane= valeur qui partage une distribution en deux effectifs égaux Si effectifs = n, médiane = (n+1)/2 Toujours classer les effectifs Ex: Série: 2, 5, 6, 9, 9 : médiane = 6 Série: 2, 5, 8, 8, 9,10,11 : médiane = 8 Série: 2, 5, 9, 10, 11, 11 : médiane = 9,5 Série: 2,5,5,5 : Médiane = 5
Variables quantitatives: quelques éléments de description (2) Valeur minimale, valeur maximale, étendue de la distribution (= différence entre les valeurs extrêmes) Ex: série de valeurs d âge 17, 24, 27, 27, 29, 29, 32, 35, 37 ans valeur min: 17 valeur max: 37 étendue: 17-37 (ou 20 ans) 6
Variables quantitatives: quelques éléments de description (3) Quartiles: valeurs qui partagent une distribution en 4 groupes d effectifs égaux (3 quartiles) 1 er quartile: 25% de la distribution au dessous, 75% au dessus 2 ème quartile: 50% de la distribution au dessous, 50% au dessus = médiane 3 ème quartile: 75% de la distribution au dessous, 25% au dessus 7
Variables qualitatives: quelques éléments de description Proportion: rapport de 2 valeurs dont le numérateur est compris dans le dénominateur Ex: nombre d hommes/nombre d hommes et de femmes (= nombre total de cas) atteints de tuberculose Ratio: rapport de 2 valeurs dont le numérateur n est pas compris dans le dénominateur Ex: sex ratio Population: 20 hommes et 50 femmes Sex ratio H/F= 20/50 = 0,4 8
Mesures de mortalité : définitions Mortalité globale = nombre de décès / population étudiée Mortalité spécifique pour une cause x = nombre de décès dus à cette cause / population étudiée pour une classe d âge donnée = nombre de décès dans cette classe d âge / population étudiée 9 Létalité: nombre de décès dus à une maladie / nombre de patients atteints par cette maladie
Mesures de mortalité : exemples 10 Camp de réfugiés de 18 000 personnes (stable) 184 décès observés en 2000 12 900 cas de paludisme 44 décès dus au paludisme Mortalité brute=184/18 000 = 0,0102 soit 10,2 décès pour 1000 personnes Mortalité spécifique due au paludisme = 184/18 000 = 2,4 pour 1000 personnes Létalité due au paludisme = 44/12900 = 0,0034 soit 0,34% des cas
Morbidité : définition Nombre de personnes souffrant d une maladie donnée pendant un temps donné dans une population Prévalence Incidence 11
Morbidité: Prévalence et incidence 12 Prévalence fréquence d une maladie dans une population nombre de cas observés / population étudiée à un instant temps donné Ex: 2007 en France: prévalence de l infection par le VIH = 113 000 et 141 000 personnes Incidence fréquence de survenue d une maladie dans une population nombre de nouveaux cas /population étudiée au cours d une période donnée Ex: entre 1996 et 2005 en France: nombre de nouveaux cas = incidence de la coqueluche chez les nourrissons de moins de 3 mois = 276 / 100 000
Estimation d une moyenne (ou d un pourcentage) (1) Mesures faites sur un échantillon le plus souvent But du calcul d une moyenne sur échantillon = estimer la moyenne inconnue dans la population d étude Problème: Fluctuations d échantillonnage 13 D où: on estime la moyenne inconnue en calculant un intervalle de confiance (IC) (formule de calcul)
Estimation d une moyenne (ou d un pourcentage) (2) IC : 2 bornes entre lesquelles la valeur inconnue de la moyenne a la plus grande probabilité de se trouver IC généralement fixé à 95% = 95 chances sur 100 que la moyenne se situe dans cet intervalle Ex: moyenne «m» de la glycémie d un échantillon de 25 sujets représentatifs de la population d étude = 1,52 g/l Calcul de l IC à 95% : m = 1,52 +/- 0,165 g/l ou m compris dans l intervalle [1,355-1,685] 14
Estimation d une moyenne (ou d un pourcentage) (3) Exemple de présentation des résultats: Pourcentage = 11,7 % [10,6 ; 12,3] Signification de l IC à 95% il y a 95 chances sur 100 pour que le pourcentage inconnu (population) soit compris dans cet intervalle il y a 5 chances sur 100 pour qu il soit extérieur à cet intervalle il y a donc 5 chances sur 100 de se tromper 15
Principaux schémas d études: étude de cohorte (1) Comparer la survenue d une maladie entre des groupes exposés et non-exposés à un facteur de risque Sujets exposés et sujets non exposés à une caractéristique Suivis puis comparés pour l incidence de l évènement Etudes prospectives ou rétrospectives 16
Principaux schémas d études: étude de cohorte (2) Etude de cohorte prospective Exposition Etude Survenue de la maladie Etude Exposition Survenue de la maladie Temps 17
Principaux schémas d études: étude de cohorte (3) Etude de cohorte rétrospective Exposition Survenue de la maladie Etude Temps 18
Principaux schémas d études: étude de cohorte (4) Ex: l infection à VIH augmente-t-elle le risque de survenue de tuberculose? Exposition Population Cas de TB suivie sur 2 ans VIH + 215 8 VIH - 298 1 19
Etude de cohorte: mesure du Risque Relatif (RR) Malades Non malades Total Exposés a b Nb d'exposés (E1) Non exposés c d Nb de non exposés (E0) Total Nb de malades (M1) Nb de non malades (M0) Total (T) 20 Calcul incidence maladie chez les exposés (a/e1) et chez non exposés (c/e0) Risque relatif = (a/e1) / (c/e0) Signifie l excès de risque de survenue d une maladie chez des sujets exposés à un facteur de risque
Principaux schémas d études: étude cas-témoins (1) Identifier un groupe de malades (cas) et un groupe de non malades (témoins) Comparer la fréquence d exposition chez les cas et chez les témoins ATCD exposition Recrutement des cas et témoins Etude 21 Temps
Principaux schémas d études: étude cas-témoins (2) Ex: Toxi-infection alimentaire collective Consommation mayonnaise cas témoins oui 36 9 non 2 8 22
Etude cas-témoins: mesure de l Odds- Ratio (OR) Malades Non malades Total Exposés a b Nb d'exposés (E1) Non exposés c d Nb de non exposés (E0) Total Nb de malades (M1) Nb de non malades (M0) Total (T) 23 Calcul parmi les cas du rapport sujets exposés/ sujets non exposés (a/c) et parmi les témoins du rapport exposés/ sujets non exposés (b/d) Odds- ratio = (a/c)/(b/d)= ad/bc Signifie l excès de risque de survenue d une maladie chez des sujets exposés à un facteur de risque
Interprétation du RR ou de l OR =1 pas d association entre l exposition et la maladie: «pas d association» >1 risque de maladie plus fort chez les exposés que chez les non exposés: «facteur de risque» <1 risque de maladie moins fort chez les exposés que chez les non exposés: «facteur protecteur» 24
Ce qu il faut retenir Quelque soit le choix, se rappeler que études castémoin et de cohorte ont la même finalité : Mettre en évidence une liaison entre exposition et survenue de la maladie 25 Le choix du type d étude dépend : fréquence du facteur de risque fréquence de la maladie ressources disponibles temps disponible et..du jugement de l épidémiologiste
Interprétation de l Intervalle de Confiance du RR ou de l OR (1) Etudes de cohorte ou cas-témoins: sur échantillons représentatifs de population d étude Problème: Fluctuations d échantillonnage D où: intervalle de confiance (IC) à 95% du RR ou de l OR (formules de calcul) 26
Interprétation de l IC du RR (ou de l OR) (2) RR<1 facteur protecteur IC95% d association) RR=1 absence de risque (pas RR>1 facteur de risque 0 1 27
Notions de signification statistique (1) Le plus souvent en épidémiologie : comparaison d une observation sur un échantillon à une valeur théorique d un paramètre observé sur un échantillon à ce même paramètre observé sur un autre échantillon 28
Notions de signification statistique (2) Ex: Entreprise: surpoids parmi les femmes travaillant de nuit Hypothèse : ration calorique quotidienne plus importante parmi les femmes effectuant un travail de nuit par rapport aux recommandations ( 2000 kcal/j) Enquête décrivant la moyenne des apports caloriques pour un échantillon de 100 femmes travaillant de nuit : 2500 kcal/j «Compte-tenu que cette observation provient d un échantillon, cette ingestion est-elle réellement plus importante que celle qui est recommandée ou bien cette différence peut-elle être due au seul hasard?» 29
Notions de signification statistique (3) Tests statistiques de comparaison des différences entre paramètres: moyennes, pourcentages calcul de la probabilité p, p étant la probabilité que «la différence observée soit due uniquement au hasard» Différence significative : p<0,05 Il est peu probable que la différence observée soit due au hasard = la différence entre les paramètres étudiés est significative 30 Différence non significative: p>0,05 La probabilité que la différence observée soit due au hasard est forte = la différence observée entre les paramètres observés est non significative
31 Notions de signification statistique (4)