Université Pierre et Marie Curie. Biostatistique PACES - UE

Dimension: px
Commencer à balayer dès la page:

Download "Université Pierre et Marie Curie. Biostatistique PACES - UE4 2013-2014"

Transcription

1 Uiversité Pierre et Marie Curie Biostatistique PACES - UE Resposables : F. Carrat et A. Mallet Auteurs : F. Carrat, A. Mallet, V. Morice Mise à jour : 21 octobre 2013 Relecture : V. Morice, A. Mallet, A.J. Vallero, F. Carrat et S. Tézeas

2 2/179 Biostatistique - Carrat, Mallet, Morice

3 Sommaire Sommaire 3 Sommaire 9 Avat-propos 11 Itroductio 11 1 La variabilité et l icertai 12 2 La mesure d ue gradeur Uités et équatios au dimesios Erreurs de mesure 14 3 La décisio das l icertai 15 Chapitre 1 : Statistique(s) et Probabilité(s) Statistique Populatio et échatillo Statistique et probabilité 19 Chapitre 2 : Rappels mathématiques Esembles, élémets Opératios sur les esembles Esembles fiis, déombrables, o déombrables Esembles produits Familles d esembles Autres rappels mathématiques Rappel sur les sommes Rappel sur les itégrales 25 Chapitre 3 : Elémets de calcul des Probabilités Itroductio Epériece aléatoire, esemble fodametal et évéemets Opératios sur les évéemets Règles du calcul des probabilités Remarque Illustratio de quelques esembles probabilisés Esemble probabilisé fii Esemble fii équiprobable Esembles probabilisés ifiis Biostatistique - Carrat, Mallet, Morice 3/179

4 Sommaire Cas déombrable Cas d u esemble probabilisé ifii o déombrable 33 Chapitre 4 : Probabilité Coditioelle ; Idépedace et Théorème de Bayes Probabilité coditioelle Théorème de la multiplicatio Diagramme e arbre Théorème de Bayes Idépedace etre évéemets Idépedace, iclusio et eclusio de deu évéemets 41 Chapitre 5 : Evaluatio de l itérêt diagostique des iformatios médicales Itroductio Le diagostic Les iformatios médicales Situatio epérimetale et estimatio Les paramètres de l évaluatio Sesibilité et spécificité Valeurs prédictives Comparaiso des deu couples de paramètres Choi d u seuil : courbes ROC Estimatio des paramètres de l évaluatio U échatillo représetatif Les doées Estimatio de la sesibilité et de la spécificité Estimatio des valeurs prédictives Deu échatillos représetatifs 51 Chapitre 6 : Variables aléatoires Défiitio d ue variable aléatoire Variables aléatoires fiies Représetatio d ue loi de probabilité fiie Espérace mathématique d ue variable fiie Variace et écart-type d ue variable fiie Loi de probabilité produit Variables aléatoires idépedates Foctio de répartitio Variables ifiies déombrables (hors programme) Variables aléatoires cotiues Etesio de la otio de variable aléatoire 4/179 Biostatistique - Carrat, Mallet, Morice

5 Sommaire 63 Chapitre 7 : Eemples de distributios Lois discrètes Loi de Beroulli Loi biomiale Loi de Poisso Lois cotiues Loi ormale Défiitio Propriétés Loi du 2 (chi-2) Défiitio Propriétés Loi de Studet (hors programme) Loi epoetielle (hors programme) Applicatio de la Loi de Poisso à l iterprétatio d u risque saitaire possible qui a pas ecore été observé Itroductio Le problème «direct» Problème iverse Applicatio umérique Remarque 77 Chapitre 8 : Statistiques descriptives Rappels et complémets Représetatio complète d ue série d epérieces Cas d ue variable qualitative Cas d ue variable quatitative discrète Cas d ue variable quatitative cotiue. Notio d HISTOGRAMME Représetatio simplifiée d ue série d epérieces Idicateurs de localisatio des valeurs Idicateurs de dispersio des valeurs Reformulatio de la moyee et de la variace observées Reformulatio de la moyee observée Reformulatio de la variace observée Cas particulier d ue variable à deu modalités - Proportio Epressio de l espérace mathématique de X Epressio de la variace de X Iterprétatio de la moyee observée Coclusio : la variable aléatoire moyee arithmétique 87 Résumé du chapitre Biostatistique - Carrat, Mallet, Morice 5/179

6 Sommaire 89 Chapitre 9 : Fluctuatios de la moyee observée : la variable aléatoire moyee arithmétique Première propriété de la variable aléatoire moyee arithmétique U eemple Gééralisatio Secode propriété de la variable aléatoire moyee arithmétique : le théorème cetral limite Etude de la distributio ormale (rappel) Applicatio du théorème cetral limite. Itervalle de Pari (I. P.) Défiitio de l itervalle de pari (I. P.) d ue moyee observée Les facteurs de dépedace de la logueur de l itervalle de pari (IP) L itervalle de pari d ue variable aléatoire 98 Résumé du chapitre 99 Chapitre 10 : Estimatio - Itervalle de cofiace Itroductio Estimatio poctuelle Défiitio Propriétés Biais Variace Erreur quadratique moyee Eemple Estimatio par itervalle - Itervalle de cofiace Eemple d ue proportio Itervalle de cofiace approché d ue proportio «vraie» Itervalle de cofiace approché d ue moyee «vraie» (variable cotiue) Applicatios Précisio d u sodage Précisio d ue moyee 109 Chapitre 11 : Les tests d hypothèses. Pricipes U eemple cocret (empruté à Schwartz) Pricipe gééral des tests d hypothèses Les étapes de mises e œuvre Justificatio de la règle de décisio. Choi de Iterprétatio de Effet d u chagemet de valeur de Justificatio des coclusios du test. Puissace d u test Amélioratio de l iterprétatio du rejet de H Notio de degré de sigificatio 6/179 Biostatistique - Carrat, Mallet, Morice

7 Sommaire Orietatio du rejet Rappels et précisios 122 Résumé du chapitre 123 Chapitre 12 : Quelques tests usuels Tests cocerat des variables de Beroulli Test d égalité d ue proportio «vraie» à ue valeur doée (ou test de comparaiso d ue proportio observée à ue valeur doée) Mise e place du test Autre iterprétatio du paramètre z Nombre de sujets écessaires Test d égalité de deu proportios «vraies» (ou test de comparaiso de deu proportios observées) Mise e place du test Nombre de sujets écessaires Tests cocerat des variables quatitatives Tests impliquat ue valeur doée Test d égalité d ue moyee «vraie» à ue valeur doée (ou test de comparaiso d ue moyee observée à ue valeur doée) Test de symétrie d ue variable (X) par rapport à ue valeur doée (0) : test de Wilcoo Tests de comparaiso de variables quatitatives Test d égalité de deu moyees «vraies» (ou test de comparaiso de deu moyees observées) Test d égalité de deu distributios (ou test de comparaiso de deu distributios observées) : test de Ma-Whitey-Wilcoo Cas des séries appariées Test de comparaiso de deu moyees observées sur séries appariées Test de symétrie de la distributio des différeces 135 Résumé du chapitre 137 Chapitre 13 : Tests cocerat des variables qualitatives Comparaiso d ue répartitio observée à ue répartitio doée ou test du 2 d ajustemet Les étapes de mise e œuvre Cas particulier : variable à deu modalités Comparaiso de plusieurs répartitios observées ou test du 2 d homogééité Test d idépedace etre deu variables qualitatives 150 Résumé du chapitre Biostatistique - Carrat, Mallet, Morice 7/179

8 Sommaire 151 Chapitre 14 : Liaiso etre deu variables cotiues : otio de corrélatio Itroductio Abord du problème U idicateur de covariatio : le coefficiet de corrélatio Le coefficiet de corrélatio «vrai» Test d égalité du coefficiet de corrélatio «vrai» à Résumé du chapitre 163 Chapitre 15 : Méthodologie des études épidémiologiques La causalité Démarche epérimetale et démarche d observatio Les essais radomisés Défiitio Commet limiter les biais das le déroulemet d u essai thérapeutique radomisé? Aveugle et placebo Commet limiter les biais das l aalyse d u essai thérapeutique radomisé? Itetio de traiter Les études d observatio Cohortes - Cas-témois et études trasversales Etudes prospectives et rétrospectives Doées logitudiales E pratique Mesures d associatio utilisées e épidémiologie Risque attribuable, proportio de cas évitables 172 Résumé du chapitre 173 Aee A : Tables statistiques 174 A.1 TABLE DE LA VARIABLE NORMALE REDUITE Z 175 A.2 TABLE DU TEST DE WILCOXON 176 A.3 TABLE DU TEST DE MANN-WHITNEY-WILCOXON 177 A.4 TABLE DE A.5 TABLE DU COEFFICIENT DE CORRELATION 179 A.6 TABLE DU t DE STUDENT 8/179 Biostatistique - Carrat, Mallet, Morice

9 Avat-propos Avat-propos Ce polycopié cotiet le cours de biostatistique de la PACES - UE4 - de la Faculté de Médecie Pierre et Marie Curie (Paris VI). O pourra trouver des complémets das le livre de A. J. Vallero : A.J. Vallero. UE4 : évaluatio des méthodes d aalyse appliquées au scieces de la vie et de la saté. Elsevier-Masso (collectio Pass Saté) Des QCM corrigées sot e particulier dispoibles das le livre : V. Morice & A. Mallet. QCM corrigées et commetées de Biostatistique. Ellipses 2012 Pour e savoir plus : R. Beuscart et Collège des Eseigats de Biostatistique. Biostatistique. Omisciece, Biostatistique - Carrat, Mallet, Morice 9/179

10 Avat-propos 10/179 Biostatistique - Carrat, Mallet, Morice

11 Itroductio Itroductio La statistique costitue, e médecie, l outil permettat de répodre à de ombreuses questios qui se poset e permaece au médeci : 1. Quelle est la valeur ormale d ue gradeur biologique, taille, poids, glycémie? 2. Quelle est la fiabilité d u eame complémetaire? 3. Quel est le risque de complicatio d u état pathologique, et quel est le risque d u traitemet? 4. Le traitemet A est-il plus efficace que le traitemet B? 1 La variabilité et l icertai Toutes ces questios, propremet médicales, reflètet ue propriété fodametale des systèmes biologiques qui est leur variabilité. Cette variabilité est la somme d ue variabilité epérimetale (liée au protocole de mesure) et d ue variabilité propremet biologique. O peut aisi décomposer la variabilité d ue gradeur mesurée e deu grades composates : variabilité totale = variabilité biologique + variabilité métrologique La variabilité biologique peut être elle-même décomposée e deu termes : d ue part la variabilité itra-idividuelle, qui fait que la même gradeur mesurée chez u sujet doé peut être soumise à des variatios aléatoires ; et d autre part la variabilité iter-idividuelle qui fait que cette même gradeur varie d u idividu à l autre. variabilité biologique = variabilité itra-idividuelle + variabilité iter-idividuelle La variabilité itra-idividuelle peut être observée lors de la mesure de la performace d u athlète qui est pas capable des mêmes performaces à chaque essai, mais qui se différecie des autres athlètes (variabilité iter-idividuelle). E gééral, la variabilité itra est moidre que la variabilité iter. La variabilité métrologique peut être elle aussi décomposée e deu termes : d ue part les coditios epérimetales dot les variatios etraîet u facteur d aléas ; et d autre part les erreurs iduites par l appareil de mesure utilisé. variabilité métrologique = variabilité epérimetale + variabilité appareil de mesure La mesure de la pressio artérielle peut grademet varier sur u idividu doé suivat les coditios de cette mesure ; il est aisi recommadé de la mesurer après u repos d au mois 15 miutes, allogé, e mettat le patiet das des coditios de calme maimal. Cette recommadatio vise à miimiser la variabilité due au coditios epérimetales. La précisio de l appareil de mesure est ue doée itrisèque de l appareil, et est fourie par le costructeur Biostatistique - Carrat, Mallet, Morice 11/179

12 Itroductio 2 La mesure d ue gradeur 2.1 Uités et équatios au dimesios Les gradeurs mesurées possèdet la plupart du temps ue uité. La distace etre Paris et Marseille se mesurera par eemple e kilomètres, l épaisseur d u cheveu e micros, le poids d ue orage e grammes. Das quelle mesure ces gradeurs peuvet-elles être comparées? La distace etre Paris et Marseille, et l épaisseur d u cheveu sot deu logueurs ; leur comparaiso est possible si o les mesure avec ue uité commue, par eemple le mètre. E revache, le poids de l orage est pas comparable au logueurs précédetes. Deu gradeurs qui peuvet être comparées sot dites posséder la même dimesio. Elles peuvet être caractérisées par leur dimesio : o parlera par eemple de logueur. Les dimesios de toutes les gradeurs physiques peuvet s eprimer e foctio de sept dimesios de base : la logueur otée L, la masse M, le temps T, l itesité électrique I, la température, l itesité lumieuse J, et la quatité de matière N. Par eemple ue vitesse est ue logueur divisée par u temps. O dira que sa dimesio est LT -1. Plus précisémet, de l équatio doat la vitesse v e foctio de la distace d parcourue pedat le temps t, v=d/t, o déduit la relatio etre les dimesios (otées etre crochets) des deu membres de l équatio [v] =[d]/[t] =LT -1. Cette relatio est appelée équatio au dimesios. Ue équatio au dimesios permet doc d eprimer la dimesio de importe quelle gradeur e foctio des dimesios élémetaires, à coditio de coaître les relatios etre elles. Elle permet aussi ue première validatio d ue relatio etre gradeurs physiques : les dimesios de la partie gauche et de la partie droite de la relatio doivet être idetiques. Détermios par eemple la dimesio d ue éergie ou d u travail, à partir de la formule w = f.l (u travail est le produit d ue force par ue logueur). Ue force est le produit d ue masse par ue accélératio (f = m.) et ue accélératio est ue logueur divisée par le carré d u temps. Doc [w] =[f][l]=[m][l]t -2 ][l] =ML 2 T -2. U autre itérêt des équatios au dimesios cocere les uités des gradeurs mesurées. O défiit u système d uités e imposat des uités au 7 dimesios de base, les autres uités de défiissat à l aide des équatios au dimesios. Le système d uités le plus utilisé est le Système Iteratioal, ou SI, das lequel ue logueur est mesurée e mètres (m), ue masse e kilogrammes (kg), u temps e secodes (s), ue itesité électrique e ampères (A), ue température e degrés Kelvi (K), ue itesité lumieuse e cadelas (cd), et ue quatité de matière e moles (mol). Das le système iteratioal, certaies uités dérivées sot évidetes : ue surface s eprime e mètres carrés. D autres le sot mois. Citos l hertz pour ue fréquece, le pascal pour ue pressio, le joule pour ue éergie ou u travail, le watt pour ue puissace, le ewto pour ue force, le coulomb pour ue charge électrique, le volt pour ue différece de potetiel, l ohm pour ue résistace, etc. Il eiste des gradeurs sas dimesio, calculées comme le rapport de deu gradeurs de même dimesio, mais qui possèdet pourtat ue uité. U agle est ue gradeur sas dimesio mesurée e radias das le système iteratioal. 12/179 Biostatistique - Carrat, Mallet, Morice

13 Itroductio 2.2 Erreurs de mesure La mesure d ue gradeur e peut coduire à ue valeur eacte. E premier lieu, l istrumet de mesure possède écessairemet ue précisio limitée : ue règle graduée millimètre par millimètre e peut doer ue meilleure précisio qu u demi millimètre. E secod lieu, la gradeur à mesurer peut être source de variabilité itra-idividuelle : la répétitio de la mesure avec le même istrumet et das des coditios idetiques coduit alors à des résultats différets. Efi, l istrumet de mesure peut être mal étaloé ou mal adapté et coduire à u biais de mesure systématique : les valeurs mesurées serot systématiquemet trop élevées, ou systématiquemet trop basses. Pour ue gradeur X à mesurer, o ote X l erreur de mesure. Cette erreur est gééralemet facilemet coue si elle est due qu à u problème de précisio. S il eiste ue variabilité itraidividuelle (raisoablemet faible), o fera iterveir l écart-type des mesures (voir chapitre 10 page 99). Si est la valeur mesurée, la vraie valeur est doc comprise etre -X et +X. Si ue gradeur G est pas mesurée, mais déduite d autres gradeurs X, Y, Z à l aide d ue formule, l erreur G sur G doit se déduire des erreurs X, Y, Z sur X, Y, Z. Le plus souvet, o utilise u calcul basé sur la différetielle totale eacte de la formule. Si G = f(x, Y, Z), la différetielle totale eacte 1 est : df f f f = dx dy dz X Y Z L erreur de mesure est alors doée par : G = f = f X + f Y + X Y f Z Z Supposos par eemple devoir calculer ue résistace R e mesurat l itesité I du courat qui y circule et la différece de potetiel U à ses bores. La formule liat ces gradeurs est R = U/I. O mesure U = 1000 volts à 1 volt près et I = 1 ampère à 10-3 ampère près. La formule doe R = 1000 ohms et l erreur se calcule par R U U = I = 2 I Le calcul basé sur la différetielle totale eacte est cepedat qu ue approimatio (o cofod ue courbe et sa tagete). Lorsque des calculs plus eacts sot possibles, ils sot préférables. Aisi, supposos avoir trouvé 100 avec ue précisio de 1 pour la mesure d ue gradeur X et ous itéresser à la gradeur Y =1/X. X La formule de la différetielle totale eacte doe Y = , doc ue valeur de Y comprise etre 0,0099 et 0,0101. X 2 = 10 4 Mais puisque la vraie valeur de X est comprise etre 99 et 101, la vraie valeur de Y est e réalité comprise etre 1/101 et 1/99, soit etre 0, et 0, I 2 1. Rappel : calculer la dérivée partielle d ue foctio par rapport à l ue des variables cosiste à dériver e assimilat les autres variables à des costates Biostatistique - Carrat, Mallet, Morice 13/179

14 Itroductio 3 La décisio das l icertai Pour predre ue décisio diagostique ou thérapeutique le médeci doit avoir des élémets lui permettat de predre e compte cette variabilité aturelle, pour distiguer ce qui est ormal de ce qui est pathologique (décisio à propos d u patiet) et pour évaluer la qualité d u ouvel eame, ou d ue ouvelle thérapeutique (décisio thérapeutique). La compréhesio des méthodes statistiques, de leur puissace et de leurs limites, est essetielle pour u médeci de os jours. Tout résultat de recherche médicale résulte d ue epérimetatio (cliique ou biologique) qui s appuie sur ue méthodologie statistique rigoureuse, et dot les résultats sot aalysés e termes statistiques. De même la démarche statistique permet d évaluer les risques (ou les bééfices) d ue prescriptio, de détermier das ue situatio doée l eame qui apportera la meilleure iformatio diagostique. Nous voyos doc l importace de la maîtrise de l outil et de la démarche statistique : Pour permettre les progrès de la coaissace médicale : c est le domaie de la recherche cliique qui e peut s accomplir coveablemet (défiitio de la questio, mise e place du protocole epérimetal, aalyse des résultats) qu e suivat ue méthodologie statistique rigoureuse. Pour mieu coaître l état de saté d ue populatio, la fréquece et la gravité d ue épidémie (peser au SIDA), etc. Cette coaissace se fera à partir d échatillos coveablemet choisis et de calculs basés sur les outils de la statistique. Il sera alors possible de rechercher les stratégies de prévetio les mieu adaptées, d e évaluer leur impact. Il s agit là des applicatios relevat de l épidémiologie et de la saté publique. Pour améliorer la pratique médicale das ses aspects décisioels, à savoir choisir le meilleur eame (cliique ou para-cliique) pour aboutir le plus rapidemet et le plus sûremet au diagostic. Pour optimiser la thérapeutique, choisir le traitemet le mieu adapté à u patiet doé (choi du médicamet, posologie, etc). L objectif de ce cours est de vous fourir les bases idispesables permettat de compredre les méthodes utilisées, d iterpréter correctemet les résultats de ouvelles recherches, et d adopter u mode de raisoemet qui soit à même d aider à la décisio das l eercice de la médecie. Plus précisémet ous étudieros successivemet : 1. Les bases de calcul de probabilités, qui sot idispesables à la compréhesio et à l utilisatio des méthodes statistiques. 2. La statistique descriptive qui permet de représeter et de quatifier la variabilité d ue ou plusieurs gradeurs observées. 3. La statistique iductive qui iclura les tests statistiques permettat de reteir ue hypothèse A plutôt qu ue hypothèse B à partir de doées epérimetales (comme das le cas de la comparaiso de deu traitemets, où l hypothèse A est que les deu traitemets sot équivalets et l hypothèse B est qu ils sot différets). 4. Les applicatios des méthodes statistiques à l épidémiologie, à l aide à la décisio thérapeutique et diagostique, et les applicatios au essais thérapeutiques. 14/179 Biostatistique - Carrat, Mallet, Morice

15 Statistique(s) et Probabilité(s) Chapitre 1 Statistique(s) et Probabilité(s) Nous commeceros par défiir les termes et les cocepts importats. 1.1 Statistique Le terme statistique désige à la fois u esemble de doées d observatios, et l activité qui cosiste e leur recueil, leur traitemet et leur iterprétatio. Les termes statistique, ou statistiques (au pluriel) eglobet aisi plusieurs otios distictes : 1. D ue part le recesemet de gradeurs d itérêt comme le ombre d habitats d u pays, le reveu moye par habitat, le ombre de séropositifs das la populatio fraçaise. Nous voyos que la otio fodametale qui se dégage de cette éumératio est celle de Populatio. Ue populatio est u esemble d objets, d êtres vivats ou d objets abstraits (esemble des mais de 5 cartes distribuées au bridge...) de même ature. 2. La statistique e tat que sciece s itéresse au propriétés des populatios aturelles. Plus précisémet elle traite de ombres obteus e comptat ou e mesurat les propriétés d ue populatio. Cette populatio d objets doit e outre être soumise à ue variabilité, qui est due à de très ombreu facteurs icous (pour les populatios d objets biologiques qui ous itéresset ces facteurs sot les facteurs géétiques et les facteurs eviroemetau). 3. A ces deu acceptios du terme statistiques (au pluriel) il faut ajouter le terme statistique (au sigulier) qui défiit toute gradeur calculée à partir d observatios. Ce peut être la plus grade valeur de la série statistique d itérêt, la différece etre la plus grade et la plus petite, la valeur de la moyee arithmétique de ces valeurs, etc. 1.2 Populatio et échatillo O appelle populatio P u esemble gééralemet très grad, voire ifii, d idividus ou d objets de même ature. Tous les médecis de Frace costituet ue populatio, de même que l esemble des résultats possibles du tirage du loto. Ue populatio peut doc être réelle ou fictive. Il est le plus souvet impossible, ou trop coûteu, d étudier l esemble des idividus costituat ue populatio ; o travaille alors sur ue partie de la populatio que l o appelle échatillo. Pour qu u échatillo permette l étude de la variabilité des caractéristiques d itérêt de la popu Biostatistique - Carrat, Mallet, Morice 15/179

16 Statistique(s) et Probabilité(s) latio, il faut qu il soit coveablemet sélectioé. O parlera d échatillo représetatif si les idividus le costituat ot été tirés au sort 1 das la populatio. Si par eemple o souhaite détermier les caractéristiques «moyees» du poids et de la taille des prématurés masculis o tirera au hasard u certai ombre de sujets parmi les aissaces de prématurés de l aée. Chaque idividu, ou uité statistique, apparteat à ue populatio est décrit par u esemble de caractéristiques appelées variables ou caractères. Ces variables peuvet être quatitatives (umériques) ou qualitatives (o umériques) : quatitatives pouvat être classées e variables cotiues (taille, poids) ou discrètes (ombre d efats das ue famille) qualitatives pouvat être classées e variables catégorielles (couleurs des yeu) ou ordiales (itesité d ue douleur classée e ulle, faible, moyee, importate). 1.3 Statistique et probabilité La théorie (ou le calcul) des probabilités est ue brache des mathématiques qui permet de modéliser les phéomèes où le hasard iterviet (iitialemet développée à propos des jeu de hasard, puis progressivemet étedue à l esemble des scieces epérimetales, dot la physique et la biologie). Cette théorie permet de costruire des modèles de ces phéomèes et permet le calcul : c est à partir d u modèle probabiliste d u jeu de hasard comme le jeu de dés que l o peut prédire les fréqueces d apparitio d évéemets comme le ombre de fois que l o obtiet ue valeur paire e jetat u dé u grad ombre de fois. Les élémets de calcul des probabilités idispesables à la compréhesio des statistiques serot traités das la première partie du cours. Sous jacete à la otio de statistiques se trouve la otio de Populatio dot o souhaite coaître les propriétés (plus précisémet les régularités), permettat e particulier de savoir si deu populatios sot idetiques ou o. Ce cas est celui du cadre des essais thérapeutiques, où l o cosidère 2 populatios (patiets traités avec le médicamet A ou avec le médicamet B) dot o souhaite savoir si elles diffèret ou o (c est le cas le plus simple des essais cliiques). Pour ce faire il est écessaire de modéliser les populatios, e utilisat des modèles probabilistes. U modèle de ce type est par eemple de cosidérer que la taille des idividus suit ue distributio gaussiee. A partir de ce modèle o peut calculer les propriétés d échatillos ; c est ce qu o appelle ue déductio qui va du modèle vers l epériece. A l iverse, cosidérat u échatillo d ue populatio o peut essayer de recostruire le modèle de la populatio. Cette démarche est calquée sur la démarche scietifique habituelle. Le scietifique est capable, e utilisat les mathématiques, de prédire le comportemet d u modèle doé (c est par eemple ue «loi» de la physique) : c est la démarche déductive. A l iverse, observat des faits epérime- 1. Nous reviedros sur cette méthode permettat d obteir u échatillo représetatif de la populatio étudiée. Cela cosiste e gros à sélectioer les idividus sur la base d u tirage aalogue à celui qui cosiste à tirer des oms das ue ure qui cotiedrait tous les oms possibles. 16/179 Biostatistique - Carrat, Mallet, Morice

17 Statistique(s) et Probabilité(s) tau il va teter de dégager des propriétés géérales du phéomèe observé qu il va e gééral représeter sous forme d u modèle (toutes les lois de la physique et de la chimie sot des modèles mathématiques les plus géérau possibles des faits epérimetau) : c est la costructio iductive de la théorie. Cette démarche géérale va plus loi car le modèle permet de prédire des epérieces o réalisées. Si les prédictios aisi réalisées sot cotradictoires avec les résultats epérimetau alors o pourra avec certitude réfuter le modèle (o dit aussi qu o l a falsifié) ; das le cas cotraire o garde le modèle mais o est pas certai qu il soit «vrai». Autremet dit, à l issue d u tel test o e peut avoir de certitude que si o a trouvé des élémets permettat de réfuter le modèle. Nous verros das la suite que cette approche se traspose eactemet das la démarche statistique, e particulier das le domaie des tests Biostatistique - Carrat, Mallet, Morice 17/179

18 Statistique(s) et Probabilité(s) 18/179 Biostatistique - Carrat, Mallet, Morice

19 Rappels mathématiques Chapitre 2 Rappels mathématiques 2.1 Esembles, élémets O appelle esemble, toute liste ou collectio d objets bie défiis, eplicitemet ou implicitemet ; o appelle élémets ou membres de l esemble les objets apparteat à l esemble et o ote : p A si p est u élémet de l esemble A B est partie de A, ou sous esemble de A, et l o ote B A ou A B, si B A O défiit u esemble soit e listat ses élémets, soit e doat la défiitio de ses élémets : A = {1, 2, 3} X = { : est u etier positif} Notatios : la égatio de A est A est l esemble vide E est l esemble uiversel. 2.2 Opératios sur les esembles Soiet A et B deu esembles quelcoques. Itersectio L itersectio de A et B, otée A B, est l esemble des élémets tels que A et B. Soit : A B = { : A et B } Le terme «et» est employé au ses A et B si appartiet à la fois à A et à B Biostatistique - Carrat, Mallet, Morice 19/179

20 Rappels mathématiques A B E A B Cas particulier : si AB =, o dit que A et B sot disjoits. Réuio La réuio de A et B, otée A B, est l esemble des élémets tels que A ou B. Soit : A B = { : A ou B } Le terme «ou» est employé au ses A ou B si appartiet à A, ou à B, ou à A et B (car A et B sigifie A et B ). A B E A B Complémetaire Le complémetaire de A est l esemble des élémets de E qui appartieet pas à A. CA = A = : A E CA A Différece La différece etre A et B, ou complémetaire de B relatif à A, est l esemble des élémets de A qui appartieet pas à B. A B = CAB = : B et A C B A E A B 20/179 Biostatistique - Carrat, Mallet, Morice

21 Rappels mathématiques Algèbre des esembles A A = A A A A B C = A B C A B C = A B C A B = B A A B = B A A B C = A B A C A B C = A B A C A A E = A A E = E A = = = A A A CA = E A CA = CCA = A CE =, C = E CA B = CA CB CA B = CA CB 2.3 Esembles fiis, déombrables, o déombrables U esemble est fii s il est vide () ou s il cotiet u ombre fii d élémets ; sio, il est ifii : A = {a 1, a 2, a 3 } est fii ; I = { [,] 01 } est ifii. U esemble ifii est dit déombrable si o peut faire correspodre de faço uique chaque élémet de l esemble à u etier aturel et u seul : A = { : est u etier pair} est ifii déombrable. U esemble ifii est o déombrable das le cas cotraire. Das la pratique, les seuls esembles ifiis o déombrables que ous recotreros serot des itervalles de : { [,] a b } ou des itervalles de 2 : { y : [,]y a b [,] c d }. 2.4 Esembles produits Soiet A et B deu esembles ; l esemble produit de A et de B, oté A B, est l esemble de tous les couples ordoés (a, b), avec a A et b B. Eemples : Biostatistique - Carrat, Mallet, Morice 21/179

22 Rappels mathématiques A = {a, b, c} ; B = {1, 2} A B = { (a, 1), (a, 2), (b, 1), (b, 2), (c, 1), (c, 2) } est le pla cartésie, chaque élémet de état défii par so abscisse et so ordoée : (a,b) b a 2.5 Familles d esembles Les élémets d u esemble peuvet eu-mêmes être des esembles. O dit alors que ces esembles fot partie de la même classe ou de la même famille. Parties Soit u esemble A quelcoque. O appelle famille des parties de A l esemble des sousesembles de A. Eemple : A = {1, 2} PA = {, 12 {, 12} } Partitio Ue partitio d u esemble A est ue subdivisio de A e sous-esembles disjoits dot la réuio forme A. Notatio Soit ue famille d esembles {A i }={A 1, A 2,..., A,...} qui peut être fiie ou o. O ote : A i = A 1 A 2... A... i A i = A 1 A 2... A... i 2.6 Autres rappels mathématiques Rappel sur les sommes Soit {a i } ue suite de termes a i. O ote a i = a 1 + a a. Propriétés : i = 1 22/179 Biostatistique - Carrat, Mallet, Morice

23 Rappels mathématiques i a i + b i = ka i = ka i i i i a i + i b i Si k est ue costate (idépedate de i), elle peut être sortie de la somme Rappel sur les itégrales Défiitio Soit f ue foctio réelle. L itégrale défiie de cette foctio sur l itervalle [a,b] est l aire sous la courbe de f sur l itervalle [a,b]. b Elle est otée f d. a f b a f d Propriétés b a b f + g d b a = b a kf d = k fd a b c f d b a + b a g d 3. f d = a f d + f d a c Foctio primitive Soit f ue foctio réelle. L aire sous la courbe sur l itervalle ]- ] varie lorsqu o fait varier de - à+cette aire est ue foctio F de, appelée foctio primitive de f. Elle est défiie par : F = fd Noter l utilisatio de la variable d itégratio. O peut utiliser importe quel om de variable (il s agit d ue variable muette), différet de la bore d itégratio. Propriétés df 1. Si F = fd, alors f = d b 2. Doc F se déduit de f par itégratio, et f se déduit de F par dérivatio. b f d = Fb Fa a Biostatistique - Carrat, Mallet, Morice 23/179

24 Rappels mathématiques 24/179 Biostatistique - Carrat, Mallet, Morice

25 Elémets de calcul des Probabilités Chapitre 3 Elémets de calcul des Probabilités 3.1 Itroductio Le calcul des probabilités est la théorie mathématique, doc fodée aiomatiquemet, qui permet de modéliser des phéomèes aléatoires, ou o détermiistes. De tels phéomèes sot bie représetés par les jeu de hasard dot l étude a iitié le calcul des probabilités. Cosidéros le cas du jeu de dés ; lorsqu o jette u dé o est certai qu il va tomber sur la table (phéomèe détermiiste), mais o est pas capable de prédire la valeur qui va sortir (phéomèe aléatoire). U phéomèe détermiiste est u phéomèe dot o peut prévoir le résultat ; les lois de la physique classique sot des modèles permettat de prédire le résultat d ue epériece doée. La loi d Ohm permet de prédire la valeur de l itesité du courat coaissat la résistace et la tesio au bores. Les lois de la physique mettet e évidece ue régularité qui permet de prédire les résultats d ue epériece lorsqu o cotrôle les causes. Les phéomèes aléatoires ehibet u autre type de régularité. Preos le cas des lois de Medel. Medel était u biologiste qui étudiait les résultats du croisemet de deu espèces de plates ; plus précisémet, il étudiait la trasmissio de caractères comme la couleur, l aspect, etc. Ue observatio typique de régularité d u ouveau type est d observer que, sur ue série suffisammet grade de croisemets de deu espèces A et B, o observait par eemple, das 1/4 des cas, les caractères de A, et das 3/4 des cas, les caractères de B. Ue telle régularité fréquetielle a doé lieu à ce qu o appelle les lois de Medel. Cette régularité permet de prédire la fréquece d apparitio d u phéomèe, ce qui est plus «faible» que la prédictio détermiiste. L étude et la modélisatio de tels phéomèes (la recherche de lois) est le champ d applicatio du calcul des probabilités Biostatistique - Carrat, Mallet, Morice 25/179

26 Elémets de calcul des Probabilités 3.2 Epériece aléatoire, esemble fodametal et évéemets Epériece aléatoire O s itéresse ici au seules epérieces dot le résultat est pas prévisible, les epérieces aléatoires. Ue epériece aléatoire est aussi appelée ue épreuve. Esemble fodametal Pour ue epériece aléatoire doée, l esemble des résultats possibles est appelé l esemble fodametal, que ous oteros E das la suite du cours. Chaque résultat d epériece est u poit de E ou u élémet de E. Evéemet U évéemet A est u sous esemble de E, c est-à-dire u esemble de résultats. L évéemet {a}, costitué par u seul poit de E, doc par u seul résultat a E, est appelé évéemet élémetaire. L esemble vide e cotiet aucu des résultats possibles : il est appelé évéemet impossible. L esemble E cotiet tous les résultats possibles : c est l évéemet certai. Si E est fii, ou ifii déombrable, tout sous-esemble de E est u évéemet ; ce est pas vrai si E est o déombrable (ceci sort du cadre de ce cours). O ote parfois l esemble de tous les évéemets. Eemples 1. O jette u dé et o observe le résultat obteu. L esemble fodametal est formé par les 6 résultats possibles : E = {1, 2, 3, 4, 5, 6} L évéemet correspodat à l apparitio d u ombre pair est A = {2, 4, 6}, qui est bie u sous esemble de E. L évéemet correspodat à l apparitio d u ombre premier est B = {1, 2, 3, 5}, et l évéemet correspodat à l apparitio d u 3 est C = {3}. 2. Das l eemple précédet E était fii et doc déombrable ; E peut être ifii déombrable comme das le cas suivat. O jette ue pièce de moaie jusqu à ce qu o obtiee pile ; l esemble fodametal correspodat est la suite des ombres etiers E = {1, 2, 3,...,,...} puisqu o peut avoir u pile au bout d u jet, de 2 jets, de jets, état aussi grad que l o veut. 3. O vise avec ue fléchette ue cible suffisammet grade ; si o admet que la fléchette est très fie, comme le serait u poit de la géométrie, l espace fodametal est la surface de la cible qui est costituée de poits et doc ifiie et o déombrable. 26/179 Biostatistique - Carrat, Mallet, Morice

27 Elémets de calcul des Probabilités 3.3 Opératios sur les évéemets Les évéemets peuvet se combier etre eu pour former de ouveau évéemets. Si A et B sot deu évéemets, les opératios de combiaiso sot : 1. A B est l évéemet qui se produit si A ou B (ou les deu) est réalisé. Il est parfois oté A+ B ou A ou B. 2. A B est l évéemet qui se produit si A et B sot réalisés tous les deu. Il est parfois oté A B ou A et B. 3. CA est l évéemet qui se produit quad A est pas réalisé. O l appelle aussi égatio de A. Il est parfois oté «o A», ou A. Evéemets icompatibles Quad deu évéemets A et B sot tels que A B =, ils e peuvet être réalisés simultaémet. O dit qu ils s ecluet mutuellemet, ou qu ils sot icompatibles. Système complet d évéemets O dit que les évéemets A 1, A 2,..., A formet ue famille complète si les A i costituet ue partitio de E, c est-à-dire si : 1. les évéemets sot deu à deu disjoits : i j,a i A j = 2. ils couvret tout l espace : A i = E Eemple i Repreos l eemple précédet du jeu de dés : E = {1, 2, 3, 4, 5, 6}, A = {2, 4, 6}, B = {1, 2, 3, 5}, C = {3}. A B = = apparitio d u ombre pair ou premier A B = 2 = apparitio d u ombre pair et premier CC = = apparitio d u ombre autre que 3 A C = : A et C s ecluet mutuellemet. 3.4 Règles du calcul des probabilités Soit u esemble fodametal E. Nous itroduisos ue foctio Pr qui, à tout évéemet A, associe u ombre réel positif ou ul. Pr est dite foctio de probabilité, et Pr(A) est appelée probabilité de l évéemet A, si les coditios ou règles suivates sot satisfaits : 1. PrA 0 pour tout évéemet A : ue probabilité est positive ou ulle 2. PrE = 1 : la probabilité de l évéemet certai est 1 3. A B = PrA B = PrA+ PrB : permet le calcul de la probabilité de la réuio de deu évéemets disjoits 4. Soit u esemble déombrable (fii ou o) d évéemets A i deu à deu disjoits Biostatistique - Carrat, Mallet, Morice 27/179

28 Elémets de calcul des Probabilités ( A i A j = ), alors PrA 1 A 2... = PrA 1 + PrA Cette quatrième coditio est proche de la troisième. Elle e peut cepedat pas s e déduire das le cas d u esemble d évéemets ifii déombrable. Propriétés importates déduites des quatre coditios précédetes : 1. Pr = 0 Soit A u évéemet quelcoque. A et sot évidemmet disjoits puisque A = ; doc PrA = PrA+ Pr. Or A = A ; doc PrA = PrA. D où Pr = PrA 1 A et so complémetaire CA sot disjoits, et leur réuio forme E, de probabilité 1. Doc PrE = 1 = PrA CA = PrA+ PrCA. Toute probabilité état positive ou ulle, o obtiet bie PrA PrCA = 1 PrA A démotrer e eercice, e otat que E = A CA. 4. Si A B, alors PrA PrB. A démotrer e eercice, e otat que B = A C B A. C B A A B 5. PrC A B = PrA PrA B A démotrer e eercice, e remarquat que A = C A B A B. A B A C A B B 6. PrA B = PrA + PrB PrA B A démotrer e eercice, e remarquat que A B = C A B B. A C A B B 28/179 Biostatistique - Carrat, Mallet, Morice

29 Elémets de calcul des Probabilités 3.5 Remarque Alors que Pr = 0, il eiste des évéemets o vides qui peuvet avoir ue probabilité ulle. Das le cas d u esemble ifii o déombrable, u tel évéemet est pas écessairemet impossible : il est alors dit «presque impossible». Eemple Cosidéros l epériece qui cosiste à choisir au hasard u poit sur ue feuille de papier quadrillé avec ue poite de compas ifiimet fie. La probabilité de l évéemet piquer das u carré doé a ue certaie valeur (par eemple celle du rapport de la surface du carré avec celle de la feuille de papier) ; e revache, si o réduit le carré à u poit (carré ifiimet petit) la probabilité deviedra zéro alors que l évéemet (piquer das ce carré si petit qu il est deveu u poit) est pas impossible. De même u évéemet de probabilité 1 peut e pas être certai. Il est alors qualifié de «presque certai». 3.6 Illustratio de quelques esembles probabilisés Esemble probabilisé fii Soit E = {a 1, a 2,..., a } u esemble fodametal fii. O probabilise cet esemble e attribuat à chaque poit a i u ombre p i, probabilité de l évéemet élémetaire {a i }, tel que : p i 0 p 1 + p p = 1 La probabilité d u évéemet quelcoque A est la somme des probabilités des a i qu il cotiet : PrA = p i a i A Eemple O jette 3 pièces de moaie et o compte le ombre de «face» obteu. L esemble fodametal correspodat à cette epériece est E = {0, 1, 2, 3} puisqu o peut obteir comme résultat de l epériece : 0 fois «face» (3 fois «pile»), 1 fois «face» (2 fois «pile»), 2 fois «face», ou 3 fois «face». O probabilise cet esemble fii e doat ue valeur p 0, p 1, p 2 et p 3 au évéemets {0}, {1}, {2} et {3} ; comme par eemple p 0 = 1/8, p 1 = 3/8, p 2 =3/8 et p 3 =1/8. Cosidéros l évéemet A tel qu o ait au mois 2 fois «face», A = {a 2, a 3 }: Pr(A)= p 2 + p 3 = 3/8 + 1/8 = 4/8 = 1/ Biostatistique - Carrat, Mallet, Morice 29/179

30 Elémets de calcul des Probabilités Esemble fii équiprobable C est u esemble fii probabilisé tel que tous les évéemets élémetaires ot la même probabilité. O dit aussi qu il s agit d u espace probabilisé uiforme. E = {a 1, a 2,..., a } et Pr({a 1 }) = p 1, Pr({a 2 }) = p 2,..., Pr({a }) = p avec p 1 = p 2 =... = p = 1/ Les jeu de hasard - dés, cartes, loto, etc. - etret précisémet das cette catégorie : jeu de dés : E = {1, 2, 3, 4, 5, 6} ; p 1 = p 2 = p 3 = p 4 = p 5 = p 6 = 1/6 jeu de cartes : E = {esemble des cartes d u jeu de 52 cartes} ; p i = 1/52 Propriété Das u esemble fii équiprobable, la probabilité d u évéemet A est égale au rapport du ombre de résultats tel que A est vrai, sur le ombre d évéemets de E. Remarque Quad o dit qu o tire «au hasard», o sous-eted que l esemble probabilisé cosidéré est équiprobable. Eemple O tire «au hasard» ue carte das u jeu de 52 cartes. Quelle est la probabilité de tirer u trèfle? Prtirer u trèfle ombre de trèfles 13 = = = ombre de cartes 52 Quelle est la probabilité de tirer u roi? Prtirer u roi ombre de rois 4 = = = ombre de cartes 52 Quelle est la probabilité de tirer u roi de trèfle? Prtirer u roi de trèfle = Remarque Le cas des esembles fiis équiprobables est le plus simple à appréheder. Il faut isister sur le fait que l équiprobabilité est qu u cas particulier des esembles probabilisés ; ce est (de loi) pas le plus utile e médecie Esembles probabilisés ifiis Cas déombrable O a alors u esemble fodametal de la forme E = {a 1, a 2,..., a,...} comme das le cas fii. Cet esemble fodametal est probabilisé e affectat à chaque élémet a i ue valeur réelle p i telle que : 30/179 Biostatistique - Carrat, Mallet, Morice

31 Elémets de calcul des Probabilités p i 0 et p i = 1. i = 1 La probabilité d u évéemet quelcoque est alors la somme des p i correspodat à ses élémets. Eemple 1 A = {a 25, a 31, a 43 } Pr(A)= p 25 + p 31 + p 43 Eemple 2 Si o repred l epériece cosistat à jeter ue pièce et à compter le ombre de jets jusqu à ce qu o obtiee u résultat «pile» (c est u espace ifii déombrable), o peut costruire u espace probabilisé e choisissat : p 1 = --p 2 2 = p 4 = p = 0 2 Remarque : Le choi des p i est arbitraire ; e réalité, il est justifié soit par des cosidératios a priori (das le cas de l epériece précédete o suppose que chaque jeté costitue ue epériece avec Pr(pile) = Pr(face) = 1/2 et que le résultat d u jet iflue pas sur le suivat). Il peut être aussi estimé ; c est le problème des statistiques qui, à partir de ombreuses réalisatios de l epériece, permet d approcher les valeurs p i (ce poit sera revu das la suite du cours et costitue l objet de l approche statistique) Cas d u esemble probabilisé ifii o déombrable Pour illustrer ce cas, o peut predre l eemple de la chute d u satellite e fi de vie (ce fut le cas, e octobre 1993 pour u gros satellite chiois dot o parla beaucoup das la presse). Das l état actuel des coaissaces sur l orbite de ce satellite, o est pas capable de prédire l edroit de la chute ; l hypothèse reteue est alors celle d u espace de probabilité uiforme. Das ce cas, le satellite a la même chace de tomber das importe quelle parcelle du mode et o peut calculer la probabilité qu il tombe sur Paris comme le rapport de la surface de Paris sur la surface du globe. Lorsqu o se rapprochera de l échéace, o pourra avoir des hypothèses plus précises, et o pourra prédire par eemple que le poit de chute aura u maimum de probabilité das ue régio, la probabilité autour de cette régio état d autat plus petite qu o s éloige de ce maimum. Il s agit bie sûr d u espace ifii o déombrable puisqu o peut réduire (au mois par l esprit) la taille de l élémet de la régio cosidérée à celle d u poit. Des probabilités peuvet doc être associées à chaque régio de taille o ulle, mais la probabilité d ue chute e u poit doé est ulle, puisque sa surface est ulle. Nous verros das la suite que les probabilités se calculet gééralemet à partir d ue desité (de probabilité) associée à chaque poit : lorsque les poits d ue régio ot ue desité élevée, la probabilité de chute das cette régio est élevée Biostatistique - Carrat, Mallet, Morice 31/179

32 Elémets de calcul des Probabilités 32/179 Biostatistique - Carrat, Mallet, Morice

33 Probabilité Coditioelle ; Idépedace et Théorème de Bayes Chapitre 4 Probabilité Coditioelle ; Idépedace et Théorème de Bayes 4.1 Probabilité coditioelle Soiet A et B deu évéemets quelcoques d u esemble fodametal E mui d ue loi de probabilité Pr. O s itéresse à ce que deviet la probabilité de A lorsqu o appred que B est déjà réalisé, c est-à-dire lorsqu o restreit l esemble des résultats possibles E à B. La probabilité coditioelle de A, sachat que l évéemet B est réalisé, est otée Pr(A/ B) et est défiie par la relatio suivate : PrA B PrA B = PrB Equatio 1 : probabilité coditioelle Das cette équatio, les probabilités des évéemets A B et B doivet être calculées sur tout l esemble fodametal E, comme si o e savait pas que B s est déjà réalisé. Sio, o obtiet évidemmet Pr(B)=1. A B A B Figure 1 : probabilité coditioelle Cette relatio géérale pour tout espace probabilisé s iterprète facilemet das le cas où E est u Biostatistique - Carrat, Mallet, Morice 33/179

34 Probabilité Coditioelle ; Idépedace et Théorème de Bayes espace équiprobable (mais cette relatio est vraie pour u espace o-équiprobable!). E otat A le ombre d élémets de A : PrA B = A B B A B PrB = PrA B = E E B Pr(A/ B) traduit le rapport de la surface de A B sur la surface de B das la figure 1. Toujours das le cas où E est équiprobable, o a PrA B = ombre de réalisatios possibles de A et B e même temps ombre de réalisatios de B Cette iterprétatio de la probabilité coditioelle, facile à appréheder das le cas d équiprobabilité, est la défiitio géérale de la probabilité coditioelle qu o doit utiliser telle quelle, sas chercher ue iterprétatio fréquetiste das tous les cas. Eemple O jette ue paire de dés bie équilibrés (espace équiprobable). O observe ue réalisatio de l évéemet {somme des dés = 6}. Quelle est la probabilité pour qu u des deu dés ait doé le résultat 2? B = {somme des deu dés = 6} A = {au mois u des deu dés doe 2} B = {(2, 4), (4, 2), (1, 5), (5, 1), (3, 3)} Nombre de réalisatios de A B = {(2, 4), (4, 2)} = 2 A B 2 11 D où PrA B = = --, alors que PrA = (à vérifier). B Théorème de la multiplicatio Repreos l équatio 1, défiitio des probabilités coditioelles : O e tire immédiatemet PrA B PrA B = PrA BPrB = PrB APrA Equatio 2 : théorème de la multiplicatio = PrA B PrB L équatio 2 peut se gééraliser facilemet. Soiet A 1,..., A des évéemets quelcoques d u espace probabilisé ; à partir de l équatio 2, o motre : PrA 1 A 2... A = PrA 1 PrA 2 A 1 PrA 3 A 1 A 2...PrA A 1 A 2... A 1 Eemple Ue boîte cotiet 10 articles dot 4 sot défectueu. O tire 3 objets de cette boîte. Calculer la probabilité pour que ces 3 objets soiet défectueu. Pr(1 er défectueu) = 4/10 Pr(2 ème défectueu / 1 er défectueu) = 3/9 34/179 Biostatistique - Carrat, Mallet, Morice

35 Probabilité Coditioelle ; Idépedace et Théorème de Bayes Pr(3 ème défectueu / 1 er et 2 ème défectueu) = 2/8 Pr(1 er et 2 ème et 3 ème défectueu) = 4/103/92/8 = 1/ Diagramme e arbre O cosidère ue séquece fiie d epérieces dot chacue d etre elles a u ombre fii de résultats possibles. Les probabilités associées au résultats possibles d ue epériece dépedet du résultat de l epériece précédete ; il s agit de probabilités coditioelles. Pour représeter cette séquece, o utilise ue représetatio «e arbre», le théorème précédet permettat de calculer la probabilité de chaque feuille de l arbre. Eemple O sait que les tau de réussite au cocours das les trois CHU Pitié, Sait Atoie et Broussais (l uiversité Pierre et Marie Curie a logtemps comporté ces 3 CHU) étaiet respectivemet (doées arbitraires) de 0,20 ; 0,15 ; et 0,10 (0,20 = Pr(Réussite/Pitié)) ; o sait que 1/4 des étudiats de Paris VI étaiet à Sait Atoie, 1/4 à Broussais et 1/2 à la Pitié. Quelle était la probabilité qu u étudiat de Paris VI soit reçu au cocours? Sait Atoie 0,15 R 1 PrR Sait Atoie = /4 1/2 Pitié 0,85 0,20 E R 1 PrR Pitié = ,80 E 1/4 Broussais 0,10 0,90 R E 1 PrR Broussais = R sigifie réussite et E échec. PrR = PrR Sait Atoie + PrR Pitié+ PrR Broussais Pr(R) = 0,151/4 + 0,201/2 + 0,101/4 = 0,1625 La probabilité qu u chemi particulier de l arbre se réalise est, d après le théorème de la multiplicatio, le produit des probabilités de chaque brache du chemi. Les chemis s ecluat mutuellemet, la probabilité d être reçu est égale à la somme des probabilités d être reçu pour tout chemi aboutissat à u état R (reçu) Biostatistique - Carrat, Mallet, Morice 35/179

36 Probabilité Coditioelle ; Idépedace et Théorème de Bayes 4.4 Théorème de Bayes E repreat l équatio 2 page 34 (sectio 4.2), o obtiet la formule de Bayes : PrA BPrB PrB A = PrA Equatio 3 : formule de Bayes Le théorème est ue forme développée de cette formule que ous itroduisos maiteat. Cosidéros des évéemets A 1,..., A tels qu ils formet ue partitio de l esemble fodametal E. Par défiitio, les A i s ecluet mutuellemet et leur uio est E : i j, A i A j = ; A i = E i = 1 Soit B u évéemet quelcoque A 1 B A 2 A 3 De E = A 1 A 2... A et de B E = B, o tire B = B A 1 A 2... A. Soit, par distributivité, B = B A 1 B A 2... B A. E remarquat que les B A sot eclusifs, puisque les A i le sot, et e appliquat la 3 ème i règle du calcul des probabilités o obtiet la formule dite des «probabilités totales» : PrB = PrB A 1 + PrB A PrB A Equatio 4 : probabilités totales E appliquat le théorème de la multiplicatio : PrB = PrB A1PrA 1 + PrB A2PrA PrB A Or, par la forme simple du théorème de Bayes, o a D où le théorème de Bayes : PrA i B = PrA PrB AiPrA i PrB PrA i B = PrB AiPrA i PrB A1PrA 1 + PrB A2PrA PrB APrA Equatio 5 : théorème de Bayes 36/179 Biostatistique - Carrat, Mallet, Morice

37 Probabilité Coditioelle ; Idépedace et Théorème de Bayes Eemple 1 Repreos l eemple des résultats au cocours des étudiats de Paris VI. Comme précédemmet, soit R l évéemet «u étudiat de Paris VI est reçu». O a, e otat C 1, C 2, C 3 les 3 acies CHU Sait Atoie, Pitié et Broussais respectivemet : Pr(R) = Pr(R/C 1 )Pr(C 1 )+ Pr(R/C 2 )Pr(C 2 )+ Pr(R/C 3 )Pr(C 3 ) [oter que c est la même chose que la somme des probabilités des chemis de l arbre, qui coduiset à u succès] Le théorème de Bayes permet de répodre à la questio duale. Au lieu de chercher la probabilité d obteir u étudiat reçu sachat qu il veait d u CHU doé, o cherche la probabilité qu u étudiat ait été iscrit à u CHU doé sachat qu il a été reçu (probabilité des causes). Calculos la probabilité qu u étudiat reçu soit issu du CHU Pitié-Salpêtrière. PrR C 2 PrC 2 PrC 2 R = PrR C 1 PrC 1 + PrR C 2 PrC 2 + PrR C 3 PrC 3 Avec Pr(C 1 ) = 0,25 ; Pr(C 2 ) = 0,50 ; Pr(C 3 ) = 0,25 ; et Pr(R/C 1 ) = 0,15 ; Pr(R/C 2 ) = 0,20 ; Pr(R/C 3 ) = 0, D où PrC 2 R = = Ce qui sigifie que, das ce cas, la probabilité qu u étudiat appartiee à C 2, s il est reçu, est plus grade que si l o e sait rie (probabilité a priori Pr(C 2 ) = 0,50). Cette faço de calculer les probabilités des causes coaissat les effets est essetielle e médecie. E effet, le problème du diagostic peut être posé e ces termes. Eemple 2 Cosidéros, pour illustrer otre propos, le problème du diagostic d ue douleur aiguë de l abdome. Il s agit d u patiet arrivat au urgeces pour u «mal au vetre». Si l o e sait rie d autre sur le patiet (o a pas fait d eame cliique ou complémetaire), o e coaît que les probabilités d avoir tel ou tel diagostic si o observe ue douleur. Soiet D 1, D 2 et D 3 les 3 diagostics pricipau (il y e a e fait au mois ue douzaie) et eclusifs ; par eemple D 1 = appedicite, D 2 = perforatio d ulcère, D 3 = autres diagostics. Soit u sige s 1 pour lequel o coaît Pr(s 1 /D 1 ), Pr(s 1 /D 2 ), et Pr(s 1 /D 3 ). Par eemple, s 1 serait «présece d ue fièvre 38,5 C» ; Pr(s 1 /D 1 ) = 0,90 ; Pr(s 1 / D 2 ) = 0,30 ; et Pr(s 1 /D 3 ) = 0,10. Ces probabilités peuvet être estimées sur ue populatio de patiets e déombrat le ombre de sujets ayat le diagostic D 1 et présetat le sige s 1. De même, o peut coaître Pr(D 1 ), Pr(D 2 ) et Pr(D 3 ). Le problème diagostique se pose comme celui de choisir par eemple le diagostic le plus probable coaissat le sige s 1 ; pour ce faire, o calcule Pr(D 1 /s 1 ), Pr(D 2 /s 1 ), Pr(D 3 / s 1 ) et o retiet le diagostic qui a la plus grade probabilité : c est l applicatio de l approche bayesiee au problème de l aide au diagostic Biostatistique - Carrat, Mallet, Morice 37/179

38 Probabilité Coditioelle ; Idépedace et Théorème de Bayes 4.5 Idépedace etre évéemets O dit que deu évéemets A et B sot idépedats si la probabilité pour que A soit réalisé est pas modifiée par le fait que B se soit produit. O traduit cela par Pr(A / B) =Pr(A). D après la défiitio d ue probabilité coditioelle, défiitio : PrA B PrA B = , o tire la PrB A et B sot idépedats si et seulemet si PrA B = PrAPrB. La symétrie de cette défiitio implique qu o a aussi bie Pr(A / B) =Pr(A) (A est idépedat de B) que Pr(B / A) =Pr(B) (B est idépedat de A) : l apparitio d u des deu évéemets iflue pas sur l apparitio de l autre. Note Ce qui est défii précédemmet est l idépedace de deu évéemets. Si o cosidère maiteat 3 évéemets A, B, C, o dira que ces 3 évéemets sot idépedats : 1. s ils sot idépedats 2 à 2 : A idépedat de B ; A idépedat de C ; et B idépedat de C 2. et si PrA B C = PrAPrBPrC. Cette coditio est pas ue coséquece des précédetes. 4.6 Idépedace, iclusio et eclusio de deu évéemets Cosidéros deu évéemets A et B. 1. Si A B (A est iclus das B) : si A est réalisé, alors B aussi. A B Alors PrA B = PrA. Pr D où PrB A A B et. PrA 1 PrA B PrA = = PrA B = = PrB PrB A et B e sot pas idépedats. 38/179 Biostatistique - Carrat, Mallet, Morice

39 Probabilité Coditioelle ; Idépedace et Théorème de Bayes 2. Si A B = (A et B sot eclusifs) : si A est réalisé, B e peut pas l être. A B Alors PrA B = Pr = 0. PrA B 0 D où PrA B = =. PrB Pr = B 0 De même A et B e sot pas idépedats Biostatistique - Carrat, Mallet, Morice 39/179

40 Probabilité Coditioelle ; Idépedace et Théorème de Bayes 40/179 Biostatistique - Carrat, Mallet, Morice

41 Evaluatio de l itérêt diagostique des iformatios médicales Chapitre 5 Evaluatio de l itérêt diagostique des iformatios médicales 5.1 Itroductio La tâche essetielle des médecis est de traiter les patiets. Pour prescrire u traitemet, il faut savoir, plus ou mois précisémet selo les cas, ce dot souffre le malade. Pour résumer e u seul terme u processus physiopathologique complee, les médecis ot créé des cocepts : les diagostics. La recherche «du» diagostic est doc la première étape de la cosultatio cliique. Pour parveir au diagostic, le médeci accumule des iformatios, dot certaies lui sot spotaémet livrées par le patiet (le motif de la cosultatio, les symptômes), d autres doivet être recherchées mais sot dispoibles immédiatemet (les siges physiques), d autres efi sot d obtetio plus ou mois difficile et coûteuse (les résultats d eames complémetaires). De ouvelles procédures diagostiques apparaisset fréquemmet : o a vu, par eemple, l apparitio des échographies, de la tomodesitométrie (scaer), de l IRM, pour e citer que le domaie de l imagerie. Il est bie sûr pas questio d effectuer tous les eames complémetaires sur tous les malades : il faut doc préciser les idicatios de ces eames, ce qui repose sur l évaluatio de leur itérêt diagostique. Avat d aborder la méthodologie de l évaluatio, ous reviedros sur certais cocepts utilisés das ce paragraphe Le diagostic O peut défiir u diagostic comme u cocept résumat l état d u idividu. Le terme de «diagostic» est doc beaucoup mois précis qu o pourrait le peser à première vue : o peut e gééral fourir plusieurs diagostics pour u même état physiopathologique, les termes diagostiques utilisés dépedat de l aspect privilégié. Parmi ces aspects, o peut citer : la symptomatologie Biostatistique - Carrat, Mallet, Morice 41/179

42 Evaluatio de l itérêt diagostique des iformatios médicales la physiopathologie et l étiologie la coduite thérapeutique E pratique, la précisio du diagostic dépedra souvet des possibilités thérapeutiques : par eemple, o e recherchera pas, e gééral, le virus resposable d u sydrome grippal, surtout si o s atted à ce que la maladie guérisse spotaémet. D u poit de vue statistique, le diagostic sera souvet cosidéré comme ue variable aléatoire biaire : le patiet souffre ou e souffre pas de l affectio cosidérée, ou, eprimé autremet, le diagostic est vrai ou fau chez ce patiet. Les valeurs possibles de la variable serot otées M et M (maladie présete ou absete), ou D et D (diagostic vrai ou fau) Les iformatios médicales O divise l esemble des iformatios médicales e siges cliiques et siges complémetaires. Les siges cliiques sot divisés e siges foctioels ou symptômes, décrits par le malade (spotaémet ou par l iterrogatoire) et siges physiques, recherchés par le médeci. Les siges complémetaires peuvet être biologiques ou radiologiques. Leur itérêt peut être : diagostique (caractère mali ou béi d ue tumeur) thérapeutique (localisatio précise d ue tumeur) proostique (etesio gaglioaire) D u poit de vue statistique, ces siges peuvet être représetés par des variables biaires (présece ou absece d u odule sur ue image) ou cotiues (cholestérolémie). Nous cosidéros ici le seul cas d u sige biaire, préset (oté S) ou abset (oté S ). Das la suite, o cosidère que la présece du sige est évocateur de la maladie M. Si l iformatio est de type cotiu, o se ramèe au cas biaire par l itroductio d u seuil : d u côté du seuil, les valeurs sot dites ormales, et le sige biaire est abset ; de l autre côté du seuil, les valeurs sot dites pathologiques, et le sige biaire est préset Situatio epérimetale et estimatio Quad o cherche à évaluer l itérêt diagostique d u sige pour ue affectio, o recherche le sige chez des idividus présetat ou o l affectio cosidérée. Deu situatios epérimetales sot à evisager : u échatillo représetatif d ue populatio est costitué. O pourra estimer, à partir de cet échatillo, toutes les probabilités d évéemets par les fréqueces observées correspodates (cette maière de faire sera revue plus tard, page 78) ; deu échatillos sot costitués, l u représetatif des idividus pour lesquels le diagostic est vrai, l autre représetatif des idividus pour lesquels il est fau. Cette maière de procéder est souvet la seule possible e pratique, surtout quad la maladie cosidérée est rare. Il faut remarquer, cepedat, qu o e peut plus estimer importe quelle probabilité par la fré- 42/179 Biostatistique - Carrat, Mallet, Morice

43 Evaluatio de l itérêt diagostique des iformatios médicales quece observée correspodate ; ce poit sera développé plus loi das ce chapitre. Remarque : ous utilisos actuellemet le mot estimatio das le ses d approimatio de la vraie valeur. Nous doeros des défiitios plus rigoureuses das le chapitre 10 page Les paramètres de l évaluatio Sesibilité et spécificité La sesibilité d u sige pour ue maladie est la probabilité que le sige soit préset si le sujet est atteit de la maladie cosidérée. Il s agit doc de la probabilité coditioelle qu o peut oter : Sesibilité = Se =Pr(S / M) U test diagostic est doc d autat plus sesible que les sujets atteits de la maladie présetet plus souvet le sige S. La spécificité d u sige pour ue maladie est la probabilité que le sige soit abset si le sujet est pas atteit de la maladie. De maière similaire, o a : Spécificité = Sp = PrS M U test diagostic est doc d autat plus spécifique que les sujets idemes de la maladie présetet mois souvet le sige S. Pour u eame «parfait», c est-à-dire effectuat aucue erreur, les valeurs de la sesibilité et de la spécificité sot égales à 1. Si la présece du sige est défiie par u «seuil de positivité», o observe que ces deu paramètres variet e ses iverse lorsqu o fait varier ce seuil. Ceci eplique qu u seul de ces deu paramètres e suffise pas à évaluer u eame. Supposos par eemple qu o s itéresse au sige température vis à vis de la grippe. O cosidère que le sige est préset si la température dépasse u certai seuil, par eemple 39 C. Si o augmete le seuil pour le porter à 40 C, la probabilité de dépasser le seuil (chez les sujets grippés) va dimiuer, doc la sesibilité dimiue. E revache, la probabilité d être e dessous du seuil (chez les sujets o grippés) va augmeter, doc la spécificité augmete. U test diagostique de boe sesibilité coduit à u résultat positif chez presque tous les malades. Il est doc utilisable pour u dépistage. Si le test possède ue boe spécificité, il coduit à u résultat égatif chez presque tous les o-malades. Il pourrait doc être utilisé e tat qu eame de cofirmatio du diagostic. Ces cosidératios sot bie sûr schématiques, d autres élémets iterveat das l évaluatio, Biostatistique - Carrat, Mallet, Morice 43/179

44 Evaluatio de l itérêt diagostique des iformatios médicales comme la fréquece de la maladie (prévalece), les risques liés à la maladie, à l eame, l eistece et les performaces d autres eames cocurrets Valeurs prédictives E pratique, quad u médeci reçoit le résultat d u eame complémetaire, positif ou égatif, il e sait pas si le patiet souffre de l affectio qu il cherche à diagostiquer ou o, et les probabilités qui l itéresset s eprimet de la maière suivate : quelle est la probabilité de présece de la maladie M chez ce patiet, sachat que l eame a doé u résultat positif (ou égatif)? Ces probabilités sot appelées valeurs prédictives. Plus précisémet, o a : la valeur prédictive positive d u sige pour ue maladie est la probabilité que le sujet soit atteit de la maladie si le sige est préset ; la valeur prédictive égative d u sige pour ue maladie est la probabilité que le sujet soit ideme de la maladie si le sige est abset. O peut oter ces paramètres : VPP VPN = = PrM S PrM S Comme les sesibilité et spécificité, les valeurs prédictives positive et égative variet e ses iverse, et doivet doc être cosidérées simultaémet. Les valeurs prédictives peuvet s eprimer e foctio du couple sesibilité - spécificité, et de la fréquece de la maladie das la populatio (cette probabilité Pr(M) s appelle la prévalece de la maladie). Il suffit d utiliser le théorème de Bayes : PrS MPrM VPP = PrM S = PrS MPM + PrS MPrM Se PrM = Se PrM + 1 Sp 1 PrM VPN PrS MPrM = PrM S = PrS MPM + PrS MPrM Sp 1 PrM = Se PrM+ Sp 1 PrM Comparaiso des deu couples de paramètres E situatio cliique, o a vu que les valeurs prédictives correspodet au préoccupatios des médecis, et elles pourraiet sembler les «meilleurs» paramètres d évaluatio. Pourtat, e réalité, c est la sesibilité et la spécificité qui sot le plus souvet utilisées pour évaluer les eames com- 44/179 Biostatistique - Carrat, Mallet, Morice

45 Evaluatio de l itérêt diagostique des iformatios médicales plémetaires. La raiso e est la suivate : la sesibilité d u eame pour ue affectio repose sur la défiitio de la populatio des «malades», et est doc caractéristique de la maladie et du sige. E particulier, elle est pas susceptible de varier d u cetre à l autre (d u service hospitalier spécialisé à ue cosultatio de médeci gééraliste, par eemple). Le même raisoemet peut s appliquer à la spécificité, si o cosidère qu elle repose aussi sur la défiitio de la maladie. Les valeurs prédictives, au cotraire, sot foctios des proportios respectives de malades et de o-malades das la populatio (de la prévalece de la maladie). Or ces proportios sot dépedates des cetres cosidérés ; les valeurs prédictives des eames variet doc d u cetre à l autre pour ue même maladie, ce qui eplique qu elles sot mois utilisées comme paramètre d évaluatio, même si elles sot itéressates à coaître pour u cetre doé Choi d u seuil : courbes ROC Lorsqu u eame fourit des résultats de type cotiu, il faut détermier le meilleur seuil etre les valeurs pathologiques et les valeurs ormales. L idéal serait d obteir ue sesibilité et ue spécificité égales à 1. Ce est gééralemet pas possible, et il faut teter d obteir les plus fortes valeurs pour ces deu paramètres, sachat qu ils variet e ses iverse. O s aide pour ce choi d u outil graphique, la courbe ROC (Receiver Operatig Characteristics). Ue courbe ROC est le tracé des valeurs de la sesibilité Se e foctio de 1-Sp Biostatistique - Carrat, Mallet, Morice 45/179

46 Evaluatio de l itérêt diagostique des iformatios médicales Cet eemple (tiré du livre de A.J. Vallero) motre 3 courbes ROC correspodat à 3 eames différets. La courbe A est celle obteue pour l eemple précédet de la température et de la grippe. Le poit de la courbe le plus proche du coi supérieur gauche du carré coteat la courbe (ici Se = 0,65, Sp = 0,75, et température = 39 C)) est celui qui permet d obteir u bo compromis etre sesibilité et spécificité (le coi supérieur gauche correspod à Se = Sp = 1). E réalité, o e choisira pas toujours ce poit, car il faut aussi teir compte des coûts des erreurs diagostiques : il peut par eemple être beaucoup plus grave de e pas détecter ue maladie, que de traiter à tort. La courbe B correspod à u eame qui apporte rie au diagostic, puisque les variables sige et maladie sot ici idépedates : Se = PrS M = 1 Sp = PrS M La courbe C correspod à u bo critère diagostic pour lequel o peut obteir simultaémet des valeurs élevées de sesibilité et de spécificité. 46/179 Biostatistique - Carrat, Mallet, Morice

47 Evaluatio de l itérêt diagostique des iformatios médicales 5.3 Estimatio des paramètres de l évaluatio U échatillo représetatif Les doées Quad o a u échatillo représetatif d ue populatio, o peut résumer les doées de l epériece par u tableau de cotigece 22, sur lequel sot idiqués les effectifs suivats : VP (Vrais Positifs) : ce sot les idividus malades (M) et chez lesquels le sige est préset {S} ; FP (Fau Positifs) : la maladie est absete { M } et le sige est préset {S} ; FN (Fau Négatifs) : la maladie est présete {M) et le sige est abset { S } ; VN (Vrais Négatifs) : la maladie est absete { M } et le sige est abset { S }. Tableau 1 M M S VP FP S FN VN Estimatio de la sesibilité et de la spécificité Par défiitio, sesibilité = Se = Pr(S / M) O estime cette probabilité coditioelle par le rapport des effectifs correspodats sur le tableau de cotigece observé : Se VP VP FN Note : O otera de maière idetique, suivat u usage établi, les paramètres vrais, qui sot des probabilités coditioelles, et leurs estimatios, qui sot des rapports d effectifs observés. VN Spécificité = Sp = PrS M VN FP Par eemple, calculos les estimateurs de ces paramètres das le cas où o cherche à diagostiquer u diabète à partir d u sige de la forme «la glycémie mesurée à jeu est supérieure à...»). Pour deu seuils doés S 1 et S 2, o obtiet les tableau de cotigece ci-dessous : a. Seuil S Biostatistique - Carrat, Mallet, Morice 47/179

48 Evaluatio de l itérêt diagostique des iformatios médicales Tableau 2 M M S S b. Seuil S 2 Tableau 3 M M S S O peut estimer les sesibilités et spécificités correspodat au deu seuils par : Se 1 90 / 100 = 0,90 ; Sp / 500 = 0,60 Se 2 50 / 100 = 0,50 ; Sp / 500 = 0,95. O retrouve ici le fait que sesibilité et spécificité variet e ses iverse. O costate d autre part que le seuil S 1 correspod à ue boe sesibilité (l eame est positif chez 90 % des malades), mais à ue spécificité médiocre (l eame est positif chez 40 % des «o-malades») ; il peut doc être utilisé pour u eame de dépistage, le diagostic devat être cofirmé ultérieuremet par u eame plus spécifique. Le seuil S 2, e revache, iduit u test d ue sesibilité qui pourrait être jugée trop faible pour u eame de dépistage. E revache, sa spécificité peut être acceptable pour u eame de cofirmatio Estimatio des valeurs prédictives Les estimatios s obtieet à partir du même tableau des doées : VPP = VPN = PrM S PrM S VP VP + FP VN VN FN Par eemple, pour les tableau de cotigece vus ci-dessus, o a : VPP 1 90 / 290 = 0,31 ; VPN / 310 = 0,97 VPP 2 50 / 75 = 0, 67 ; VPN / 525 = 0,90 Ces résultats peuvet s iterpréter aisi : e affirmat le diagostic sur la base de la positivité de l eame, o se trompe das 69 % des cas avec le seuil S 1 et 33 % des cas avec le seuil S 2 ; et e élimiat le diagostic e costatat la égativité de l eame, o se trompe das 3 % des cas avec 48/179 Biostatistique - Carrat, Mallet, Morice

49 Evaluatio de l itérêt diagostique des iformatios médicales le seuil S 1 et 10 % des cas avec le seuil S Deu échatillos représetatifs L icovéiet du schéma epérimetal ci-dessus (u seul échatillo) est que, si la maladie est peu fréquete ou rare, il faut costituer u échatillo de très grade taille pour obteir u ombre suffisat de malades. Les o-malades, au cotraire, serot «trop» ombreu. C est pourquoi o costituera souvet, e pratique, deu échatillos, u échatillo de malades et u échatillo de o-malades. O peut ecore résumer les résultats par u tableau comme celui du tableau 1 page 47, mais ce tableau doit être iterprété différemmet, les proportios respectives des malades et o-malades e correspodat plus à la réalité : le rapport etre le ombre de malades et le ombre de o-malades du tableau déped des tailles respectives choisies pour les deu échatillos, et a aucu lie avec la fréquece de la maladie das la populatio (la prévalece). O peut toujours estimer la sesibilité et la spécificité comme ci-dessus. E effet, la sesibilité par eemple est estimée uiquemet à partir de VP et FN, doc de la répartitio des malades etre ceu qui présetet le sige et les autres. Or l échatillo des malades respecte cette répartitio. E revache, l estimatio précédete des valeurs prédictives utilisait la répartitio etre malades et o malades, que le tableau actuel e représete pas correctemet. L estimatio des valeurs prédictives reste cepedat possible à coditio de coaître la prévalece de la maladie Pr(M). O utilisera les formules itroduites sectio page 44 : VPP Se PrM = Se PrM + 1 Sp 1 PrM Sp 1 PrM VPN = Se PrM+ Sp 1 PrM O remplacera das ces formules la sesibilité et la spécificité par leurs estimatios Biostatistique - Carrat, Mallet, Morice 49/179

50 Evaluatio de l itérêt diagostique des iformatios médicales 50/179 Biostatistique - Carrat, Mallet, Morice

51 Variables aléatoires Chapitre 6 Variables aléatoires 6.1 Défiitio d ue variable aléatoire Cosidéros u esemble fodametal E correspodat à ue certaie epériece. Les élémets de E, résultats possibles de l epériece, e sot gééralemet pas des ombres. Il est cepedat utile de faire correspodre u ombre à chaque élémet de E, e vue de faire esuite des calculs. Pour u jet de dé, il semble aturel de faire correspodre à la face obteue par le jet, le ombre de poits qu elle porte, mais ce est pas ue obligatio. Si o jette 2 dés, o s itéressera par eemple à la somme des poits obteus. Pour ue carte à jouer, il faut coveir d ue valeur pour chaque carte. Ue variable aléatoire X, sur u esemble fodametal E, est ue applicatio de E das : à tout résultat possible de l epériece (à tout élémet de E), la variable aléatoire X fait correspodre u ombre. Lorsque E est fii ou ifii déombrable, toute applicatio de E das est ue variable aléatoire. Lorsque E est o déombrable, il eiste certaies applicatios de E das qui e sot pas des variables aléatoires. E effet, la défiitio rigoureuse d ue variable aléatoire X impose que tout itervalle de soit l image d u évéemet de E par l applicatio X. Cette coditio est vérifiée pour toute applicatio X si E est fii ou déombrable, puisque toute partie de E est u évéemet. Ce est plus vrai si E est o déombrable. Heureusemet, les applicatios choisies aturellemet sot des variables aléatoires. O parle de variable aléatoire discrète lorsque la variable est ue applicatio de E das u sousesemble discret de, le plus souvet N ou ue partie de N. O parle sio de variable aléatoire cotiue. Pour u ombre réel a doé, l évéemet costitué de tous les résultats d epériece tels que X()=a est oté [X() =a], ou, e abrégé, X = a. Pour deu ombres réels a et b (a b), l évéemet costitué de tous les résultats d epériece tels que a X() b est oté [a X() b] ou, e abrégé, a X b. Si X et Y sot des variables aléatoires défiies sur le même esemble fodametal E, et si k est ue costate, o peut motrer que les foctios suivates sot aussi des variables aléatoires : (X + Y)()= X() + Y() (X + k)()= X() + k (kx)()= kx() (XY)() = X() Y() pour tout élémet de E Biostatistique - Carrat, Mallet, Morice 51/179

52 Variables aléatoires 6.2 Variables aléatoires fiies Cosidéros maiteat le cas le plus simple d ue variable aléatoire fiie, que ous gééraliseros das u secod temps à ue variable aléatoire ifiie déombrable, puis cotiue. Soit X ue variable aléatoire sur u esemble fodametal E à valeurs fiies : X(E) = { 1, 2,..., }. X(E) deviet u esemble probabilisé si l o défiit la probabilité Pr(X = i ) pour chaque i, que l o ote p i. L esemble des valeurs p i = Pr(X = i ) est appelé distributio ou loi de probabilité de X. Puisque les p i sot des probabilités sur les évéemets {X= 1, X= 2,..., X= }, o a : i p i 0 et p i = 1. i = Représetatio d ue loi de probabilité fiie O peut représeter la loi de probabilité p i par ue table : p 1 p 2... p Ou par u diagramme e bâtos : p i où la hauteur du bâto positioé e i a pour valeur p i. i Espérace mathématique d ue variable fiie L espérace mathématique cherche à traduire la tedace cetrale de la variable aléatoire. Il s agit d ue moyee où chacue des valeurs i iterviet d autat plus que sa probabilité est importate, c est-à-dire d u barycetre ou d u cetre de gravité. O défiit alors la moyee théorique (parfois aussi appelée vraie), ou espérace mathématique d ue variable X par X = EX = p i i = 1 p p p. i = 1 52/179 Biostatistique - Carrat, Mallet, Morice

53 Variables aléatoires X peut être otée s il y a pas de cofusio possible. Eemple O cosidère l epériece qui cosiste à jeter deu dés parfaitemet équilibrés. L espace fodametal est costitué par l esemble des couples ordoés E = {(1, 1), (1, 2), (1, 3),..., (6, 6)} C est u espace équiprobable (tous les couples résultats élémetaires du tirage sot équiprobables). Cosidéros la variable aléatoire défiie comme suit : soit r = (a, b) u élémet quelcoque de E ; o pose X(r)=X(a, b)=ma(a, b) (la valeur de X(r) est égale à a si a > b et à b das le cas cotraire). X est ue variable aléatoire sur E avec X(E) = {1, 2, 3, 4, 5, 6}, et la loi de probabilité p 1 = Pr(X = 1) = Pr({(1, 1)}) = 1/36 ; p 2 = Pr(X = 2) = Pr({(1, 2), (2, 1), (2, 2)}) = 3/36 ; p 3 = 5/36 ; p 4 = 7/36 ; p 5 = 9/36 ; p 6 = 11/36. Soit : i p i 1/36 3/36 5/36 7/36 9/36 11/36 E(X) = 1/36 + 6/ / / / /36 = 161/36 4,47 p i E(X) Théorèmes 1. Soit X ue variable aléatoire et k ue costate réelle. O a : E(kX)= ke(x) E(X + k)= E(X) + k 2. Soiet X et Y deu variables aléatoires défiies sur le même espace fodametal E. O a : E(X + Y) = E(X)+ E(Y) i Biostatistique - Carrat, Mallet, Morice 53/179

54 Variables aléatoires O e déduit que pour variables aléatoires X i, défiies sur le même espace fodametal : E X i = EX i i = 1 i = 1 (l espérace de la somme est la somme des espéraces). Eemple Cosidéros l epériece du jeu de dés où E = {1, 2, 3, 4, 5, 6} uiforme (équiprobable). Soit X(E) ue première variable aléatoire défiie par X(E) = {1, 2, 3, 4, 5, 6} et p X1 = p X2 = p X3 = p X4 = p X5 = p X6 = 1/6 E(X) = ( ) / 6 = 21/6 Soit Y(E) ue secode variable aléatoire telle que Y(E) = 1 si le chiffre tiré est impair Y(E) = 2 si le chiffre tiré est pair. Doc Y(E) = {1, 2} py 1 = Pr({1, 3, 5}) = 1/2 py 2 = Pr({2, 4, 6}) = 1/2 E(Y) = 1/2 + 1 = 1,5 Calculos maiteat la loi de (X + Y)(E) (X + Y)(r) = X(r) + Y(r) Pour r = 1, (X + Y)(1) = X(1) + Y(1)= 1+ 1= 2 Pour r = 2, (X + Y)(2) = X(2) + Y(2)= 2+ 2= 4 Pour r = 3, (X + Y)(3) = X(3) + Y(3)= 3+ 1= 4 Pour r = 4, (X + Y)(4) = X(4) + Y(4)= 4+ 2= 6 Pour r = 5, (X + Y)(5) = X(5) + Y(5)= 5+ 1= 6 Pour r = 6, (X + Y)(6) = X(6) + Y(6)= 6+ 2= 8 O a doc (X + Y)(E) = {2, 4, 6, 8} et Pr((X + Y) = 2) = 1/6, Pr((X + Y) = 4) = 2/6, Pr((X + Y) = 6) = 2/6, Pr((X + Y) = 8) = 1/6 E(X + Y) = 2/6 + 8/6 + 12/6 + 8/6 = 30/6 Or o retrouve bie ce résultat e utilisat E(X)+ E(Y) = 21/6 + 3/2 = 30/6. Remarque Lorsqu o doit calculer l espérace d ue foctio g(x), il faut étudier la variable Y = g(x) dot les valeurs sot y 1 = g( 1 ), y 2 = g( 2 ),..., y = g( ). Alors : Pr(Y = y i )= Pr[g(X)= g( i )] Si g est ue foctio mootoe, o a g(x) = g( i ) X = i D où Pr(Y = y i )= Pr(X = i )= p i Doc : EgX = EY = y i PrY = y i = i = 1 i = 1 g i p i O motre que ce résultat reste valide, même si g est pas mootoe. Par eemple, si l o doit calculer E(X 2 ), o cosidère la variable Y = X 2 dot les valeurs sot y 1 = 1 2, y 2 = 2 2,..., y = 2. Alors : 54/179 Biostatistique - Carrat, Mallet, Morice

55 Variables aléatoires EX 2 = EY = y i PrY = y i = i = 1 i = 1 i 2 pi O costate que pour calculer l espérace d u carré, il faut élever les valeurs i au carré, mais pas les probabilités p i associées Variace et écart-type d ue variable fiie Après avoir traduit la tedace cetrale par l espérace, il est itéressat de traduire la dispersio autour de l espérace par ue valeur (la variace ou l écart-type). La variace (vraie ou théorique) de X, otée var(x) ou, est défiie par : X 2 X 2 = varx = EX X 2 où X = EX L écart-type de X, oté X ou X, est défii par X = X = varx. X peut être otée s il y a pas de cofusio possible. Remarques : 1. O démotre facilemet que varx EX 2 2 = X E effet : EX X 2 i X = p i = i 2 X i + X p i i = , par défiitio i = 1 EX X 2 2 i pi 2 X p 2 = i i + X i = 1 i = 1 i = 1 3. Soit X ue variable aléatoire de moyee et de variace 2. X O défiit la variable cetrée réduite par Y = O peut motrer facilemet (faites l eercice) que E(Y) = 0 et var(y) = E(Y 2 ) = Si a est ue costate, o motre que var(x + a) = var(x) et var(ax)= a 2 var(x). EX X i pi 2 X + X EX 2 2 = = X X 2 i = 1 p i Loi de probabilité produit Soiet X et Y deu variables aléatoires fiies sur le même espace fodametal E ayat pour image respective : X(E)= { 1, 2,..., } Biostatistique - Carrat, Mallet, Morice 55/179

56 Variables aléatoires Y(E) = {y 1, y 2,..., y m }. Cosidéros l esemble produit X(E)Y(E) = {( 1, y 1 ), ( 1, y 2 ),..., (, y m )} (esemble des couples ( i, y j ) pour i = 1,..., et j = 1,..., m) Cet esemble produit peut être trasformé e esemble probabilisé si o défiit la probabilité du couple ordoé ( i, y j ) par PrX = i Y = y j que l o ote p i,yj. Cette loi de probabilité de X, Y est appelée distributio joite de X et Y. Y X i = 1 i y 1 p 1,y1 p 2,y1 p y1 y 2 p 1,y2 p y2... y m p 1,ym Les probabilités = p i yj et p = p yj i yj sot souvet appelées lois de probabilité margiales de X et de Y. Il s agit simplemet de leurs distributios. La loi de probabilité p i,yj possède, bie etedu, les propriétés d ue loi : y j j = 1 m p i p i yj m p i yj i = 1 j = 1 0,ij = 1 p 1 p 2 1 m j = 1 i = 1 Soiet X et Y les espéraces de X et de Y, X et Y leurs écart-types. O motre facilemet que var(x + Y) = 2 X + 2 Y + 2cov(X, Y), où cov(x, Y) représete la covariace de X et Y et est défiie par : covx Y = EX X Y Y = i X De même que pour la variace (voir sectio 6.2.3), o a : cov(x, Y) = E(X Y) - X Y La covariace de X et Y se ote aussi XY. Ue otio dérivée de la covariace est celle de corrélatio etre X et Y, défiie par : XY = covx Y X Y m i = 1 j = 1 y j Y p i yj 56/179 Biostatistique - Carrat, Mallet, Morice

57 Variables aléatoires O peut vérifier que (X, Y)= (Y, X) 1 XY 1 (X, X)= 1 (ax + b, cy + d)= (X, Y) si a et c o uls Variables aléatoires idépedates Soiet X et Y deu variables aléatoires sur u même espace fodametal E. X et Y sot idépedates si tous les évéemets X = i et Y = y j sot idépedats : PrX = i Y = y j = PrX = i PrY = y j pour tous les couples (i, j). Autremet dit, si p i et p yj sot les distributios respectives de X et Y, les variables sot idépedates si et seulemet si o a p i,yj = p i p yj (la probabilité cojoite est égale au produit des probabilités margiales). Il e découle les propriétés importates suivates : si X et Y sot idépedates, o a (attetio la réciproque est pas toujours vraie) 1. E(XY)= E(X)E(Y) 2. var(x + Y)= var(x) + var(y) 3. cov(x, Y) = 0 et (X, Y) = Foctio de répartitio Si X est ue variable aléatoire, o défiit sa foctio de répartitio F() par F = PrX pour tout Si X est ue variable aléatoire discrète o a F = PrX = i = p i Das tous les cas, F() est ue foctio mootoe croissate, c est-à-dire Fa De plus lim F = 0 et lim F = 1 i i Fb si a b Biostatistique - Carrat, Mallet, Morice 57/179

58 Variables aléatoires Cet eemple motre la distributio de probabilités d ue variable aléatoire fiie et la foctio de répartitio correspodate. La foctio de répartitio est ue foctio e escalier. Les discotiuités se produiset pour les valeurs possédat des probabilités o ulles. Pour chacue de ces valeurs de, la hauteur d ue discotiuité est la probabilité de. 6.3 Variables ifiies déombrables (hors programme) Tout ce qui a été vu précédemmet das le cas où E est fii (E = {s 1, s 2,..., s }) se gééralise (ous e verros pas les démostratios) au cas où E est ifii déombrable ; o aura par eemple 58/179 Biostatistique - Carrat, Mallet, Morice

59 Variables aléatoires X = EX = p i i i = 1 La somme coverge à l ifii vers E(X), toutes les autres propriétés sot coservées, les sommes deveat des séries. 6.4 Variables aléatoires cotiues La gééralisatio au cotiu est délicate et même difficile si o e dispose pas d outils mathématiques hors du champ de ce cours. Nous ous coteteros de procéder par aalogie avec le cas discret. Ue variable aléatoire X dot l esemble image X(E) est u itervalle de est ue variable aléatoire cotiue (cotiue par oppositio à discrète, cf supra). Rappelos que, par défiitio d ue variable aléatoire, a X b est u évéemet de E dot la probabilité est bie défiie. O défiit la loi de probabilité de X, ou distributio de X, à l aide d ue foctio f(), appelée desité de probabilité de X, telle que b f d = Pra X b a Remarques 1. Si f est doée, la probabilité Pra X b est la surface sous la courbe etre a et b f() Pra X b a b 2. Le passage du discret au cotiu trasforme les sommes e itégrales et p i e f()d Biostatistique - Carrat, Mallet, Morice 59/179

60 Variables aléatoires Aisi, soit X ue variable aléatoire discrète et p i sa distributio p i La formule Pr k X = p i est aalogue à Pra X b = f d E utilisat cette aalogie, o admettra les défiitios suivates pour ue variable aléatoire X, cotiue, de distributio f() : 1. f 0 (aalogue à p i 0 ) 2. f d = 1 (aalogue à p i = 1 ) 3. = X EX = fd (aalogue à p ) i i 4. = varx = X 2 f d (aalogue à i X 2 p i ) 2 5. X varx 2 f d = = X (aalogue à i pi X ) F = PrX = fd (aalogue à p i ) 8. X 2 X = X = varx i i = k i Les propriétés de la foctio de répartitio doées sectio page 57 sot coservées : foctio mootoe croissate, partat de 0 pour - et atteigat 1 pour +. Pra X b = f d = b a Fb Fa i i i i b a 60/179 Biostatistique - Carrat, Mallet, Morice

61 Variables aléatoires Cet eemple motre la desité de probabilité et la foctio de répartitio d ue certaie variable aléatoire cotiue. La probabilité de l itervalle [a b] est la surface sous la courbe de desité limitée par cet itervalle. C est aussi la différece des hauteurs F(b)-F(a) si o utilise la foctio de répartitio. Cotrairemet au cas des variables discrètes, la foctio de répartitio est ici cotiue. Pour résumer l aalogie etre le cas discret et le cas cotiu, u poit du domaie discret correspod à u itervalle das le cas cotiu, la somme discrète correspod à l itégrale. 6.5 Etesio de la otio de variable aléatoire Ue variable aléatoire, telle qu elle est défiie das ce chapitre, e peut predre que des valeurs umériques. Il est pourtat souvet pratique de s itéresser directemet au résultats d ue epériece, qu ils soiet umériques ou o, c est à dire d éviter le codage umérique de ces résultats. Par abus de lagage, das la suite du cours, o pourra parler de variables aléatoires alors qu il s agit de résultats d epériece. Das ce cotete, la classificatio atérieure des variables (discrètes ou cotiues) doit être étedue : Biostatistique - Carrat, Mallet, Morice 61/179

62 Variables aléatoires Variables quatitatives variables dot les valeurs sot umériques. C est l uique possibilité das le cas de variables aléatoires au ses strict. O distigue deu types de variables quatitatives : variables discrètes, dot les valeurs sot discrètes, e gééral des ombres etiers. Eemple : ombre d étudiats das u amphi. variables cotiues, pour lesquelles toutes les valeurs sot possibles, au mois sur u itervalle. Eemples : le poids ou la taille. Variables qualitatives Variables dot les valeurs e sot pas umériques. O e distigue deu types : variables ordiales, dot les valeurs peuvet être ordoées. Eemple : itesité d ue douleur qui peut aller de absete à très itese. variables catégorielles ou omiales, dot les valeurs e peuvet pas être ordoées. Eemple : couleur des yeu. 62/179 Biostatistique - Carrat, Mallet, Morice

63 Eemples de distributios Chapitre 7 Eemples de distributios 7.1 Lois discrètes Les lois décrites ici e coceret que des variables dot les valeurs sot des ombres etiers Loi de Beroulli O cosidère ue epériece ayat que deu résultats possibles, par eemple succès et échec (ou présece et absece d ue certaie caractéristique). O itroduit la variable aléatoire X qui associe la valeur 0 à l échec (ou à l absece de la caractéristique) et la valeur 1 au succès (ou à la présece de la caractéristique). Cette variable aléatoire est appelée variable de Beroulli. Distributio de X Appelos la probabilité de l évéemet succès : Pr({succès}) = Pr(X = 1) = d où Pr({échec}) = Pr(X = 0) = 1 - Espérace de X X = EX = i PrX = i = 1 PrX = PrX = 0 = Variace de X 2 X varx EX X 2 EX 2 2 = = = X X 2 = 1 2 PrX = PrX = 0 2 X 2 = 2 = Loi biomiale Défiitio Soiet les épreuves répétées et idépedates d ue même epériece de Beroulli. Chaque epériece a que deu résultats possibles : succès ou échec. Comme précédem Biostatistique - Carrat, Mallet, Morice 63/179

64 Eemples de distributios met, appelos la probabilité de l évéemet élémetaire succès. A cette epériece multiple o associe ue variable aléatoire X qui mesure le ombre de succès obteus. Distributio de X O motre aisémet que la probabilité d avoir k succès lors de épreuves répétées est! PX = k pour essais = k! k! k 1 k Rappel! = 1 2 pour tout etier positif 0! = 1 par défiitio Remarques a. La probabilité de avoir aucu succès au cours de épreuves (k = 0) est (1- ; la probabilité d avoir au mois u succès est doc 1 - (1- (u succès ou plus)! b est souvet oté k ou C k! k! k Les s appellet coefficiets du biôme. k E effet ils itervieet das le développemet du biôme selo la formule a + b = a r r = 0 r r b Eercice : utiliser cette formule pour vérifier que a + b 4 = a 4 + 4a 3 b + 6a 2 b 2 + 4ab 3 + b 4 c. E appliquat la formule du biôme précédete o retrouve que la somme des probabilités pour toutes les valeurs de X est égale à 1 : k k 1 = + 1 = 1 = 1 k k = 0 Eemples 1. O jette 6 fois ue pièce bie équilibrée ; o suppose que face est u succès. O a doc = 1/2 et = 6 a. Probabilité que l o ait eactemet 2 faces Pr2 faces parmi 6 jets Pr2 faces parmi 6 jets 6! !4! = = = = = b. Probabilité d avoir 4 faces ou plus (au mois 4 faces) C est aussi la probabilité d avoir au plus 2 piles (0, 1 ou 2 piles) p 4 = Pr4 faces 6! !4! = = = /179 Biostatistique - Carrat, Mallet, Morice

65 Eemples de distributios p 5 = Pr5 faces = 6! !5! = = p 6 = Pr6 faces = 6! ! = Prau mois 4 faces = p 4 + p 5 + p 6 = = O jette 7 fois u dé équilibré et o cosidère que tirer 5 ou 6 est u succès. Calculer a. la probabilité pour qu o ait 3 succès eactemet 2 1 Prsuccès = Pr56 = -- = ! Pr3 succès = !4! = b. la probabilité de avoir aucu succès Praucu succès = = = Propriétés La foctio de probabilité Pr(X= k) déped des 2 paramètres (ou costates) et. C est ue distributio discrète qui pred les valeurs suivates : k Pr(X= k) ( O dit que X est distribuée selo ue loi biomiale B(, ). O peut motrer que Distributio biomiale B(, ) Espérace = Variace Ecart-type 2 = 1 = Biostatistique - Carrat, Mallet, Morice 65/179

66 Eemples de distributios Loi de Poisso La loi de Poisso (due à Siméo Deis Poisso e 1837) est la loi du ombre d évéemets observé pedat ue période de temps doée das le cas où ces évéemets sot idépedats et faiblemet probables. Elle peut s appliquer au ombre d accidets, à l apparitio d aomalies diverses, à la gestio des files d attetes, au ombre de coloies bactériees das ue boîte de Pétri, etc. Défiitio Soit X la variable aléatoire représetat le ombre d apparitios idépedates d u évéemet faiblemet probable das ue populatio ifiie. La probabilité d avoir k apparitios de l évéemet est k PrX = k = e ---- k! Cette loi déped d u paramètre, ombre réel strictemet positif. Les ombres k possibles sot toutes les valeurs etières 0, 1, 2, etc. Cepedat, lorsque k est suffisammet grad, la probabilité correspodate deviet etrèmemet faible. Propriétés O peut motrer que Loi de Poisso P Espérace = Variace 2 = Ecart-type = La démostratio utilise le fait que Si deu variables aléatoires idépedates X 1 et X 2 sot distribuées selo des lois de Poisso de paramètres 1 et 2, alors la variable X 1 +X 2 est distribuée selo ue loi de Poisso de paramètre Remarques Si o coaît la probabilité de observer aucu évéemet Pr(X=0) = p : D après la formule, p = e = e 0! O e déduit : = lp 1 PrX = 1 = e ---- = p, 1! k = 0 k ---- = k! e 66/179 Biostatistique - Carrat, Mallet, Morice

67 Eemples de distributios 2 PrX = 2 = e ---- = PrX = 1, 2! -- 2 PrX = 3 = e = PrX = 2, 3! PrX = k = PrX = k 1 -- k O peut aisi calculer facilemet de proche e proche les probabilités des diverses valeurs de k. Lie avec la loi biomiale Si ue variable aléatoire X est distribuée selo ue loi biomiale B(, ), o motre que si est petit (e pratique iférieur à 0,1) et assez grad (supérieur à 50), la loi biomiale peut être approimée par ue loi de Poisso de paramètre =. Les calculs sot plus simples avec la loi de Poisso qu avec la biomiale. Notos que puisque X est distribuée selo ue loi biomiale, ses valeurs possibles e peuvet dépasser, alors que l approimatio par la loi de Poisso autorise des valeurs supérieures. Cepedat le calcul fourit des probabilités très faibles pour ces valeurs aberrates. 7.2 Lois cotiues Loi ormale Défiitio La distributio ormale, ou de Laplace-Gauss, appelée aussi gaussiee, est ue distributio cotiue qui déped de deu paramètres et. O la ote N(, 2 ). Le paramètre peut être quelcoque mais est positif. Cette distributio est défiie par : f ; = e 2 2 C est ue des lois les plus importates, sio la plus importate comme vous le verrez à l occasio du théorème cetral limite Propriétés Allure de la courbe La loi ormale, otée N(, 2 ), est symétrique par rapport à la droite d abscisse. Eemples : Biostatistique - Carrat, Mallet, Morice 67/179

68 Eemples de distributios Figure 2 : N(, 1) pour les valeurs de -2 ; 0 et 2 Figure 3 : N(0, 2 ) pour les valeurs de 0,3 ; 1 et 2 Caractéristiques Loi ormale N(, 2 ) Espérace Variace 2 Ecart-type La distributio ormale cetrée réduite O dit que la distributio est cetrée si so espérace est ulle ; elle est dite réduite si sa variace 2 (et so écart-type ) est égale à 1. La distributio ormale cetrée réduite N(0, 1) est doc défiie par la formule 68/179 Biostatistique - Carrat, Mallet, Morice

69 Eemples de distributios ft ; 01 = e t 2 2 Figure 4 : loi ormale cetrée réduite N(0, 1) Les probabilités correspodat au divers itervalles ot été calculées et regroupées das ue table umérique. Aisi la table A.1 (e fi de polycopié) permet, à partir d ue probabilité doée, de trouver les bores -u,+u d u itervalle symétrique autour de 0, tel que Prt z ; +z = ou ecore, à partir de u, de trouver. D où par eemple : Prt z ; +z = 1 Prt z = Prt z = 2 O observe aisi que eviro 68 % de la surface est comprise etre (-1 et +1), 95 % etre (-2 et +2) et 99 % etre (-3 et +3) (la table A.1 e permet pas de trouver des valeurs aussi précises que celles de la figure 4). Trasformatio d ue loi ormale quelcoque e loi ormale cetrée réduite Soit ue variable X distribuée selo ue loi ormale d espérace et d écart-type Alors la variable t = X est distribuée selo ue loi ormale cetrée réduite. Les probabilités obteues pour la loi cetrée réduite permettet de calculer les probabilités pour ue loi ormale quelcoque, à l aide de cette trasformatio : t = X Soit par eemple à calculer Pra X b. Par la trasformatio, o a Pra X b = Prc t d avec c = a b et d = La probabilité cherchée, sur la variable X, reviet doc à lire sur la table de la loi cetrée Biostatistique - Carrat, Mallet, Morice 69/179

70 Eemples de distributios réduite (variable t), la probabilité de se trouver etre c et d. O remarque e particulier que Pr 2 t 2 = Pr 2 X , Approimatio de la distributio biomiale par la loi ormale Lorsque est grad, et que et e sot pas trop proches de 0 (e pratique si 5 et 1 5 ), alors o costate que la distributio biomiale ted vers la distributio ormale de moyee et de variace ; plus précisémet, pour ue variable K distribuée selo ue loi biomiale B(, ) et ue variable X distribuée selo ue loi ormale N( =, 2 = ), o a : PrK = k = Prk = Prk 05, K k + 05, Prk 05, X k + 05, O choisit l artifice de représeter graphiquemet Pr(k) par u rectagle dot la base est [k - 0,5, k + 0,5] et la surface est Pr(k) pour comparer la loi discrète Pr(k) et la loi ormale cotiue. Pr(4) = surface du rectagle = Prk 05, K k + 05, aire sous la gaussiee correspodate Approimatio de la loi de Poisso par la loi ormale Lorsque so paramètre est grad (e pratique supérieur à 25), ue loi de Poisso peut être approchée par ue loi ormale d espérace et de variace. Le pricipe est aalogue à celui utilisé pour l approimatio de la loi biomiale par la loi ormale Loi du 2 (chi-2) Défiitio C est ue loi dérivée de la loi ormale, très importate pour ses applicatios e statistiques comme ous le reverros das les tests. Soiet X 1,..., X des variables aléatoires idépedates, chacue état distribuée selo ue loi ormale cetrée réduite : i N01 X i La distributio de S = X (somme des carrés des X i ) est appelée loi de X X à degrés de liberté (e abrégé d. d. l.), que l o ote 2 () où est le ombre de d. d. l., seul paramètre 70/179 Biostatistique - Carrat, Mallet, Morice

71 Eemples de distributios de la loi. Loi du 2 () Espérace Variace Ecart-type Propriétés a. Allure de la distributio de 2 () pour différetes valeurs de Pour = 1, la courbe décroît de + vers zéro de faço mootoe ; pour = 2, la courbe décroît de faço mootoe de 0,5 à zéro ; pour > 2, la courbe part de 0, a so maimum pour = - 2, puis redesced vers zéro. b. Propriété asymptotique La loi d ue variable X suivat u 2 () ted vers ue loi ormale lorsque +. O a doc, après avoir cetré et réduit cette variable : X N NB : Das la pratique, o utilise plutôt la variable Y = 2X 2 1 dot o motre qu elle est à peu près distribuée selo ue loi ormale cetrée réduite dès que > 30. c. Tables De même que pour la loi ormale cetrée réduite, ue table eiste pour la loi du 2 (voir e fi de polycopié, table A.4). Cette table idique pour ue probabilité doée, et u degré de liberté doé, la valeur K, telle que PrX =. K, Loi de Studet (hors programme) Il s agit ecore d ue loi dérivée de la loi ormale, très utilisée das les tests statistiques. O cosi Biostatistique - Carrat, Mallet, Morice 71/179

72 Eemples de distributios dère ue première variable aléatoire X, distribuée selo ue loi ormale cetrée réduite, puis ue secode variable Y, idépedate de X, distribuée selo u 2 à degrés de liberté. Alors la variable aléatoire Z otée t(). = X Y est distribuée selo ue loi de Studet à degrés de liberté, Loi de Studet t() Espérace 0 Variace Ecart-type La courbe correspodate est symétrique autour de 0, et so allure est proche de celle de la loi ormale. Cette loi est cetrée, mais o réduite : la variace, , est supérieure à 1. 2 Lorsque croît, e pratique pour > 30, la variace peut être prise égale à 1, et la distributio assimilée à celle d ue loi ormale cetrée réduite Loi epoetielle (hors programme) Cette loi décrit par eemple le processus de mortalité das le cas où le «risque istataé» de décès est costat. La loi correspodate est : f = e avec 0 et 0 où est la durée de vie. Loi epoetielle Espérace Variace Ecart-type /179 Biostatistique - Carrat, Mallet, Morice

73 Eemples de distributios 7.3 Applicatio de la Loi de Poisso à l iterprétatio d u risque saitaire possible qui a pas ecore été observé Cette sectio a été écrite par A.J. Vallero Itroductio Das de ombreu cas, o s itéresse à u risque saitaire a priori faible et o costate, après observatios, que l évéemet redouté a jamais eu lieu. Par eemple, au bout de prescriptios d u médicamet ouveau, o a pas observé u seul effet idésirable. Ou u chirurgie eamiat le suivi de ses 50 derières itervetios avec ue techique très iovate a la satisfactio de e pas avoir eu u seul échec. Ces observatios semblet plutôt rassurates, mais que peut-o e tirer pour apprécier le risque ecouru au bout de de ces prescriptios, ou au bout de itervetios avec cette techique chirurgicale? C est u problème qui se pose particulièremet e pharmacovigilace : o admet das de ombreuses classes thérapeutiques qu u médicamet qui tuerait u malade sur de prescriptios devrait être retiré du marché. Le biostatisticie posera doc le problème suivat : sachat qu après prescriptios aucu décès causé par le médicamet a été observé, quel ombre de décès peut cepedat être redouté sur de prescriptios qui soit compatible avec ce qu o sait aujourd hui (0 décès sur ). Si ce ombre dépasse 1 (o verra das l applicatio umérique traitée plus loi qu il le dépasse de loi), la plus grade vigilace s imposera! Le raisoemet qui suit combie le calcul des probabilités (loi de Poisso, approimatio d ue loi biomiale par ue loi de Poisso), et «l iférece statistique». L iférece statistique est le mode de raisoemet qui permet à partir d ue observatio (ici : 0 effet idésirable sur ) de tirer des coclusios géérales (ici : ce qui pourrait arriver sur ou de prescriptios). Les applicatios pricipales de l iférece coceret l estimatio statistique et les tests statistiques ; elles sot traitées e détail das les chapitres suivats du polycopié. Mais l applicatio détaillée ci-après iitie bie à ce mode de raisoemet Le problème «direct» Das le problème direct o suppose que le risque d effet idésirable chez u patiet doé est cou, et o veut calculer la probabilité d observer l évéemet «0 effet idésirable au bout des premières observatios». Soit le risque idividuel (= la probabilité) d u effet idésirable après traitemet. Soit le ombre de patiets traités. Alors le ombre X de patiets présetat u effet idésirable suit ue loi biomiale de moyee Biostatistique - Carrat, Mallet, Morice 73/179

74 Eemples de distributios =. Si est très petit, très grad et assez petit (ces hypothèses serot toujours faites das ces problèmes de risque saitaire) la loi de X peut être approimée par ue loi de Poisso de paramètre. E particulier, Pr(X = 0) = e - et Pr(X = 1) = e -. Remarque : o sait calculer eactemet Pr(X = 0) = (1- ) e eprimat que chacue des prescriptios doit être sas effet idésirable (probabilité 1- ). Quad est très petit, et pas trop grad o motre que cette valeur est très proche de e Problème iverse C est le problème qui se pose e pratique : O observe l évéemet «= zéro effet adverse sur patiets traités». Que peut-o alors dire de? (ou de car = /). O approchera la distributio de X par la loi de Poisso de paramètre =. Pour répodre, la méthode utilisée est d écarter les valeurs de pour lesquelles otre observatio ( = 0 après répétitios) serait «ivraisemblable». Mais que veut dire ivraisemblable? Pour fier les idées, imagios que l o ait observé =0 parmi = traitemets. Si avait été 1/1000, la probabilité de l évéemet observé («= 0 sur ») aurait été e -10 = 0, = 4,5/ (car = ). Cette probabilité est ifime : tout le mode sera d accord pour dire qu il aurait été très ivraisemblable de avoir aucu effet idésirable si le risque idividuel icou était de = 1/1000. Si avait été 1/10 000, la probabilité de l évéemet observé aurait été e -1 = 0,37 = 37% (car = = 1). La probabilité 0,37 est «forte». Tout le mode sera d accord pour dire qu il était pas ivraisemblable de observer aucu effet idésirable si le risque idividuel était = 1/ e -10 est ue «petite» probabilité - l évéemet est ivraisemblable ; e -1 est ue «grade» probabilité - l évéemet est pas ivraisemblable. Pour préciser quatitativemet ce que veut dire «ivraisemblable» il faut choisir u seuil e dessous duquel o va déclarer qu ue probabilité est «petite» : la valeur covetioelle reteue uiversellemet est 5%. La traductio de ce choi est qu o décide de e pas trouver «ivraisemblable» u évéemet ayat 10 chaces sur 100 de se produire (car 10% > 5%), mais de trouver «ivraisemblable» u évéemet ayat 1 chace sur 100 de se produire. Ce choi permet d apporter ue solutio au problème posé : l observatio «= 0 sur 10000» est ivraisemblable si sa probabilité est iférieure à 5%, c est-à-dire si ep(- ) < 5%. Toutes les valeurs de supérieures à la solutio de cette iégalité serot réputées «ivraisemblables» ; et les autres serot réputées «vraisemblables». La résolutio de l iéquatio doe > lim = l(0,05)/ = 3/. Résultat Quad o observe 0 effet idésirable parmi répétitios, ceci est compatible avec u risque idividuel compris etre 0 et 3/. E revache, les risques supérieurs à 3/ sot jugés ivraisemblables. 74/179 Biostatistique - Carrat, Mallet, Morice

75 Eemples de distributios Comme la médecie veille à limiter le plus possible le risque ecouru par les malades à l occasio d u traitemet, la démarche de «précautio» est, lorsqu o observe 0 effets idésirables sur traitemets, de coclure que le risque réel du traitemet peut aller jusqu à 3/. Il peut bie sûr être plus petit : l aveir le dira, et l estimatio du risque se précisera au fur et à mesure que de plus e plus de patiets aurot été traités. Mais e attedat, pour se préparer «au pire», o doit cosidérer la valeur maimum o ivraisemblable, à savoir 3/ Applicatio umérique O traite patiets sas observer d évéemet idésirable. Evaluer la limite supérieure du ombre d évéemets idésirables qu o peut redouter sur de prescriptios, compatibles avec cette observatio prélimiaire. Par applicatio du résultat, l observatio «= 0 sur 10,000» est compatible avec u risque idividuel maimum de 3/ Sur de prescriptios, o aura doc au maimum u ombre de 3/ = 300 effets idésirables. Aisi, u laboratoire pharmaceutique ayat mis sur le marché ue ouvelle molécule e peut e rie être «rassuré» sur le risque associé à celle-ci après avoir costaté qu il y avait aucu décès sur les premières prescriptios. Cette observatio reste compatible avec u risque de 3/10000, et 300 décès sur le de prescriptios suivat, ce qui serait ue catastrophe saitaire. Ceci illustre égalemet la difficulté de garatir u médicamet «sas risque» lorsqu il a été testé que chez quelques milliers de patiets afi de voir s il est efficace (voir chapitre 15 sur la méthodologie des études épidémiologiques et les essais thérapeutiques), comme c est gééralemet le cas au momet de la demade d autorisatio de mise sur le marché Remarque Le calcul meat au résultat ecadré repose sur u raisoemet subtil (qui sera retrouvé das les chapitres relatifs au tests statistiques). Chacu doit compredre das l eemple traité que le résultat trouvé e sigifie pas qu il y a 5 chaces sur 100 pour que le risque saitaire soit de 3/ (cette iterprétatio fausse du «3» est très majoritairemet faite, y compris par de ombreu professioels). Ce que le calcul idique, c est que si le risque de mort était de 3/10000 (il e l est peut-être pas), il y aurait 5 chaces sur 100 d observer 0 décès sur prescriptios, comme o l a fait. E repreat les otatios des probabilités coditioelles, il e faut pas cofodre Pr(A / B) et Pr(B / A), avec ici A = { =3} et B = {X = 0} Biostatistique - Carrat, Mallet, Morice 75/179

76 Eemples de distributios 76/179 Biostatistique - Carrat, Mallet, Morice

77 Statistiques descriptives Chapitre 8 Statistiques descriptives Les statistiques descriptives viset à représeter des doées dot o veut coaître les pricipales caractéristiques quatifiat leur variabilité. 8.1 Rappels et complémets O suppose que l o s itéresse à ue caractéristique particulière observable chez des idividus issus d ue populatio ; cette caractéristique sera appelée variable ; si cette caractéristique peut varier etre les idividus, sas pouvoir l aticiper, o l appellera variable aléatoire. Le dispositif permettat d obteir ue valeur de la variable est l epériece aléatoire. Cette défiitio imagée est compatible avec la défiitio du chapitre 6. Rappel Il eiste deu grads groupes de variables : a. Les variables quatitatives qui sot des variables ordoées, productives de ombres. Eemples : ombre d efats das ue famille, glycémie, taille d u idividu, ombre de coloies bactériees das u milieu de culture. Parmi ces variables quatitatives, certaies preet u cotiuum de valeurs (etre deu valeurs possibles, il eiste toujours ue troisième valeur possible) ; ces variables sot dites cotiues. D autres e preet que des valeurs discotiues ; elles sot dites discrètes, fiies ou o. b. Les variables qualitatives qui produiset des valeurs o umériques. Eemples : see, couleur des cheveu, apparteace au groupe des fumeurs ou des o fumeurs, présece ou absece d ue maladie. Les valeurs peuvet être ordoées ; o parle alors de variable qualitative ordiale. Eemple : itesité d ue douleur (faible, moyee, forte). Si les valeurs e peuvet pas être ordoées, il s agit d ue variable catégorielle (ou omiale). Remarque L idividu évoqué ci-dessus, sur lequel o observe les caractéristiques d itérêt, la variable, est pas écessairemet u idividu physique. C est l etité sur laquelle s opère l observatio de la variable d itérêt. Eemples : famille, coloies bactériees. Défiitio L etité sur laquelle peut s observer la variable aléatoire s appelle l uité statistique Biostatistique - Carrat, Mallet, Morice 77/179

78 Statistiques descriptives Coaître le phéomèe mettat e jeu cette variable, ou coaître cette variable, c est coaître la probabilité pour qu u idividu tiré au hasard das la populatio présete telle valeur de la variable. O peut apprécier la probabilité d u évéemet aléatoire grâce à l iterprétatio suivate de la otio de probabilité. Cette iterprétatio est cohérete avec les cours précédets. O iterprétera la probabilité d u évéemet aléatoire comme la valeur limite de la fréquece avec laquelle l évéemet se réalise au cours d u ombre croissat de répétitios de l epériece. Autremet dit comme la valeur limite du rapport du ombre de fois où l évéemet s est réalisé et du ombre de répétitios de l epériece. Remarques Ce qui précède peut être vu comme ue iterprétatio de la otio de probabilité (voire comme ue défiitio). E dépit de cette iterprétatio, la probabilité d u évéemet aléatoire reste ue fictio du domaie théorique. Mais cette iterprétatio a deu coséqueces : pour approcher ue probabilité o est ameé à répéter ue epériece, les fréqueces se substituet au probabilités ; elles serot les cotreparties des probabilités. O va doc répéter ue epériece u ombre fii de fois, oté ; o aura doc observé ue sous-populatio appelée échatillo. Chaque epériece aléatoire produit u résultat i ; o disposera doc de 1,...,, esemble appelé échatillo de valeurs de la variable étudiée X. De faço plus formelle, o défiit u échatillo d ue variable aléatoire de la maière suivate : U échatillo de taille d ue variable aléatoire X est u esemble X 1, X 2,..., X de variables aléatoires, idépedates etre elles, et ayat chacue la même distributio que X. O peut doc dire qu u échatillo de valeurs de X est ue réalisatio de l échatillo de la variable X tel qu il viet d être défii. 8.2 Représetatio complète d ue série d epérieces Cas d ue variable qualitative La variable est décrite par la suite des probabilités des différetes modalités. Si l o coaissait ces probabilités, o produirait le diagramme e bâtos (ou répartitio «vraie») de cette variable ; o va produire la répartitio observée par substitutio au probabilités icoues des fréqueces ob- 78/179 Biostatistique - Carrat, Mallet, Morice

79 Statistiques descriptives servées. Si la variable est ordiale, o respectera cet ordre das l éumératio des modalités portées e abscisses. Fréqueces modalité 1 modalité 2... D autres types de représetatio sot utilisés : par eemple la représetatio e camembert où les différetes modalités sot représetées par secteurs agulaires d agles au cetre proportioels au fréqueces observées. D C A B Cas d ue variable quatitative discrète La situatio est similaire si ce est qu il eiste u ordre et ue échelle aturels e abscisses ; la Biostatistique - Carrat, Mallet, Morice 79/179

80 Statistiques descriptives répartitio observée se omme égalemet histogramme e bâtos. Fréqueces valeur 1 valeur Cas d ue variable quatitative cotiue. Notio d HISTOGRAMME Das le cas de variables cotiues, o va choisir de représeter les doées graphiquemet d ue faço qui soit proche de la représetatio d ue desité de probabilité d ue variable aléatoire cotiue. Pour cela o découpe l esemble du domaie des valeurs possibles de la variable étudiée e itervalles cotigus dot o choisit le ombre et les bores. Afi d obteir ue représetatio proche d ue desité de probabilité, o décide de représeter idirectemet la fréquece des valeurs observées comprises etre deu bores cosécutives par la surface d u rectagle dot la base sera précisémet cet itervalle. Autremet dit la hauteur de ce rectagle sera le rapport de la fréquece observée de ces valeurs et de la différece etre ces bores (différece égalemet appelée largeur de la classe). 1,2 (m -1 ) 1,0 0,8 0,6 0,4 0,2 0 0,5 1,75 taille (m) Les bores sot choisies arbitrairemet ; éamois, pour que l histogramme ait u ses il est écessaire que la taille de chaque classe costituat u itervalle compree u ombre suffisammet grad de valeurs observées, de telle faço que la surface d u rectagle élémetaire puisse être iterprétée comme approchat la probabilité pour que la variable pree ue valeur comprise das l itervalle du rectagle. Si la taille de l échatillo croît, la surface de chaque rectagle ted 80/179 Biostatistique - Carrat, Mallet, Morice

81 Statistiques descriptives vers la probabilité que la variable ait ue valeur icluse das l itervalle correspodat. De plus, si la taille de l échatillo est grade, o peut alors sas icovéiet costruire u plus grad ombre de classes, c est-à-dire costruire par eemple deu fois plus de rectagles, chacu ayat u support deu fois plus petit. E répétat cette opératio, croissat, o peut compredre que l histogramme ted (d ue faço que ous e préciseros pas ici) vers la desité de probabilité de la loi qui a gééré l échatillo. 8.3 Représetatio simplifiée d ue série d epérieces O a défii certais idicateurs pour représeter, de faço plus résumée que ci-dessus, u échatillo de valeurs issues d ue variable aléatoire. Les idicateurs présetés ci-dessous e coceret que les variables quatitatives Idicateurs de localisatio des valeurs Médiae observée C est la valeur qui partage l échatillo e deu groupes de même effectif ; pour la calculer, il faut commecer par ordoer les valeurs (les rager par ordre croissat par eemple) Eemple : soit la série o l ordoe : est la médiae de la série Moyee observée C est l idicateur de localisatio le plus fréquemmet utilisé. La moyee observée d u échatillo de valeurs 1,..., est défiie comme la moyee arithmétique de ces valeurs ; o la ote souvet m, ou simplemet m s il y a pas de cofusio possible : m 1 = -- i i = 1 Avec la série précédete, qui comporte = 7 valeurs, o obtiet : m = -- 7 i = = i = Idicateurs de dispersio des valeurs Variace observée La variace observée d u échatillo { i } i = 1,..., est doée par s 2 = i m 2 i = Biostatistique - Carrat, Mallet, Morice 81/179

82 Statistiques descriptives Attetio : o divise par -1 et o par pour que la variace observée soit u bo estimateur de la variace théorique de la loi (ous reverros ce poit das la suite). Ue autre epressio de s 2, équivalete, est idiquée das le résumé de ce chapitre. Ecart-type observé L écart-type observé, oté s, est défii par s = s Reformulatio de la moyee et de la variace observées Reformulatio de la moyee observée Preos le cas d ue variable quatitative discrète. Les doées sot otées 1,...,. Les k valeurs possibles de la variable sot otées val 1,val 2,..., val k. Eemple d u jet de dé : val 1 = 1,..., val 6 = 6 Chaque doée i coïcide avec ue certaie valeur val j Par eemple pour le jet de dé, o peut avoir jet 1 ; 1 = 1 = val 1 jet 2 ; 2 = 1 = val 1 jet 3 ; 3 = 4 = val 4 jet 4 ; 4 = 3 = val 3 jet 5 ; 5 = 6 = val 6 jet 6 ; 6 = 1 = val 1 jet 7 ; 7 = 2 = val 2 jet 8 ; 8 = 5 = val 5 jet 9 ; 9 = 6 = val 6 Alors : i = 1 i = k j = 1 j val j où j est le ombre de fois où ue observatio coïcide avec val j Das otre eemple du jet de dé, o a : 1 = 3, 2 = 1, 3 = 1, 4 = 1, 5 = 1, 6 = 2 k 1 j Fialemet m = -- i = ---val j i = 1 j = 1 82/179 Biostatistique - Carrat, Mallet, Morice

83 Statistiques descriptives j Mais --- est ue approimatio de Pr(face marquée = val j ) Aisi m est ue estimatio - ue appréciatio - de : j val j Prvaleur de la variable = val j c est-à-dire ue appréciatio de l espérace mathématique de la variable. O raccorde aisi ue moyee observée à ue gradeur descriptive du phéomèe étudié, à ue gradeur dite «théorique» ou «vraie». O peut dire ceci : la répétitio des epérieces vise à estimer Pr(valeur de la variable = certai iveau). La moyee observée permet d estimer quelque chose de plus grossier, ue combiaiso de toutes ces probabilités, précisémet l espérace mathématique = val j Prvaleur de la variable = val j j C est la raiso pour laquelle das la suite o utilisera égalemet la termiologie MOYENNE «VRAIE» ou MOYENNE THEORIQUE de la variable pour parler de l espérace mathématique. Reteos : ESPERANCE MATHEMATIQUE, MOYENNE «VRAIE», MOYENNE THEORIQUE sot SYNONYMES. Ce sot des gradeurs théoriques. Remarque La même aalyse peut être faite - mais l epressio est u peu plus délicate - das le cas d ue variable quatitative cotiue. La moyee observée approime là ecore l espérace mathématique Reformulatio de la variace observée De la même faço o peut obteir le résultat suivat : s 2 est ue approimatio de la gradeur 2 = val j 2 Prvaleur de la variable = val j j Cette epressio, itroduite das le chapitre 6 sous le om de variace sera souvet déommée das la suite VARIANCE «VRAIE» ou VARIANCE THEORIQUE de la variable. Das le cas d ue variable cotiue, la variace observée s 2 approime : 2 = 2 f d LES DIFFERENCES ENTRE CES NOTIONS DE MOYENNE ET VARIANCE «VRAIES», ET DE MOYENNE ET VARIANCE OBSERVEES SONT ESSENTIELLES ; NOUS ENGA- GEONS LE LECTEUR A BIEN LES COMPRENDRE AVANT DE POURSUIVRE Biostatistique - Carrat, Mallet, Morice 83/179

84 Statistiques descriptives 8.5 Cas particulier d ue variable à deu modalités - Proportio O est très souvet ameé à cosidérer des variables à deu modalités, c est-à-dire des epérieces aléatoires à deu évéemets élémetaires. Eemples : maladie : maladie présete - maladie absete sige cliique : préset - abset traitemet : idividu traité - idividu o traité Or o peut trasformer ue telle variable e variable quatitative, sas restrictio de gééralité, par u artifice de codage : ue des modalités est codée avec la valeur umérique 0 ; l autre modalité est codée avec la valeur umérique 1. Ue telle variable s appelle variable de Beroulli. Notos X cette variable. Elle est complètemet décrite par la doée de Pr(valeur de la variable = 1) car Pr(valeur de la variable = 1) + Pr(valeur de la variable = 0) = 1. O utilise la otatio covetioelle suivate : Pr(valeur de la variable = 1) SE NOTE Epressio de l espérace mathématique de X Utilisat l epressio géérale de l espérace mathématique, et remarquat que val 1 = 0, val 2 =1, o obtiet : = val j Prvaleur de la variable = val j = = j Aisi, = = Pr(valeur de la variable = 1) = probabilité de la modalité codée 1 = PROPORTION VRAIE des idividus présetat la modalité Epressio de la variace de X 2 = val j 2 Prvaleur de la v.a. = val j = = 1 j 84/179 Biostatistique - Carrat, Mallet, Morice

85 Statistiques descriptives Iterprétatio de la moyee observée 1 1 ombre de fois où X = 1 m = -- i = = i Aisi, m coïcide avec la fréquece observée de la modalité codée 1. Cette fréquece sera otée p et s appelle de faço aturelle PROPORTION OBSERVEE d idividus présetat la modalité 1. Eemple Das le cas de l étude d u sige cliique, e codat 1 la présece du sige cliique, m (doc p) sera la fréquece observée de la présece du sige ou ecore le pourcetage des idividus présetat le sige (à u facteur 100 près). E résumé si X est ue variable de Beroulli, sa moyee «vraie»= sa variace «vraie» = (1 - ) UNE PROPORTION OBSERVEE EST UNE MOYENNE OBSERVEE. 8.6 Coclusio : la variable aléatoire moyee arithmétique O a jusqu ici associé ue valeur de moyee observée à ue série de réalisatios d ue variable aléatoire quatitative X. Mais chaque epériece cosistat à recueillir réalisatios de la variable X permet de calculer ue valeur, différete à chaque epériece, de moyee observée. Autremet dit, la moyee observée doit être vue comme ue ouvelle variable aléatoire que ous appelleros moyee arithmétique ; o la otera M. Das certais cas, afi de rappeler que cette variable déped de, o otera M la variable costruite à partir de réalisatios de X. 1 M = -- X i i = 1 O utilisera la termiologie suivate : o dira que M (ou M si écessaire) est la VARIABLE ALEATOIRE MOYENNE ARITHME- TIQUE DEDUITE DE LA VARIABLE ALEATOIRE X, FONDEE SUR REPETITIONS ou, de faço équivalete que M (ou M si écessaire) est la VARIABLE ALEATOIRE MOYENNE ARITHMETIQUE ASSOCIEE A LA VARIABLE ALEATOIRE X, FONDEE SUR REPETITIONS Remarque Das le cas où X est ue variable de Beroulli, M sera otée P (et M simplemet P). Il s agit Biostatistique - Carrat, Mallet, Morice 85/179

86 Statistiques descriptives d ue variable aléatoire proportio dot o coaît déjà pratiquemet la distributio puisque P ~B(, ) (voir sectio page 63). 86/179 Biostatistique - Carrat, Mallet, Morice

87 Résumé du chapitre Statistiques descriptives 1. Ue variable aléatoire est ue variable observable au cours d ue epériece et dot la valeur peut varier d ue epériece à l autre de faço o prévisible. 2. Représetatio d ue variable répartitio d u échatillo représetatio de la populatio variable qualitative répartitio observée répartitio vraie variable quatitative discrète histogramme e bâtos répartitio vraie variable quatitative cotiue histogramme desité de probabilité 3. Moyees (variables quatitatives + variables de Beroulli) moyee observée espérace, ou moyee «vraie» variable discrète m 1 = -- i = val j Prvariable = val j i = 1 k j = 1 variable cotiue variable de Beroulli m 1 = -- = fd i i = 1 m est otée p = Prvariable = 1 est otée 4. Variaces (variables quatitatives) variaces observées variaces «vraies» variable discrète variable cotiue s 2 s = i m 2 2 = val j 2 Prvariable = val j i = 1 k j = = i m 2 2 = i = 1 2 f d Biostatistique - Carrat, Mallet, Morice 87/179

88 Statistiques descriptives 5. Variables cetrée et cetrée réduite associées à ue variable X Si X est ue variable aléatoire de moyee et de variace 2, la variable (X - ) est dite variable cetrée associée à X, X la variable est dite variable cetrée réduite associée à X. 88/179 Biostatistique - Carrat, Mallet, Morice

89 Fluctuatios de la moyee observée : la variable aléatoire moyee arithmétique Chapitre 9 Fluctuatios de la moyee observée : la variable aléatoire moyee arithmétique O coserve le cotete d étude du chapitre précédet, c est-à-dire l eame de la variabilité d ue gradeur (variable aléatoire) das ue populatio d idividus ou uités statistiques. Mais o s itéresse ici à la variable aléatoire «moyee arithmétique». 9.1 Première propriété de la variable aléatoire moyee arithmétique U eemple Preos à ouveau le cas d ue variable discrète pouvat predre les deu valeurs 0 et 1 [c est-àdire variable associée à présece-absece ou oui-o]. Supposos que l o ait des raisos de peser que Pr(X = 0) = Pr(X = 1) = 1/2. O a vu qu ue telle variable a pour espérace 1/2, pour variace «vraie» 1/4. O peut, par le calcul, proostiquer le résultat d ue répétitio d epérieces. E particulier, calculer la répartitio de la variable «moyee arithmétique calculée sur u échatillo de deu idividus», otée M 2, ici deu lacers de pièce. O isole cette variable. Quelles valeurs peut-elle predre, avec quelles probabilités? jet 1 : résultats Proba jet 1 jet 2 : résultats Proba jet 2 Proba jet1, jet2 0 1/2 0 1/2 1/4 1/2(0+0) = 0 0 1/2 1 1/2 1/4 1/2(0+1) = 1/2 M Biostatistique - Carrat, Mallet, Morice 89/179

90 Fluctuatios de la moyee observée : la variable aléatoire moyee arithmétique jet 1 : résultats Proba jet 1 jet 2 : résultats Proba jet 2 Proba jet1, jet2 1 1/2 0 1/2 1/4 1/2(1+0) = 1/2 1 1/2 1 1/2 1/4 1/2(1+1) = Aisi, PrM 2 = 0 = -- Pr M 4 2 = = = --PrM = 1 = -- 4 Alors : moyee vraie de M 2 = = -- = moyee vraie de X variace vraie de M = = -- = 4 8 Aisi la variace «vraie» de la moyee arithmétique est plus faible que la variace «vraie» de la variable d origie (la moitié ici). L espérace reste ichagée. Et aisi vot les choses si la taille des échatillos (ici 2) qui costituet les uités statistiques augmete. La dispersio de M dimiue au fur et à mesure que M se trouve calculée sur la base d u échatillo de taille croissate. Le «commet» de cette situatio peut être résumé aisi : les valeurs de la moyee arithmétique devieet de plus e plus probables das u voisiage de l espérace car le ombre de situatios pouvat doer ue valeur observée proche de l espérace augmete das ce voisiage. Cela est dû au fait que l espérace mathématique est «au milieu» des valeurs possibles. O le voit sur l eemple ci-dessus où l espérace est obteue das les deu cas (0, 1) et (1, 0). C est ecore plus perceptible sur l eemple d u dé. Pour que la moyee observée calculée sur deu jets de dé soit 6, il faut obteir le résultat (6, 6) ; pour qu elle soit 3, il faut u total de 6, c est-à-dire (5, 1), (4, 2), (3, 3), (2, 4), (1, 5), soit u évéemet 5 fois plus probable. Il est possible de quatifier tout cela. O peut gééraliser ce qui a été obteu avec deu jets de pièces et o obtiet, quelle que soit la distributio de la variable étudiée - qu elle soit cotiue ou discrète - les résultats fodametau suivats. M Gééralisatio i. L espérace mathématique, ou moyee «vraie», de la variable aléatoire moyee arithmétique calculée sur u échatillo de taille coïcide avec la moyee «vraie» de la variable étudiée, ce que l o peut résumer par : EM = EX ii. La variace «vraie» de la variable aléatoire moyee arithmétique calculée sur u échatillo de taille est égale à la variace «vraie» de la variable DIVISEE PAR, ce que l o peut résumer par : 90/179 Biostatistique - Carrat, Mallet, Morice

91 Fluctuatios de la moyee observée : la variable aléatoire moyee arithmétique 2 M 1 = -- 2 X d où la relatio etre écarts-types : M 1 = X iii. Das le cas où X est ue variable de Beroulli de paramètre (Pr(X =1)=), les relatios précédetes devieet : 2 ( P ) (P ) = 1 = Secode propriété de la variable aléatoire moyee arithmétique : le théorème cetral limite O souhaiterait comparer, par curiosité, les distributios de plusieurs moyees arithmétiques, correspodat à diverses variables aléatoires. Par eemple la taille, la glycémie. Ces distributios sot différetes, e serait-ce qu à cause des différeces etre moyees et variaces «vraies». Pour s abstraire de ces premières différeces, cosidéros la variable cetrée réduite associée, soit pour chaque variable cosidérée : M M M soit M X X Maiteat toutes ces variables ot e commu leur espérace (0) et leur variace (1). Il se passe quelque chose d etraordiaire : lorsque est suffisammet grad, elles fiisset par avoir e commu leur distributio, leur desité de probabilité. Cela sigifie que les distributios de toutes ces variables (moyees arithmétiques cetrées réduites issues de variables aléatoires différetes) fiisset par coïcider, lorsque est suffisammet grad, avec ue distributio particulière uique. Cette distributio s appelle LOI NORMALE, et puisque sa moyee «vraie» est ulle et sa variace «vraie» est 1, o l appelle LOI NORMALE CENTREE REDUITE ou ecore distributio de Gauss ou de Laplace-Gauss (1800). O la otera schématiquemet N(0, 1) où 0 rappelle la valeur de la moyee «vraie», 1 la valeur Biostatistique - Carrat, Mallet, Morice 91/179

92 Fluctuatios de la moyee observée : la variable aléatoire moyee arithmétique de la variace «vraie». Doc la propriété ci-dessus - coue sous le om de théorème cetral limite - s éoce : THEOREME CENTRAL LIMITE Soit X ue variable aléatoire quatitative d espérace mathématique, de variace «vraie» 2. Soit M la variable aléatoire moyee arithmétique associée à X costruite sur répétitios. La distributio limite de la variable aléatoire ormale cetrée réduite otée N(0,1). M est la distributio Il faut bie mesurer la portée de cette propriété. Quel que soit le phéomèe étudié - apprécié par la variable aléatoire que l o étudie - il suffit de coaître la moyee et la variace de la variable pour déduire la distributio (la desité de probabilité) - c est-à-dire l epressio la plus achevée des propriétés de variabilité - de la variable aléatoire moyee arithmétique calculée sur u échatillo de taille suffisate. Nous reviedros plus loi, au paragraphe résumé et précisios (voir page 93), sur cette otio vague «taille suffisate». Or c est peu de coaître moyee, variace (ou écart-type) seulemet - e. : pour le poids à la aissace = 3 kg, = 1,2 kg. 9.3 Etude de la distributio ormale (rappel) La distributio limite que l o a mise e évidece dépeit ue variable aléatoire d espérace mathématique 0 et de variace «vraie» 1, que l o a appelée distributio ormale cetrée réduite ou N(0, 1). La desité de probabilité est doée par ue foctio d équatio est représetée sur la figure 5. Ses pricipales caractéristiques morphologiques sot les suivates : elle est symétrique, elle présete deu poits d ifleio e = 1 et =-1 et dot l allure Par ailleurs, pour faciliter les calculs de probabilité relatifs à cette variable, des tables ot été costruites qui doet le lie etre et u, où ces valeurs ot le ses suivat (voir figure 5) : PrX u ; +u = E particulier, pour = 0,05, la valeur u lue das la table est 1,96, d où u 0,05 = 1,96 O peut voir facilemet que toute probabilité PrX [ a, b] s obtiet à partir d ue telle table, quelles que soiet les valeurs de a et b. f 1 = e /179 Biostatistique - Carrat, Mallet, Morice

93 Fluctuatios de la moyee observée : la variable aléatoire moyee arithmétique Figure 5 : loi ormale cetrée réduite Remarque Sur la base de cette loi cetrée réduite, o défiit toute ue famille de lois de la faço suivate : Si X est distribuée selo ue loi ormale cetrée réduite (otatio X ~ N (0, 1)), alors la variable Y = X + dot l espérace est et la variace 2, est distribuée selo ue loi ormale d espérace et de variace 2. O écrit Y ~N(, 2 ) A l iverse, si o dit que X ~ N (, 2 ) X cela veut dire que N0 1 (variable cetrée réduite associée). Eemple La figure 6. présete l aspect de deu distributios ormales l ue N(0, 1), l autre N(2,9,4). Figure 6 : eemple de lois ormales Résumé et précisios (théorème cetral limite) Si est suffisammet grad, X ayat pour moyee «vraie», pour variace «vraie» 2, alors : M N 0 1 (à peu près) Biostatistique - Carrat, Mallet, Morice 93/179

94 Fluctuatios de la moyee observée : la variable aléatoire moyee arithmétique ou, de faço équivalete, M N (à peu près) où la otatio ~ se lit : «est distribué comme» ou «suit ue distributio». a. La distributio de M est eactemet ue loi ormale (la metio à peu près est iutile), quel que soit, si X elle-même est gaussiee (i.e. est distribuée ormalemet). b. si X est pas gaussiee : si X est ue variable quatitative autre que Beroulli, la coditio de validité usuelle est 30 si X est ue variable de Beroulli (valeurs 0 et 1), la coditio usuelle de validité est 5 et 1 5 E outre das ce cas, =, 2 = (1 - ) si bie que l o aura : P N 0 1 (à peu près) ou, de faço équivalete, P N (à peu près) 9.4 Applicatio du théorème cetral limite. Itervalle de Pari (I. P.) Défiitio de l itervalle de pari (I. P.) d ue moyee observée O cosidère ue variable aléatoire de moyee «vraie» et de variace «vraie» 2. O sait que pour grad ( 30, ou et (1 - ) 5) : M la variable Z = est approimativemet distribuée selo N (0, 1) O se pose le problème suivat. O s apprête à réaliser ue série d epérieces, c est-à-dire à mesurer la variable X sur u échatillo de idividus. Peut-o costruire u itervalle [a, b] tel que la probabilité pour que la moyee observée que l o s apprête à calculer appartiee à cet iter- 94/179 Biostatistique - Carrat, Mallet, Morice

95 Fluctuatios de la moyee observée : la variable aléatoire moyee arithmétique valle ait ue valeur doée? Il s agit doc de costruire u itervalle qui cotiee avec ue probabilité fiée la valeur observée que l o va obteir. Il s agit doc de trouver deu valeurs a et b telles que Pra M b = valeur doée = 1. Eemple : Pra M b = 095 U tel itervalle [a, b] s appelle INTERVALLE DE PARI (I. P.) de iveau 1 -, ou ecore itervalle de pari au risque, ou ecore INTERVALLE DE FLUCTUATION La figure 7 illustre le problème posé. Figure 7 : le problème de l itervalle de pari Ce problème admet plusieurs solutios : sauf besoi spécifique o choisit u itervalle symétrique autour de (ce qui est aturel compte teu de la distributio de M ). Résolutio : a = et b = La valeur icoue doit vérifier : Pr M = 1 Pr M = 1 M Pr = Si le théorème cetral limite s applique, l epressio ci-dessus suit ue loi N(0, 1) ; otos-la Z. Alors doit vérifier Pr Z = 1. C est le u de la table. Fialemet : = u Pr u M + u = 1 et Biostatistique - Carrat, Mallet, Morice 95/179

96 Fluctuatios de la moyee observée : la variable aléatoire moyee arithmétique IP 1 = u ; + u Itervalle de Pari (I. P.) de la moyee observée d ue variable de moyee «vraie», de variace «vraie» 2 costruite sur u échatillo de taille Eemple : = 0,05 u = 1,96 IP 095, = 196, ; + 196, Les coditios de validité de cette costructio sot celles du théorème cetral limite, c est-à-dire 30 pour les variables cotiues o ormales et, (1 - ) 5 pour les variables de Beroulli. Cas d ue variable de Beroulli : est otée, 2 = (1 - ). Doc IP 095, = 196, ; + 196, L iterprétatio de l itervalle de pari est fodametale. Si cet itervalle est bie calculé, o est quasi sûr, avec ue probabilité 1 - (ici 0,95), d obteir ue valeur de la moyee observée comprise das cet itervalle. E pariat que la valeur va tomber das cet itervalle, o se trompera (e moyee) das ciq pour cet des epérieces. Eemple : O a des raisos de peser que la fréquece d ue maladie das la populatio est = 0,2. L itervalle de pari de la moyee observée (proportio observée) calculée sur 64 idividus au iveau 0,95 est : 196, 0, 21 0, 2 196, 0, 21 0, 2 IP 095, = 02, ; 0, = 0, 10 ; 0, Il y a 95 chaces sur 100 pour que la proportio observée «tombe» das cet itervalle Les facteurs de dépedace de la logueur de l itervalle de pari (IP) La logueur de l IP est 2u la logueur déped de Si ', la logueur de IP 1 ' est supérieure à la logueur de Eemple = 0,05 u 0,05 = 1,96 = 0,01 u 0,01 = 2,57 IP 1 96/179 Biostatistique - Carrat, Mallet, Morice

97 Fluctuatios de la moyee observée : la variable aléatoire moyee arithmétique la logueur déped de La logueur de IP 1 décroît avec. C est le reflet du fait cou selo lequel les fluctuatios d échatilloage s estompet avec Eemple Das le cas ci-dessus, si o remplace = 64 par = 6400, o obtiet IP 095, = 019, ; 021, Remarque Pour réduire das u rapport 2 la logueur de l IP, il faut u échatillo 4 fois plus grad (2 2 ) L itervalle de pari d ue variable aléatoire Ce que l o a dit pour ue moyee observée peut s evisager pour ue variable X quelcoque dot o coaît la distributio. L IP de iveau 1 - est l itervalle [a, b] tel que Pra X b = 1. Eemple : X ~ N(0, 1) IP 1 = u ; u Ue valeur umérique à reteir : pour ue variable aléatoire ormale cetrée réduite IP 0,95 = [-1,96 ; 1,96] Biostatistique - Carrat, Mallet, Morice 97/179

98 Fluctuatios de la moyee observée : la variable aléatoire moyee arithmétique Résumé du chapitre 1. Propriétés de la moyee arithmétique M d ue variable aléatoire X, moyee calculée sur uités statistiques : 2. Théorème cetral limite Si X a pour moyee «vraie», pour variace «vraie» 2, M est, lorsque est suffisammet grad ( 30, ou et (1 - ) 5), à peu près distribuée comme ue variable ormale de moyee «vraie» et de variace «vraie» 2, ce que l o écrit : 3. Itervalle de pari (I. P.) Lorsque les coditios ci-dessus sot satisfaites, l itervalle a la propriété suivate : moyee «vraie» de M = moyee «vraie» de X variace «vraie» de M = M variace «vraie» de X N ou M N IP 1 = u ; + u PrM IP 1 = 1 Cet itervalle s appelle itervalle de pari (I. P.) de iveau 1-, ou itervalle de pari au risque. 98/179 Biostatistique - Carrat, Mallet, Morice

99 Estimatio - Itervalle de cofiace Chapitre 10 Estimatio - Itervalle de cofiace 10.1 Itroductio Le problème de l estimatio statistique est le suivat : o cherche à coaître les valeurs de certaies caractéristiques d ue variable aléatoire grâce à des observatios réalisées sur u échatillo. U grad ombre de problèmes statistiques cosistet e la détermiatio de la moyee «vraie», sur la base d observatios réalisées sur u échatillo. Cepedat, o peut aussi chercher à coaître les valeurs d autres caractéristiques, comme par eemple les variaces (eemple c. cidessous). Eemples : a. quelle est la fréquece de surveue de tel type de cacer chez les souris? b. quelle est la vraie valeur de la glycémie de ce patiet? c. quelle est la variace de la glycémie mesurée chez ce patiet? Il est bie sûr impossible de répodre à ces questios au ses strict. O y apporte gééralemet deu types de réposes : 1. O produit ue valeur qui ous semble être la meilleure possible : o parle alors d estimatio poctuelle. 2. O produit u itervalle de valeurs possibles, compatibles avec les observatios. C est la otio d itervalle de cofiace ou d estimatio par itervalle. Das la suite o ote X la variable aléatoire dot o cherche à estimer ue caractéristique, aussi appelée paramètre, dot la valeur est otée. Par eemple le paramètre peut être la glycémie, et sa valeur celle du patiet cosidéré Biostatistique - Carrat, Mallet, Morice 99/179

100 Estimatio - Itervalle de cofiace 10.2 Estimatio poctuelle Défiitio A partir d u échatillo (X 1, X 2,..., X ) de la variable aléatoire X, o costruit ue ouvelle variable aléatoire t(x 1, X 2,..., X ) dot les réalisatios «se rapprochet» de la valeur. Cette ouvelle variable est appelée estimateur de. Pour simplifier, cette variable t(x 1, X 2,..., X ) est otée T ou T. 1 Par eemple t(x 1, X 2,..., X ) = M = -- «se rapproche» de l espérace de X (voir chapitre X i 9). i = 1 C est u estimateur aturel de E[X] Propriétés Les estimateurs sot des foctios des échatillos : ce sot doc des variables aléatoires qui possèdet ue desité de probabilité, et le plus souvet, ue moyee (espérace mathématique) et ue variace. Ces deu gradeurs permettet de comparer, das ue certaie mesure, les estimateurs etre eu. Figure 8 : desité de probabilité de 3 estimateurs T1, T2 et T3 La figure 8 représete les desités de probabilité de 3 estimateurs T1, T2 et T3 d ue moyee Biais O voit sur la figure 8 que T1 et T2 sot cetrés autour de, tadis que T3 a pour moyee ' iférieure à. Cette otio est défiie plus précisémet de la maière suivate : Le biais d u estimateur, oté B(T), est la différece moyee etre sa valeur et celle de la quatité qu il estime. O a : 100/179 Biostatistique - Carrat, Mallet, Morice

101 Estimatio - Itervalle de cofiace B(T) = E(T - )= E(T) - Ici, o a : B(T1) = E(T1 - ) = E(T1) - = 0 de même : B(T2) = 0 mais : BT3 = ET3 = ET3 = ' 0 O dit que T1 et T2 sot des estimateurs sas biais de, et que T3 est u estimateur biaisé de Variace La variace d u estimateur est défiie de la maière usuelle : var(t) = E[T - E(T)] 2 Si deu estimateurs sot sas biais, le meilleur est celui qui a la variace la plus petite : e effet, ses valeurs sot «e moyee» plus proches de la quatité estimée. Par eemple, sur la figure ci-dessus, o voit que var(t1) < var(t2). O peut doc coclure que T1 est u meilleur estimateur de que T2. Quad des estimateurs sot biaisés, e revache, leur comparaiso est pas aussi simple : u estimateur peu biaisé, mais de variace très faible, pourrait même, e pratique, être préféré à u estimateur sas biais, mais de variace grade Erreur quadratique moyee L erreur quadratique moyee est ue gradeur permettat de comparer des estimateurs etre eu, qu ils soiet biaisés ou sas biais. Elle est défiie de la maière suivate : EQM(T) = E[(T - ) 2 ] O démotre facilemet qu o peut relier l erreur quadratique moyee, l espérace et la variace d u estimateur par l epressio suivate : EQM(T) = var(t) + [E(T) - ] 2 = var(t) + B(T) 2 E particulier, l erreur quadratique moyee des estimateurs sas biais est égale à leur variace. Lorsqu o compare deu estimateurs, o cosidère que le meilleur est celui qui présete l erreur quadratique moyee la plus faible Eemple O a souvet utilisé, das ce cours, les quatités m, moyee observée, et s 2, variace observée. La variable aléatoire moyee arithmétique, otée M, a été étudiée au chapitre 8. De la même maière, étudios la variable aléatoire variace S 2, défiie par : S 2 = M 1 2 M 2 où est la variable aléatoire «moyee arithmétique de X 2». M Biostatistique - Carrat, Mallet, Morice 101/179

102 Estimatio - Itervalle de cofiace O va calculer E(S 2 ). O rappelle que si U est ue variable aléatoire, la variable moyee arithmétique défiie sur U a les propriétés suivates : EM U = EU (1) et varm U 1 = --varu (2) O a par ailleurs : var(u)= E(U 2 )- [E(U)] 2 et doc E(U 2 )= var(u)+ [E(U)] 2 (3). O peut maiteat calculer E(S 2 ). Soit X ue variable aléatoire d espérace E(X) = et de variace var(x)= 2. O a : 2 ES 2 = EM 1 2 EM Mais = EX 2 = d après (1) et (3), EM 2 et = varm + EM 2 = d après (3), (2) et (1), 2 et fialemet : ES = = 2. 1 S 2 est doc u estimateur sas biais de 2. EM Estimatio par itervalle - Itervalle de cofiace Bie que des itervalles de cofiace soiet défiissables pour toute quatité estimée, leur détermiatio est le plus souvet difficile. Nous ous limiteros doc das ce cours à la défiitio des itervalles de cofiace des moyees (et proportios) «vraies» Eemple d ue proportio L idée directrice est la suivate : o souhaite associer à ue valeur observée p u itervalle appelé INTERVALLE DE CONFIANCE qui ait «de boes chaces» de coteir la valeur «vraie» de la proportio. Que sigifie de «boes chaces»? Si l o effectue u grad ombre de fois l epériece - chaque epériece produisat u pourcetage observé p - o costruit autat d itervalles de cofiace. O voudrait qu u grad ombre de ces itervalles cotiee la valeur «vraie». Par eemple que 95 % des itervalles e gros cotieet. O parlera alors d itervalle de cofiace DE NIVEAU 0,95 ou d itervalle de cofiace AU RISQUE 0,05. O cosidérera gééralemet des itervalles de cofiace de iveau 1-. La valeur sera alors le risque - ou la probabilité - pour qu u itervalle de cofiace e cotiee pas la proportio «vraie». 102/179 Biostatistique - Carrat, Mallet, Morice

103 Estimatio - Itervalle de cofiace DE FACON GENERALE, L INTERVALLE DE CONFIANCE AU RISQUE D UNE VA- LEUR QUE L ON CHERCHE A ESTIMER EST UN INTERVALLE QUI CONTIENT AVEC UNE PROBABILITE 1 - LA VALEUR CHERCHEE ; IL S AGIT D UN INTERVALLE QUE L ON DEVRA ETRE EN MESURE DE CONSTRUIRE A L ISSUE D UNE EXPERIENCE PORTANT SUR UN ECHANTILLON. Commet costruire de tels itervalles? C est facile graphiquemet. Figure Biostatistique - Carrat, Mallet, Morice 103/179

104 Estimatio - Itervalle de cofiace Figure 10 Cosidéros la figure 9. O a porté e abscisses ue échelle 0-1 de mesure de proportios «vraies», e ordoées ue échelle de mesure de proportios observées. Doos ous ue valeur de proportio «vraie» ; o sait associer à cette valeur u itervalle de pari de iveau 0,95 de la proportio observée que l o est susceptible d obteir au cours d ue epérimetatio coduite sur idividus. Cet itervalle de pari peut être représeté sur l échelle verticale. Si l o opère cette représetatio pour toutes les valeurs possibles d ue proportio «vraie», o obtiet u domaie limité par les deu courbes représetées sur la figure. Cosidéros alors u problème mettat e jeu ue proportio «vraie»,. Supposos que ous fassios u esemble d epérieces, chaque epériece portat sur idividus état productive d ue valeur de proportio observée p. O peut associer à chacue de ces epérieces u poit de coordoées (, p) sur la figure 9. Compte teu de la costructio précédete, o peut affirmer que ces poits appartiedrot 95 fois sur cet (c est-à-dire das 95 % des epérieces) au domaie limité par les deu courbes, et ceci quelle que soit la valeur de. Maiteat supposos qu ue epériece uique ait été réalisée, produisat ue valeur de proportio, p. Le problème est, sur la base de cette valeur, de défiir u itervalle ayat de boes chaces de coteir la valeur icoue de la proportio «vraie». La solutio, immédiate, est fourie par la figure 10. Il suffit de tracher le domaie limité par les deu courbes DANS L AUTRE SENS. Cet itervalle cotiedra 95 fois sur cet la véritable valeur de la proportio. Aisi, si o adopte cette stratégie de costructio, o aura pour chaque valeur observée p u itervalle qui cotiedra avec la probabilité 0,95. Le problème est résolu. Maiteat, ce qui est simple sur u dessi est compliqué e termes de calcul et il eiste des tables d itervalles de cofiace et des formules toutes faites permettat de former des itervalles de cofiace approchés. 104/179 Biostatistique - Carrat, Mallet, Morice

105 Estimatio - Itervalle de cofiace Itervalle de cofiace approché d ue proportio «vraie» O motre qu ue boe approimatio de l itervalle de cofiace de iveau 1 - de, fodé sur la valeur observée p, p état calculée sur idividus, est doée par l itervalle ci-dessous : p1 p p1 p IC 1 = p u ; p + u Notos mi et ma les bores de cet itervalle. Cette approimatio est jugée satisfaisate que sous les CONDITIONS DE VALIDITE suivates : mi 5, (1- ma ) 5 LORSQUE LES CONDITIONS DE VALIDITE NE SONT PAS REMPLIES, IL FAUT AVOIR RECOURS A DES TABLES (hors programme). Eemple : = 100, = 0,05, p = 0,12 IC 095, = 012, 1, , 0, 88 ; 0, 12+ 1, , 0, 88 = 0, 06 ; 0, coditios de validité 100 0,06 = (1-0,18) = Itervalle de cofiace approché d ue moyee «vraie» (variable cotiue) De même, il eiste ue epressio approchée pour l itervalle de cofiace de iveau 1 - d ue moyee «vraie», itervalle fodé sur la valeur observée m obteue après ue epériece portat sur idividus. Le calcul de cet itervalle suppose e outre le calcul de la variace observée s 2. L epressio est la suivate : s s IC 1 = m u ; m + u L approimatio ci-dessus est jugée satisfaisate que sous la CONDITION DE VALIDITE : 30. Lorsque cette coditio est pas remplie, o e sait plus former d itervalle de cofiace sauf si l o peut supposer que la variable primitive X d itérêt est ormale. Si la variable étudiée est NORMALE, alors, et sas autre coditio de validité, u itervalle de cofiace de iveau 1 - a pour epressio : s s IC 1 = m t ; m+ t Biostatistique - Carrat, Mallet, Morice 105/179

106 Estimatio - Itervalle de cofiace où t est associé à ue ouvelle distributio, dite de Studet, à (-1) degrés de liberté (voir sectio page 71). La otatio t s apparete à la otatio u et est eplicitée table A.6 page 179. Remarque (pour ue variable ormale ecore) Si la variace «vraie» de la variable étudiée, 2, est coue, l itervalle de cofiace a la forme suivate : IC 1 = m u ; m+ u Applicatios L itervalle de cofiace eprime fodametalemet, comme so om l idique, la cofiace que l o peut attribuer à u résultat epérimetal. IDEALEMENT TOUT PROBLEME D ESTIMATION DEVRAIT ETRE PRODUCTIF D UN INTERVALLE DE CONFIANCE. Ne doer qu ue estimatio poctuelle masque l icertitude qui accompage tout résultat. Eemple : supposos qu étudiat la fréquece d u évéemet, o ait obteu ue fréquece observée p égale à 0,12. Supposos que cette valeur ait été obteue sur la base de 8 idividus (l évéemet étudié s est doc réalisé ue fois). O peut lire das ue table spécialisée que l itervalle de cofiace de la fréquece «vraie» est, au risque 0,05 [0,003 ; 0,527]. Cela sigifie que cette valeur observée de 12 % sur si peu d idividus e fait qu idiquer ceci : la fréquece «vraie» se situe das le domaie 3, 52,7 %. Supposos que cette même valeur 12 % ait été obteue sur la base de 100 idividus (l évéemet étudié s est réalisé 12 fois au cours des 100 essais). L itervalle de cofiace associé est alors proche de [0,06 ; 0,18]. Sur la base de cette valeur 12 %, o est maiteat e mesure d affirmer, acceptat toujours u risque d erreur de 5 pour cet, que la fréquece «vraie» se situe das le domaie 6 %, 18 %, domaie beaucoup plus étroit que le précédet. De faço géérale, la logueur de l itervalle de cofiace idique la précisio obteue. Les deu eemples qui suivet motret l usage que l o peut e faire Précisio d u sodage Supposos que l o s apprête à réaliser u sodage pour estimer la prévalece d ue maladie, c est-à-dire la proportio de la populatio atteite par cette maladie à la date du sodage. O souhaite u résultat précis, c est-à-dire que l o souhaite par eemple que l itervalle de cofiace résultat ait ue logueur au plus égale à 0,04, avec u risque d erreur de 5 %. O remarque que la logueur de l itervalle de cofiace e déped que d ue seule gradeur cotrôlable, le ombre d idividus. La questio est doc : combie d idividus faut-il iclure das le sodage? Ce problème est simple, puisque la logueur de l itervalle de cofiace s établit à : 106/179 Biostatistique - Carrat, Mallet, Morice

107 Estimatio - Itervalle de cofiace 2 1, 96 p1 p qu o arrodit ici à 4 p p L effectif de l échatillo devra doc être au mois p(1 - p). Toutefois, cet effectif déped de p, icou avat l epériece. L usage de ces calculs supposera doc que l o ait ue idée du résultat attedu, grâce à u sodage eploratoire par eemple ou grâce à ue coaissace préalable du phéomèe étudié. De faço géérale, si l o souhaite obteir u itervalle de cofiace d ue proportio de logueur 2i, il est écessaire d iclure u ombre d idividus au mois égal à : 4 p1 p 2 p1 p au risque 0,05 (ou u au risque ) i 2 i 2 REMARQUE Lorsque le sodage est réalisé, u itervalle de cofiace lui est associé. Das le lagage courat, les istituts de sodage ommet ces itervalles de cofiace des FOURCHETTES Précisio d ue moyee Das le cas où l o s itéresse à la moyee «vraie» d ue variable quatitative, o peut effectuer le même type de calcul. Pour obteir u itervalle de cofiace de logueur 2i, il faut iclure u ombre d idividus au mois égal à : 2 s 2 = u ---- i 2 L eploitatio de ce calcul écessite ici ue coaissace, même approimative, de la variace de la variable étudiée pour se doer a priori s 2 - ou mieu 2. Eemple très importat : les problèmes de dosage. Soit à doser la glycémie ; o a devat soi u échatillo de sag. Quelle est la cocetratio e glucose? Si o fait plusieurs dosages, o va obteir plusieurs résultats. Cela est dû, o à la variabilité de la glycémie, mais au erreurs aalytiques. O assimile la glycémie «vraie» à la moyee «vraie» de la variable aléatoire «résultat du dosage». Supposos que l o coaisse la variace des résultats, car o coaît bie la techique aalytique. Par eemple, = 10 mg.l -1. Supposos e outre que les résultats epérimetau soiet distribués ormalemet. Si o effectue u dosage doat 90 mg.l -1, o a pour itervalle de cofiace approché ( état cou) : IC 0,95 = [90-2 ; ] = [70 ; 110] soit u itervalle de logueur 40. Si o effectue deu dosages doat 90 et 96 mg.l -1, o a IC 095, = ; = 78, 9 ; 107, soit u itervalle d amplitude 28, Biostatistique - Carrat, Mallet, Morice 107/179

108 Estimatio - Itervalle de cofiace Si l o effectue trois dosages doat 90, 96 et 93 mg.l -1 o a IC 095, = ; = 81, 5 ; 104, soit u itervalle d amplitude 23,0. Ces calculs objectivet le fait bie cou selo lequel la répétitio des dosages permet d attéuer les coséqueces des erreurs epérimetales. Certais dosages - certaies mesures (tesio artérielle) - sot répétés avat qu ue valeur soit idiquée. 108/179 Biostatistique - Carrat, Mallet, Morice

109 Les tests d hypothèses. Pricipes Chapitre 11 Les tests d hypothèses. Pricipes Les tests d hypothèses sot fodés sur les itervalles de pari U eemple cocret (empruté à Schwartz) Ue variété de souris présete des cacers spotaés avec u tau (ue fréquece ou proportio das la populatio) costat bie cou, = 20 %. O se demade si u traitemet doé modifie ce tau (e plus ou e mois), c est-à-dire est actif. Pour répodre à cette questio o procède à ue epériece sur 100 souris ; il s agira, au vu du pourcetage observé p d aimau cacéreu, de dire si le traitemet est actif. Il est pas possible de répodre au ses strict à cette questio. Supposos que le traitemet soit sas effet ; alors chaque souris traitée aura toujours 20 chaces sur 100 de deveir cacéreuse. Mais le pourcetage de souris cacéreuses, calculé sur u échatillo de 100 souris sera soumis au fluctuatios d échatilloage que l o a étudiées. Le pourcetage observé (moyee observée) pourra predre a priori, c est-à-dire avat epériece, plusieurs valeurs, même si les valeurs voisies de 0,2 sot les plus probables. Des valeurs de 0 ou 100 % pourraiet même être observées. Aisi même si le pourcetage observé est très différet de 20 %, il est possible que le traitemet soit sas effet. Supposos maiteat que le traitemet soit actif ; la probabilité de cacer pour chaque souris (ou la proportio «vraie» de souris cacéreuses das ue populatio fictive de souris traitées) est 1, différete de 0,2. Ecore à cause des fluctuatios d échatilloage, o pourra très bie, peut être de faço peu probable, obteir ue fréquece observée égale à 20 %. Aisi même si le pourcetage observé est 20 %, il est possible que le traitemet soit actif. O e peut doc répodre avec certitude à la questio posée. Pourtat e pas répodre serait reocer à cosidérer tous les problèmes liés à la variabilité, c està-dire à «tous» les problèmes biologiques. Alors o répodra, mais e acceptat u risque d erreur. Répodre correspod à la démarche que chacu adopterait ; par eemple, déclarer le traite Biostatistique - Carrat, Mallet, Morice 109/179

110 Les tests d hypothèses. Pricipes met actif si le tau observé de cacers après traitemet s écarte «ettemet» de 20 %. C est le ses que l o peut doer à ce «ettemet» qui est le fodemet du pricipe des tests. Das le cas étudié, o aurait tedace à s y predre de la faço suivate. Deu hypothèses sot e présece : le traitemet est iactif, le traitemet est actif. La première hypothèse est plus «fie» que la secode car elle porte e elle ue iterprétatio umérique : le pourcetage «vrai» de souris cacéreuses parmi les souris traitées est 0,2 - l autre hypothèse idiquat seulemet que ce pourcetage est différet de 0,2 ; ce qui est plus vague. Supposos alors vraie l hypothèse la plus fie. Il deviet possible de faire des déductios : sachat ce qui se passe au iveau de la populatio des souris traitées o peut e déduire ce qui se passera au iveau d u échatillo. E particulier, o sait costruire les itervalles de pari cetrés de iveau 1- pour la fréquece observée. Par eemple, preat = 0,05 et = 100 souris, o obtiet IP 0,95 = [0,12 ; 0,28] Cela sigifie, rappelos-le, que si = 0,2 (fréquece supposé «vraie»), 95 % des valeurs des moyees observées calculées sur 100 idividus appartiedrot à l itervalle [0,12 ; 0,28]. O adopte alors la stratégie suivate : si la valeur observée de la fréquece de souris cacéreuses parmi les 100 traitées appartiet à cet itervalle, o cosidère que cette valeur est compatible avec les fluctuatios d échatilloage et l activité du traitemet est pas prouvée. Si la valeur observée appartiet pas à cet itervalle, le traitemet sera cosidéré comme actif. Das ce derier cas le raisoemet est le suivat. Cet évéemet (la fréquece observée est à l etérieur de l itervalle de pari) avait mois de 5 chaces sur 100 de se produire et pourtat il s est produit ; doc je e crois plus à l hypothèse qui m a permis de déduire ces 5 % de chaces. Remarque : reformulatio des calculs Notos p la proportio observée de souris traitées développat u cacer, sur les souris traitées. Le résultat du test sera de coclure ou o à l activité du traitemet selo que c est-à-dire : p ou IP p ou 0 u ; 0 + u où 0 est la proportio hypothétique (0,2 das l eemple) et u la bore de l itervalle de pari au risque de p. O suppose ici que les coditios du théorème cetral limite sot satisfaites. O coclut doc selo 110/179 Biostatistique - Carrat, Mallet, Morice

111 Les tests d hypothèses. Pricipes que p 0 ou u ; u ou ecore selo que p ou u ; u O recoaît das la derière epressio l itervalle de pari N(0, 1), itervalle idépedat de l epériece projetée. IP 1 d ue variable aléatoire C est comme cela que l o abordera gééralemet les tests ; o cherchera à costruire ue variable aléatoire dot o coaisse, si l hypothèse fie est vraie, la distributio, pour pouvoir costruire u itervalle de pari ; ici il s agirait de la variable aléatoire Z déduite de la variable aléatoire moyee arithmétique selo : Z = P avec 0 = 0,2 (trascriptio de l hypothèse). Ue telle variable aléatoire s appelle usuellemet «paramètre» du test et est otée covetioellemet Z. Ici o sait que Z ~ N(0, 1) et l o costruit l itervalle de pari de iveau 1 - pour Z. Par eemple avec = 0,05, IP 0,95 = [-1,96 ; 1,96]. Puis o réalise l epériece ce qui permet d obteir p, valeur observée de P, doc ue valeur observée de Z, otée u : p 0 z = O pourrait alors s eprimer comme ceci (ue termiologie plus précise sera idiquée plus loi) : si z IP 095 o e peut pas dire que le traitemet est actif si z IP 095 le traitemet est actif. Nous allos, à la lumière de cet eemple, éumérer les étapes de mise e œuvre d u test et reveir sur différets aspects (ses de par eemple) avat de doer d autres eemples de tests usuels Biostatistique - Carrat, Mallet, Morice 111/179

112 Les tests d hypothèses. Pricipes 11.2 Pricipe gééral des tests d hypothèses La mise e œuvre d u test statistique écessite plusieurs étapes Les étapes de mises e œuvre Etape 1 Avat le recueil des doées. Défiir avec précisio les deu hypothèses e présece H 0 et H 1. H 0 et H 1 jouet toujours des rôles dissymétriques. Le plus souvet, ue des hypothèses est précise, ou fie. Elle egage ue égalité gééralemet ; c est elle qui sera H 0 et o l appellera hypothèse ulle, H 0 : hypothèse ulle Eemple : la fréquece «vraie» d apparitio du cacer chez les souris traitées est 0,2, ce qui se trascrit par = 0,2 (plus gééralemet = 0 ). Le pricipe des tests est d admettre cette hypothèse H 0 sauf cotradictio flagrate etre ses coséqueces et les résultats epérimetau. L autre hypothèse est toujours plus vague ; elle regroupe toutes les hypothèses, hormis H 0. C est H 1 et o l appellera hypothèse alterative, H 1 : hypothèse alterative Eemple : la fréquece «vraie» d apparitio du cacer chez les souris traitées est différete de 0,2, qui se trascrit par 0,2 (gééralemet 0 ). Remarque : la formulatio de ces hypothèses écessite gééralemet ue traductio et ue simplificatio du problème médical sous-jacet. Etape 2 Avat le recueil des doées. O suppose que H 0 est vraie et o cherche à défiir ue variable aléatoire (ou paramètre) dot o coait alors la distributio. E d autres termes, o cherche à costruire ue foctio des doées à veir dot o coait la distributio si H 0 est vraie. Soit Z cette variable aléatoire. P 0 Eemple : Z = N /179 Biostatistique - Carrat, Mallet, Morice

113 Les tests d hypothèses. Pricipes Si possible, vérifier les coditios de validité. Etape 3 Avat le recueil des doées.. Rappe- Choisir u seuil. Typiquemet = 0,05 (ue quasi obligatio e pratique) Costruire u itervalle de pari (pour le paramètre Z) de iveau 1 -, oté IP 1 los qu il s agit d u itervalle tel que si H 0 est vraie, alors PZ IP 1 = 1 Eemple : IP 1 pour Z ci-dessus = [-1,96 ; 1,96] Défiitio : l etérieur de l itervalle de pari seuil. Etape 4 Avat le recueil des doées. IP 1 s appelle régio critique du test au Défiir la règle de décisio. Les doées vot permettre de calculer ue valeur de Z, que l o ote z. p réellemet observé 0 Eemple : z = Alors décider que : si z appartiet à la régio critique, remettre e cause H 0, la rejeter, et coclure H 1 est vraie, ou dire : «au risque, H 0 est rejetée». si z appartiet pas à la régio critique, mais à l itervalle de pari IP 1, dire que l o e coclut pas, ou dire que l o e rejette pas l hypothèse ulle H 0. Etape 5 Recueil des doées Réaliser l epériece. O recueille les doées 1,..., ; calculer z et coclure. Si o fait à l étape 2, vérifier les coditios de validité. Etape 6 Iterprétatio des résultats Cette étape cocere l iterprétatio des résultats e des termes compatibles avec le problème médical iitialemet soulevé, et cocere e particulier le problème de la causalité. Ce poit sera détaillé au chapitre 15. Eemple : das le cas des souris, et e cas de coclusio au rejet de l hypothèse ulle, la questio serait de savoir si ce rejet eprime véritablemet ue activité du traitemet Biostatistique - Carrat, Mallet, Morice 113/179

114 Les tests d hypothèses. Pricipes Justificatio de la règle de décisio. Choi de Iterprétatio de O a déjà vu ue iterprétatio de avec l eemple des souris. De faço géérale, est la probabilité pour que la valeur observée - ou calculée - z appartiee à la régio critique si H 0 est vraie. Si cet évéemet se réalise, o rejette H 0. Cela e se justifie que si est petit car alors o dit : voilà u évéemet qui avait 100 % chaces de se réaliser (5 % par eemple) - doc peu de chaces - et qui pourtat s est réalisé : les résultats e sot pas coformes à l hypothèse doit être petit. Ue autre iterprétatio de motre ecore mieu que doit être petit. A ouveau, lorsque H 0 est vraie, la probabilité d obteir u résultat z das la régio critique est. Mais alors o dit «H 1 est vraie». Doc = «probabilité» de coclure H 1 alors que H 0 est vraie C est u risque d erreur qu il coviet de situer das des valeurs acceptables (petites). Cette valeur s appelle RISQUE DE PREMIERE ESPECE. Cela veut dire que sur u grad ombre d epérieces, e admettat, o coclura à tort das 100 % des cas (5 % des cas par eemple). Pourquoi alors e pas choisir u microscopique? Effet d u chagemet de valeur de Les itervalles de pari croisset lorsque leur iveau augmete, c est-à-dire lorsque dimiue. = 0,1 = 0,05 = 0,01 IP [ ] IP [ ] IP [ ] Doc, toutes choses égales par ailleurs, la régio critique dimiue lorsque décroît. Doc o rejette mois fréquemmet H 0. A vouloir commettre mois d erreurs, o coclut plus raremet. O s epose doc à u autre risque : celui de e pas coclure alors qu il le faudrait car H 0 est fausse. A la limite, si o se fie = 0, o e coclut jamais, H 0 est jamais rejetée. Predre ue décisio, c est accepter u risque. Pour fiir avec ce problème de il faut reteir : 114/179 Biostatistique - Carrat, Mallet, Morice

115 Les tests d hypothèses. Pricipes La valeur de doit être fiée a priori : jamais e foctio des doées Pire que cela, o choisit la valeur = 0,05 qui est u compromis etre le risque de coclure à tort et la faculté de coclure, compromis adopté par l esemble de la commuauté scietifique Justificatio des coclusios du test. Puissace d u test O compred maiteat la partie de la règle de décisio coduisat au rejet de H 0 lorsque la valeur calculée du paramètre appartiet pas à l itervalle de pari. O a par ailleurs idiqué (voir l étape 4 de mise e œuvre des tests) que lorsque la valeur calculée du paramètre appartiet à l itervalle de pari, c est-à-dire lorsque les résultats epérimetau e sot pas cotradictoires avec l hypothèse ulle, o s eprime avec beaucoup de précautios oratoires puisqu o demade de dire : «o e coclut pas» ou «o e rejette pas l hypothèse ulle». Pourquoi e pas affirmer plus directemet «l hypothèse ulle est vraie»? Premier élémet E faisat cela, o adopte ue démarche qui s apparete à la démarche scietifique qui cosiste à admettre ue théorie jusqu à la preuve de so échec. Lorsque l o dit «admettre» o e sigifie pas que la théorie est vraie mais qu elle red compte pour l istat - jusqu à plus ample iformé - des epérieces. Eemples la mécaique géérale admise jusqu à la théorie de la relativité la mécaique céleste Secod élémet Supposos que l o mette e parallèle les deu tests suivats : H 0 : = 0,2 H 0 : = 0, H 1 : 0,2 H 1 : 0, Les paramètres calculés, soit 0,2 0, z = p observée serot etrêmemet voisis, doc les coclusios pratiquemet toujours les mêmes Biostatistique - Carrat, Mallet, Morice 115/179

116 Les tests d hypothèses. Pricipes Cosidéros alors ue epériece au cours de laquelle z IP 095 pour les deu valeurs calculées. Peut-o coclure à la fois = 0,2 et = 0,200001? Pourtat o peut remarquer qu il y a pas de vice de fod au iveau de la formulatio des hypothèses car il eiste bie ue valeur «vraie», c est-à-dire qu il y a vraimet ue hypothèse vraie du type = quelque chose. O retiet : les tests e sot pas faits pour «démotrer» H 0, mais pour la rejeter. Cela e veut pas dire que l o est toujours cotet de rejeter H 0. Eemples cas des souris traitées. Là o aimerait probablemet rejeter H 0, c est-à-dire coclure à l activité du traitemet. cas d u test d homogééité. O vous livre u ouveau lot de souris ou des souris d u autre élevage. Vous voulez cotiuer vos recherches. La première chose à faire est de tester l hypothèse selo laquelle ces ouvelles souris sot similaires au précédetes vis-à-vis du tau de cacer, H 0 : = 0,2. Mais là vous espérez bie e pas rejeter H 0. C est à cette coditio que vous pouvez cotiuer. PUISSANCE D UN TEST Reveos à la coclusio «l activité du traitemet est pas démotrée». Sous etedu compte teu de l epériece effectuée. Cela a de ses de s eprimer comme cela que s il est pesable qu ue autre epériece, plus complète par eemple, puisse motrer cette efficacité si elle eiste. C est le cas, e effet. L aptitude d u test à rejeter l hypothèse ulle alors qu elle est fausse est limitée. Précisémet : O appelle PUISSANCE D UN TEST P la probabilité de rejeter l hypothèse ulle, face à ue hypothèse alterative, alors qu elle est fausse. La valeur complémetaire à 1 de cette puissace, c est-à-dire la probabilité de e pas rejeter l hypothèse ulle alors que l hypothèse alterative est vraie, s appelle le RISQUE DE DEUXIEME ESPECE et se ote covetioellemet : =1-P. Le calcul de la puissace d u test est ue opératio complee. La difficulté tiet essetiellemet au fait que l hypothèse alterative est vague. Pour cotourer cette difficulté et apprécier plus étroitemet cette otio de puissace, cosidéros le cas d ue hypothèse alterative fie. Par eemple, repreat l eemple des souris, supposos que l hypothèse H 1 soit = 0,3, l hypothèse H 0 restat ichagée, c est-à-dire = 0,2. Das ces coditios, il est possible de calculer la distributio de la proportio observée, o plus seulemet sous l hypothèse ulle, mais égalemet sous l hypothèse alterative. O obtiet : 02, 1 02, sous l hypothèse ulle ( = 0,2) : P N0, , 1 03, sous l hypothèse alterative ( = 0,3) : P N0, /179 Biostatistique - Carrat, Mallet, Morice

117 Les tests d hypothèses. Pricipes Figure 11 : risque de deuième espèce d u test La figure 11 présete les deu distributios correspodates, pour ue certaie valeur de. Supposos alors juste l hypothèse H 1 ; la valeur observée p sera issue de la distributio de droite, et l o coclura à tort au o rejet de H 0 avec ue probabilité égale à l aire grisée, puisque cette aire est la probabilité pour que la valeur observée appartiee à l itervalle de pari associé au test, sachat que cette valeur observée est gouverée par la distributio associée à H 1. Aisi la valeur de cette aire grisée eprime le risque de deuième espèce, so complémetaire à 1 la puissace du test. Supposos pour fier les idées que la valeur de cette aire soit 0,4. Cela sigifie que si les hypothèses sot = 0,2 et = 0,3, o aura «6 chaces sur di» seulemet de rejeter l hypothèse = 0,2 lorsque sera égal à 0,3. Autremet dit, 4 fois sur di, o sera icapable de détecter que vaut 0,3 et o 0,2. Figure 12 : risque de deuième espèce d u test Par ailleurs, o perçoit que plus les hypothèses H 0 et H 1 sot cotrastées (par eemple les hypothèses = 0,2, = 0,4 sot plus cotrastées que les hypothèses = 0,2, = 0,3), plus les distributios de P sous ces deu hypothèses sot «éloigées», et plus la puissace est grade. C est la raiso pour laquelle o dit souvet que la otio de puissace est proche de la otio de pouvoir discrimiat etre hypothèses Biostatistique - Carrat, Mallet, Morice 117/179

118 Les tests d hypothèses. Pricipes La figure 12 reproduit les coditios de la figure 11, mais avec ue valeur de accrue. Autremet dit le même test est mis e œuvre, mais sur u ombre d uités statistiques supérieur. O costate sur cette figure que le risque de deuième espèce est très faible. Ce résultat est gééral : TOUTES CHOSES EGALES PAR AILLEURS, LA PUISSANCE D UN TEST AUG- MENTE AVEC LA TAILLE DE L ECHANTILLON Remarque Les calculs de puissace ébauchés ci-dessus, joits au résultat précédet, permettet de répodre à des questios du type : combie de sujets est-il écessaire d iclure das u essai pour avoir de boes chaces (9 chaces sur di par eemple) de mettre e évidece ue différece etre proportios «vraies» d au mois 0,1? si je dispose de 100 sujets, quelle différece miimum etre proportios «vraies» suis-je capable de détecter avec ue probabilité de 0,9? Des formules de la relatio etre puissace et taille des échatillos serot doées das le chapitre 12. Les développemets ci-dessus motret que lorsque vous avez pas rejeté l hypothèse ulle, vous pouvez toujours dire que c est u maque de puissace du test puisque H 0 est sas doute fausse (pesos à = 0,2 eactemet). O peut doc dire qu avec u plus grad ombre d idividus vous auriez rejeté H 0. Cela justifie l epressio «l activité du traitemet est pas démotrée». Cepedat il faut être réaliste : repreos l eemple des souris traitées ou o traitées. Vous avez réalisé votre epériece sur u échatillo de 1000 souris. Résultat du test : o rejet de H 0 c est-à-dire l activité est toujours pas démotrée. Il est pas raisoable das ces coditios d évoquer u maque de puissace du test ; ce résultat suggère plutôt ue très faible activité du traitemet, si elle eiste Amélioratio de l iterprétatio du rejet de H Notio de degré de sigificatio Supposos que l o réalise u test au risque ou seuil = 0,05. Cosidéros deu epérieces coduisat au rejet de H 0, pour lesquelles o a obteu des valeurs calculées du paramètre z 1 et z 2 représetées ci-dessous. O aurait evie de rejeter plus fortemet H 0 das le secod cas que das le premier. E effet, cosidéros des itervalles de pari pour z, de iveau croissat à partir de 0, /179 Biostatistique - Carrat, Mallet, Morice

119 Les tests d hypothèses. Pricipes z 1 z 2 IP 0,95 [ ] IP 0,97 [ ] IP 0,99 [ ] IP 0,999 [ ] O observe que z 1 est à l etérieur des itervalles de pari jusqu au iveau 0,97, que z 2 est à l etérieur des itervalles de pari jusqu au iveau 0,999. Cela sigifie que, e ce qui cocere la première epériece, H 0 aurait été rejetée même si o avait limité le risque d erreur à 1-0,97 = 0,03 (soit 3 %), et que, e ce qui cocere la secode, H 0 aurait été rejetée même si o avait limité le risque d erreur à 1-0,999 = 0,001 (soit 1 ). C est ce pseudo risque d erreur que l o appelle degré de sigificatio et qui mesure la force avec laquelle o rejette H 0. Ce degré de sigificatio est oté p : plus il est petit, plus cofortable est le rejet. Si l o veut ue défiitio plus précise : Défiitio Lorsque H 0 est rejetée, o appelle degré de sigificatio d u test le risque associé au plus grad itervalle de pari qui e cotiet pas le paramètre calculé z. Calcul pratique du degré de sigificatio O cherche das la table la valeur de p pour laquelle u p = z, u p état du type u Eemple: z = 2,43. O trouve das la table u 0,02 = 2,32 et u 0,01 = 2,57 alors p 001, ; 002, La valeur eacte e se trouve pas das la table : o dira p < 0,02. Le plus grad itervalle de pari e coteat pas z est de iveau > 0,98, ou au risque < 0,02. La plupart des résultats de tests s eprimet avec ce degré de sigificatio : O réalise le test (avec u risque = 0,05) Si H 0 est rejetée, o calcule ou o évalue le degré de sigificatio p Si H 0 est pas rejetée, o e calcule pas p Orietatio du rejet Le rejet de H 0 correspod gééralemet à l ue des deu situatios : rejet car z est trop petit (iférieur à la bore iférieure de l itervalle de pari) rejet car z est trop grad (supérieur à la bore supérieure de l itervalle de pari) Biostatistique - Carrat, Mallet, Morice 119/179

120 Les tests d hypothèses. Pricipes Das le cadre de l eemple précédet, chacue de ces situatios correspod gééralemet à des commetaires radicalemet différets. Par eemple : z est trop petit le traitemet est efficace z trop grad le traitemet est uisible 11.3 Rappels et précisios 1. LES TESTS PRENNENT EN COMPTE DES HYPOTHESES SYNTHETIQUES O a vu que les tests reposet sur l éocé de deu hypothèses eclusives. Il y a parfois beaucoup de chemi à parcourir etre la formulatio d u problème médical et sa formulatio e termes statistiques. Repreos l eemple des souris de ce chapitre. Le problème fodametal est celui de l activité du traitemet. Cette activité peut avoir bie d autres maifestatios que la modificatio de la fréquece d apparitio des cacers. O peut peser à u effet portat sur l âge de surveue de la maladie, portat sur la vitesse de développemet des tumeurs etc O e peut répodre simultaémet à toutes ces questios, par l itermédiaire d u test du mois : les tests e permettet de répodre qu à des questios simples. 2. ON NE CHOISIT PAS LE SEUIL DE SIGNIFICATION Que dirait-o d u médeci aoçat : j aime le risque alors j ai choisi u risque de 0,4 et le traitemet que je propose est efficace (ou actif) à ce risque? = 0,05 est covetioel 3. ON NE DIT PRATIQUEMENT JAMAIS : L EXACTITUDE DE L HYPOTHESE NULLE EST DEMONTREE 4. ON N ENCHAINE PAS LES TESTS DE FAÇON INCONSIDEREE E effet, les risques de coclusio à tort augmetet alors. Par eemple, supposos que l o veuille tester l égalité à ue valeur doée de deu proportios (e : succès d ue itervetio chirurgicale das deu services hospitaliers, le pourcetage de succès sur la Frace état par ailleurs cou (doées de l aée précédete par eemple)). Que se passe-t-il si l o effectue deu tests successifs dot les hypothèses ulles sot : service 1 : 1 = 0 ; puis service 2 : 2 = 0. Le risque de première espèce global de la procédure eprime la probabilité de dire au mois ue fois (soit au cours du premier test soit au cours du secod) H 1 alors que H 0 est vraie les deu fois : Pr(coclure H 1 au mois ue fois si H 0 est vraie) = 1 - Pr(e rejeter H 0 aucue des deu fois si H 0 est vraie) 120/179 Biostatistique - Carrat, Mallet, Morice

121 Les tests d hypothèses. Pricipes Or Pr(e pas rejeter H 0 si H 0 est vraie) = 1 - Doc Pr(e rejeter H 0 aucue des deu fois si H 0 est vraie) = (1 - ) 2 d où u risque total = 1 - (1 - ) 2 Eemple Si = 0,05, le risque global est eviro 0,10. Cette situatio s aggrave si le ombre de tests s accroît. Aisi, das le cas de 3 services le risque global est 0,14 10 services le risque global est 0, services le risque global est 0,994 Cela sigifie par eemple que das le cas où 10 services sot à comparer à ue référece il y a 4 chaces sur 10 pour qu au mois ue fréquece observée s écarte de faço sigificative de la valeur de référece, alors qu e réalité tous les résultats sot homogèes. Si l o pred la fréquece observée la plus différete de la valeur de référece, le test permettra de coclure, à tort, avec ue probabilité supérieure à 0,4. E fait, lorsque l o désire faire des comparaisos multiples, des tests spécifiques doivet être utilisés de faço que les coclusios puisset être tirées avec u risque d erreur global de 5%. 5. IL EST DANGEREUX ET ERRONE DE CHOISIR LES HYPOTHESES AU VU DES DONNEES Lorsque l o opère de cette faço, o a e réalité réalisé plus ou mois cosciemmet u ombre idétermié de tests que l o a jugés o cocluats. LA STRATEGIE D ANALYSE DES DONNEES DOIT ETRE FIXEE CLAI- REMENT AVANT LA REALISATION DE L EXPERIENCE Biostatistique - Carrat, Mallet, Morice 121/179

122 Résumé du chapitre Les tests d hypothèses. Pricipes A. Etapes de mise e œuvre des tests : 1. Eamier le problème médical, aboutir à ue formulatio sous forme d ue questio simple mettat e jeu deu hypothèses H 0 (précise, dite hypothèse ulle) et H 1 (cotraire de H 0, dite hypothèse alterative). Eocer ces hypothèses. 2. Costruire u paramètre dépedat des doées à veir dot o coaisse la distributio si H 0 est juste. 3. Choisir le seuil ; = 0,05 4. Mettre e place la règle de décisio sur la base d u itervalle de pari au risque. 5. Faire l epériece, les calculs et coclure sur le pla statistique. E particulier idiquer le degré de sigificatio du test e cas de rejet de l hypothèse ulle. 6. Se livrer à ue iterprétatio médicale des résultats du test (ce poit sera revu au chapitre 15). Vérifier les coditios de validité à l étape 2 ou l étape 5. B. Mettre e œuvre u test c est accepter deu risques d erreur : le risque de première espèce,, chiffrat la probabilité de rejeter H 0 alors qu elle est vraie, le risque de deuième espèce,, chiffrat la probabilité de e pas rejeter H 0 alors qu elle est fausse. La valeur 1- s appelle la puissace du test et mesure l aptitude du test à détecter u écart etre la réalité et l hypothèse ulle. Cette puissace augmete avec la taille des échatillos sur lesquels a été mis e œuvre le test. 122/179 Biostatistique - Carrat, Mallet, Morice

123 Chapitre 12 Quelques tests usuels Quelques tests usuels 12.1 Tests cocerat des variables de Beroulli Test d égalité d ue proportio «vraie» à ue valeur doée (ou test de comparaiso d ue proportio observée à ue valeur doée) Mise e place du test Eemple : les souris du chapitre précédet 1. Les hypothèses e présece H0 (hypothèse ulle) : la proportio «vraie» (de souris cacéreuses das la populatio des souris traitées) est égale à 0 (proportio hypothétique ou supposée qu o se doe pour le test). H1 (hypothèse alterative) : la proportio «vraie» est différete de 0. Notatios : H 0 : = 0 H 1 : 0 2. Défiitio du paramètre P 0 Z = où P représete la variable aléatoire proportio. Sous H 0, Z est à peu près distribuée selo N(0, 1) Biostatistique - Carrat, Mallet, Morice 123/179

124 Quelques tests usuels [coditios de validité : 0 5 et (1-0 ) 5] 3. Choi d u seuil de sigificatio Costructio de l itervalle de pari de iveau 1 - : IP 1 Eemple : = 0,05 IP 0,95 = [-1,96 ; 1,96] (lu das la table de la distributio ormale) 4. Mise e place de la procédure de décisio Lorsque les doées serot dispoibles o obtiedra ue valeur du paramètre Z, soit : p 0 z = Si z IP 1 o rejette H 0 et o dit : au risque l hypothèse d égalité de la proportio «vraie» et de la valeur doée est fausse ; ou, au risque, la proportio «vraie» est différete de la valeur doée. Si z IP 1 o e rejette pas H 0 ou «o e coclut pas». 5. Recueil des doées. Coclusio Rappelos les coditios de validité : 0 5 et (1-0 ) Autre iterprétatio du paramètre z Regardos la forme du paramètre z. O coclut (c est-à-dire o rejette H 0 ) si z u ; u c està-dire si z u soit si : p 0 u c est-à-dire si la proportio observée p est suffisammet différete de 0. Voilà pourquoi o dit que l o compare p et 0. C est pourquoi o dit aussi, lorsque H 0 est rejetée : La proportio observée est sigificativemet différete de la valeur doée, au risque (0,05), ou ecore : la différece etre p et 0 est sigificative. Ce qui idique ue différece etre la valeur doée et la proportio «vraie». Lorsque H 0 est pas rejetée, o dit : la proportio observée est pas sigificativemet différete de la valeur doée. Très importat : ue même différece p - 0 peut être ou o sigificative selo la valeur de. Si l o vous demade : p = 0,25 et 0,2, sot-elles sigificativemet différetes, e répodez-pas ; demadez : quelle est la taille de l échatillo sur lequel p a été calculé, à quel risque? 124/179 Biostatistique - Carrat, Mallet, Morice

125 Quelques tests usuels Nombre de sujets écessaires Si o cosidère qu e réalité = 1, le ombre de sujets écessaires pour obteir ue puissace 1- ( < 0,5) est approimativemet doé par u = Coditios de validité : 0 5 et 0 ) Test d égalité de deu proportios «vraies» (ou test de comparaiso de deu proportios observées) Mise e place du test Repreos l eemple des souris mais e supposat maiteat que l o e coaît plus la fréquece «vraie» de cacer chez les souris o traitées (le 0,2 d alors). O se pose toujours la même questio relative à l activité du traitemet. O est ameé à reformuler légèremet le problème et idetifier l absece d activité du traitemet à l égalité des proportios «vraies» de souris cacéreuses das deu populatios, l ue traitée l autre o traitée, et l activité à ue différece etre ces deu pourcetages. O otera A et B les deu populatios, A et B les fréqueces «vraies» de souris cacéreuses das ces deu populatios, A et B les tailles des échatillos sur lesquels o calculera p A et p B, les fréqueces observées correspodates. Mettos e place le test. 1. Les hypothèses e présece H 0 hypothèse ulle : les fréqueces «vraies» sot égales A = B H 1 hypothèse alterative : les fréqueces «vraies» sot différetes A B 2. Costructio d u paramètre dot o coaisse la loi sous l hypothèse ulle (i.e. si H 0 est vraie) C est ue étape u peu délicate (le lecteur peu curieu peut passer rapidemet sur ces développemets). Essayos de ous rameer à u cas cou : comparaiso d u pourcetage observé à ue valeur doée, problème associé au hypothèses suivates : H 0 : = 0 H 1 : 0 O y parviet e reformulat les hypothèses H 0 : A - B = 0 H 1 : A - B 0 Il s agit doc de comparer à 0 la différece A - B. P 0 Auparavat o formait le paramètre Biostatistique - Carrat, Mallet, Morice 125/179

126 Quelques tests usuels v.a. proportio valeur théorique qui peut s iterpréter comme écart-type de la v.a. proportio différece des v.a. proportios valeur théorique Alors o va former écart-type des différeces des v.a. proportios P A P B soit écart-type des différeces des v.a. proportios La difficulté est de former l epressio de l écart type des différeces des % epérimetau. Remarquos d abord que les variables aléatoires P A et P B sot idépedates ; cette idépedace résulte du fait que ce est pas parce que l o a trouvé ue souris cacéreuse das la populatio des souris traitées que l o a plus ou mois de chaces de trouver ue souris cacéreuse ou o das la populatio o traitée. Alors : var(p A - P B )= var(p A )+ var(-p B )= var(p A )+ var(p B ) (voir chapitre 6) Par ailleurs, sous l hypothèse ulle, les moyees «vraies» A de P A et B de P B sot idetiques, et leur valeur commue, icoue, est otée. D où : varp A si A et B sot les tailles des échatillos sur lesquels P A et P B sot calculées. Doc : varp A 1 1 = et varp B = A P B A Maiteat, reste icou ; il s agit de la valeur «vraie» commue des pourcetages. Le mieu pour l estimer est de mélager les deu populatios - elles cotieet sous H 0 le même pourcetage de souris cacéreuses - et dire : ombre de souris cacéreuses das les deu échatillos proche de ˆ = ombre total de souris A p A + B p B soit : ˆ = A + B Fialemet o adopte le paramètre suivat : Z P A P B = ˆ 1 ˆ ˆ 1 ˆ A B A p A + B p B avec ˆ = A + B Sous l hypothèse ulle Z est à peu près distribuée selo N(0, 1). Coditios de validité : A ˆ 5 A 1 ˆ 5 B ˆ 5 B 1 ˆ 5 B 1 1 = B 126/179 Biostatistique - Carrat, Mallet, Morice

127 Quelques tests usuels 3. Choi d u seuil de sigificatio ( = 0,05). Costructio de l itervalle de pari e. : IP 0,95 = [-1,96 ; 1,96] IP 1 lu das ue table. 4. Mise e place de la procédure de décisio Si z, dot o coaîtra la valeur ue fois l epériece réalisée IP 0,95 o e coclut pas IP 0,95 o rejette H 0 : ue proportio est alors plus grade que l autre. p A p B 5. Réalisatio de l epériece, calcul de z = , coclusio. ˆ 1 ˆ ˆ 1 ˆ Nombre de sujets écessaires A B Pour obteir ue puissace 1 - ( < 0,5) sur la base de 2 échatillos de même taille, la valeur miimale de est doée par la formule approchée suivate 2 2ˆ u 2 1 ˆ A + B = A B 2 avec ˆ = Coditios de validité : A 5, A ) 5, B 5 et B ) Tests cocerat des variables quatitatives Tests impliquat ue valeur doée Ces tests coceret les variables quatitatives cotiues et permettet de traiter les types de questios suivates : 1. la moyee «vraie» de la taille des idividus das ue sous-populatio est-t-elle égale à la moyee «vraie» de la taille des idividus das la populatio géérale, cette taille moyee état coue par ailleurs. 2. la distributio de la taille des idividus das cette sous populatio est-elle dissymétrique par rapport à cette moyee «vraie», c est-à-dire témoige-t-elle d ue iégalité de fréqueces etre les «petites» tailles et les «grades tailles», ce qui est le cas par eemple si la fréquece des «20-25 cms de mois que la moyee» est différete de celle des «20-25 cms de plus que la moyee»? Ces deu tests sot apparetés das la mesure où le premier met à l épreuve E(X) = 0, l autre le Biostatistique - Carrat, Mallet, Morice 127/179

128 Quelques tests usuels fait que X - 0 et 0 - X ot la même desité de probabilité. Cette derière coditio, qui etraîe alors E(X)- 0 = 0 - E(X) et doc E(X)= 0, état plus cotraigate que la première Test d égalité d ue moyee «vraie» à ue valeur doée (ou test de comparaiso d ue moyee observée à ue valeur doée) Ce cas cocere les variables quatitatives cotiues et est valide que lorsque Les hypothèses e présece : H 0 : la moyee «vraie» est égale à avec la valeur doée 0 : = 0 H 1 : 0 2. Costructio du paramètre Z M 0 = s Z est à peu près distribué selo N(0, 1). Cela résulte du théorème cetral limite, à ceci près que s 2 est utilisé à la place de 2. O admettra que Z est tout de même distribué selo ue distributio ormale. 3. Choi du seuil ; = 0,05 Costructio de l itervalle de pari cetré IP 1 IP 1 = u ; u ; u 0,05 = 1,96 4. Défiitio de la règle de décisio La règle de décisio est tout à fait similaire au cas des proportios. Si z IP 1, rejet de H 0. O dit alors : au risque la moyee «vraie» diffère de la valeur doée ou, pour les mêmes raisos que pour les proportios : la moyee observée est sigificativemet différete, au risque, de la valeur doée ; ou ecore : la moyee observée et la valeur doée sot sigificativemet différetes, au risque. Si z IP 1, o e coclut pas. La moyee observée est pas sigificativemet différete de la valeur doée. m 0 5. Recueil des doées. Calcul de z = Coclusio. s Nombre de sujets écessaires Pour rejeter H 0 avec ue puissace 1 - ( < 0,5), lorsque = 1 et que X a pour variace 2, il faut costituer u échatillo dot la taille miimale est doée par la formule approchée suivate = u /179 Biostatistique - Carrat, Mallet, Morice

129 Quelques tests usuels Coditio de validité : Test de symétrie d ue variable (X) par rapport à ue valeur doée ( 0 ) : test de Wilcoo 1. Les hypothèses e présece : H 0 : les variables X - 0 et 0 - X ot même desité de probabilité H 1 : les variables X - 0 et 0 - X ot pas la même desité de probabilité 2. Costructio du paramètre Le paramètre est costruit à partir des valeurs ordoées par ordre croissat des valeurs absolues des i - 0 où les i sot les valeurs de X observées das l échatillo ; à chaque valeur o associe so rag de classemet et l o garde la mémoire de so sige. O attribue au évetuels e-æquo u rag commu égal à la moyee des rags qu ils occupet. Eemple Si les valeurs observées (qui e serot dispoibles qu après réalisatio de l epériece) sot : -2,3 ; 4 ; 1 ; 5,6 ; -1,2 Le classemet sera : 1 (+) ; 1,2 (-) ; 2,3 (-) ; 4 (+) ; 5,6 (+) O s itéresse alors à la somme des rags des places occupées par les valeurs positives, appelée T +. Ici la valeur de T + serait = 10. Le paramètre du test est : T Z = La variable Z a ue distributio coue : Lorsque > 15 cette distributio est à peu près N(0, 1). Pour 15, il s agit d ue distributio faisat l objet d ue table spécifique, la table du test de Wilcoo. 3. Choi du seuil ; = 0,05 Costructio de l itervalle de pari cetré IP 1 IP 1 = W ; W ; lorsque > 15, W = u 4. Défiitio de la règle de décisio Si z IP 1, rejet de H 0. O dit alors : au risque la desité de probabilité de X est pas symétrique par rapport à 0 ; selo le sige de z, o coclura que X est «plutôt plus grad que 0», ou que X est «plutôt plus petit que 0». Si z IP 1, o e coclut pas ; o e rejette pas H Biostatistique - Carrat, Mallet, Morice 129/179

130 Quelques tests usuels 5. Recueil des doées, calcul de z, coclusio. Remarque : si < 6 ce test e permet jamais de rejeter H Tests de comparaiso de variables quatitatives Ces tests coceret les variables quatitatives cotiues et permettet de traiter les types de questios suivates : 1. la moyee «vraie» de la taille des idividus das ue sous-populatio A est-t-elle égale à la moyee «vraie» de la taille des idividus das ue autre sous-populatio B, ces moyees «vraies» état pas coues. 2. la distributio de la variable aléatoire taille des idividus das la populatio A coïcide-t-elle avec la distributio de la variable aléatoire taille des idividus das la populatio B. Ces deu tests sot apparetés, l hypothèse d égalité des distributios état plus cotraigate que l hypothèse d égalité des moyees «vraies» seules. Das les deu cas o va réaliser ue epériece mettat e jeu deu échatillos issus des deu populatios, à l issue de laquelle o disposera de deu séries de valeurs de taille (les ombres de valeurs observées sot otés respectivemet A et B ) Test d égalité de deu moyees «vraies» (ou test de comparaiso de deu moyees observées) Ce test est valide que lorsque A et B sot 30, cas dit des grads échatillos. Il s agit d u problème très proche du problème traité e Les hypothèses e présece H 0 hypothèse ulle : les moyees «vraies» das les deu populatios sot égales A = B H 1 hypothèse alterative : A B 2. Costructio du paramètre : cette costructio suit les mêmes liges que précédemmet et o obtiet Z M B = M A 2 s A A s B 2 B Z est à peu près distribuée selo N(0, 1). 3. Choi d u seuil de sigificatio (0,05) Costructio de l itervalle de pari IP 1 (IP 0,95 ) 130/179 Biostatistique - Carrat, Mallet, Morice

131 Quelques tests usuels 4. Règle de décisio 5. Mise e œuvre de l epériece. Calculs : A m A = ia et s A = A 1 ia m A 2 A i = 1 B les ia et ib état les valeurs de tailles observées das les échatillos des populatios A et B respectivemet. Coclusio. Nombre de sujets écessaires Pour détecter ue différece de moyees avec ue puissace 1 - ( < 0,5) il faut costituer deu échatillos, chacu de taille au mois égale à, valeur doée par la formule approchée suivate où 2 A et 2 B sot les variaces das les populatios u 2 2 A + B = A B 2 Coditio de validité : Test d égalité de deu distributios (ou test de comparaiso de deu distributios observées) : test de Ma-Whitey-Wilcoo 1. Les hypothèses e présece A i = m B = ib et s B = B 1 ib m B 2 z B i = 1 m B = m A 2 s A A s B 2 B B i = 1 H 0 les desités de probabilité coïcidet das les deu populatios : f A = f B H 1 les desités de probabilité e coïcidet pas : f A f B 2. Costructio du paramètre : cette costructio suit les mêmes liges que celles du test de Wilcoo décrit sectio Par covetio, o cosidère que A B. O ordoe par valeurs croissates l esemble des doées observées (dot o disposera après réalisatio de l epériece). O attribue au évetuels e-æquo u rag commu égal à la moyee des rags qu ils occupet. Puis o calcule la somme des rags de classemet occupés par les doées issues de l échatillo de la populatio A, soit T A Biostatistique - Carrat, Mallet, Morice 131/179

132 Quelques tests usuels A A + B + 1 O calcule égalemet = T A Puis T A de la faço suivate : si > 0 T A = T A - 0,5 si < 0 T A = T A + 0,5 Eemple Si les valeurs observées sot : Echatillo de populatio A : 1,7 ; 6,1 ; 3,2 ; 1,5 Echatillo de populatio B : 4,3 ; 0,5 ; 1,1 ; 2,7 ; 5,4 Le classemet coduit à 0,5 (B) ; 1,1 (B) ; 1,5 (A) ; 1,7 (A) ; 2,7 (B) ; 3,2 (A) ; 4,3 (B) ; 5,4 (B) ; 6,1(A) et à T A = = 22. Efi = /2 = 2. Doc T A = 21,5. Le paramètre du test est : T A A A + B Z = lorsque A et B 10 A B A + B T A A A + B Z = lorsque A ou B > 10 A B A + B Z a ue distributio coue : Lorsque A ou B >10 cette distributio est à peu près N(0,1). Lorsque A et B 10, il s agit d ue distributio faisat l objet d ue table spécifique, la table du test de Ma-Whitey-Wilcoo. 3. Choi du seuil ; = 0,05 Costructio de l itervalle de pari IP 1 Cet itervalle est du type IP 1 = M ; M Eemple : si A = 3 et B = 5, o a M 0,05 = 2, Règle de décisio Si z IP 1, rejet de H 0. O dit alors : au risque la desité de probabilité de la variable étudiée est pas la même das les populatios A et B ; selo le sige de z, o coclura que la variable est «plutôt plus grade das A que das B», ou que la variable est «plutôt plus petite das A que das B». Si z IP 1, o e coclut pas ; o e rejette pas H Mise e œuvre de l epériece ; calcul de z ; coclusio. 132/179 Biostatistique - Carrat, Mallet, Morice

133 Quelques tests usuels Remarque : si A < 3 ou B < 4, ce test e permet jamais de rejeter H Cas des séries appariées Jusqu à préset o a supposé que les tirages (la costitutio) des échatillos des populatios A et B étaiet idépedats. Il arrive que cette coditio e soit pas vérifiée, que les idividus des deu échatillos soiet liés. Ceci se produit das les eemples suivats : pour comparer le iveau de sévérité de deu eamiateurs, o fait corriger 100 copies par chacu d eu, c est-à-dire chacu corrigeat chacue de ces copies, et il s agit de comparer les otes moyees. pour comparer deu méthodes de dosage de la glycémie o dose 100 prélèvemets de sag par chacue de ces deu méthodes et l o souhaite comparer les valeurs moyees «vraies». La procédure idiquée plus haut e coviet plus. A u momet de la mise e place des tests o avait à calculer la variace de la différece des moyees observées. O avait dit qu elle coïcide avec la somme des variaces de chacue des moyees. Ici, c est fau ; o peut s e covaicre facilemet. Supposez qu u correcteur accorde systématiquemet u poit de plus que so collègue à toutes les copies. Alors, quoi qu il arrive, la différece des moyees observées sera 1, doc cette différece est pas soumise au fluctuatios d échatilloage ; sa variace est ulle, doc a rie à voir avec les variaces de chacue des moyees qui, elles - ces variaces -reflètet les différeces de qualité etre les copies. O motre que le bo abord du problème est de travailler sur les différeces des paires de valeurs obteues par uité statistique (différece des otes, différece des glycémies par idividu). Cela reviet au problème de la comparaiso d ue moyee (moyee des différeces) à zéro ou à la questio de la symétrie d ue distributio (celle des différeces) par rapport à zéro. O se ramèe aisi à des tests que l o coaît (cf. sectio ). O ote d la variable aléatoire différece etre résultats pour u même sujet Test de comparaiso de deu moyees observées sur séries appariées Ce test est valide que si 30 Les étapes de mise e œuvre du test sot les suivates : 1. H 0 : la moyee «vraie» de d est ulle, soit = 0. H 1 : la moyee «vraie» de d est o ulle, soit Costructio du paramètre Z = M d s où s 2 est la variace observée des différeces, soit s 2 = d 1 i m d 2 i = Biostatistique - Carrat, Mallet, Morice 133/179

134 Quelques tests usuels est le ombre de paires Md est la variable aléatoire moyee arithmétique des différeces et m d est la moyee observée des différeces. O motre que Z est à peu près distribuée selo N(0, 1). Les étapes se succèdet alors de faço ordiaire : choi de, costructio de l IP, défiitio de la règle de décisio, calcul de Pour le ombre de sujets écessaires, se reporter à la sectio page 128 z = m d , coclusio. s Remarque Si les otes attribuées par chacu des correcteurs variet gééralemet das le même ses - c està-dire ue copie mieu otée qu ue autre par le premier eamiateur le sera égalemet par le secod - alors la valeur absolue de z calculée sur la base de l appariemet est supérieure à la valeur absolue que l o aurait obteue e «oubliat» l appariemet. Aisi, toutes choses égales par ailleurs, o coclura plus fréquemmet au rejet de l hypothèse ulle : le test aisi mis e place est plus puissat. O a eploité plus d iformatio. O a gommé ue source de fluctuatios, celle liée à la disparité de la qualité des copies. Si cet effet de variatio das le même ses est pas réel (e. : lorsque l u ote la copie, l autre la ote 20 - ) le problème das so esemble a plus beaucoup de ses Test de symétrie de la distributio des différeces Ce test est u cas particulier du test vu au paragraphe car les hypothèses cosidérées das ce cas sot les suivates : 1. Hypothèses e présece H 0 : La desité de probabilité de la variable aléatoire d est symétrique par rapport à zéro. H 1 : La desité de probabilité de la variable d est pas symétrique par rapport à zéro ; il eiste des domaies de valeurs de d plus probables que leur opposé (par eemple si le domaie [2,1 ; 2,4] est plus probable que le domaie [-2,4 ; -2,1]). 2. Costructio du paramètre Le paramètre se costruit comme e : o rage das l ordre croissat de leurs valeurs et sas teir compte de leur sige les différeces d i. La suite se déroule comme e /179 Biostatistique - Carrat, Mallet, Morice

135 Résumé du chapitre Quelques tests usuels 1. Comparaiso d ue proportio observée à ue valeur doée p 0 z = ; v.a. ~ N(0, 1) ; validité 0 5 et (1-0 ) Comparaiso de deu proportios observées p A p B A p A + B p B z = ; v.a. ~ N(0, 1) ; ˆ = ˆ 1 ˆ ˆ 1 ˆ A + B A B validité : A ˆ 5 A 1 ˆ 5 B ˆ 5 B 1 ˆ 5 3. Comparaiso d ue moyee observée à ue valeur doée z m 0 = ; v.a. ~ N(0, 1) ; validité 30 s Test de symétrie d ue variable par rapport à ue valeur doée Ordoer les valeurs absolues des écarts à la valeur doée et calculer T +, somme des rags des écarts positifs. T z = ; v.a. ~ N(0, 1) si > 15 ; v.a. Wilcoo sio Comparaiso de deu moyees observées z m B = ; v.a. ~ N(0, 1) ; validité A et B 30 m A 2 s A A s B 2 B 6. Test d égalité de deu distributios (o suppose A B ) A A + B + 1 Ordoer les valeurs. T A = somme des rags des doées A. = T A T A = T A - 0,5 si > 0, T A = T A + 0,5 sio z z = = T A A A + B N 0 1 lorsque A ou B > 10 A B A + B T A A A + B Ma-Whitey-Wilcoo si A et B 10 A B A + B Comparaiso de deu moyees observées sur séries appariées O utilise le test 3 e comparat la moyee de la variable différece d à 0 8. Test de symétrie des différeces (séries appariées) O utilise le test 4 de symétrie de la variable d par rapport à Biostatistique - Carrat, Mallet, Morice 135/179

136 Quelques tests usuels 136/179 Biostatistique - Carrat, Mallet, Morice

137 Tests cocerat des variables qualitatives Chapitre 13 Tests cocerat des variables qualitatives Itroductio O a jusqu à préset complètemet égligé les variables qualitatives à plus de deu modalités. O a e effet toujours parlé de moyee, et cette otio eiste pas pour les variables qualitatives, sauf pour celles à deu modalités grâce à u artifice de codage. Il y a pas d istrumet permettat de résumer la distributio d ue variable qualitative ; il faut cosidérer la distributio das so esemble, c est-à-dire l esemble des probabilités pour que telle ou telle modalité se réalise. Pourtat des problèmes de choi d hypothèses se poset égalemet das le cas de telles variables ou tels caractères (e : la répartitio [distributio] de la couleur des cheveu diffère-t-elle chez les habitats de tel départemet et de tel autre?). Si la répartitio du caractère est coue das ue des deu populatios, o aura à comparer ue répartitio «observée» à ue répartitio doée. Si les deu répartitios sot icoues, o aura à comparer deu répartitios «observées». Ces problèmes sot respectivemet les homologues des tests de comparaiso d ue moyee à ue valeur doée, de comparaiso de deu moyees. Il eiste des tests adaptés à chacu de ces cas Comparaiso d ue répartitio observée à ue répartitio doée ou test du 2 d ajustemet Supposos que l o souhaite savoir si la répartitio de la couleur des cheveu das la populatio des habitats du départemet A diffère de la répartitio de la couleur des cheveu das la populatio fraçaise, cette derière répartitio état supposée doée. Supposos qu il y ait k couleurs répertoriées. O est alors ameé à cosidérer ue variable qualitative à k modalités. Notos i la probabilité de surveue de l évéemet «la i ème modalité est observée». Eemple : 1 = probabilité qu u idividu tiré au hasard das le départemet A ait les cheveu blods 2 = probabilité qu u idividu tiré au hasard das le départemet A ait les cheveu brus Biostatistique - Carrat, Mallet, Morice 137/179

138 Tests cocerat des variables qualitatives etc... Notos par ailleurs hi la proportio «vraie» de la modalité i das la populatio fraçaise. O s apprête à réaliser ue epériece sur idividus à l issue de laquelle o disposera d u esemble de O i (O i = ombre d idividus présetat la modalité i du caractère étudié, parmi les idividus de l échatillo) Les étapes de mise e œuvre 1. Les hypothèses e présece Deu hypothèses sot e présece : i. la répartitio «vraie» de la variable das la populatio étudiée coïcide avec la répartitio doée (hypothèse ulle H 0 ) ii. les répartitios diffèret (hypothèse alterative H 1 ) Avec les otatios précédemmet itroduites, cela s écrit : H 0 : hypothèse ulle : i = hi pour tous les i de 1 à k. H 1 : hypothèse alterative : i hi pour au mois ue modalité, c est-à-dire pour au mois u i. 2. Costructio du paramètre O a déjà mis e place ce test das le cas d ue variable (0-1) c est-à-dire d ue variable à deu modalités. Das ce cas, les hypothèses e présece étaiet bie du type ci-dessus c està-dire H 0 : = h1 et 1 - = h2 = 1 - h1 ce qui s écrit avec les ouvelles otatios : 1 = h1 et 2 = 1 - h1 Mais o avait reteu que la coditio = h1 (e fait = ) car das ce cas les deu coditios ci-dessus sot redodates. Le paramètre calculé reteu était : p h1 z = h1 1 h Calculos so carré z 2 p h1 2 p h1 2 p h1 2 = = h1 1 h1 h1 1 h1 z 2 p h1 2 1 p 1 h p h1 2 1 p h2 2 = = h1 h1 h1 h2 138/179 Biostatistique - Carrat, Mallet, Morice

139 Tests cocerat des variables qualitatives 3. Itervalle de pari état choisi (0,05), costructio de l itervalle de pari IP 1 La variable 2 a l allure présetée figure 13. O remarque qu il serait stupide de choisir l i- Or p = ombre d idividus observés présetat la valeur 1 c est-à-dire la modalité 1 de la variable ; or sous H 0 la probabilité de cette modalité est h1. O s atted doc à observer h1 idividus présetat cette valeur. Ce ombre d idividus attedu s appellera effectif attedu ou calculé de la première modalité et sera oté A 1. De la même faço, (1 - p) = ombre d idividus observés présetat la valeur 0 c est-à-dire la modalité 2 de la variable ; or sous H 0 la probabilité de cette modalité est h2 =1- h1. O s atted doc à observer h2 idividus présetat cette valeur. Ce ombre d idividus attedu s appellera effectif attedu ou calculé de la secode modalité et sera oté A 2. D où z 2 O 1 A 1 2 O 2 A 2 2 = A 1 A 2 où les O i représetet les effectifs observés das les différetes modalités, les A i représetet les effectifs hi dits prévus ou calculés ou ATTENDUS das les différetes modalités. GENERALISATION Lorsque les variables cosidérées ot plus de deu modalités, o gééralise le calcul ci-dessus et o retiet le paramètre suivat : k O i A i 2 Q = i = 1 A i où la somme s éted à toutes les k modalités de la variable. O rappelle que les O i sot les effectifs observés, et que les A i valet hi. O remarque que Q chiffre l écart etre ce qui est prévu par l hypothèse H 0 et ce qui est obteu ; cet écart se fode aturellemet sur les différeces O i - hi car hi est le ombre attedu d idividus présetat la modalité i. Eemple : si hi = 0,4, sur 100 idividus o e atted 40 présetat la modalité i. C est le ombre que l o aurait si la distributio d échatilloage coïcidait avec la distributio hypothétique. Par ailleurs o a pu motrer (résultat dû à Pearso) que sous H 0 (et si tous les A i 5) ce paramètre a ue distributio qui e déped que du ombre de modalités, k. Cette distributio porte le om de DISTRIBUTION DE 2. Si bie que l o peut former - grâce ecore à ue table - u itervalle de pari de iveau doé relatif à cette variable. RETENONS : CONDITIONS DE VALIDITE : TOUS LES A i DOIVENT ETRE AU MOINS EGAUX A Biostatistique - Carrat, Mallet, Morice 139/179

140 Tests cocerat des variables qualitatives tervalle de pari cetré dessié sur cette figure car alors des valeurs umériques voisies de zéro pour la valeur Q c du paramètre Q seraiet das la régio critique du test ; or des valeurs proches de zéro sot plutôt compatibles avec H 0 d où le choi suivat (voir figure 14) : IP 1 = 0 ; K ddl, C est cette valeur, otée K ddl, qui est lisible directemet das ue table. Remarque : otez que cet itervalle, bie que o symétrique autour de la moyee, respecte la défiitio d u itervalle de pari doée sectio page 94. Figure 13 : distributio de 2 Figure 14 : distributio de 2 Usage de la table Cette table comporte - comme celle du t de Studet - ue etrée etière appelée ombre de degrés de liberté (ddl). O motre que pour le test evisagé ici ombre de degrés de liberté = ombre de modalités /179 Biostatistique - Carrat, Mallet, Morice

141 Tests cocerat des variables qualitatives Eemple : K 5;0,05 (5 ddl, si 6 modalités) = 11,07 La suite de la mise e place de ce test est usuelle. 4. Règle de décisio Si Q c K ddl, o e coclut pas Si Q c K ddl, H 0 est rejetée. Cela sigifie que l o coclut que la répartitio du caractère étudié (par eemple la couleur des cheveu das le départemet A) e coïcide pas - ou e s ajuste pas - avec la répartitio doée (par eemple la répartitio de la couleur des cheveu das la populatio fraçaise). O admet, e formulat cette coclusio, u risque d erreur égal à. 5. Recueil des doées et coclusio Eemple umérique : le tableau ci-dessous présete ue applicatio umérique de l eemple cosidéré. couleur des cheveu blods brus rou total effectifs observés (O i ) () effectifs attedus (A i = hi ) répartitio doée ( hi ) 14,8 11,1 11,1 37 0,4 0,3 0,3 1 Les coditios de validité sot vérifiées (A i 5). O obtiet ici : 25 14, , , 1 2 Q c = = 13, 3 14, 8 11, 1 11, 1 O sait que Q est distribué selo u 2 à (3-1) degrés de liberté ; o lit das la table : K 2;0,05 = 5,99. Aisi, la valeur calculée appartiet pas à l itervalle de pari : o coclut que la répartitio du caractère e coïcide pas avec la répartitio doée Biostatistique - Carrat, Mallet, Morice 141/179

142 Tests cocerat des variables qualitatives Cas particulier : variable à deu modalités O a vu que le paramètre du test Q gééralise l epressio du carré du paramètre Z utilisé pour la comparaiso d ue proportio observée à ue valeur doée. Das le cas d ue variable à deu modalités (k = 2), ces deu paramètres sot égau : Q = Z 2. E outre, et sio il y aurait icohérece, o peut vérifier l égalité suivate : 2 K 1; = u Eemple : pour = 0,05 K 1;0,05 = 3,84 = (1,96) 2 Aisi, pour comparer ue répartitio observée à ue répartitio doée, das le cas d ue variable à deu modalités, o dispose de 2 tests équivalets, l u fodé sur la distributio ormale, l autre fodé sur la distributio du 2 à 1 d.d.l. (qui est e fait la distributio du carré de N(0, 1)). O peut utiliser l u ou l autre de ces tests idifféremmet. Eemple : Repreos l eemple du chapitre 11 Ue race de souris présete u tau de cacers spotaés de 0,2. Sur 100 souris traitées o observe 34 cacers soit p = 0,34. La différece est elle sigificative? test de comparaiso : 034, 0, 2 z = = 3, 5 02, 0, test du 2 : cacer absece de cacer répartitio théorique 0,2 0,8 effectifs attedus effectifs observés Q c = = 12, 25 = 3, (effectif total) Remarque : O parle souvet de ce test sous la termiologie «test du 2 d ajustemet» pour eprimer qu il met à l épreuve l ajustemet - la compatibilité - etre ue répartitio observée et ue répartitio doée. 142/179 Biostatistique - Carrat, Mallet, Morice

143 Tests cocerat des variables qualitatives 13.2 Comparaiso de plusieurs répartitios observées ou test du 2 d homogééité O repred l eemple précédet cocerat la répartitio de la couleur des cheveu mais sas plus supposer que l ue de ces répartitios est coue ; il s agit par eemple des répartitios de ce caractère das deu départemets. O souhaite doc comparer deu répartitios observées. Pour cela, o s apprête à réaliser ue epériece mettat e jeu deu échatillos, u échatillo de 1 idividus issu de la populatio des habitats du départemet 1, et u échatillo de 2 idividus issu de la populatio des habitats du départemet 2. A l issue de cette epériece o disposera d u esemble d effectifs observés, otés de la faço suivate : O 1i est le ombre d idividus du premier échatillo présetat la modalité i de la variable. O 2i est le ombre d idividus du secod échatillo présetat la modalité i de la variable. Le test se met e place de la faço suivate : 1. Les hypothèses e présece H 0 : les répartitios «vraies» de la variable sot idetiques das les deu populatios H 1 : les répartitios «vraies» sot différetes Ces hypothèses se schématiset par : H 0 : 1i = 2i pour toutes les modalités i. H 1 : 1i 2i pour au mois ue modalité i. 2. Costructio du paramètre C est ecore ici le poit délicat. La solutio ressemble das so approche à celle du problème de la comparaiso de deu pourcetages. Clé du pricipe : o mélage les deu populatios pour calculer ue pseudo-répartitio théorique. O se retrouve alors pratiquemet das la situatio du paragraphe précédet. Cela se verra mieu sur u eemple. O va faire, pour des raisos de simplicité de calcul, ue petite etorse à otre faço de procéder, et directemet évaluer le paramètre dot o coaît la loi. i. O costruit ce que l o appelle u tableau de cotigece qui cotiet les résultats epérimetau. O a procédé à ue epériece portat sur 37 idividus issus de la populatio 1 et 40 idividus issus de la populatio 2. Les résultats sot les suivats : Biostatistique - Carrat, Mallet, Morice 143/179

144 Tests cocerat des variables qualitatives Tableau 4 : effectifs observés (O 1i et O 2i ) blods brus rou ombre total échatillo = 1 échatillo = 2 ii. O costruit ue pseudo-répartitio de référece, e mélageat les résultats epérimetau, c est-à-dire e oubliat leur origie (populatio 1 ou populatio 2). O obtiet les résultats suivats, e termes d effectifs (première lige), puis e termes de fréqueces (deuième lige). Tableau 5 : répartitio de «référece» blods brus rou ombre total mélage fréqueces 38/77 = 0,49 26/77 = 0,34 13/77 = 0,17 Ces trois fréqueces, 0,49, 0,34, 0,17, vot jouer maiteat le rôle des probabilités hypothétiques hi de la sectio Pour la commodité de l écriture, o les ote respectivemet p 1, p 2, p 3. iii. O forme le tableau des effectifs attedus. Si l hypothèse ulle est juste, c est-à-dire si les répartitios de la couleur des cheveu coïcidet das les deu départemets, o s atted à trouver des effectifs calculés comme suit : effectif attedu pour la modalité i (modalité 1 = blod, modalité 2 = bru, modalité 3 = rou) das l échatillo j (j = 1 ou 2) : j multiplié par p i Par eemple le ombre attedu d idividus brus das l échatillo de la première populatio est : 37 0,34 = 12,6. E effectuat systématiquemet ces calculs, o obtiet le tableau des EFFECTIFS AT- TENDUS. Tableau 6 : effectifs attedus (A 1i et A 2i ) blods brus rou échatillo 1 18,1 ( 1 p 1 ) 12,6 ( 1 p 2 ) 6,3 ( 1 p 3 ) échatillo 2 19,6 ( 2 p 1 ) 13,6 ( 2 p 2 ) 6,8 ( 2 p 3 ) iv. O calcule fialemet le paramètre du test 144/179 Biostatistique - Carrat, Mallet, Morice

145 Tests cocerat des variables qualitatives O motre que le paramètre adapté à ce test est : où k demeure le ombre de modalités de la variable. O a souvet recours à ue epressio plus compacte de l epressio ci-dessus et o écrit : MAIS ICI LA SOMMATION S ETEND A TOUTES LES CASES DES TABLEAUX, umérotées grâce à l idice j. Eemple : das l eemple traité il s agira doc de calculer ue somme de 6 termes. O motre que, si H 0 est vraie, Q est distribué comme u 2 à (3-1) (2-1) degrés de liberté [3 est le ombre de modalités, et 2 le ombre de répartitios] La VALIDITE de ce résultat suppose que tous les effectifs attedus A j soiet au mois égau à 5. GENERALISATION Les calculs ci-dessus se gééraliset à u ombre quelcoque de modalités k, à u ombre quelcoque de populatios m. Le paramètre Q à calculer a alors la forme ci-dessus, où la somme compred km termes. La distributio de Q, sous H 0 est alors u 2 à (k -1)(m - 1) degrés de liberté. Les coditios de validité du test sot : A j 5, 1 j km 3. La suite des étapes de mise e œuvre est classique. La valeur observée de Q, otée Q c, sera comparée à la valeur K ddl;0,05 : si Q c K ddl;0,05 o e coclut pas. Il est pas démotré que les deu répartitios «vraies» diffèret. si Q c K ddl;0,05 o coclut que les deu répartitios observées diffèret sigificativemet. Suite de l eemple : o obtiet : soit : Q Q = = k O 1i A 1i A 1i i = k O 2i A 2i A 2i i = ombre de cases du tableau O j A j A j j = , , , , , , 8 2 Q c = , , , + 19, , , Q c = 996, Or : K 2;0,05 = 5,99 rejet de H 0. Les répartitios observées de la couleur des cheveu diffèret sigificativemet das les deu populatios Biostatistique - Carrat, Mallet, Morice 145/179

146 Tests cocerat des variables qualitatives Remarque 1 : Ce test s appelle aussi test du 2 d homogééité de plusieurs répartitios. Remarque 2 : Cas particulier de deu variables à deu modalités : das le cas où l o cosidère deu variables à deu modalités, c est-à-dire das le cas où le tableau de cotigece est à deu liges et deu coloes, o observe que le problème se réduit à u problème de comparaiso de deu proportios observées. O motre que, das ce cas, la valeur de Q coïcide avec le carré de la valeur de Z, Z état le paramètre formé pour comparer directemet ces proportios (voir chapitre 12) Test d idépedace etre deu variables qualitatives Repreos l eemple précédet et supposos que les populatios 1 et 2, plutôt que de correspodre à des idividus habitat le départemet 1 et le départemet 2, soiet e fait : populatio 1 : populatio des idividus ayat les yeu bleus populatio 2 : populatio des idividus ayat les yeu verts La questio que l o aurait résolue das le paragraphe précédet aurait été : la répartitio de la couleur des cheveu diffère-t-elle das les populatios d idividus au yeu bleus ou verts. Ou ecore, la répartitio de la couleur des cheveu diffère-t-elle selo la couleur des yeu? Autremet dit : la variable couleur des cheveu déped-elle statistiquemet de la variable couleur des yeu? Maiteat supposos que l o veuille répodre à cette questio. Plutôt que de predre u échatillo de la populatio des idividus au yeu bleus et u autre échatillo issu de la populatio des idividus au yeu verts, autat predre u échatillo de la populatio géérale (c est-à-dire quelle que soit la couleur de ses yeu) et observer cojoitemet la couleur des cheveu et la couleur des yeu. Vues comme cela, les deu variables jouet bie des rôles symétriques et le problème est doc de mettre à l épreuve leur idépedace. 1. Les hypothèses e présece. O formule aturellemet deu hypothèses : Hypothèse H 0 les deu variables étudiées (couleur des cheveu, couleur des yeu) sot idépedates. Sous cette hypothèse, le fait d avoir observé chez u idividu la couleur de ses cheveu (respectivemet la couleur de ses yeu) apporte aucue iformatio sur la couleur de ses yeu (respectivemet la couleur de ses cheveu). O pourra se reporter au chapitre 6 das lequel ot été commetées ces otios d idépedace. O otera que, comme das tous les cas recotrés jusqu ici, cette hypothèse est ue 146/179 Biostatistique - Carrat, Mallet, Morice

147 Tests cocerat des variables qualitatives hypothèse fie qui egage u esemble d égalités. E effet, o sait que l idépedace s eprime par : Pr(la modalité de la couleur des cheveu est l et la modalité de la couleur des yeu est c) = Pr(la modalité de la couleur des cheveu est l) Pr(la modalité de la couleur des yeu est c), et ceci pour tous les choi possibles de l et c. Remarque : o pourra vérifier que parmi les (ombre de modalités de la couleur des cheveu ombre de modalités de la couleur des yeu) égalités qui e résultet, certaies sot redodates, et que (ombre de modalités de la couleur des cheveu - l) (ombre de modalités de la couleur des yeu - 1) égalités suffiset à eprimer les mêmes coditios. Hypothèse H 1 les deu variables étudiées e sot pas idépedates. Cette hypothèse eprime le cotraire de H 0. TRES IMPORTANT (des erreurs sot souvet commises) HYPOTHESE NULLE : LES DEUX VARIABLES SONT INDEPENDANTES HYPOTHESE ALTERNATIVE : LES DEUX VARIABLES SONT LIEES 2. Le paramètre du test Le paramètre est ecore Q, et s eprime eactemet comme précédemmet, c est-à-dire : ombre de cases du tableau O j A j 2 Q = j = 1 A j Ici le ombre de cases du tableau de cotigece est égal au produit du ombre de modalités de la première variable et du ombre de modalités de la secode variable. Les effectifs attedus s obtieet eactemet comme das le cas du paragraphe précédet, aisi qu o peut le voir sur l eemple umérique ci-dessous. U eemple umérique Le tableau ci-dessous motre u eemple de tableau de cotigece (D. Schwartz, Méthodes statistiques à l usage des médecis et des biologistes, Flammario (collectio statistique e biologie et médecie), 3 e éditio, p79) ; cet eemple est similaire au précédets, si ce est que l o a cosidéré u plus grad ombre de modalités pour la variable couleur des cheveu, et que la ouvelle variable itroduite (couleur des yeu) comporte trois modalités. Ces modalités remplacet les échatillos cosidérés das la sectio 13.2 page 143. Aisi, la modalité «bleu» par eemple peut être lue : «échatillo issu de la populatio des idividus au yeu bleus». La taille de cet échatillo est cepedat plus maîtrisée Biostatistique - Carrat, Mallet, Morice 147/179

148 Tests cocerat des variables qualitatives Couleur des yeu Couleur des cheveu blods brus rou oirs total fréquece bleus /124 gris /124 marros /124 total fréquece 45/124 39/124 19/124 21/ /124 Les effectifs attedus s obtieet comme précédemmet. Aisi, l effectif attedu relatif au couple «blods, marros» sera : 45/12433/ = 11,9. REMARQUES i. Pour alléger les calculs, o peut remarquer que l effectif attedu relatif à la cellule localisée lige l, coloe c est égal au rapport du produit du total de la lige l et du total de la coloe c, et du total gééral. ii. La somme des effectifs attedus, soit e lige, soit e coloe, coïcide avec les mêmes sommes sur les effectifs observés. Cette remarque permet ue vérificatio partielle des calculs. iii. Das la présetatio des calculs, o a procédé au «mélage» des résultats sas plus teir compte de la couleur des yeu (ce qui coduit à sommer les liges du tableau). O peut de faço équivalete mélager les résultats epérimetau sas plus teir compte de la couleur des cheveu, ce qui coduira à sommer les coloes du tableau de cotigece pour obteir la répartitio de référece. O pourra vérifier que les résultats du calcul sot strictemet les mêmes, ce que l o atted compte teu du rôle symétrique joué par les deu variables étudiées. SOUS L HYPOTHESE NULLE D INDEPENDANCE etre les deu variables, Q EST DISTRIBUE SELON u 2 à: (ombre de modalités de la première variable - 1) (ombre de modalités de la secode variable - 1) DEGRES DE LIBERTE. 148/179 Biostatistique - Carrat, Mallet, Morice

149 Tests cocerat des variables qualitatives 3. La suite des étapes est habituelle Les CONDITIONS DE VALIDITE sot ecore : A j 5. E particulier, la règle de décisio s établit comme suit : si la valeur calculée de Q, otée Q c, est iférieure à K ddl,, o e rejette pas l hypothèse d idépedace des deu variables. si la valeur calculée Q c est supérieure à K ddl,, o rejette l hypothèse d idépedace des deu variables. O dira alors que les deu variables sot liées, au risque. Eemple : Das l eemple ci-dessus, la valeur de Q c, résultat de la sommatio de 12 termes, est 15,1. Le ombre de degrés de liberté est : (4-1)(3-1) = 6, la valeur de K 6;0,05 associée état 12,6 (lue das ue table). O rejette doc ici l hypothèse d idépedace : couleur des cheveu et couleur des yeu sot liées, ou ecore sot dépedates. Voyos ue illustratio de cette dépedace. Sur la base des doées observées o a : Pr(yeu bleus) = 44/124 = 0,35 Pr(yeu bleus / cheveu blods) = 25/45 = 0,56 La coaissace de la couleur des cheveu (ici la modalité «blod») modifie la répartitio de la couleur des yeu (ici la fréquece de la modalité «bleu» qui évolue de 0,35 à 0,56). Le test idique que cette modificatio est sigificative. E réalité la valeur de Q c ci-dessus chiffre das leur esemble les différeces etre Pr(A / B) et Pr(A), c est-à-dire les écarts de Pr(A et B) par rapport au produit Pr(A)Pr(B), où A est u évéemet relatif à la couleur des yeu et B u évéemet relatif à la couleur des cheveu Biostatistique - Carrat, Mallet, Morice 149/179

150 Résumé du chapitre Tests cocerat des variables qualitatives Tests du 2. Effectifs observés O j, effectifs attedus A j. Coditios de validité géérales : A j 5 Paramètre gééral : ombre de cases du tableau O j A j 2 Q = j = 1 A j Comparaiso d ue répartitio observée à ue répartitio doée (ajustemet) H 0 : La répartitio «vraie» s ajuste à la répartitio doée H 1 : La répartitio «vraie» e s ajuste pas à la répartitio doée Nombre de cases = ombre de modalités Q ~ 2 (ombre de modalités -1) Comparaiso de plusieurs répartitios observées (homogééité) H 0 : Les répartitios coïcidet H 1 : Les répartitios diffèret Nombre de cases = ombre de modalités ombre de répartitios Q ~ 2 ((ombre de modalités -1) (ombre de répartitios -1)) Test d idépedace de deu variables qualitatives H 0 : Les deu variables sot idépedates H 1 : Les deu variables sot liées Q ~ 2 ((b de modalités de 1 ère variable - 1) (b de modalités de 2 ème variable - 1)) Das les deu deriers cas, si l est le ombre de liges, c le ombre de coloes du tableau de cotigece, le ombre de degrés de liberté des 2 est (l - 1)(c - 1). 150/179 Biostatistique - Carrat, Mallet, Morice

151 Liaiso etre deu variables cotiues : otio de corrélatio Chapitre 14 Liaiso etre deu variables cotiues : otio de corrélatio 14.1 Itroductio Nous avos rappelé das le chapitre précédet la otio fodametale d idépedace etre deu variables qualitatives et vu la faço dot cette idépedace pouvait être mise à l épreuve lors d ue epériece. Das le chapitre 12, les tests mis e œuvre faisaiet iterveir ue variable quatitative cotiue et ue variable qualitative ecore jugées das leurs iterdépedaces. Il se trouve qu il eiste ue autre classe de problèmes mettat e jeu ecore deu variables aléatoires, mais cette fois-ci, deu variables cotiues. Cosidéros, par eemple, deu variables aléatoires, l isuffisace réale (avec deu valeurs ou modalités présece-absece) et l isuffisace hépatique (avec les deu mêmes modalités). Supposos que l o coaisse u idicateur de la foctio réale (ou de certais de ses aspects), la clairace à la créatiie par eemple et u idicateur de la foctio hépatique (ou de certais de ses aspects) la bilirubiémie et que le diagostic d isuffisace réale soit porté lorsque la clairace est iférieure à u seuil, celui d isuffisace hépatique lorsque la bilirubiémie est supérieure à u autre seuil. O sait résoudre (voir chapitre 13) la questio de savoir si les variables isuffisace réale et isuffisace hépatique sot idépedates ou liées. Toutefois, compte teu des précisios doées sur l origie des diagostics d isuffisace réale et d isuffisace hépatique, o est teté de reformuler le problème posé e ces termes : y a-t-il u lie etre les variables aléatoires clairace à la créatiie et bilirubiémie? U iveau élevé de l ue est-il «aociateur» d u iveau élevé de l autre? Ou ecore : la coaissace du iveau de l ue modifie-t-elle l idée que l o se fait du iveau de l autre, o ecore observée? Cette derière formulatio est très proche de la formulatio utilisée pour discuter de l idépedace etre évéemets : la coaissace du fait qu u évéemet s est réalisé (maiteat u iveau de clairace cou) modifie-t-elle la plausibilité d u autre évéemet (maiteat la bilirubiémie)? Les situatios das lesquelles o se pose aturellemet la questio de savoir si deu variables cotiues sot liées sot etrêmemet fréquetes. Voilà quelques eemples : Biostatistique - Carrat, Mallet, Morice 151/179

152 Liaiso etre deu variables cotiues : otio de corrélatio la cosommatio de cigarettes (quotidiee ou cumulée) et la capacité respiratoire sot-elles liées? la gastriémie et la quatité de cellules ECL sot-elles liées? les valeurs de glycémie obteues selo deu méthodes de dosage sur les mêmes échatillos saguis sot-elles liées [ici, il faut l espérer] Abord du problème Cosidéros deu variables aléatoires cotiues X (créatiiémie) et Y (bilirubiémie). Imagios que ous ayos réalisé ue epériece cosistat e l observatio cojoite du iveau de ces deu variables sur u esemble (échatillo) de sujets. O dispose aisi d u esemble de couples de valeurs i, y i. La représetatio aturelle - sio la meilleure - de ces résultats est doée das la figure ci-dessous ; chaque couple de valeurs obteu chez chaque idividu est représeté par u poit de coordoées (créatiiémie-bilirubiémie). O lit sur u tel dessi, au mois grossièremet, le domaie des valeurs possibles de X, le domaie des valeurs possibles de Y. Itéressos ous à u ouvel idividu ; e mesuros chez lui que la valeur de la créatiiémie, 0. Que peut-o dire alors, sur la base de cette coaissace et sur la base de l epériece ci-dessus cocerat le domaie des valeurs possibles de Y pour ce même idividu? O peut proposer la répose géométrique ou visuelle idiquée sur la figure ci-dessous. y (bilirubiémie) domaie des valeurs de Y domaie des valeurs de X (créatiiémie) y (bilirubiémie) domaie des valeurs de Y sachat 0 0 (créatiiémie) 152/179 Biostatistique - Carrat, Mallet, Morice

153 Liaiso etre deu variables cotiues : otio de corrélatio Le ouveau domaie possible - sachat 0 - est très voisi du domaie iitial ; ceci se reproduit pour toute valeur de 0. Il est alors clair que das cet eemple, la coaissace de X apporte pas d iformatio sur celle de Y. O a ici ue situatio visuelle d u cas où les deu variables X et Y sot idépedates. O pourrait reverser le rôle de X et Y, la coclusio serait la même. Cosidéros maiteat le cas où les résultats epérimetau produiset la représetatio de la figure ci-dessous. Das ce cas, au cotraire, o voit clairemet que la coaissace de 0 (respectivemet y 1 ) modifie le domaie des valeurs possibles, doc attedues de Y (respectivemet X) ; les deu variables X et Y sot liées. domaie de Y y domaie de Y sachat 0 0 y y 1 domaie de X sachat y 1 domaie de X La modificatio ici cocere aussi bie l amplitude du domaie que sa localisatio e termes de valeurs. L appréciatio visuelle de la dépedace correspod à l appréciatio de «l épaisseur» de l esemble des poits. Plus les poits epérimetau ot tedace à se répartir sur ue courbe - o horizotale i verticale - plutôt qu à remplir ue partie du pla, plus les variables sot liées. Peut-o trouver u idicateur umérique de la force d ue telle liaiso? Au ses strict, la répose est o. Quelques situatios de dépedace - c est-à-dire de liaiso - sot représetées sur les figures ci Biostatistique - Carrat, Mallet, Morice 153/179

154 Liaiso etre deu variables cotiues : otio de corrélatio dessous. y y O e sait pas, e toute gééralité, résumer e u seul ombre eprimat la liaiso etre deu variables cotiues les résultats d ue epériece. O e coaît qu u idicateur gééral preat e compte o pas le degré de proimité à ue courbe quelcoque mais le degré de proimité à ue droite : c est le coefficiet de corrélatio [liéaire]. Il faut voir cepedat que das la plupart des situatios réelles au cours desquelles o s itéresse à l eame de la liaiso etre deu variables, la possibilité d iterprétatio des résultats est largemet foctio du caractère mootoe, sio rectilige, de la dépedace ; que dire e termes d iterprétatio d ue dépedace figurée schématiquemet sur la figure ci-dessous? y 14.3 U idicateur de covariatio : le coefficiet de corrélatio Cherchos alors à quatifier u phéomèe de covariatio, c est-à-dire u phéomèe de variatio couplée etre X et Y. O impose aturellemet à l idicateur recherché ue ivariace par traslatio : les phéomèes productifs de X et Y demeuret fodametalemet ialtérés s ils produiset X + a, Y + b. Aisi l idicateur se fodera-t-il sur les valeurs i m et y i m y. Par ailleurs, o souhaite que l idicateur e dépede pas des uités eprimat X et Y ; alors o travaillera sur 154/179 Biostatistique - Carrat, Mallet, Morice

155 Liaiso etre deu variables cotiues : otio de corrélatio i m y i m y ri = et y ri = Maiteat si Y et Y présetet u caractère de covariatio, c est que de faço fréquete, sio systématique soit les variables variet das le même ses, c est-à-dire lorsque i est grad (i.e. ri positif par eemple), y i l est égalemet le plus souvet (i.e. y ri positif), que lorsque i est petit ( ri < 0) y i l est égalemet (y ri < 0) ; das ce cas, le produit ri y ri est fréquemmet positif. soit les variables variet e ses cotraire : lorsque i est grad, y i est petit, lorsque i est petit, y i est grad ; das ce cas le produit ri y ri est fréquemmet égatif. Compte teu de l aalyse précédete, o choisit pour idicateur de la covariatio ou corrélatio le ombre : r Aisi s X 1 = ri y ri i s Y si r est grad, c est le sige d ue covariatio das le même ses de X et Y ; si r est petit (c est-à-dire grad e valeur absolue et égatif), c est le sige d ue covariatio de X et Y e ses cotraire ; si r est voisi de zéro, c est le sige d ue absece de covariatio. Reteos, eprimé sur la base des valeurs observées : i m y i m y i r = s X s Y Le umérateur de cette epressio est appelé la covariace observée des deu variables X et Y, otée cov 0 (X, Y), dot o motre qu elle s eprime aussi sous la forme cov 0 XY = i y i y i Les figures ci-dessous présetet diverses situatios relativemet au coefficiet de corrélatio observé Biostatistique - Carrat, Mallet, Morice 155/179

156 Liaiso etre deu variables cotiues : otio de corrélatio y m y y m y m y m y y m y m m m r>0, grad r<0, r grad y y m y m y m m Propriétés umériques fodametales de r : r a toujours ue valeur comprise etre -1 et 1 ; r pred la valeur -1 (respectivemet 1) si et seulemet si il eiste des valeurs a et b telles qu o ait pour tout i y i = a i + b avec a égatif (respectivemet a > 0). Remarques : r voisi de zéro plus r est grad e valeur absolue, plus les variables sot dites corrélées, la valeur absolue de r décroît, lorsque s estompe le caractère rectilige du «uage» des valeurs observées, lorsque s épaissit ledit uage, ue valeur absolue très faible du coefficiet de corrélatio e permet pas de coclure à l idépedace de deu variables. Deu variables idépedates préseterot e revache u coefficiet de corrélatio observé très faible e valeur absolue. 156/179 Biostatistique - Carrat, Mallet, Morice

157 Liaiso etre deu variables cotiues : otio de corrélatio Quelques eemples sot présetés ci-dessous pour fier les idées. y y r 0,9 r 0,7 y y r 0,7 r 0,6 y y r 0,5 r 0, Biostatistique - Carrat, Mallet, Morice 157/179

158 Liaiso etre deu variables cotiues : otio de corrélatio y y r 0 r 0 Remarque complémetaire : Le coefficiet de corrélatio liéaire est, au même titre que toute statistique, soumis au fluctuatios d échatilloage. La questio se pose alors de savoir que faire de cet idicateur e termes d iféreces. Par eemple, avat de coclure que les deu variables sot corrélées, peut-o se garatir du risque de l observatio d u coefficiet de corrélatio ul sur ue plus grade série d observatios? O se retrouve das le cotete des tests d hypothèses avec ici ue difficulté supplémetaire qui tiet au fait que l o a pas quitté le iveau epérimetal, le iveau ituitif. Il coviet de trouver ue cotrepartie «vraie» à ce coefficiet de corrélatio observé r Le coefficiet de corrélatio «vrai» Cherchos à substituer de la faço la plus aturelle possible des gradeurs «vraies» au gradeurs observées costitutives de r. O ote l apparitio au déomiateur de s X et s Y auquelles o substitue aturellemet X et Y, les écarts types «vrais» de X et Y. Au umérateur o remarque m et m y auquels o substitue E(X) et E(Y) les moyees «vraies» de X et Y. Reste au umérateur ue moyee observée (lisos à la place de -1) ; o lui substitue ue moyee «vraie» : moyee «vraie» du produit [X - E(X)][Y - E(Y)], soit E{[X - E(X)][Y - E(Y)]}. Cette moyee «vraie» dépedat de X et Y à la fois s appelle covariace «vraie» de X et Y. Fialemet, o obtiet la cotrepartie «vraie» otée : EX EXY EY XY = X Y Remarque : à propos des otios d espérace, de covariace «vraie», de coefficiet de corrélatio «vrai», voir le chapitre /179 Biostatistique - Carrat, Mallet, Morice

159 Liaiso etre deu variables cotiues : otio de corrélatio 14.5 Test d égalité du coefficiet de corrélatio «vrai» à 0 Des calculs théoriques complees, et imposat u certai ombre de restrictios, qui, dépassat le cadre de ce cours, e serot pas metioés, permettet de calculer la distributio de r sous l hypothèse - reteue comme hypothèse ulle - de ullité du coefficiet de corrélatio «vrai». Il s agit d ue famille de distributios ideées par u etier appelé ombre de degrés de liberté. La mise e œuvre du test est alors covetioelle : H 0 : = 0 [les variables e sot pas corrélées], H 1 : 0 [les variables sot corrélées] Paramètres du test : coefficiet de corrélatio observé i m y i m y i r = s X s Y sous H 0, r suit ue distributio coue, dite du coefficiet de corrélatio à -2 degrés de liberté où est le ombre de couples (i, yi) epérimetau. L itervalle de pari pour r est de la forme IP 1 = corr 2 ; corr 2 corr 2 état lue das ue table. Coditios de validité Les coditios de validité sot complees et eprimet que toute combiaiso liéaire des variables X et Y est distribuée selo ue loi ormale. Autremet dit, toute variable ax + by où a et b sot deu ombres quelcoques doit être ormale. Pour la commodité de l epressio, o éocera les coditios de validité sous le éologisme «distributio de (X, Y) biormale». la suite de la mise e œuvre est stadard. Quelques eemples umériques Au risque 5 % : = 10, IP 0,95 = [-0,632 ; 0,632], ddl = 8 = 20, IP 0,95 = [-0,444 ; 0,444], ddl = 18 = 50, IP 0,95 = [-0,280 ; 0,280], ddl = 48 Aisi, par eemple, pour pouvoir coclure à la corrélatio, lorsque l o dispose de 20 observatios (20 couples ( i, y i )), le coefficiet de corrélatio observé doit être supérieur à 0,444, ou iférieur à -0,444. Autre formulatio du test O peut motrer que t = r r 2 est, sous H 0, distribué selo ue loi de Studet à -2 ddl Biostatistique - Carrat, Mallet, Morice 159/179

160 Liaiso etre deu variables cotiues : otio de corrélatio Si o préfère utiliser ce paramètre plutôt que r, il faut lire la table de Studet pour costruire l itervalle de pari. 160/179 Biostatistique - Carrat, Mallet, Morice

161 Liaiso etre deu variables cotiues : otio de corrélatio Résumé du chapitre 1. La corrélatio etre deu variables aléatoires quatitatives X et Y se mesure à l aide du coefficiet de corrélatio «vrai» : EX EXY EY XY = X Y Propriétés : XY 1 ; 1 Si X, Y idépedates, alors (X, Y) = 0 2. Disposat d u échatillo de couples ( i, y i ) o défiit le coefficiet de corrélatio observé : i m y i m y i y i m m y i i r = = s X s Y s X s Y Propriété : r 1 ; 1 3. Il eiste u test de ullité du coefficiet de corrélatio «vrai» dot le paramètre est r. 4. Idépedace et corrélatio sot des otios différetes ; deu variables dot le coefficiet de corrélatio «vrai» est ul peuvet être liées Biostatistique - Carrat, Mallet, Morice 161/179

162 Liaiso etre deu variables cotiues : otio de corrélatio 162/179 Biostatistique - Carrat, Mallet, Morice

163 Méthodologie des études épidémiologiques Chapitre 15 Méthodologie des études épidémiologiques The world is richer i associatios tha meaigs, ad it is the part of wisdom to differetiate the two. Joh Barth 15.1 La causalité La causalité est ue thématique cetrale e philosophie des scieces et e logique, et les premiers écrits sur ce sujet remotet à Aristote. Jusqu au 18 ème siècle, la causalité ait de l observatio, et les coaissaces sot costruites à partir des observatios sas idée précoçues du réel (iférece dite iductive). Nous formos alors ue sorte d aticipatio, qui ous représete que le secod évéemet (l effet) doit se produire quad le premier (la cause) se produit - même si les mécaismes eplicatifs liat ces deu évéemets ous échappet. Das la vie courate, l acquisitio de os appretissages ou l applicatio des règles de «bo ses», illustret cette coceptio de la causalité. Hume, philosophe écossais, motrera pourtat les limites de ce pricipe et l impossibilité de prouver la relatio causale de l observatio de la successio de deu évéemets dot o e peut jamais eclure la coïcidece. Le questioemet sur la causalité e médecie est égalemet acie. Claude Berard écrit e 1865 : «L esprit de l homme e peut cocevoir u effet sas cause, de telle sorte que la vue d u phéomèe éveille toujours e lui ue idée de causalité. Toute la coaissace humaie se bore à remoter des effets observés à leur cause. À la suite d ue observatio, ue idée relative à la cause du phéomèe observé se présete à l esprit ; puis o itroduit cette idée aticipée das u raisoemet e vertu duquel o fait des epérieces pour la cotrôler.» O retrouve das ce propos ue coceptio différete de la causalité : il s agit de déduire (au ses strict) les coséqueces d ue hypothèse et esuite de comparer ces coséqueces au doées. S il y a désaccord, alors l hypothèse est réfutée. Das le cas cotraire, l hypothèse est pas prouvée mais otre croyace e elle s e trouve reforcée. Cette coceptio, de type déductif, formalisée par Karl Popper au début du 20 ème siècle, s est imposée comme le socle de la découverte scietifique. Des livres d épidémiologie etiers, dot certais très mathématiques utilisat les outils de la logique, traitet de ce problème de la causalité. O retiedra qu ue relatio causale etre deu caractères pourra être évoquée lorsque l u des deu est «cotrôlé». L essai cotrôlé est la seule Biostatistique - Carrat, Mallet, Morice 163/179

164 Méthodologie des études épidémiologiques méthode qui permet de mesurer l effet causal d ue itervetio, par eemple u traitemet, sur u évéemet, par eemple, la guériso d ue maladie Démarche epérimetale et démarche d observatio Caractère cotrôlé ; caractère aléatoire Das ce qui suit, les termes caractère, caractéristique, variable et facteur sot cosidérés comme syoymes. O dit d u caractère qu il est cotrôlé lorsque sa détermiatio ous appartiet. Eemple : o s itéresse à l effet d u traitemet sur la surveue d u type de cacer chez des souris. Le caractère absece ou présece du traitemet est cotrôlé car détermié par l epérimetateur. Das le cas cotraire, o dit que le caractère est aléatoire. Eemple : la surveue du cacer chez la souris. Lorsqu o evisage u problème de liaiso etre deu variables (cela recouvre tous les problèmes que l o a recotrés) u au plus des caractères peut être cotrôlé. Démarche epérimetale Lorsque l epériece se coduit avec u facteur cotrôlé, o dit que l o suit ue démarche epérimetale. Das ce cas, au cours de la costitutio de l échatillo qui permettra de mettre e œuvre les tests, o décide du choi de la valeur d u caractère (par eemple, o décide si le X ème patiet sera traité ou o, et o étudie la guériso de la maladie). Démarche d observatio Lorsque l epériece se coduit sur la base de deu facteurs aléatoires, o dit que l o suit ue démarche d observatio (par eemple, o observe si le X ème sujet est fumeur ou o, et o étudie la surveue de cacer). Pricipe fodametal La discussio de la causalité e se coçoit pas sas cotrôle d u des deu caractères étudiés. Autremet dit, o e peut mesurer u effet causal hors d ue démarche epérimetale. Seule cette démarche, e effet, permet d assurer que les idividus costituat l échatillo sot comparables e tout (homogèes) sauf pour ce qui cocere le caractère cotrôlé. Ecore faut-il assurer cette homogééité et la méthode de référece est le tirage au sort. O parle de radomisatio pour l attributio par tirage au sort du caractère cotrôlé, le traitemet. 164/179 Biostatistique - Carrat, Mallet, Morice

165 Méthodologie des études épidémiologiques 15.3 Les essais radomisés Défiitio Le but de l essai radomisé est, grâce à ue démarche epérimetale rigoureuse, d évaluer l efficacité d ue itervetio de saté, par eemple u ouveau traitemet - o parle alors d essai thérapeutique radomisé. Il peut s agir égalemet d ue autre itervetio médicale, par eemple ue techique chirurgicale, u programme d éducatio pour la saté, u dispositif médical, ue méthode diagostique. Das u essai thérapeutique pour ue maladie, o cherche le plus souvet à motrer qu u ouveau traitemet a ue efficacité supérieure à celle du traitemet habituellemet utilisé das cette maladie, ou à l absece de traitemet (otammet lorsqu il eiste pas ecore de traitemet d usage pour la maladie étudiée). Parce que l attributio du traitemet est cotrôlée et décidée par tirage au sort, o sera le cas échéat e mesure de coclure qu ue différece d efficacité est causée par le traitemet (au risque d erreur statistique choisi). La réalisatio d u essai thérapeutique écessite doc de défiir le critère que l o utilisera pour juger de l efficacité - appelé critère de jugemet. Des eemples de critères de jugemet sot la régressio des symptômes d ue maladie, la durée de survie, la valeur d ue costate biologique, u score de qualité de vie... E pratique o distigue les critères de jugemet objectifs, reposat sur ue gradeur évaluable par ue mesure physique objective, par eemple la charge virale, la cocetratio de cholestérol sagui, la survie,... des critères de jugemet subjectifs, qui peuvet être ifluecés par des effets de type psychologique, par eemple la douleur, l aiété, la qualité de vie, la mesure d ue impotece à ue épreuve de marche,... L essai thérapeutique doit être orgaisé afi de limiter au maimum les biais pouvat modifier le déroulemet de l essai ou l iterprétatio du critère de jugemet Commet limiter les biais das le déroulemet d u essai thérapeutique radomisé? Aveugle et placebo Le placebo est ue présetatio à l idetique du médicamet à l étude mais qui e cotiet pas le pricipe actif. Aisi lorsqu u essai radomisé cotre placebo est réalisé, u sujet das l essai recevra au hasard soit le médicamet à l étude soit ue copie de ce médicamet, et i ce sujet, i le médeci qui le pred e charge das l étude, i la persoe (souvet le médeci) qui évaluera le critère de jugemet e saurot ce qui est réellemet pris. O parle das ce cas de mise e isu ou d aveugle. Les sujets recevat le placebo costituet ce que l o appelle le groupe témoi (ou groupe cotrôle par aglicisme). L aveugle est justifié pour deu raisos pricipales : 1) d ue part, parce qu il garatit que les patiets serot a priori pris e charge et suivis de la même maière das l essai quel que soit le groupe das lequel ils ot été radomisés. E l absece d aveugle, u patiet recevat, par eemple, u placebo, pourrait être ameé plus facilemet à iterrompre rapidemet sa participatio das l essai (puisqu il a le placebo) pour pouvoir bééficier d u autre traitemet, cotrairemet à u patiet recevat le traitemet à l étude ; u patiet recevat le traitemet à l étude pourrait faire l objet de plus d attetio que celui du groupe placebo et 2) Biostatistique - Carrat, Mallet, Morice 165/179

166 Méthodologie des études épidémiologiques d autre part, parce qu il permet d éviter ue iterprétatio tedacieuse ou biaisée du critère de jugemet si celui-ci est subjectif. L évaluateur d ue douleur résiduelle 6 mois après le début de l essai sera iévitablemet ifluecé das so jugemet s il coaît le groupe du patiet, et aura tedace à trouver ue plus grade efficacité sur la douleur chez les patiets qui reçoivet le traitemet à l étude que chez les patiets du groupe témoi. D ailleurs, e cas d absece d aveugle, le simple fait de soumettre u sujet à u traitemet améliore souvet u critère de jugemet subjectif, même si ce traitemet a aucue efficacité itrisèque : c est l effet placebo. L effet placebo est défii comme l écart positif costaté etre l effet thérapeutique observé et l effet pharmacologique propre d u médicamet. Si l o doe ue substace ierte sur le pla pharmacologique, o observera uiquemet u effet placebo. O cosidère aisi que l homéopathie ou d autres médecies «douces», relèvet uiquemet de l effet placebo et doc que l effet de ces thérapeutiques est eclusivemet subjectif. Das u essai e aveugle, l effet placebo est réparti de la même maière etre les deu groupes de patiets, et la différece observée est doc imputable au seules propriétés pharmacologiques du traitemet. U essai cotre placebo e aveugle peut porter sur d autres itervetios que le seul médicamet. U eemple célèbre récet porte sur la chirurgie du geou chez les sujets obèses. Jusque récemmet, tous les essais idiquaiet ue amélioratio frache de la douleur et de la mobilité chez les sujets radomisés das le groupe ayat subi l itervetio chirurgicale ligametaire par rapport à ceu radomisés das le groupe sas itervetio. Jusqu au jour où u essai fut coduit comparat des sujets chez qui l itervetio sur les ligamets était réalisée, à des sujets edormis et chez lesquels u simulacre d itervetio (ouverture/fermeture simple de la cavité articulaire) était réalisé. Le résultat motrait l amélioratio de la douleur das les deu groupes (l effet placebo), et l absece de différece etre les deu groupes (doc l absece d efficacité itrisèque de l itervetio) Commet limiter les biais das l aalyse d u essai thérapeutique radomisé? Itetio de traiter L aalyse des résultats d u essai thérapeutique est effectuée grâce à la méthode statistique. Ce sot les tests statistiques qui permettet de coclure si les différeces observées etre le groupe de sujets traités et le groupe de sujets o traités ou recevat le placebo permettet de rejeter ou o l hypothèse d égalité de traitemet, c est-à-dire de coclure qu u traitemet est ou o meilleur que l autre. De faço tout à fait géérale, les tests employés sot des tests bilatérau. De faço tout aussi géérale, das ce type d essai de supériorité ou d efficacité, l aalyse statistique est effectuée selo le pricipe de l itetio de traiter. Ce pricipe cosiste à cosidérer le patiet das l essai littéralemet «tel qu o avait l itetio de le traiter», c est à dire, das le groupe das lequel il avait été radomisé - peu importe ce qui a été réellemet pris. Par eemple, u patiet radomisé das le groupe placebo pourrait e réalité recevoir le traitemet à l essai pedat toute la durée de l étude, par simple erreur au momet de la délivrace du médicamet : quad bie même, ce patiet sera aalysé das le groupe placebo. Le pricipe de l aalyse e itetio de traiter a pour objectif de préserver les bééfices de la radomisatio au momet de l aalyse des résultats, et de limiter les biais liés au écarts etre le protocole de l essai et la coduite de celui-ci. E pratique, la coséquece implicite d ue aalyse e itetio de traiter sera que tout patiet radomisé sera 166/179 Biostatistique - Carrat, Mallet, Morice

167 Méthodologie des études épidémiologiques iclus das l aalyse y compris ceu ayat pas bie voire pas du tout pris le traitemet qui leur était alloué. Cepedat, les études radomisées e sot pas toujours réalisables d où l importace de la questio de causalité das les études observatioelles e médecie. E particulier, si l epérimetatio peut parfois permettre de mesurer u effet causal etre u traitemet et ue maladie, elle est très souvet impossible lorsque la cause potetielle étudiée est u risque Les études d observatio O regroupe sous cette termiologie, les études dot l objectif est d idetifier les facteurs associés à des évéemets de saté et e reposat pas sur ue démarche epérimetale. Il est e effet cotre les pricipes éthiques d eposer ue persoe à ue cause potetielle de maladie pour étudier commet celle-ci surviet - par eemple faire fumer par tirage au sort des sujets pour étudier le rôle du tabac das les cacers. E revache, les persoes d elles-mêmes se répartisset souvet e eposées / o eposées (e : fumeur/o fumeur), et le but de ces études d observatio sera doc d étayer avec la meilleure démarche possible l hypothèse testée à partir de ces observatios. Les études d observatio peuvet être catégorisées e cohortes - cas-témois et trasversales ; prospectives et rétrospectives. O otera que cette termiologie peut s appliquer égalemet à la démarche epérimetale : u essai thérapeutique est ue étude prospective imposat u recueil de doées logitudiales. Das les études d observatio, o étudie le plus souvet l associatio etre ue epositio et u évéemet de saté. L epositio peut être u risque (par eemple fumer, u polymorphisme géétique), ou u bééfice (par eemple u traitemet, le poids). Des évéemets de saté sot par eemple, la surveue d ue maladie, ue guériso, u décès, ue récidive, etc Cohortes - Cas-témois et études trasversales Etudes de cohorte Ue cohorte était le diième d ue légio romaie. C est plus gééralemet u esemble de sujets. Das ue étude dite de cohorte les sujets sot répartis e groupes e foctio de leur epositio (par eemple, fumeur/o fumeur) et l évéemet est pas surveu au momet où cette répartitio est faite. Chacu de ces groupes défiit ue «sous cohorte», et la comparaiso du tau de surveue de l évéemet etre ces différetes sous cohortes, permettra de mesurer l associatio etre epositio et évéemet. D u poit de vue pratique l étude de cohorte est la démarche d observatio la plus «proche» de l essai radomisé, la pricipale différece état que das u essai, l attributio de l epositio (le traitemet) est réalisée par tirage au sort. Etudes cas-témois Das ue étude cas-témois (ou cas-cotrôle), les groupes de sujets sot costitués e foctio de leur réalisatio ou o de l évéemet de saté : les cas sot par eemple les malades atteits d u cacer et les témois, des sujets o atteits de ce cacer. O com Biostatistique - Carrat, Mallet, Morice 167/179

168 Méthodologie des études épidémiologiques pare les iveau d epositio das ces deu groupes pour étudier l associatio etre epositio et évéemet de saté. E gééral, o choisit de u à 4 témois pour chaque cas et la proportio de malades das l étude est complètemet détermiée (de 50 % pour 1 témoi pour 1 cas, à 20 % pour 4 témois par cas), et e correspod e rie à la proportio de malades das la populatio cible. Etudes trasversales Ue étude trasversale est ue étude descriptive dot le pricipe est essetiellemet de recueillir simultaémet des iformatios sur epositios et évéemets de saté sur u échatillo représetatif de la populatio cible - celle à laquelle o souhaite pouvoir etrapoler les résultats. Les equêtes de prévalece sot u eemple typique de ces études trasversales, das lesquelles o évalue le ombre de malades présets à u istat das la populatio, et qui idetifie les facteurs associés au variatios de prévalece. Ces études trasversales sot limitées par l absece de descriptio temporelle des epositios (et des évéemets), mais peuvet permettre d idetifier des relatios etre évéemet de saté et epositio lorsque celles-ci sot ivariables das le temps (par eemple, le see, le groupe sagui,...) Etudes prospectives et rétrospectives Ue étude est dite prospective lorsque l epositio est mesurée avat la surveue de l évéemet étudié. Ue étude est dite rétrospective lorsque la mesure de l epositio surviet après la surveue de l évéemet. Par eemple, ue étude das laquelle o mesure la cosommatio jouralière de tabac, et das laquelle o observe la surveue de cacer au cours du suivi des sujets est ue étude prospective ; a cotrario, demader la cosommatio de tabac des di derières aées à des sujets ayat u cacer est ue étude rétrospective. O otera que cette défiitio de prospective/rétrospective est pas cosesuelle, et les épidémiologistes moderes recommadet de ce fait, de e plus utiliser cette termiologie Doées logitudiales O dit que les doées sot logitudiales lorsque qu il eiste plusieurs mesures à travers le temps par sujet. Par eemple, la mesure du tau de cholestérol chez u sujet tous les 6 mois, ou la mesure du statut fumeur/o fumeur au cours du temps est ue doée logitudiale. Les mesures logitudiales chez u même sujet e peuvet pas être cosidérées comme réalisatio de variables aléatoires idépedates ; par eemple, le tau de cholestérol d u sujet à u istat quelcoque apporte ue iformatio sur le tau de cholestérol du même sujet 6 mois plus tard. Il faudra teir compte de cette o-idépedace das les aalyses statistiques de ces doées - qui serot souvet complees. 168/179 Biostatistique - Carrat, Mallet, Morice

169 Méthodologie des études épidémiologiques E pratique Le plus souvet, ue étude de cohorte sera prospective, et aura recueilli des doées logitudiales. Le plus souvet ue étude cas-témois sera rétrospective Mesures d associatio utilisées e épidémiologie O traite le cas le plus simple où ue epositio est répartie e deu iveau (oui/o, préset/abset, eposé/ o eposé), et o otera E+ l epositio, E- l absece d epositio au facteur étudié. L évéemet d itérêt est égalemet catégorisé e deu iveau, M+ pour malade, M- pour omalade. O otera que das le cas d u essai thérapeutique E+ est le traitemet à l étude, et M- peut être défii comme le succès thérapeutique, doc ce qui suit s applique aussi bie à l essai radomisé qu au études d observatio. A partir de cette catégorisatio, il est possible de dresser le tableau suivat : O défiit M+ M- E+ 1 2 E- 3 4 le risque absolu chez les eposés, comme la proportio vraie de malades parmi les eposés P(M+ E+), estimé par 1/(1+2) le risque absolu chez les o eposés, comme la proportio de malades chez les o eposés, P(M+ E-), estimé par 3/(3+4) le risque relatif est ue mesure d associatio, défii comme le rapport des risques absolus chez les eposés et o eposés, P(M+ E+) / P(M+ E-). Ce risque est estimé par 1/(1+2) / 3/(3+4) le rapport des cotes (odds-ratio e aglais) est ue autre mesure d associatio très utilisée e biomédecie. Rappelos que la cote d u évéemet est défiie comme le rapport de sa probabilité sur so complémetaire : jouer à ue cote de 9 cotre 1 sigifie jouer avec 9 chace de perdre cotre ue chace de gager. Le rapport des cotes est défii comme le rapport de la cote de la maladie chez les eposés P(M+ E+)/P(M- E+) sur la cote de la maladie chez les o-eposés P(M+ E-)/P(M- E-), mais aussi, par applicatio du théorème de Bayes, comme le rapport de la cote des epositios chez les malades P(E+ M+)/P(E- M+), par la cote des epositios chez les o malades P(E+ M-)/P(E- M-). Il est estimé par le rapport des produits croisés (14) / (23) Biostatistique - Carrat, Mallet, Morice 169/179

170 Méthodologie des études épidémiologiques Le rapport des cotes est la seule quatité pertiete qui peut être estimée das ue étude cas-témois puisque le ombre total de sujets o malades est détermié par le ombre de témois choisi par cas. Si la maladie est rare das la populatio cible, aussi bie chez les eposés que chez les oeposés, P(M+) est proche de 0 et doc P(M-) voisi de 1, et P( M+ E+)/P(M- E+) est voisi de P( M+ E+) ; P(M+ E-)/P(M- E-) proche de P(M+ E-) et doc le rapport des cotes défii ci-dessus est proche de du risque relatif. Le risque relatif et le rapport des cotes sot des quatités qui peuvet predre les valeurs etre 0 et l ifii. Sous l hypothèse (ulle) d idépedace etre l epositio et l évéemet étudié, ces deu quatités valet 1. U risque relatif ou u rapport de cotes supérieur à 1 (coclusio que l o portera après avoir fait le test d hypothèse approprié) sigifie que l epositio est u facteur de risque de l évéemet étudié. U risque relatif ou u rapport de cotes iférieur à 1 sigifie que l epositio est u facteur protecteur de l évéemet. U risque relatif de 50 (par eemple) pour l epositio «fumeur» et l évéemet «cacer du poumo» s iterprète littéralemet comme «il y a 50 fois plus de cacer du poumo chez les fumeurs que chez les o fumeurs» Risque attribuable, proportio de cas évitables Cette sectio a été écrite par A.J. Vallero. Le risque attribuable à u facteur est la proportio des cas que l o pourrait éviter e supprimat ce facteur, lorsqu il est causal. Par eemple, le risque de cacers du poumo attribuable au tabac est de l ordre de 90 % (si o supprimait par magie le tabac, eviro 10 % des cacers des broches surviedraiet ecore, car ils sot dus à d autres facteurs). Soit : N le ombre total de malades ; N F le ombre de malades eposés au facteur F ; N NF le ombre de malades o eposés au facteur F. O peut écrire N = N F + N NF. Parmi les N Pr(M) cas totau de maladie, o e peut éviter les N Pr(M/NF) cas qui seraiet surveus de toute faço e l absece du facteur F. O peut espérer éviter les NF autres. La proportio maimale de cas que l o peut éviter est doc : PrM PrM NF PrM Soit f la proportio de sujets eposés. E écrivat que : Pr(M) =f Pr(M/F) +(1-f) Pr(M/NF) o trouve que le risque attribuable vaut : frr frr /179 Biostatistique - Carrat, Mallet, Morice

171 Méthodologie des études épidémiologiques Résultat : Das ue populatio où ue proportio f des sujets est eposée à u facteur F augmetat le risque de maladie, cette augmetatio état caractérisée par le risque relatif RR = Pr(M/ F)/Pr(M/NF), le risque attribuable au facteur, c est à dire la proportio maimale de cas qui peut être évitée vaut frr frr La proportio calculée grâce à cette formule est «maimale» : elle est atteite que si le facteur F a u rôle causal das le déclechemet de la maladie. Par eemple, l epositio au tabac est u facteur causal du cacer des broches. L alcoolisme e l est pas. Pourtat, le risque relatif RR de cacer des broches chez les alcooliques est supérieur à 1 parce que les alcooliques sot plus souvet fumeurs que les o alcooliques. L alcoolisme est appelé facteur de cofusio. Bie etedu, e supprimat l alcool, o e supprimerait pas le cacer des broches! Biostatistique - Carrat, Mallet, Morice 171/179

172 Résumé du chapitre Méthodologie des études épidémiologiques 1. L essai cotrôlé radomisé permet de mesurer de l effet causal d ue itervetio de saté, u traitemet par eemple. 2. La radomisatio qui cosiste à tirer au sort l attributio de l itervetio, permet d assurer que les idividus costituat l échatillo sot comparables e tout (homogèes) sauf pour ce qui cocere le caractère cotrôlé. 3. Das u essai radomisé, le critère de jugemet est la variable qui sera comparée etre les groupes pour juger de l efficacité de l itervetio. O distigue critères de jugemets objectifs (e : décès) et subjectifs (e : douleurs), ces deriers pouvat être facilemet ifluecés par d autres effets que les effets propres de l itervetio. 4. L effet thérapeutique das u essai est la somme de l effet pharmacologique propre et de l effet placebo. 5. La mise e aveugle qui sigifie que i le patiet, i le médeci qui le suit, i l évaluateur du critère e savet das quel groupe est radomisé le patiet, est utilisée pour limiter les biais. 6. L aalyse e itetio-de-traiter sigifie que l o compare le critère de jugemet etre les groupes tels qu ils ot été costitués par la radomisatio. Elle implique que tous les patiets radomisés sot coservés das l aalyse. 7. Das ue étude d observatio, il est pas possible de coclure causalemet, juste de mettre e évidece des associatios etre epositios (par eemple fumer) et évéemet de saté (par eemple u cacer). 8. Les études d observatios viset à idetifier les facteurs associés à des évéemets de saté ; il s agit souvet de risques. 9. O distigue les études de cohortes, où les sujets sot répartis e groupes e foctio de leur epositio (e : fumeur/o fumeur) ; les études cas-témois, où les sujets sot répartis e groupes e foctio de la réalisatio ou o de l évéemet de saté (e cacer/ pas cacer) ; les études trasversales, où epositios et évéemets sot mesurés simultaémet. 10. Ue étude est dite prospective lorsque l epositio est mesurée avat la surveue de l évéemet étudié. Ue étude est dite rétrospective lorsque la mesure de l epositio surviet après la surveue de l évéemet. 11. Le risque relatif et le rapport des cotes mesuret la force de l associatio etre l epositio et l évéemet de saté étudié. Ils valet 1 e cas d absece d associatio. 172/179 Biostatistique - Carrat, Mallet, Morice

173 Tables statistiques Aee A Tables statistiques Biostatistique - Carrat, Mallet, Morice 173/179

174 Tables statistiques A.1 TABLE DE LA VARIABLE NORMALE REDUITE Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,00 2,576 2,326 2,170 2,054 1,960 1,881 1,812 1,751 1,695 0,10 1,645 1,598 1,555 1,514 1,476 1,440 1,405 1,372 1,341 1,311 0,20 1,282 1,254 1,227 1,200 1,175 1,150 1,126 1,103 1,080 1,058 0,30 1,036 1,015 0,994 0,974 0,954 0,935 0,915 0,896 0,878 0,860 0,40 0,842 0,824 0,806 0,789 0,772 0,755 0,739 0,722 0,706 0,690 0,50 0,674 0,659 0,643 0,628 0,613 0,598 0,583 0,568 0,553 0,539 0,60 0,524 0,510 0,496 0,482 0,468 0,454 0,440 0,426 0,412 0,399 0,70 0,385 0,372 0,358 0,345 0,332 0,319 0,305 0,292 0,279 0,266 0,80 0,253 0,240 0,228 0,215 0,202 0,189 0,176 0,164 0,151 0,138 0,90 0,126 0,113 0,100 0,088 0,075 0,063 0,050 0,038 0,025 0,013 La probabilité s obtiet par additio des ombres iscrits e marge eemple : pour u = 0,994, la probabilité est = 0,30 + 0,02 = 0,32 TABLE POUR LES PETITES VALEURS DE LA PROBABILITÉ 0,001 0, , , , , , u 3, , , , , , ,10941 (d après Fisher et Yates, Statistical tables for biological, agricultural, ad medical research (Oliver ad Boyd, Ediburgh) avec l aimable autorisatio des auteurs et des éditeurs) 174/179 Biostatistique - Carrat, Mallet, Morice

175 Tables statistiques A.2 TABLE DU TEST DE WILCOXON Table adaptée de Siegel 0,05 0,02 0,01 6 2, ,961 2, ,044 2,324 2, ,026 2,263 2, ,947 2,253 2, ,009 2,276 2, ,008 2,322 2, ,964 2,313 2, ,952 2,329 2, ,965 2,306 2,533 Idique, pour 15 les valeurs de W pour = 0,05, 0,02 et 0, Biostatistique - Carrat, Mallet, Morice 175/179

176 Tables statistiques A.3 TABLE DU TEST DE MANN- WHITNEY-WILCOXON Table adaptée de Siegel A B 4 0,05 2,333 1,905 0,01 2,687 2, ,05 2,117 2,107 2,110 0,01 2,415 2,596 2, ,05 1,962 2,047 2,118 2,018 0,01 2,479 2,473 2,483 2, ,05 2,074 2,003 1,965 2,086 2,057 0,01 2,530 2,570 2,615 2,514 2, ,05 1,960 1,970 1,991 2,014 2,037 1,953 0,01 2,572 2,480 2,576 2,530 2,500 2, ,05 2,052 2,099 2,013 1,956 2,022 1,982 2,040 0,01 2,422 2,561 2,680 2,546 2,551 2,560 2, ,05 1,961 2,065 2,033 2,017 2,010 2,008 2,009 2,011 0,01 2,366 2,489 2,523 2,560 2,498 2,541 2,580 2,540 Idique, pour A 10 et B 10, A B, les valeurs de M, pour =0,05 et =0,01. Eemple : A =5, B =8 : M 0,05 =1, /179 Biostatistique - Carrat, Mallet, Morice

177 Tables statistiques A.4 TABLE DE 2 La table doe la probabilité pour que 2 égale ou dépasse ue valeur doée, e foctio du ombre de degrés de liberté (d. d. l.) Quad le ombre de degrés de liberté est élevé, 2 2 autour de égale à 1 est à peu près distribué ormalemet 2d.d.l. 1 avec ue variace 0,90 0,50 0,30 0,20 0,10 0,05 0,02 0,01 0,001 ddl 1 0,0158 0,455 1,074 1,642 2,706 3,841 5,412 6,635 10, ,211 1,386 2,408 3,219 4,605 5,991 7,824 9,210 13, ,584 2,366 3,665 4,642 6,251 7,815 9,837 11,345 16, ,064 3,357 4,878 5,989 7,779 9,488 11,668 13,277 18, ,610 4,351 6,064 7,289 9,236 11,070 13,388 15,086 20, ,204 5,348 7,231 8,558 10,645 12,592 15,033 16,812 22, ,833 6,346 8,383 9,803 12,017 14,067 16,622 18,475 24, ,490 7,344 9,524 11,030 13,362 15,507 18,168 20,090 26, ,168 8,343 10,656 12,242 14,684 16,919 19,679 21,666 27, ,865 9,342 11,781 13,442 15,987 18,307 21,161 23,209 29, ,578 10,341 12,899 14,631 17,275 19,675 22,618 24,725 31, ,304 11,340 14,011 15,812 18,549 21,026 24,054 26,217 32, ,042 12,340 15,119 16,985 19,812 22,362 25,472 27,688 34, ,790 13,339 16,222 18,151 21,064 23,685 26,873 29,141 36, ,547 14,339 17,322 19,311 22,307 24,996 28,259 30,578 37, ,312 15,338 18,418 20,465 23,542 26,296 29,633 32,000 39, ,085 16,338 19,511 21,615 24,769 27,587 30,995 33,409 40, ,865 17,338 20,601 22,760 25,989 28,869 32,346 34,805 42, ,651 18,338 21,689 23,900 27,204 30,144 33,687 36,191 43, ,443 19,337 22,775 25,038 28,412 31,410 35,020 37,566 45, ,240 20,337 23,858 26,171 29,615 32,671 36,343 38,932 46, ,041 21,337 24,939 27,301 30,813 33,924 37,659 40,289 48, ,848 22,337 26,018 28,429 32,007 35,172 38,968 41,638 49, ,659 23,337 27,096 29,553 33,196 36,415 40,270 42,980 51, ,473 24,337 28,172 30,675 34,382 37,652 41,566 44,314 52, ,292 25,336 29,246 31,795 35,563 38,885 42,856 45,642 54, ,114 26,336 30,319 32,912 36,741 40,113 44,140 46,963 55, ,939 27,336 31,391 34,027 37,916 41,337 45,419 48,278 56, ,768 28,336 32,461 35,139 39,087 42,557 46,693 49,588 58, ,599 29,336 33,530 36,250 40,256 43,773 47,962 50,892 59,703 Eemple : avec d. d. l. = 3, pour K 3; = 0,584 la probabilité est = 0,90 (d après Fisher et Yates, Statistical tables for biological, agricultural, ad medical research (Oliver ad Boyd, Ediburgh) avec l aimable autorisatio des auteurs et des éditeurs) Biostatistique - Carrat, Mallet, Morice 177/179

178 Tables statistiques A.5 TABLE DU COEFFICIENT DE CORRELATION La table idique la probabilité pour que le coefficiet de corrélatio égale ou dépasse, e valeur absolue, ue valeur doée r, c est-à-dire la probabilité etérieure à l itervalle (- r,+ r ), e foctio du ombre de degrés de liberté (d. d. l.) ddl \ 0,10 0,05 0,02 0,01 1 0,9877 0,9969 0,9995 0, ,9000 0,9500 0,9800 0, ,8054 0,8783 0,9343 0, ,7293 0,8114 0,8822 0, ,6694 0,7545 0,8329 0, ,6215 0,7067 0,7887 0, ,5822 0,6664 0,7498 0, ,5494 0,6319 0,7155 0, ,5214 0,6021 0,6851 0, ,4973 0,5760 0,6581 0, ,4762 0,5529 0,6339 0, ,4575 0,5324 0,6120 0, ,4409 0,5139 0,5923 0, ,4259 0,4973 0,5742 0, ,4124 0,4821 0,5577 0, ,4000 0,4683 0,5425 0, ,3887 0,4555 0,5285 0, ,3783 0,4438 0,5155 0, ,3687 0,4329 0,5034 0, ,3598 0,4227 0,4921 0, ,3233 0,3809 0,4451 0, ,2960 0,3494 0,4093 0, ,2746 0,3246 0,3810 0, ,2573 0,3044 0,3578 0, ,2428 0,2875 0,3384 0, ,2306 0,2732 0,3218 0, ,2108 0,2500 0,2948 0, ,1954 0,2319 0,2737 0, ,1829 0,2172 0,2565 0, ,1726 0,2050 0,2422 0, ,1638 0,1946 0,2301 0,2540 Eemple : avec d. d. l. = 30, pour r = 0,3494 la probabilité est = 0,05 (d après Fisher et Yates, Statistical tables for biological, agricultural, ad medical research (Oliver ad Boyd, Ediburgh) avec l aimable autorisatio des auteurs et des éditeurs) 178/179 Biostatistique - Carrat, Mallet, Morice

179 Tables statistiques A.6 TABLE DU t DE STUDENT 0,90 0,50 0,30 0,20 0,10 0,05 0,02 0,01 0,001 ddl 1 0,158 1,000 1,963 3,078 6,314 12,706 31,821 63, , ,142 0,816 1,386 1,886 2,920 4,303 6,965 9,925 31, ,137 0,765 1,250 1,638 2,353 3,182 4,541 5,841 12, ,134 0,741 1,190 1,533 2,132 2,776 3,747 4,604 8, ,132 0,727 1,156 1,476 2,015 2,571 3,365 4,032 6, ,131 0,718 1,134 1,440 1,943 2,447 3,143 3,707 5, ,130 0,711 1,119 1,415 1,895 2,365 2,998 3,499 5, ,130 0,706 1,108 1,397 1,860 2,306 2,896 3,355 5, ,129 0,703 1,100 1,383 1,833 2,262 2,821 3,250 4, ,129 0,700 1,093 1,372 1,812 2,228 2,764 3,169 4, ,129 0,697 1,088 1,363 1,796 2,201 2,718 3,106 4, ,128 0,695 1,083 1,356 1,782 2,179 2,681 3,055 4, ,128 0,694 1,079 1,350 1,771 2,160 2,650 3,012 4, ,128 0,692 1,076 1,345 1,761 2,145 2,624 2,977 4, ,128 0,691 1,074 1,341 1,753 2,131 2,602 2,947 4, ,128 0,690 1,071 1,337 1,746 2,120 2,583 2,921 4, ,128 0,689 1,069 1,333 1,740 2,110 2,567 2,898 3, ,127 0,688 1,067 1,330 1,734 2,101 2,552 2,878 3, ,127 0,688 1,066 1,328 1,729 2,093 2,539 2,861 3, ,127 0,687 1,064 1,325 1,725 2,086 2,528 2,845 3, ,127 0,686 1,063 1,323 1,721 2,080 2,518 2,831 3, ,127 0,686 1,061 1,321 1,717 2,074 2,508 2,819 3, ,127 0,685 1,060 1,319 1,714 2,069 2,500 2,807 3, ,127 0,685 1,059 1,318 1,711 2,064 2,492 2,797 3, ,127 0,684 1,058 1,316 1,708 2,060 2,485 2,787 3, ,127 0,684 1,058 1,315 1,706 2,056 2,479 2,779 3, ,127 0,684 1,057 1,314 1,703 2,052 2,473 2,771 3, ,127 0,683 1,056 1,313 1,701 2,048 2,467 2,763 3, ,127 0,683 1,055 1,311 1,699 2,045 2,462 2,756 3, ,127 0,683 1,055 1,310 1,697 2,042 2,457 2,750 3,646 0,126 0,674 1,036 1,282 1,645 1,960 2,326 2,576 3,291 Eemple : avec d. d. l. = 10, pour t = 2,228, la probabilité est = 0,05 (d après Fisher et Yates, Statistical tables for biological, agricultural, ad medical research (Oliver ad Boyd, Ediburgh) avec l aimable autorisatio des auteurs et des éditeurs) Biostatistique - Carrat, Mallet, Morice 179/179

STATISTIQUE : TESTS D HYPOTHESES

STATISTIQUE : TESTS D HYPOTHESES STATISTIQUE : TESTS D HYPOTHESES Préparatio à l Agrégatio Bordeaux Aée 203-204 Jea-Jacques Ruch Table des Matières Chapitre I. Gééralités sur les tests 5. Itroductio 5 2. Pricipe des tests 6 2.a. Méthodologie

Plus en détail

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1 Premières propriétés des ombres réels 2 Suites umériques 3 Suites mootoes : à faire 4 Séries umériques 4. Notio de série. Défiitio 4.. Soit (u ) ue suite de ombres réels ou complexes. Pour N N, o ote S

Plus en détail

Séquence 5. La fonction logarithme népérien. Sommaire

Séquence 5. La fonction logarithme népérien. Sommaire Séquece 5 La foctio logarithme épérie Objectifs de la séquece Itroduire ue ouvelle foctio : la foctio logarithme épérie. Coaître les propriétés de cette foctio : sa dérivée, ses variatios, sa courbe, sa

Plus en détail

CHAPITRE 2 SÉRIES ENTIÈRES

CHAPITRE 2 SÉRIES ENTIÈRES CHAPITRE 2 SÉRIES ENTIÈRES 2. Séries etières Défiitio 2.. O appelle série etière toute série de foctios ( ) f dot le terme gééral est de la forme f ()=a, où (a ) désige ue suite réelle ou complee et R.

Plus en détail

Statistique descriptive bidimensionnelle

Statistique descriptive bidimensionnelle 1 Statistique descriptive bidimesioelle Statistique descriptive bidimesioelle Résumé Liaisos etre variables quatitatives (corrélatio et uages de poits), qualitatives (cotigece, mosaïque) et de types différets

Plus en détail

SÉRIES STATISTIQUES À DEUX VARIABLES

SÉRIES STATISTIQUES À DEUX VARIABLES 1 ) POSITION DU PROBLÈME - VOCABULAIRE A ) DÉFINITION SÉRIES STATISTIQUES À DEUX VARIABLES O cosidère deux variables statistiques umériques x et y observées sur ue même populatio de idividus. O ote x 1

Plus en détail

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI FEUILLE D EXERCICES 7 - PROBABILITÉS SUR UN UNIVERS FINI Exercice - Lacer de dés O lace deux dés à 6 faces équilibrés. Calculer la probabilité d obteir : u double ; ue somme des deux dés égale à 8 ; ue

Plus en détail

Chapitre 3 : Fonctions d une variable réelle (1)

Chapitre 3 : Fonctions d une variable réelle (1) Uiversités Paris 6 et Paris 7 M1 MEEF Aalyse (UE 3) 2013-2014 Chapitre 3 : Foctios d ue variable réelle (1) 1 Lagage topologique das R Défiitio 1 Soit a u poit de R. U esemble V R est u voisiage de a s

Plus en détail

1 Mesure et intégrale

1 Mesure et intégrale 1 Mesure et itégrale 1.1 Tribu boréliee et foctios mesurables Soit =[a, b] u itervalle (le cas où b = ou a = est pas exclu) et F ue famille de sous-esembles de. OditqueF est ue tribu sur si les coditios

Plus en détail

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME Uiversité Victor Segale Bordeaux Istitut de Saté Publique, d Épidémiologie et de Développemet (ISPED) Campus Numérique SEME MODULE Pricipaux outils e statistique Versio du 8 août 008 Écrit par : Relu par

Plus en détail

Limites des Suites numériques

Limites des Suites numériques Chapitre 2 Limites des Suites umériques Termiale S Ce que dit le programme : CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES Limite fiie ou ifiie d ue suite. Limites et comparaiso. Opératios sur les ites. Comportemet

Plus en détail

Cours 5 : ESTIMATION PONCTUELLE

Cours 5 : ESTIMATION PONCTUELLE Cours 5 : ESTIMATION PONCTUELLE A- Gééralités B- Précisio d u estimateur C- Exhaustivité D- iformatio E-estimateur sas biais de variace miimale, estimateur efficace F- Quelques méthode s d estimatio A-

Plus en détail

Dénombrement. Chapitre 1. 1.1 Enoncés des exercices

Dénombrement. Chapitre 1. 1.1 Enoncés des exercices Chapitre 1 Déombremet 1.1 Eocés des exercices Exercice 1 L acie système d immatriculatio fraçais était le suivat : chaque plaque avait 4 chiffres, suivis de 2 lettres, puis des 2 uméros du départemet.

Plus en détail

UNIVERSITÉ DE SFAX École Supérieure de Commerce

UNIVERSITÉ DE SFAX École Supérieure de Commerce UNIVERSITÉ DE SFAX École Supérieure de Commerce Aée Uiversitaire 2003 / 2004 Auditoire : Troisième Aée Études Supérieures Commerciales & Scieces Comptables DÉCISIONS FINANCIÈRES Note de cours N 3 Première

Plus en détail

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES DEUXIEME PARTIE Deuième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES Chapitre. L assurace de capital différé Chapitre 2. Les opératios de retes Chapitre 3. Les assuraces décès Chapitre 4. Les assuraces

Plus en détail

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire 2006-2007. Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire 2006-2007. Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4 UNVERSTE MONTESQUEU BORDEAUX V Licece 3 ère aée Ecoomie - Gestio Aée uiversitaire 2006-2007 Semestre 2 Prévisios Fiacières Travaux Dirigés - Séaces 4 «Les Critères Complémetaires des Choix d vestissemet»

Plus en détail

Principes et Méthodes Statistiques

Principes et Méthodes Statistiques Esimag - 2ème aée 0 1 2 3 4 5 6 7 0 5 10 15 x y Pricipes et Méthodes Statistiques Notes de cours Olivier Gaudoi 2 Table des matières 1 Itroductio 7 1.1 Défiitio et domaies d applicatio de la statistique............

Plus en détail

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1 Aalyse des doées Statistiques appliquées à la gestio Cours d aalyse de doés Master F. SEYTE : Maître de coféreces HDR e scieces écoomiques Uiversité de Motpellier I M. TERRAZA : Professeur de scieces écoomiques

Plus en détail

EXERCICES : DÉNOMBREMENT

EXERCICES : DÉNOMBREMENT Chapitre 7 ECE 1 - Grad Nouméa - 015 EXERCICES : DÉNOMBREMENT LISTES / ARRANGEMENTS Exercice 1 : Le code ativol Pour so vélo, Toto possède u ativol a code. Le code est ue successio de trois chiffres compris

Plus en détail

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009 M LA REGRESSION : HYPOTHESES ET TESTS Avril 009 I LES HYPOTHESES DE LA MCO. Hypothèses sur la variable explicative a. est o stochastique. b. a des valeurs xes das les différets échatillos. c. Quad ted

Plus en détail

Probabilités et statistique pour le CAPES

Probabilités et statistique pour le CAPES Probabilités et statistique pour le CAPES Béatrice de Tilière Frédérique Petit 2 3 jui 205. Uiversité Pierre et Marie Curie 2. Uiversité Pierre et Marie Curie 2 Table des matières Modélisatio de phéomèes

Plus en détail

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre 2010. 1.1 Quelques dénitions

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre 2010. 1.1 Quelques dénitions Déombremet ECE3 Lycée Carot 12 ovembre 2010 Itroductio La combiatoire, sciece du déombremet, sert comme so om l'idique à compter. Il e s'agit bie etedu pas de reveir au stade du CP et d'appredre à compter

Plus en détail

Cours de Statistiques inférentielles

Cours de Statistiques inférentielles Licece 2-S4 SI-MASS Aée 2015 Cours de Statistiques iféretielles Pierre DUSART 2 Chapitre 1 Lois statistiques 1.1 Itroductio Nous allos voir que si ue variable aléatoire suit ue certaie loi, alors ses réalisatios

Plus en détail

20. Algorithmique & Mathématiques

20. Algorithmique & Mathématiques L'éditeur L'éditeur permet à l'utilisateur de saisir les liges de codes d'u programme ou de défiir des foctios. Remarque : O peut saisir directemet des istructios das la cosole Scilab, mais il est plus

Plus en détail

Intégration et probabilités ENS Paris, 2012-2013. TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

Intégration et probabilités ENS Paris, 2012-2013. TD (20)13 Lois des grands nombres, théorème central limite. Corrigé : Itégratio et probabilités EN Paris, 202-203 TD 203 Lois des grads ombres, théorème cetral limite. Corrigé Lois des grads ombres Exercice. Calculer e cet leços Détermier les limites suivates : x +... +

Plus en détail

Chap. 5 : Les intérêts (Les calculs financiers)

Chap. 5 : Les intérêts (Les calculs financiers) Chap. 5 : Les itérêts (Les calculs fiaciers) Das u cotrat de prêt, le prêteur met à la dispositio de l empruteur, à u taux d itérêt doé, ue somme d arget (le capital) qu il devra rembourser à ue certaie

Plus en détail

UV SQ 20. Automne 2006. Responsable d Rémy Garandel ( m.-el. [email protected] ) page 1

UV SQ 20. Automne 2006. Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1 UV SQ 0 Probabilités Statistiques UV SQ 0 Autome 006 Resposable d Rémy Garadel ( m.-el. [email protected] ) page SQ-0 Probabilités - Statistiques Bibliographie: Titre Auteur(s) Editios Localisatio Niveau

Plus en détail

55 - EXEMPLES D UTILISATION DU TABLEUR.

55 - EXEMPLES D UTILISATION DU TABLEUR. 55 - EXEMPLES D UTILISATION DU TABLEUR. CHANTAL MENINI 1. U pla possible Les exemples qui vot suivre sot des pistes possibles et e aucu cas ue présetatio exhaustive. De même je ai pas fait ue étude systématique

Plus en détail

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil. Qu appelle-t-o éclipse? Éclipser sigifie «cacher». Vus depuis la Terre, deu corps célestes peuvet être éclipsés : la Lue et le Soleil. LES ÉCLIPSES Pour qu il ait éclipse, les cetres de la Terre, de la

Plus en détail

Séries réelles ou complexes

Séries réelles ou complexes 6 Séries réelles ou complexes Comme pour le chapitre 3, les suites cosidérées sot a priori complexes et les résultats classiques sur les foctios cotiues ou dérivables d ue variable réelle sot supposés

Plus en détail

Exercice I ( non spé ) 1/ u 1 = 3 4. 2 3 u 2 4 + 3 9. 19 4 2/ Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

Exercice I ( non spé ) 1/ u 1 = 3 4. 2 3 u 2 4 + 3 9. 19 4 2/ Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1 Bac blac TS Correctio Exercice I ( Spé ) / émotros par récurrece que 5x y = pour tout etier aturel 5x y = 5 8 = La propriété est doc vraie au rag = Supposos que la propriété est vraie jusqu au rag, o a

Plus en détail

14 Chapitre 14. Théorème du point fixe

14 Chapitre 14. Théorème du point fixe Chapitre 14 Chapitre 14. Théorème du poit fixe Si l o examie de plus près les méthodes de Lagrage et de Newto, étudiées au chapitre précédet, elles revieet das leur pricipe à remplacer la résolutio de

Plus en détail

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9 Au sommaire : Suites extraites Le théorème de Bolzao-Weierstrass La preuve du théorème de Bolzao-Weierstrass3 Foctio K-cotractate4 Le théorème du poit fixe5 La preuve du théorème du poit fixe6 Utilisatios

Plus en détail

Comportement d'une suite

Comportement d'une suite Comportemet d'ue suite I) Approche de "ses de variatio et de ite d'ue suite" : 7 Soit la suite ( ) telle que = 5 ( + ) 2 Représetos graphiquemet la suite das u pla mui d' u repère. Il suffit de placer

Plus en détail

Processus et martingales en temps continu

Processus et martingales en temps continu Chapitre 3 Processus et martigales e temps cotiu 1 Quelques rappels sur les martigales e temps discret (voir [4]) O cosidère u espace filtré (Ω, F, (F ) 0, IP). O ote F = 0 F. Défiitio 1.1 Ue suite de

Plus en détail

Les Nombres Parfaits.

Les Nombres Parfaits. Les Nombres Parfaits. Agathe CAGE, Matthieu CABAUSSEL, David LABROUSSE (2 de Lycée MONTAIGNE BORDEAUX) et Alexadre DEVERT, Pierre Damie DESSARPS (TS Lycée SUD MEDOC LETAILLAN MEDOC) La première partie

Plus en détail

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent http://www.math.u-bordeaux.fr/ machaven/ 2014-2015

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent http://www.math.u-bordeaux.fr/ machaven/ 2014-2015 Uiversité de Bordeaux - Master MIMSE - 2ème aée Scorig Marie Chavet http://www.math.u-bordeaux.fr/ machave/ 2014-2015 1 Itroductio L idée géérale est d affecter ue ote (u score) global à u idividu à partir

Plus en détail

[http://mp.cpgedupuydelome.fr] édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ 02475 ] [correction] Si n est un entier 2, le rationnel H n =

[http://mp.cpgedupuydelome.fr] édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ 02475 ] [correction] Si n est un entier 2, le rationnel H n = [http://mp.cpgedupuydelome.fr] édité le 1 juillet 14 Eocés 1 Nombres réels Ratioels et irratioels Exercice 1 [ 9 ] [correctio] Motrer que la somme d u ombre ratioel et d u ombre irratioel est u ombre irratioel.

Plus en détail

Chapitre 3 : Transistor bipolaire à jonction

Chapitre 3 : Transistor bipolaire à jonction Chapitre 3 : Trasistor bipolaire à joctio ELEN075 : Electroique Aalogique ELEN075 : Electroique Aalogique / Trasistor bipolaire U aperçu du chapitre 1. Itroductio 2. Trasistor p e mode actif ormal 3. Courats

Plus en détail

Statistique Numérique et Analyse des Données

Statistique Numérique et Analyse des Données Statistique Numérique et Aalyse des Doées Arak DALALYAN Septembre 2011 Table des matières 1 Élémets de statistique descriptive 9 1.1 Répartitio d ue série umérique uidimesioelle.............. 9 1.2 Statistiques

Plus en détail

c. Calcul pour une évolution d une proportion entre deux années non consécutives

c. Calcul pour une évolution d une proportion entre deux années non consécutives Calcul des itervalles de cofiace our les EPCV 996-004 - Cas d u ourcetage ou d ue évolutio e oit das la oulatio totale des méages - Cas d u ourcetage ou d ue évolutio das ue sous oulatio das les méages

Plus en détail

STATISTIQUE AVANCÉE : MÉTHODES

STATISTIQUE AVANCÉE : MÉTHODES STATISTIQUE AVANCÉE : MÉTHODES NON-PAAMÉTIQUES Ecole Cetrale de Paris Arak S. DALALYAN Table des matières 1 Itroductio 5 2 Modèle de desité 7 2.1 Estimatio par istogrammes............................

Plus en détail

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2. Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES PLAN DU CHAPITRE 2 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.1 Pla de sodage 2.2.2 Probabilités d iclusio 2.3 SONDAGE

Plus en détail

Etude de la fonction ζ de Riemann

Etude de la fonction ζ de Riemann Etude de la foctio ζ de Riema ) Défiitio Pour x réel doé, la série de terme gééral,, coverge si et seulemet si x >. x La foctio zeta de Riema est la foctio défiie sur ], [ par : ( x > ), = x. Remarque.

Plus en détail

Module 3 : Inversion de matrices

Module 3 : Inversion de matrices Math Stat Module : Iversio de matrices M Module : Iversio de matrices Uité. Défiitio O e défiira l iverse d ue matrice que si est carrée. O appelle iverse de la matrice carrée toute matrice B telle que

Plus en détail

Initiation à l analyse factorielle des correspondances

Initiation à l analyse factorielle des correspondances Fiche TD avec le logiciel : tdr620b Iitiatio à l aalyse factorielle des correspodaces A.B. Dufour & M. Royer & J.R. Lobry Das cette fiche, o étudie l Aalyse Factorielle des Correspodaces. Cette techique

Plus en détail

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 ) RAIRO Operatios Research RAIRO Oper. Res. 34 (2000) 99-129 TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 ) Commuiqué par Berard LEMAIRE Résumé. L étude

Plus en détail

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X Exo7 Détermiats Exercices de Jea-Louis Rouget Retrouver aussi cette fiche sur wwwmaths-fracefr * très facile ** facile *** difficulté moyee **** difficile ***** très difficile I : Icotourable T : pour

Plus en détail

2 ième partie : MATHÉMATIQUES FINANCIÈRES

2 ième partie : MATHÉMATIQUES FINANCIÈRES 2 ième partie : MATHÉMATIQUES FINANCIÈRES 1. Défiitios L'itérêt est l'idemité que doe au propriétaire d'ue somme d'arget celui qui e a joui pedat u certai temps. Divers élémets itervieet das le calcul

Plus en détail

Échantillonnage et estimation

Échantillonnage et estimation Stage «Nouveaux programmes de Termiale S» - Ho Chi Mih-Ville Novembre 202 Échatilloage et estimatio Partie C - Frédéric Barôme page Échatilloage et estimatio Partie C : Capacités et exercices-types. Rappelos

Plus en détail

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable Exo7 Topologie Exercices de Jea-Louis Rouget Retrouver aussi cette fiche sur wwwmaths-fracefr * très facile ** facile *** difficulté moyee **** difficile ***** très difficile I : Icotourable Exercice **

Plus en détail

Suites et séries de fonctions

Suites et séries de fonctions [http://mp.cpgedupuydelome.fr] édité le 3 avril 5 Eocés Suites et séries de foctios Propriétés de la limite d ue suite de foctios Eercice [ 868 ] [correctio] Etablir que la limite simple d ue suite de

Plus en détail

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3. EXERCICE 3 (6 poits ) (Commu à tous les cadidats) Il est possible de traiter la partie C sas avoir traité la partie B Partie A O désige par f la foctio défiie sur l itervalle [, + [ par Détermier la limite

Plus en détail

4 Approximation des fonctions

4 Approximation des fonctions 4 Approximatio des foctios Ue foctio f arbitraire défiie sur u itervalle I et à valeur das IR peut être représetée par so graphe, ou de maière équivalete par la doée de l esemble de ses valeurs f(t) pour

Plus en détail

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe Cosolidatio La société THEOS, qui commercialise des vis, exerce so activité das trois villes : Paris, Nacy et Nice. Le directeur de la société souhaite cosolider les résultats de ses vetes par ville das

Plus en détail

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT? Etude Spéciale o. 7 Javier 2003 SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT? MARK SCHNEIDER Le CGAP vous ivite à lui faire part de vos commetaires, de vos rapports et de toute demade d evoid autres

Plus en détail

Exercices de mathématiques

Exercices de mathématiques MP MP* Thierry DugarDi Marc rezzouk Exercices de mathématiques Cetrale-Supélec, Mies-Pots, École Polytechique et ENS Coceptio et créatio de couverture : Atelier 3+ Duod, 205 5 rue Laromiguière, 75005 Paris

Plus en détail

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable Eo7 Séries etières Eercices de Jea-Louis Rouget Retrouver aussi cette fiche sur wwwmaths-fracefr * très facile ** facile *** difficulté moyee **** difficile ***** très difficile I : Icotourable Eercice

Plus en détail

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales PROMENADE ALÉATOIRE : Chaîes de Markov et martigales Thierry Bodieau École Polytechique Paris Départemet de Mathématiques Appliquées [email protected] Novembre 2013 2 Table des matières

Plus en détail

Le Sphinx. Enquêtes, Sondages. Analyse de données. Internet : http://www.lesphinxdeveloppement.fr/club/index.html

Le Sphinx. Enquêtes, Sondages. Analyse de données. Internet : http://www.lesphinxdeveloppement.fr/club/index.html Equêtes, Sodages Aalyse de doées Le Sphix! Iteret : http://www.lesphixdeveloppemet.fr/club/idex.html Lagarde J. Aalyse statistique de doées, Duod. Réaliser vos equêtes Questioaire Traitemets et aalyses

Plus en détail

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation 1 / 9 Chap. 6 : Les pricipaux crédits de trésorerie et leur comptabilisatio Le cycle d exploitatio des etreprises (achats stockage productio stockage vetes) peut etraîer des décalages de trésorerie plus

Plus en détail

Processus géométrique généralisé et applications en fiabilité

Processus géométrique généralisé et applications en fiabilité Processus géométrique gééralisé et applicatios e fiabilité Lauret Bordes 1 & Sophie Mercier 2 1,2 Uiversité de Pau et des Pays de l Adour Laboratoire de Mathématiques et de leurs Applicatios - Pau UMR

Plus en détail

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation Chap. 6 : Les pricipaux crédits de trésorerie et leur comptabilisatio Les etreprises ot souvet besoi de moyes de fiacemet à court terme : elles ot alors recours aux crédits bacaires (découverts bacaires

Plus en détail

La fibre optique arrive chez vous Devenez acteur de la révolution numérique

La fibre optique arrive chez vous Devenez acteur de la révolution numérique 2 e éditio Edité par l Autorité de régulatio des commuicatios électroiques et des postes RÉPUBLIQUE FRANÇAISE DÉCEMBRE 2010 La fibre optique arrive chez vous Deveez acteur de la révolutio umérique Petit

Plus en détail

Comment les Canadiens classent-ils leur système de soins de santé?

Comment les Canadiens classent-ils leur système de soins de santé? Novembre Les sois de saté au Caada, c est capital bulleti o 4 Commet les Caadies classet-ils leur système de sois de saté? Résultats du sodage iteratioal du Fods du Commowealth sur les politiques de saté

Plus en détail

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe 1/5 Trois objectifs poursuivis par le gouveremet : > améliorer la compétitivité fiscale de la Frace > péreiser les activités de R&D > faire de la Frace u territoire attractif pour l iovatio Les icitatios

Plus en détail

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3 1 Groupe orthogoal d'u espace vectoriel euclidie de dimesio, de dimesio Voir le chapitre 19 pour l'étude des espaces euclidies et des isométries. État doé u espace euclidie E de dimesio 1, o rappelle que

Plus en détail

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus Réseaux d odelettes et réseaux de euroes pour la modélisatio statique et dyamique de processus Yacie Oussar To cite this versio: Yacie Oussar. Réseaux d odelettes et réseaux de euroes pour la modélisatio

Plus en détail

Formation d un ester à partir d un acide et d un alcool

Formation d un ester à partir d un acide et d un alcool CHAPITRE 10 RÉACTINS D ESTÉRIFICATIN ET D HYDRLYSE 1 Formatio d u ester à partir d u acide et d u alcool 1. Nomeclature Acide : R C H Alcool : R H Groupe caractéristique ester : C Formule géérale d u ester

Plus en détail

Terminale S. Terminale S 1 F. Laroche

Terminale S. Terminale S 1 F. Laroche Termiale S Exercices. Rappels et exercices de base 3.. QCM (P. Egel) 3.. QCM, Atilles 005 4. 3. QCM, Liba 009, 3 poits 4. 4. QCM, C. étragers 007. 5. QCM, Frace 007 5 6. 6. QCM, N. Calédoie 007 7. 7. QCM

Plus en détail

Baccalauréat S Asie 19 juin 2014 Corrigé

Baccalauréat S Asie 19 juin 2014 Corrigé Bcclurét S Asie 9 jui 24 Corrigé A. P. M. E. P. Exercice Commu à tous les cdidts 4 poits Questio - c. O peut élimier rpidemet les réposes. et d. cr les vecteurs directeurs des droites proposées e sot ps

Plus en détail

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation Tempêtes : Etude des dépedaces etre les braches Automobile et Icedie à l aide de la théorie des copulas Topic Risk evaluatio Belguise Olivier Charles Levi ACM Guy Carpeter 34 rue du Wacke 47/53 rue Raspail

Plus en détail

Polynésie Septembre 2002 - Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Polynésie Septembre 2002 - Exercice On peut traiter la question 4 sans avoir traité les questions précédentes. Polyésie Septembre 2 - Exercice O peut traiter la questio 4 sas avoir traité les questios précédetes Pour u achat immobilier, lorsqu ue persoe emprute ue somme de 50 000 euros, remboursable par mesualités

Plus en détail

Simulations interactives de convertisseurs en électronique de puissance

Simulations interactives de convertisseurs en électronique de puissance Simulatios iteractives de covertisseurs e électroique de puissace Jea-Jacques HUSELSTEIN, Philippe ENII Laboratoire d'électrotechique de Motpellier (LEM) - Uiversité Motpellier II, 079, Place Eugèe Bataillo,

Plus en détail

La maladie rénale chronique

La maladie rénale chronique La maladie réale chroique Qu est-ce que cela veut dire pour moi? Natioal Kidey Disease Educatio Program La maladie réale chroique: l essetiel Vous avez été iformé(e) que vous êtes atteit(e) de la maladie

Plus en détail

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO Des résultats du Programme de réductio des risques STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO 1. Cotexte La puaise tere Lygus lieolaris (figure 1) est

Plus en détail

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction A ew adaptive operator of fusio par Fraçois DELMOTTE LAMIH, Uiversité de Valeciees et du Haiaut-Cambrésis, Le Mot Houy, BP 3, 5933 Valeciees CEDEX 9 [email protected] résumé et mots clés

Plus en détail

La tarification hospitalière : de l enveloppe globale à la concurrence par comparaison

La tarification hospitalière : de l enveloppe globale à la concurrence par comparaison ANNALES D ÉCONOMIE ET DE STATISTIQUE. N 58 2000 La tarificatio hospitalière : de l eveloppe globale à la cocurrece par comparaiso Michel MOUGEOT * RÉSUMÉ. Cet article cosidère différetes politiques de

Plus en détail

MESURE DE L'INFORMATION

MESURE DE L'INFORMATION MESURE DE L'INFORMATION Marc URO TABLE DES MATIÈRES INTRODUCTION... 3 INCERTITUDE D'UN ÉVÉNEMENT (OU SELF-INFORMATION)... 7 INFORMATION MUTUELLE DE DEUX ÉVÉNEMENTS... 9 ENTROPIE D'UNE VARIABLE ALÉATOIRE

Plus en détail

Les études. Recommandations applicables aux appareils de levage "anciens" dans les ports. Guide Technique

Les études. Recommandations applicables aux appareils de levage anciens dans les ports. Guide Technique es Cetre d Etudes Techiques Maritimes et Fluviales Les études Recommadatios applicables aux appareils de levage "acies" das les ports Guide Techique PM 03.01 Cetre d Etudes Techiques Maritimes et Fluviales

Plus en détail

Introduction : Mesures et espaces de probabilités

Introduction : Mesures et espaces de probabilités Itroductio : Mesures et espaces de probabilités Référeces : Poly cédric Berardi et Jea Michel Morel. J.-F. Le Gall, Itégratio, Probabilités et Processus Aléatoire J.-Y. Ouvrard, Probabilités 2, maîtrise-agrégatio,

Plus en détail

Gérer les applications

Gérer les applications Gérer les applicatios E parcourat les rayos du Widows Phoe Store, vous serez e mesure de compléter les services de base de votre smartphoe à travers plus de 10 000 applicatios. Gratuites ou payates, ces

Plus en détail

Chaînes de Markov. Arthur Charpentier

Chaînes de Markov. Arthur Charpentier Chaîes de Markov Arthur Charpetier École Natioale de la Statistique et d Aalyse de l Iformatio - otes de cours à usage exclusif des étudiats de l ENSAI - - e pas diffuser, e pas citer - Quelques motivatios.

Plus en détail

RÈGLES ORDINALES : UNE GÉNÉRALISATION DES RÈGLES D'ASSOCIATION

RÈGLES ORDINALES : UNE GÉNÉRALISATION DES RÈGLES D'ASSOCIATION RÈGLES ORDIALES : UE GÉÉRALISATIO DES RÈGLES D'ASSOCIATIO SYLVIE GUILLAUME ALI KHECHAF 2 RÉSUMÉ: La plupart des mesures des règles cocere les variables biaires et écessite pour les autres types de variables

Plus en détail

COMMENT ÇA MARCHE GUIDE DE L ENSEIGNANT 9 E ANNÉE

COMMENT ÇA MARCHE GUIDE DE L ENSEIGNANT 9 E ANNÉE GUIDE DE L ENSEIGNANT 9 E ANNÉE TROUSSE PÉDAGOGIQUE 9 E ANNÉE Le préset Guide de l eseigat, qui accompage la trousse pédagogique COMMENT ÇA MARCHE : PRODUCTION D ÉLECTRICITÉ 9 e aée a été coçu à l itetio

Plus en détail

Microscope de mesure sans contact pour inspection et mesures de précision

Microscope de mesure sans contact pour inspection et mesures de précision KESTREL ELITE KESTREL ELITE Microscope de mesure sas cotact pour ispectio et mesures de précisio Microscope à deux axes sas cotact, idéal pour la mesure de caractéristiques 2-D de pièces techiques de petite

Plus en détail

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3... Applicatios des maths Algèbre fiacière 1. Itérêts composés O place u capital C 0 à u taux auel T a pedat aées. Quelle est la valeur fiale C de ce capital? aée capital e fi d'aée 1 C 0 + T C 0 = C 0 (1

Plus en détail

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble. II LE MARCHE DU CAFE 1 L attractivité La segmetatio selo le mode de productio Le marché du café peut être segmeté e foctio de deux modes de productio pricipaux : la torréfactio et la fabricatio de café

Plus en détail

Tableaux Croisés et Diagrammes en Mosaïque : Pour Voir Les Probabilités Marginales et Conditionnelles.

Tableaux Croisés et Diagrammes en Mosaïque : Pour Voir Les Probabilités Marginales et Conditionnelles. Tableaux Croisés et Diagrammes e Mosaïque : Pour Voir Les Probabilités Margiales et Coditioelles. Moique Le Gue CNRS- MATISSE 1 Résumé Cet article s iscrit das ue démarche de sesibilisatio aux différetes

Plus en détail

Sommaire Chapitre 1 - L interface de Windows 7 9

Sommaire Chapitre 1 - L interface de Windows 7 9 Sommaire Chapitre 1 - L iterface de Widows 7 9 1.1. Utiliser le meu Démarrer et la barre des tâches de Widows 7...11 Démarrer et arrêter des programmes...15 Épigler u programme das la barre des tâches...18

Plus en détail

DETERMINANTS. a b et a'

DETERMINANTS. a b et a' 2003 - Gérard Lavau - http://perso.waadoo.fr/lavau/idex.htm Vous avez toute liberté pour télécharger, imprimer, photocopier ce cours et le diffuser gratuitemet. Toute diffusio à titre oéreux ou utilisatio

Plus en détail

Le chef d entreprise développe les services funéraires de l entreprise, en

Le chef d entreprise développe les services funéraires de l entreprise, en Le chef d etreprise développe les services fuéraires de l etreprise, e assurat lui-même tout ou partie des activités de vete et e ecadrat directemet le persoel techique et commercial et d exploitatio.

Plus en détail

Compte Sélect Banque Manuvie Guide du débutant

Compte Sélect Banque Manuvie Guide du débutant GUIDE DU DÉBUTANT Compte Sélect Baque Mauvie Guide du débutat Besoi d aide? Preez quelques miutes pour lire attetivemet votre Guide du cliet. Le préset Guide du débutat vous facilitera l utilisatio de

Plus en détail

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot Exame fial pour Coseiller fiacier / coseillère fiacière avec brevet fédéral Recueil de formules Auteur: Iwa Brot Ce recueil de formules sera mis à dispositio des cadidats, si écessaire. Etat au 1er mars

Plus en détail

RESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *)

RESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *) RESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *) *) Uiversité de Blida Faculté des scieces Départemet de Mathématiques. BP 270, Route de Soumaa. Blida, Algérie. Tel &

Plus en détail

Télé OPTIK. Plus spectaculaire que jamais.

Télé OPTIK. Plus spectaculaire que jamais. Télé OPTIK Plus spectaculaire que jamais. Vivez toute la puissace de la télévisio sur IP grâce au réseau OPTIK 1 de TELUS et découvrez-e l extraordiaire potetiel. Télé OPTIK MC vous doe la parfaite maîtrise

Plus en détail

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions. 3 Réseau Le réseau costitue u aspect essetiel d u eviroemet virtuel ESX. Il est doc importat de compredre la techologie, y compris ses différets composats et leur coopératio. Das ce chapitre, ous étudios

Plus en détail

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers.

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers. Reseigemets et moitorig. Reseigemets commerciaux et de solvabilité sur les etreprises et les particuliers. ENSEMBLE CONTRE LES PERTES. Reseigemets Creditreform. Pour plus de trasparece. Etreteir des rapports

Plus en détail

Neolane Leads. Neolane v6.0

Neolane Leads. Neolane v6.0 Neolae Leads Neolae v6.0 Ce documet, aisi que le logiciel qu'il décrit, est fouri das le cadre d'u accord de licece et e peut être utilisé ou copié que das les coditios prévues par cet accord. Cette publicatio

Plus en détail

Les algorithmes de tri

Les algorithmes de tri CONSERVATOIRE NATIONAL DES ARTS ET METIERS PARIS MEMOIRE POUR L'EXAMEN PROBATOIRE e INFORMATIQUE par Nicolas HERVE Les algorithmes de tri Souteu le mai JURY PRESIDENTE : Mme COSTA Sommaire Itroductio....

Plus en détail