Université Pierre et Marie Curie. Biostatistique PACES - UE4 2013-2014



Documents pareils
STATISTIQUE : TESTS D HYPOTHESES

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

Séquence 5. La fonction logarithme népérien. Sommaire

CHAPITRE 2 SÉRIES ENTIÈRES

Statistique descriptive bidimensionnelle

SÉRIES STATISTIQUES À DEUX VARIABLES

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

Chapitre 3 : Fonctions d une variable réelle (1)

1 Mesure et intégrale

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Limites des Suites numériques

Cours 5 : ESTIMATION PONCTUELLE

Dénombrement. Chapitre Enoncés des exercices

UNIVERSITÉ DE SFAX École Supérieure de Commerce

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

Principes et Méthodes Statistiques

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

EXERCICES : DÉNOMBREMENT

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

Probabilités et statistique pour le CAPES

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

Cours de Statistiques inférentielles

20. Algorithmique & Mathématiques

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

Chap. 5 : Les intérêts (Les calculs financiers)

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

55 - EXEMPLES D UTILISATION DU TABLEUR.

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

Séries réelles ou complexes

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

14 Chapitre 14. Théorème du point fixe

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

Comportement d'une suite

Processus et martingales en temps continu

Les Nombres Parfaits.

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

Chapitre 3 : Transistor bipolaire à jonction

Statistique Numérique et Analyse des Données

c. Calcul pour une évolution d une proportion entre deux années non consécutives

STATISTIQUE AVANCÉE : MÉTHODES

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

Etude de la fonction ζ de Riemann

Module 3 : Inversion de matrices

Initiation à l analyse factorielle des correspondances

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

2 ième partie : MATHÉMATIQUES FINANCIÈRES

Échantillonnage et estimation

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Suites et séries de fonctions

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

4 Approximation des fonctions

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

Exercices de mathématiques

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

Le Sphinx. Enquêtes, Sondages. Analyse de données. Internet :

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Processus géométrique généralisé et applications en fiabilité

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

La fibre optique arrive chez vous Devenez acteur de la révolution numérique

Comment les Canadiens classent-ils leur système de soins de santé?

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus

Formation d un ester à partir d un acide et d un alcool

Terminale S. Terminale S 1 F. Laroche

Baccalauréat S Asie 19 juin 2014 Corrigé

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Simulations interactives de convertisseurs en électronique de puissance

La maladie rénale chronique

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

La tarification hospitalière : de l enveloppe globale à la concurrence par comparaison

MESURE DE L'INFORMATION

Les études. Recommandations applicables aux appareils de levage "anciens" dans les ports. Guide Technique

Introduction : Mesures et espaces de probabilités

Gérer les applications

Chaînes de Markov. Arthur Charpentier

RÈGLES ORDINALES : UNE GÉNÉRALISATION DES RÈGLES D'ASSOCIATION

COMMENT ÇA MARCHE GUIDE DE L ENSEIGNANT 9 E ANNÉE

Microscope de mesure sans contact pour inspection et mesures de précision

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

Tableaux Croisés et Diagrammes en Mosaïque : Pour Voir Les Probabilités Marginales et Conditionnelles.

Sommaire Chapitre 1 - L interface de Windows 7 9

DETERMINANTS. a b et a'

Le chef d entreprise développe les services funéraires de l entreprise, en

Compte Sélect Banque Manuvie Guide du débutant

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

RESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *)

Télé OPTIK. Plus spectaculaire que jamais.

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

Renseignements et monitoring. Renseignements commerciaux et de solvabilité sur les entreprises et les particuliers.

Neolane Leads. Neolane v6.0

Les algorithmes de tri

Transcription:

Uiversité Pierre et Marie Curie Biostatistique PACES - UE4 2013-2014 Resposables : F. Carrat et A. Mallet Auteurs : F. Carrat, A. Mallet, V. Morice Mise à jour : 21 octobre 2013 Relecture : V. Morice, A. Mallet, A.J. Vallero, F. Carrat et S. Tézeas

2/179 Biostatistique - Carrat, Mallet, Morice 2013-2014

Sommaire Sommaire 3 Sommaire 9 Avat-propos 11 Itroductio 11 1 La variabilité et l icertai 12 2 La mesure d ue gradeur 12 2.1 Uités et équatios au dimesios 13 2.2 Erreurs de mesure 14 3 La décisio das l icertai 15 Chapitre 1 : Statistique(s) et Probabilité(s) 15 1.1 Statistique 15 1.2 Populatio et échatillo 16 1.3 Statistique et probabilité 19 Chapitre 2 : Rappels mathématiques 19 2.1 Esembles, élémets 19 2.2 Opératios sur les esembles 21 2.3 Esembles fiis, déombrables, o déombrables 21 2.4 Esembles produits 22 2.5 Familles d esembles 22 2.6 Autres rappels mathématiques 22 2.6.1 Rappel sur les sommes 23 2.6.2 Rappel sur les itégrales 25 Chapitre 3 : Elémets de calcul des Probabilités 25 3.1 Itroductio 26 3.2 Epériece aléatoire, esemble fodametal et évéemets 27 3.3 Opératios sur les évéemets 27 3.4 Règles du calcul des probabilités 29 3.5 Remarque 29 3.6 Illustratio de quelques esembles probabilisés 29 3.6.1 Esemble probabilisé fii 30 3.6.2 Esemble fii équiprobable 30 3.6.3 Esembles probabilisés ifiis 2013-2014 Biostatistique - Carrat, Mallet, Morice 3/179

Sommaire 30 3.6.3.1 Cas déombrable 31 3.6.3.2 Cas d u esemble probabilisé ifii o déombrable 33 Chapitre 4 : Probabilité Coditioelle ; Idépedace et Théorème de Bayes 33 4.1 Probabilité coditioelle 34 4.2 Théorème de la multiplicatio 35 4.3 Diagramme e arbre 36 4.4 Théorème de Bayes 38 4.5 Idépedace etre évéemets 38 4.6 Idépedace, iclusio et eclusio de deu évéemets 41 Chapitre 5 : Evaluatio de l itérêt diagostique des iformatios médicales 41 5.1 Itroductio 41 5.1.1 Le diagostic 42 5.1.2 Les iformatios médicales 42 5.1.3 Situatio epérimetale et estimatio 43 5.2 Les paramètres de l évaluatio 43 5.2.1 Sesibilité et spécificité 44 5.2.2 Valeurs prédictives 44 5.2.3 Comparaiso des deu couples de paramètres 45 5.2.4 Choi d u seuil : courbes ROC 47 5.3 Estimatio des paramètres de l évaluatio 47 5.3.1 U échatillo représetatif 47 5.3.1.1 Les doées 47 5.3.1.2 Estimatio de la sesibilité et de la spécificité 48 5.3.1.3 Estimatio des valeurs prédictives 49 5.3.2 Deu échatillos représetatifs 51 Chapitre 6 : Variables aléatoires 51 6.1 Défiitio d ue variable aléatoire 52 6.2 Variables aléatoires fiies 52 6.2.1 Représetatio d ue loi de probabilité fiie 52 6.2.2 Espérace mathématique d ue variable fiie 55 6.2.3 Variace et écart-type d ue variable fiie 55 6.2.4 Loi de probabilité produit 57 6.2.5 Variables aléatoires idépedates 57 6.2.6 Foctio de répartitio 58 6.3 Variables ifiies déombrables (hors programme) 59 6.4 Variables aléatoires cotiues 61 6.5 Etesio de la otio de variable aléatoire 4/179 Biostatistique - Carrat, Mallet, Morice 2013-2014

Sommaire 63 Chapitre 7 : Eemples de distributios 63 7.1 Lois discrètes 63 7.1.1 Loi de Beroulli 63 7.1.2 Loi biomiale 66 7.1.3 Loi de Poisso 67 7.2 Lois cotiues 67 7.2.1 Loi ormale 67 7.2.1.1 Défiitio 67 7.2.1.2 Propriétés 70 7.2.2 Loi du 2 (chi-2) 70 7.2.2.1 Défiitio 71 7.2.2.2 Propriétés 71 7.2.3 Loi de Studet (hors programme) 72 7.2.4 Loi epoetielle (hors programme) 73 7.3 Applicatio de la Loi de Poisso à l iterprétatio d u risque saitaire possible qui a pas ecore été observé 73 7.3.1 Itroductio 73 7.3.2 Le problème «direct» 74 7.3.3 Problème iverse 75 7.3.4 Applicatio umérique 75 7.3.5 Remarque 77 Chapitre 8 : Statistiques descriptives 77 8.1 Rappels et complémets 78 8.2 Représetatio complète d ue série d epérieces 78 8.2.1 Cas d ue variable qualitative 79 8.2.2 Cas d ue variable quatitative discrète 80 8.2.3 Cas d ue variable quatitative cotiue. Notio d HISTOGRAMME 81 8.3 Représetatio simplifiée d ue série d epérieces 81 8.3.1 Idicateurs de localisatio des valeurs 81 8.3.2 Idicateurs de dispersio des valeurs 82 8.4 Reformulatio de la moyee et de la variace observées 82 8.4.1 Reformulatio de la moyee observée 83 8.4.2 Reformulatio de la variace observée 84 8.5 Cas particulier d ue variable à deu modalités - Proportio 84 8.5.1 Epressio de l espérace mathématique de X 84 8.5.2 Epressio de la variace de X 85 8.5.3 Iterprétatio de la moyee observée 85 8.6 Coclusio : la variable aléatoire moyee arithmétique 87 Résumé du chapitre 2013-2014 Biostatistique - Carrat, Mallet, Morice 5/179

Sommaire 89 Chapitre 9 : Fluctuatios de la moyee observée : la variable aléatoire moyee arithmétique 89 9.1 Première propriété de la variable aléatoire moyee arithmétique 89 9.1.1 U eemple 90 9.1.2 Gééralisatio 91 9.2 Secode propriété de la variable aléatoire moyee arithmétique : le théorème cetral limite 92 9.3 Etude de la distributio ormale (rappel) 94 9.4 Applicatio du théorème cetral limite. Itervalle de Pari (I. P.) 94 9.4.1 Défiitio de l itervalle de pari (I. P.) d ue moyee observée 96 9.4.2 Les facteurs de dépedace de la logueur de l itervalle de pari (IP) 97 9.4.3 L itervalle de pari d ue variable aléatoire 98 Résumé du chapitre 99 Chapitre 10 : Estimatio - Itervalle de cofiace 99 10.1 Itroductio 100 10.2 Estimatio poctuelle 100 10.2.1 Défiitio 100 10.2.2 Propriétés 100 10.2.2.1 Biais 101 10.2.2.2 Variace 101 10.2.2.3 Erreur quadratique moyee 101 10.2.3 Eemple 102 10.3 Estimatio par itervalle - Itervalle de cofiace 102 10.3.1 Eemple d ue proportio 105 10.3.2 Itervalle de cofiace approché d ue proportio «vraie» 105 10.3.3 Itervalle de cofiace approché d ue moyee «vraie» (variable cotiue) 106 10.3.4 Applicatios 106 10.3.4.1 Précisio d u sodage 107 10.3.4.2 Précisio d ue moyee 109 Chapitre 11 : Les tests d hypothèses. Pricipes 109 11.1 U eemple cocret (empruté à Schwartz) 112 11.2 Pricipe gééral des tests d hypothèses 112 11.2.1 Les étapes de mises e œuvre 114 11.2.2 Justificatio de la règle de décisio. Choi de 114 11.2.2.1 Iterprétatio de 114 11.2.2.2 Effet d u chagemet de valeur de 115 11.2.3 Justificatio des coclusios du test. Puissace d u test 118 11.2.4 Amélioratio de l iterprétatio du rejet de H0 118 11.2.4.1 Notio de degré de sigificatio 6/179 Biostatistique - Carrat, Mallet, Morice 2013-2014

Sommaire 119 11.2.4.2 Orietatio du rejet 120 11.3 Rappels et précisios 122 Résumé du chapitre 123 Chapitre 12 : Quelques tests usuels 123 12.1 Tests cocerat des variables de Beroulli 123 12.1.1 Test d égalité d ue proportio «vraie» à ue valeur doée (ou test de comparaiso d ue proportio observée à ue valeur doée) 123 12.1.1.1 Mise e place du test 124 12.1.1.2 Autre iterprétatio du paramètre z 125 12.1.1.3 Nombre de sujets écessaires 125 12.1.2 Test d égalité de deu proportios «vraies» (ou test de comparaiso de deu proportios observées) 125 12.1.2.1 Mise e place du test 127 12.1.2.2 Nombre de sujets écessaires 127 12.2 Tests cocerat des variables quatitatives 127 12.2.1 Tests impliquat ue valeur doée 128 12.2.1.1 Test d égalité d ue moyee «vraie» à ue valeur doée (ou test de comparaiso d ue moyee observée à ue valeur doée) 129 12.2.1.2 Test de symétrie d ue variable (X) par rapport à ue valeur doée (0) : test de Wilcoo 130 12.2.2 Tests de comparaiso de variables quatitatives 130 12.2.2.1 Test d égalité de deu moyees «vraies» (ou test de comparaiso de deu moyees observées) 131 12.2.2.2 Test d égalité de deu distributios (ou test de comparaiso de deu distributios observées) : test de Ma-Whitey-Wilcoo 133 12.2.3 Cas des séries appariées 133 12.2.3.1 Test de comparaiso de deu moyees observées sur séries appariées 134 12.2.3.2 Test de symétrie de la distributio des différeces 135 Résumé du chapitre 137 Chapitre 13 : Tests cocerat des variables qualitatives 137 13.1 Comparaiso d ue répartitio observée à ue répartitio doée ou test du 2 d ajustemet 138 13.1.1 Les étapes de mise e œuvre 142 13.1.2 Cas particulier : variable à deu modalités 143 13.2 Comparaiso de plusieurs répartitios observées ou test du 2 d homogééité 146 13.3 Test d idépedace etre deu variables qualitatives 150 Résumé du chapitre 2013-2014 Biostatistique - Carrat, Mallet, Morice 7/179

Sommaire 151 Chapitre 14 : Liaiso etre deu variables cotiues : otio de corrélatio 151 14.1 Itroductio 152 14.2 Abord du problème 154 14.3 U idicateur de covariatio : le coefficiet de corrélatio 158 14.4 Le coefficiet de corrélatio «vrai» 159 14.5 Test d égalité du coefficiet de corrélatio «vrai» à 0 161 Résumé du chapitre 163 Chapitre 15 : Méthodologie des études épidémiologiques 163 15.1 La causalité 164 15.2 Démarche epérimetale et démarche d observatio 165 15.3 Les essais radomisés 165 15.3.1 Défiitio 165 15.3.2 Commet limiter les biais das le déroulemet d u essai thérapeutique radomisé? Aveugle et placebo 166 15.3.3 Commet limiter les biais das l aalyse d u essai thérapeutique radomisé? Itetio de traiter 167 15.4 Les études d observatio 167 15.4.1 Cohortes - Cas-témois et études trasversales 168 15.4.2 Etudes prospectives et rétrospectives 168 15.4.3 Doées logitudiales 169 15.4.4 E pratique 169 15.5 Mesures d associatio utilisées e épidémiologie 170 15.6 Risque attribuable, proportio de cas évitables 172 Résumé du chapitre 173 Aee A : Tables statistiques 174 A.1 TABLE DE LA VARIABLE NORMALE REDUITE Z 175 A.2 TABLE DU TEST DE WILCOXON 176 A.3 TABLE DU TEST DE MANN-WHITNEY-WILCOXON 177 A.4 TABLE DE 2 178 A.5 TABLE DU COEFFICIENT DE CORRELATION 179 A.6 TABLE DU t DE STUDENT 8/179 Biostatistique - Carrat, Mallet, Morice 2013-2014

Avat-propos Avat-propos Ce polycopié cotiet le cours de biostatistique de la PACES - UE4 - de la Faculté de Médecie Pierre et Marie Curie (Paris VI). O pourra trouver des complémets das le livre de A. J. Vallero : A.J. Vallero. UE4 : évaluatio des méthodes d aalyse appliquées au scieces de la vie et de la saté. Elsevier-Masso (collectio Pass Saté) Des QCM corrigées sot e particulier dispoibles das le livre : V. Morice & A. Mallet. QCM corrigées et commetées de Biostatistique. Ellipses 2012 Pour e savoir plus : R. Beuscart et Collège des Eseigats de Biostatistique. Biostatistique. Omisciece, 2009 2013-2014 Biostatistique - Carrat, Mallet, Morice 9/179

Avat-propos 10/179 Biostatistique - Carrat, Mallet, Morice 2013-2014

Itroductio Itroductio La statistique costitue, e médecie, l outil permettat de répodre à de ombreuses questios qui se poset e permaece au médeci : 1. Quelle est la valeur ormale d ue gradeur biologique, taille, poids, glycémie? 2. Quelle est la fiabilité d u eame complémetaire? 3. Quel est le risque de complicatio d u état pathologique, et quel est le risque d u traitemet? 4. Le traitemet A est-il plus efficace que le traitemet B? 1 La variabilité et l icertai Toutes ces questios, propremet médicales, reflètet ue propriété fodametale des systèmes biologiques qui est leur variabilité. Cette variabilité est la somme d ue variabilité epérimetale (liée au protocole de mesure) et d ue variabilité propremet biologique. O peut aisi décomposer la variabilité d ue gradeur mesurée e deu grades composates : variabilité totale = variabilité biologique + variabilité métrologique La variabilité biologique peut être elle-même décomposée e deu termes : d ue part la variabilité itra-idividuelle, qui fait que la même gradeur mesurée chez u sujet doé peut être soumise à des variatios aléatoires ; et d autre part la variabilité iter-idividuelle qui fait que cette même gradeur varie d u idividu à l autre. variabilité biologique = variabilité itra-idividuelle + variabilité iter-idividuelle La variabilité itra-idividuelle peut être observée lors de la mesure de la performace d u athlète qui est pas capable des mêmes performaces à chaque essai, mais qui se différecie des autres athlètes (variabilité iter-idividuelle). E gééral, la variabilité itra est moidre que la variabilité iter. La variabilité métrologique peut être elle aussi décomposée e deu termes : d ue part les coditios epérimetales dot les variatios etraîet u facteur d aléas ; et d autre part les erreurs iduites par l appareil de mesure utilisé. variabilité métrologique = variabilité epérimetale + variabilité appareil de mesure La mesure de la pressio artérielle peut grademet varier sur u idividu doé suivat les coditios de cette mesure ; il est aisi recommadé de la mesurer après u repos d au mois 15 miutes, allogé, e mettat le patiet das des coditios de calme maimal. Cette recommadatio vise à miimiser la variabilité due au coditios epérimetales. La précisio de l appareil de mesure est ue doée itrisèque de l appareil, et est fourie par le costructeur. 2013-2014 Biostatistique - Carrat, Mallet, Morice 11/179

Itroductio 2 La mesure d ue gradeur 2.1 Uités et équatios au dimesios Les gradeurs mesurées possèdet la plupart du temps ue uité. La distace etre Paris et Marseille se mesurera par eemple e kilomètres, l épaisseur d u cheveu e micros, le poids d ue orage e grammes. Das quelle mesure ces gradeurs peuvet-elles être comparées? La distace etre Paris et Marseille, et l épaisseur d u cheveu sot deu logueurs ; leur comparaiso est possible si o les mesure avec ue uité commue, par eemple le mètre. E revache, le poids de l orage est pas comparable au logueurs précédetes. Deu gradeurs qui peuvet être comparées sot dites posséder la même dimesio. Elles peuvet être caractérisées par leur dimesio : o parlera par eemple de logueur. Les dimesios de toutes les gradeurs physiques peuvet s eprimer e foctio de sept dimesios de base : la logueur otée L, la masse M, le temps T, l itesité électrique I, la température, l itesité lumieuse J, et la quatité de matière N. Par eemple ue vitesse est ue logueur divisée par u temps. O dira que sa dimesio est LT -1. Plus précisémet, de l équatio doat la vitesse v e foctio de la distace d parcourue pedat le temps t, v=d/t, o déduit la relatio etre les dimesios (otées etre crochets) des deu membres de l équatio [v] =[d]/[t] =LT -1. Cette relatio est appelée équatio au dimesios. Ue équatio au dimesios permet doc d eprimer la dimesio de importe quelle gradeur e foctio des dimesios élémetaires, à coditio de coaître les relatios etre elles. Elle permet aussi ue première validatio d ue relatio etre gradeurs physiques : les dimesios de la partie gauche et de la partie droite de la relatio doivet être idetiques. Détermios par eemple la dimesio d ue éergie ou d u travail, à partir de la formule w = f.l (u travail est le produit d ue force par ue logueur). Ue force est le produit d ue masse par ue accélératio (f = m.) et ue accélératio est ue logueur divisée par le carré d u temps. Doc [w] =[f][l]=[m][l]t -2 ][l] =ML 2 T -2. U autre itérêt des équatios au dimesios cocere les uités des gradeurs mesurées. O défiit u système d uités e imposat des uités au 7 dimesios de base, les autres uités de défiissat à l aide des équatios au dimesios. Le système d uités le plus utilisé est le Système Iteratioal, ou SI, das lequel ue logueur est mesurée e mètres (m), ue masse e kilogrammes (kg), u temps e secodes (s), ue itesité électrique e ampères (A), ue température e degrés Kelvi (K), ue itesité lumieuse e cadelas (cd), et ue quatité de matière e moles (mol). Das le système iteratioal, certaies uités dérivées sot évidetes : ue surface s eprime e mètres carrés. D autres le sot mois. Citos l hertz pour ue fréquece, le pascal pour ue pressio, le joule pour ue éergie ou u travail, le watt pour ue puissace, le ewto pour ue force, le coulomb pour ue charge électrique, le volt pour ue différece de potetiel, l ohm pour ue résistace, etc. Il eiste des gradeurs sas dimesio, calculées comme le rapport de deu gradeurs de même dimesio, mais qui possèdet pourtat ue uité. U agle est ue gradeur sas dimesio mesurée e radias das le système iteratioal. 12/179 Biostatistique - Carrat, Mallet, Morice 2013-2014

Itroductio 2.2 Erreurs de mesure La mesure d ue gradeur e peut coduire à ue valeur eacte. E premier lieu, l istrumet de mesure possède écessairemet ue précisio limitée : ue règle graduée millimètre par millimètre e peut doer ue meilleure précisio qu u demi millimètre. E secod lieu, la gradeur à mesurer peut être source de variabilité itra-idividuelle : la répétitio de la mesure avec le même istrumet et das des coditios idetiques coduit alors à des résultats différets. Efi, l istrumet de mesure peut être mal étaloé ou mal adapté et coduire à u biais de mesure systématique : les valeurs mesurées serot systématiquemet trop élevées, ou systématiquemet trop basses. Pour ue gradeur X à mesurer, o ote X l erreur de mesure. Cette erreur est gééralemet facilemet coue si elle est due qu à u problème de précisio. S il eiste ue variabilité itraidividuelle (raisoablemet faible), o fera iterveir l écart-type des mesures (voir chapitre 10 page 99). Si est la valeur mesurée, la vraie valeur est doc comprise etre -X et +X. Si ue gradeur G est pas mesurée, mais déduite d autres gradeurs X, Y, Z à l aide d ue formule, l erreur G sur G doit se déduire des erreurs X, Y, Z sur X, Y, Z. Le plus souvet, o utilise u calcul basé sur la différetielle totale eacte de la formule. Si G = f(x, Y, Z), la différetielle totale eacte 1 est : df f f f = ----- dx + ----- dy + ----- dz X Y Z L erreur de mesure est alors doée par : G = f = f ----- X + f ----- Y + X Y f ----- Z Z Supposos par eemple devoir calculer ue résistace R e mesurat l itesité I du courat qui y circule et la différece de potetiel U à ses bores. La formule liat ces gradeurs est R = U/I. O mesure U = 1000 volts à 1 volt près et I = 1 ampère à 10-3 ampère près. La formule doe R = 1000 ohms et l erreur se calcule par R U U = ------- + --- I = 2 I Le calcul basé sur la différetielle totale eacte est cepedat qu ue approimatio (o cofod ue courbe et sa tagete). Lorsque des calculs plus eacts sot possibles, ils sot préférables. Aisi, supposos avoir trouvé 100 avec ue précisio de 1 pour la mesure d ue gradeur X et ous itéresser à la gradeur Y =1/X. X La formule de la différetielle totale eacte doe Y = ------, doc ue valeur de Y comprise etre 0,0099 et 0,0101. X 2 = 10 4 Mais puisque la vraie valeur de X est comprise etre 99 et 101, la vraie valeur de Y est e réalité comprise etre 1/101 et 1/99, soit etre 0,009901 et 0,010101. I 2 1. Rappel : calculer la dérivée partielle d ue foctio par rapport à l ue des variables cosiste à dériver e assimilat les autres variables à des costates. 2013-2014 Biostatistique - Carrat, Mallet, Morice 13/179

Itroductio 3 La décisio das l icertai Pour predre ue décisio diagostique ou thérapeutique le médeci doit avoir des élémets lui permettat de predre e compte cette variabilité aturelle, pour distiguer ce qui est ormal de ce qui est pathologique (décisio à propos d u patiet) et pour évaluer la qualité d u ouvel eame, ou d ue ouvelle thérapeutique (décisio thérapeutique). La compréhesio des méthodes statistiques, de leur puissace et de leurs limites, est essetielle pour u médeci de os jours. Tout résultat de recherche médicale résulte d ue epérimetatio (cliique ou biologique) qui s appuie sur ue méthodologie statistique rigoureuse, et dot les résultats sot aalysés e termes statistiques. De même la démarche statistique permet d évaluer les risques (ou les bééfices) d ue prescriptio, de détermier das ue situatio doée l eame qui apportera la meilleure iformatio diagostique. Nous voyos doc l importace de la maîtrise de l outil et de la démarche statistique : Pour permettre les progrès de la coaissace médicale : c est le domaie de la recherche cliique qui e peut s accomplir coveablemet (défiitio de la questio, mise e place du protocole epérimetal, aalyse des résultats) qu e suivat ue méthodologie statistique rigoureuse. Pour mieu coaître l état de saté d ue populatio, la fréquece et la gravité d ue épidémie (peser au SIDA), etc. Cette coaissace se fera à partir d échatillos coveablemet choisis et de calculs basés sur les outils de la statistique. Il sera alors possible de rechercher les stratégies de prévetio les mieu adaptées, d e évaluer leur impact. Il s agit là des applicatios relevat de l épidémiologie et de la saté publique. Pour améliorer la pratique médicale das ses aspects décisioels, à savoir choisir le meilleur eame (cliique ou para-cliique) pour aboutir le plus rapidemet et le plus sûremet au diagostic. Pour optimiser la thérapeutique, choisir le traitemet le mieu adapté à u patiet doé (choi du médicamet, posologie, etc). L objectif de ce cours est de vous fourir les bases idispesables permettat de compredre les méthodes utilisées, d iterpréter correctemet les résultats de ouvelles recherches, et d adopter u mode de raisoemet qui soit à même d aider à la décisio das l eercice de la médecie. Plus précisémet ous étudieros successivemet : 1. Les bases de calcul de probabilités, qui sot idispesables à la compréhesio et à l utilisatio des méthodes statistiques. 2. La statistique descriptive qui permet de représeter et de quatifier la variabilité d ue ou plusieurs gradeurs observées. 3. La statistique iductive qui iclura les tests statistiques permettat de reteir ue hypothèse A plutôt qu ue hypothèse B à partir de doées epérimetales (comme das le cas de la comparaiso de deu traitemets, où l hypothèse A est que les deu traitemets sot équivalets et l hypothèse B est qu ils sot différets). 4. Les applicatios des méthodes statistiques à l épidémiologie, à l aide à la décisio thérapeutique et diagostique, et les applicatios au essais thérapeutiques. 14/179 Biostatistique - Carrat, Mallet, Morice 2013-2014

Statistique(s) et Probabilité(s) Chapitre 1 Statistique(s) et Probabilité(s) Nous commeceros par défiir les termes et les cocepts importats. 1.1 Statistique Le terme statistique désige à la fois u esemble de doées d observatios, et l activité qui cosiste e leur recueil, leur traitemet et leur iterprétatio. Les termes statistique, ou statistiques (au pluriel) eglobet aisi plusieurs otios distictes : 1. D ue part le recesemet de gradeurs d itérêt comme le ombre d habitats d u pays, le reveu moye par habitat, le ombre de séropositifs das la populatio fraçaise. Nous voyos que la otio fodametale qui se dégage de cette éumératio est celle de Populatio. Ue populatio est u esemble d objets, d êtres vivats ou d objets abstraits (esemble des mais de 5 cartes distribuées au bridge...) de même ature. 2. La statistique e tat que sciece s itéresse au propriétés des populatios aturelles. Plus précisémet elle traite de ombres obteus e comptat ou e mesurat les propriétés d ue populatio. Cette populatio d objets doit e outre être soumise à ue variabilité, qui est due à de très ombreu facteurs icous (pour les populatios d objets biologiques qui ous itéresset ces facteurs sot les facteurs géétiques et les facteurs eviroemetau). 3. A ces deu acceptios du terme statistiques (au pluriel) il faut ajouter le terme statistique (au sigulier) qui défiit toute gradeur calculée à partir d observatios. Ce peut être la plus grade valeur de la série statistique d itérêt, la différece etre la plus grade et la plus petite, la valeur de la moyee arithmétique de ces valeurs, etc. 1.2 Populatio et échatillo O appelle populatio P u esemble gééralemet très grad, voire ifii, d idividus ou d objets de même ature. Tous les médecis de Frace costituet ue populatio, de même que l esemble des résultats possibles du tirage du loto. Ue populatio peut doc être réelle ou fictive. Il est le plus souvet impossible, ou trop coûteu, d étudier l esemble des idividus costituat ue populatio ; o travaille alors sur ue partie de la populatio que l o appelle échatillo. Pour qu u échatillo permette l étude de la variabilité des caractéristiques d itérêt de la popu- 2013-2014 Biostatistique - Carrat, Mallet, Morice 15/179

Statistique(s) et Probabilité(s) latio, il faut qu il soit coveablemet sélectioé. O parlera d échatillo représetatif si les idividus le costituat ot été tirés au sort 1 das la populatio. Si par eemple o souhaite détermier les caractéristiques «moyees» du poids et de la taille des prématurés masculis o tirera au hasard u certai ombre de sujets parmi les aissaces de prématurés de l aée. Chaque idividu, ou uité statistique, apparteat à ue populatio est décrit par u esemble de caractéristiques appelées variables ou caractères. Ces variables peuvet être quatitatives (umériques) ou qualitatives (o umériques) : quatitatives pouvat être classées e variables cotiues (taille, poids) ou discrètes (ombre d efats das ue famille) qualitatives pouvat être classées e variables catégorielles (couleurs des yeu) ou ordiales (itesité d ue douleur classée e ulle, faible, moyee, importate). 1.3 Statistique et probabilité La théorie (ou le calcul) des probabilités est ue brache des mathématiques qui permet de modéliser les phéomèes où le hasard iterviet (iitialemet développée à propos des jeu de hasard, puis progressivemet étedue à l esemble des scieces epérimetales, dot la physique et la biologie). Cette théorie permet de costruire des modèles de ces phéomèes et permet le calcul : c est à partir d u modèle probabiliste d u jeu de hasard comme le jeu de dés que l o peut prédire les fréqueces d apparitio d évéemets comme le ombre de fois que l o obtiet ue valeur paire e jetat u dé u grad ombre de fois. Les élémets de calcul des probabilités idispesables à la compréhesio des statistiques serot traités das la première partie du cours. Sous jacete à la otio de statistiques se trouve la otio de Populatio dot o souhaite coaître les propriétés (plus précisémet les régularités), permettat e particulier de savoir si deu populatios sot idetiques ou o. Ce cas est celui du cadre des essais thérapeutiques, où l o cosidère 2 populatios (patiets traités avec le médicamet A ou avec le médicamet B) dot o souhaite savoir si elles diffèret ou o (c est le cas le plus simple des essais cliiques). Pour ce faire il est écessaire de modéliser les populatios, e utilisat des modèles probabilistes. U modèle de ce type est par eemple de cosidérer que la taille des idividus suit ue distributio gaussiee. A partir de ce modèle o peut calculer les propriétés d échatillos ; c est ce qu o appelle ue déductio qui va du modèle vers l epériece. A l iverse, cosidérat u échatillo d ue populatio o peut essayer de recostruire le modèle de la populatio. Cette démarche est calquée sur la démarche scietifique habituelle. Le scietifique est capable, e utilisat les mathématiques, de prédire le comportemet d u modèle doé (c est par eemple ue «loi» de la physique) : c est la démarche déductive. A l iverse, observat des faits epérime- 1. Nous reviedros sur cette méthode permettat d obteir u échatillo représetatif de la populatio étudiée. Cela cosiste e gros à sélectioer les idividus sur la base d u tirage aalogue à celui qui cosiste à tirer des oms das ue ure qui cotiedrait tous les oms possibles. 16/179 Biostatistique - Carrat, Mallet, Morice 2013-2014

Statistique(s) et Probabilité(s) tau il va teter de dégager des propriétés géérales du phéomèe observé qu il va e gééral représeter sous forme d u modèle (toutes les lois de la physique et de la chimie sot des modèles mathématiques les plus géérau possibles des faits epérimetau) : c est la costructio iductive de la théorie. Cette démarche géérale va plus loi car le modèle permet de prédire des epérieces o réalisées. Si les prédictios aisi réalisées sot cotradictoires avec les résultats epérimetau alors o pourra avec certitude réfuter le modèle (o dit aussi qu o l a falsifié) ; das le cas cotraire o garde le modèle mais o est pas certai qu il soit «vrai». Autremet dit, à l issue d u tel test o e peut avoir de certitude que si o a trouvé des élémets permettat de réfuter le modèle. Nous verros das la suite que cette approche se traspose eactemet das la démarche statistique, e particulier das le domaie des tests. 2013-2014 Biostatistique - Carrat, Mallet, Morice 17/179

Statistique(s) et Probabilité(s) 18/179 Biostatistique - Carrat, Mallet, Morice 2013-2014

Rappels mathématiques Chapitre 2 Rappels mathématiques 2.1 Esembles, élémets O appelle esemble, toute liste ou collectio d objets bie défiis, eplicitemet ou implicitemet ; o appelle élémets ou membres de l esemble les objets apparteat à l esemble et o ote : p A si p est u élémet de l esemble A B est partie de A, ou sous esemble de A, et l o ote B A ou A B, si B A O défiit u esemble soit e listat ses élémets, soit e doat la défiitio de ses élémets : A = {1, 2, 3} X = { : est u etier positif} Notatios : la égatio de A est A est l esemble vide E est l esemble uiversel. 2.2 Opératios sur les esembles Soiet A et B deu esembles quelcoques. Itersectio L itersectio de A et B, otée A B, est l esemble des élémets tels que A et B. Soit : A B = { : A et B } Le terme «et» est employé au ses A et B si appartiet à la fois à A et à B 2013-2014 Biostatistique - Carrat, Mallet, Morice 19/179

Rappels mathématiques A B E A B Cas particulier : si AB =, o dit que A et B sot disjoits. Réuio La réuio de A et B, otée A B, est l esemble des élémets tels que A ou B. Soit : A B = { : A ou B } Le terme «ou» est employé au ses A ou B si appartiet à A, ou à B, ou à A et B (car A et B sigifie A et B ). A B E A B Complémetaire Le complémetaire de A est l esemble des élémets de E qui appartieet pas à A. CA = A = : A E CA A Différece La différece etre A et B, ou complémetaire de B relatif à A, est l esemble des élémets de A qui appartieet pas à B. A B = CAB = : B et A C B A E A B 20/179 Biostatistique - Carrat, Mallet, Morice 2013-2014

Rappels mathématiques Algèbre des esembles A A = A A A A B C = A B C A B C = A B C A B = B A A B = B A A B C = A B A C A B C = A B A C A A E = A A E = E A = = = A A A CA = E A CA = CCA = A CE =, C = E CA B = CA CB CA B = CA CB 2.3 Esembles fiis, déombrables, o déombrables U esemble est fii s il est vide () ou s il cotiet u ombre fii d élémets ; sio, il est ifii : A = {a 1, a 2, a 3 } est fii ; I = { [,] 01 } est ifii. U esemble ifii est dit déombrable si o peut faire correspodre de faço uique chaque élémet de l esemble à u etier aturel et u seul : A = { : est u etier pair} est ifii déombrable. U esemble ifii est o déombrable das le cas cotraire. Das la pratique, les seuls esembles ifiis o déombrables que ous recotreros serot des itervalles de : { [,] a b } ou des itervalles de 2 : { y : [,]y a b [,] c d }. 2.4 Esembles produits Soiet A et B deu esembles ; l esemble produit de A et de B, oté A B, est l esemble de tous les couples ordoés (a, b), avec a A et b B. Eemples : 2013-2014 Biostatistique - Carrat, Mallet, Morice 21/179