Le Théorème de Bayes

Documents pareils
Distribution Uniforme Probabilité de Laplace Dénombrements Les Paris. Chapitre 2 Le calcul des probabilités

DASES Réseau tuberculose 10 janvier 2006

Calculs de probabilités conditionelles

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Exercices sur le chapitre «Probabilités»

Chapitre 1 Evaluation des caractéristiques d un test diagnostique. José LABARERE

Probabilités sur un univers fini

Fluctuation d une fréquence selon les échantillons - Probabilités

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

YANN ROUDAUT - Professeur de l Ecole Française de Poker - roudaut@ecolefrancaisedepoker.fr

Probabilités Loi binomiale Exercices corrigés

F.Benabadji Alger

Probabilités sur un univers fini

I. Cas de l équiprobabilité

Qu est-ce qu une probabilité?

Probabilités. C. Charignon. I Cours 3

Coefficients binomiaux

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Docteur José LABARERE

B.I. «maison»: sexy or not? Expérience de la CMSE

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Feuille d exercices 2 : Espaces probabilisés

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2

Cours d électricité. Circuits électriques en courant constant. Mathieu Bardoux. 1 re année

Les tests génétiques à des fins médicales

1 Culture Cellulaire Microplaques 2 HTS- 3 Immunologie/ HLA 4 Microbiologie/ Bactériologie Containers 5 Tubes/ 6 Pipetage

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

INFORMATION GÉNÉTIQUE et REPRODUCTION SEXUÉE

315 et 495 sont dans la table de 5. 5 est un diviseur commun. Leur PGCD n est pas 1. Il ne sont pas premiers entre eux

AC AB. A B C x 1. x + 1. d où. Avec un calcul vu au lycée, on démontre que cette solution admet deux solutions dont une seule nous intéresse : x =

23. Interprétation clinique des mesures de l effet traitement

Probabilités conditionnelles Loi binomiale

MERLIN GESTION PATRIMONIALE. Groupe GESTION PATRIMONIALE. Définition d un programme de renouvellement

Montréal, 24 mars David Levine Président et chef de la direction DL Strategic Consulting. DL Consulting Strategies in Healthcare

Études épidémiologiques analytiques et biais

Suites numériques 3. 1 Convergence et limite d une suite

CODES DE BONNE CONDUITE : QUAND LES SOCIETES JOUENT A L APPRENTI LEGISLATEUR

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Cours 02 : Problème général de la programmation linéaire

Exercices de génétique classique partie II

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Principe d un test statistique

LICENCE PHYSIQUE, CHIMIE EN L3 :

CALCUL DES PROBABILITES

Titre alcalimétrique et titre alcalimétrique complet

Estimation des charges. «Le travail se dilate jusqu à remplir le temps disponible»

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Migraine et Abus de Médicaments

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Algèbre binaire et Circuits logiques ( )

Comparaison de fonctions Développements limités. Chapitre 10

Molécules et Liaison chimique

Ecran : Processeur : OS : Caméra : Communication : Mémoire : Connectique : Audio : Batterie : Autonomie : Dimensions : Poids : DAS :

MASTER (LMD) INGENIERIE DE LA SANTE

TESTS D'HYPOTHESES Etude d'un exemple

P1 : Corrigés des exercices

Culture scientifique et technologique

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Seconde et première Exercices de révision sur les probabilités Corrigé

Programme d assurance-invalidité de courte durée

Services Techniques de Boston Scientific - Tél. :

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

1 Première section: La construction générale

1. Généralités FR.TBLZ

COMPLICATIONS THROMBOTIQUES DES SYNDROMES MYÉLOPROLIFÉRATIFS: ÉVALUATION ET GESTION DU RISQUE

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

Unité 2 Leçon 2 Les permutations et les combinaisons

Raisonnement par récurrence Suites numériques

Arbre de probabilité(afrique) Univers - Evénement

Forest Stewardship Council. Guide simplifié d utilisation des marques à l intention des titulaires de certificats

Migraine et céphalées de tension: diagnostic différentiel et enjeux thérapeutiques

MIEUX VIVRE AVEC SON HEMIPLEGIE

Des familles de deux enfants

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Cours de Probabilités et de Statistique

Dimensionnement d une roue autonome pour une implantation sur un fauteuil roulant

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

APPROCHE DE MODELISATION DE LA PROPAGATION DE L INCENDIE DANS UN EDIFICE ET SON INTEGRATION DANS UN SYSTEME DECISIONNEL

où «p» représente le nombre de paramètres estimés de la loi de distribution testée sous H 0.

ORTHOPHOS XG 3 DS. Systèmes de radiographie. ORTHOPHOS XG 3 l accès facile à la panoramique numérique.

Diagnostic des Hépatites virales B et C. P. Trimoulet Laboratoire de Virologie, CHU de Bordeaux

MANUEL D ÉVALUATION DE COURS

Chapitre 6. Fonction réelle d une variable réelle

Eteindre. les. lumières MATH EN JEAN Mme BACHOC. Elèves de seconde, première et terminale scientifiques :


UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Dossier projet isn 2015 par Victor Gregoire

[o] : o, au et eau. Leçon 2. olive radio sofa. fromage rose orange métro. On a déjà lu les mots

4 Distributions particulières de probabilités

Ray-grass anglais auto-regarnissant

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Limites finies en un point

La Dysplasie Ventriculaire Droite Arythmogène

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Valencia (Spain) - Valencia (Spain)

Exemple On lance une pièce de monnaie trois fois de suite. Calculer la probabilité d obtenir exactement deux fois pile.

Transcription:

Le Théorème de Bayes Cours Interprétation de la preuve (4) Le processus du raisonnement robabilités a priori Autres informations (dossier, enquête, etc.) se combinent avec Rapport de vraisemblance Données analytiques robabilités a posteriori Décision sur l hypothèse

La théorie de Bayes La théorie de Bayes est le fondement d une partie de la théorie de la décision. robabilités a posteriori ( ) ( H E,I) H E,I robabilités a priori ( ) ( ) H I H I (, I) ( E H, E H Rapport devraisemblance Un exemple pratique our illustrer l importance de ce théorème en termes de modélisation du diagnostic : supposons que A soit l événement atteint de la maladie M. supposons que B soit l événement positif pour le test diagnostic D. Le théorème de Bayes permet de calculer la probabilité pour qu un patient positif pour le test diagnostic D soit atteint de la M, en fonction de la probabilité de la maladie M dans la population.

Théorème de Bayes Le théorème de Bayes vise à calculer les probabilités a posteriori d un événement en fonction des probabilités a priori de cet événement. A priori et a posteriori s entendent par rapport à la connaissance d une information. L exemple typique est celui du diagnostic : a priori on juge que le patient a une telle probabilité d avoir la maladie M. Que devient a posteriori cette probabilité lorsque l on apprend le résultat de tel examen clinique ou biologique? Théorème de Bayes Ce théorème est un outil de modélisation de la démarche diagnostique (en sens large). L idée de base du théorème de Bayes est de calculer les probabilité a posteriori d un événement A, sachant qu un autre événement B s est produit, en fonction de sa probabilité a priori : on veut donc exprimer (A B) en fonction de (A).

Théorème de Bayes Tout d abord, si A et B sont indépendants, on vient de voir que (A B) (A), puisque B n apporte pas d information sur A. Que se passe-t-il si B apporte une information? Dans un tel cas, on a : ( A B) ( A B) La probabilité de A sera différente selon que l on a l information que B s est produit, ou que B ne s est pas produit. Théorème de Bayes On peut écrire : ( A B) ( A B) ( A et B) ( B) ( B A) ( A) ( B)

Théorème de Bayes La clé de démonstration c est d écrire que : B (B et A) ou (B et non-a) Cette égalité rappelle que les événements élémentaires qui définissent B peuvent être classés en deux catégories : ceux qui réalisent A (ils forment B et A), ceux qui ne le réalisent pas (ils forment B et non- A. De plus, (B et A) est incompatible avec (B et non- A) parce que A et non-a le sont. Théorème de Bayes On peut donc écrire : ( A B) On a de plus : ( B A) ( A) ( B et A) + ( B et A) ( B et A) ( B A) ( A) ( B et A) ( B A) ( A)

Théorème de Bayes Le théorème de Bayes s écrit : ( A B) ( B A) ( A) ( B A) ( A) + ( B A) ( A) Intuition - le jeu des trois cartes On considère 3 cartes à jouer de même forme. Cependant, les deux faces de la première carte ont été colorées en noir, les deux faces de la deuxième carte en rouge tandis que la troisième porte une face noire et l autre rouge. On mélange les trois carte au fond d un chapeau puis une carte tirée au hasard en est extraite et placée au sol. Si la face apparente est rouge, quelle est la probabilité que l autre soit noire?

Intuition - le jeu des trois cartes Soient RR, NN et RN respectivement les événements, la carte choisie est entièrement rouge, entièrement noire et bicolore. Soit encore R l événement, la face apparente de la carte tirée est rouge. Intuition - le jeu des trois cartes On aura : ( ) RN R ( ) RN R ( R) ( R) RN ( R RN) ( RN) ( ) ( ) + ( ) ( ) + ( ) ( ) R RN RN R RR RR R NN NN ( ) RN R ( ) ( 3) ( ) ( 3) + ( ) ( 3) + ( 0) ( 3) 3

Exemple du diagnostic Supposons que : A soit l événement atteint de la maladie M, et B soit l événement positif pour le test diagnostic D. Le théorème de Bayes permet de calculer la probabilité pour qu un patient positif pour le test diagnostique D soit atteint de M, en fonction de la probabilité (ou fréquence) de maladie M dans la population. + ( M D ) + ( D M ) ( M ) + + ( D M ) ( M ) + ( D M) ( M) Sensibilité et spécificité our chaque individu examiné, nous nous intéressons aux caractères : M avoir la maladie non-m ne pas avoir la maladie T avoir un résultats positif (+) au test non-t avoir un résultat négatif (-) au test Dans une phase d évaluation, le test est appliqué à un groupe M et à un groupe non-m. Les groupes sont formés à l aide d un test de référence (gold standard) dont le résultat est considéré comme sûr.

Sensibilité et spécificité On détermine les fréquences des quatre résultats possibles indiqués par n, n, n, n TM T M T M TM M M Total T n TM n T M n T T n T M n TM n T Total n M n M n Sensibilité et spécificité M M Total T n TM n T M n T T n T M n TM n T Total n M n M n n Sensibilité n TM M proportion de + parmi les malades.

Sensibilité et spécificité M M Total T n TM n TM n T T n TM n TM n T Total n M n M n n Spécificité n TM M proportion de - parmi les sains. Des valeurs élevées de sensibilité et de spécificité indiquent clairement une bonne qualité du test. Sensibilité et spécificité - exemple M M Total T 950 0 T 50 990 Total 000 000 ntm 950 Sensibilité 95% n 000 M ntm 990 Spécificité 99% n 000 M

Les autres mesures d efficacité d un test La sensibilité et la spécificité du test ne sont pas des informations directement utiles à l individu (le patient) auquel le test est administré. En effet, supposons que la sensibilité et la spécificité d un certain test soient : sensibilité 95% spécificité 99% Supposons aussi que le médecin applique ce test à un patient et obtient un résultat positif (+). Les autres mesures d efficacité d un test Il s agit de répondre à la question : Quelle est la probabilité que le patient soit réellement malade? our répondre il nous faut une information supplémentaire concernant la fréquence de la maladie M dans la population, c est-à-dire la prévalence de la maladie. Supposons par exemple, qu il y ait seul malade par 0 000 habitants (prévalence de M /0 000).

remière solution La prévalence de /0 000 nous permet d affirmer que dans une population hypothétique de 000 000 d individus, on peut s attendre à 00 malades et 999 900 sains. Le test dépiste 95 cas positifs et 5 cas négatifs parmi les malades, car la sensibilité est de 95%. Le test trouve aussi 9 999 résultats positifs et 989 90 résultats négatifs dans la partie saine de la population (voir schéma suivant). opulation '000'000 révalence /0 000 00 malades Sensibilité 95% 999 900 sains Spécificité 99% 95 + 5-9 999 + 989 90 -

remière solution En conclusion, la proportion de malades parmi les cas positifs est de 95/0 094, ce qui indique que les chances qu un individu positif au test soit réellement malade sont seulement de 0.0094 (approximativement %). Solution avec la formule de Bayes (M T) robabilité que le patient soit malade donnée le résultat positif du test (sachant que le résultat du test est positif). ( ) M T sensibilité0.95 ( ) ( M) T M prévalence0.000 ( ) ( ) + ( ) ( ) T M M T M M -spécificité0.0 -prévalence0.9999

Solution avec la formule de Bayes (M T) robabilité que le patient soit malade donnée le résultat positif du test (sachant que le résultat du test est positif). ( ) M T 0. 95 0. 000 0. 95 0. 000+ 0. 0 0. 9999 ( ) M T 0. 0094 Solution avec la formule de Bayes Remarque : Les valeurs de (T M) et (non-t non-m) dans la population sont inconnues. Nous utilisons leurs estimations 95%, respectivement 99%, obtenus dans la phase d évaluation à l aide d un échantillon de 000 malades et 000 sains.

Solution avec la formule de Bayes 0.000 probabilité a priori 0.0 probabilité a posteriori Terminologie (T M) sensibilité du test (non-t non-m) spécificité du test (M T) valeur prédictive positive du test (non-m non-t) valeur prédictive négative du test (T non-m) taux de faux positifs ( -spécificité) Attention! pour certains auteurs : taux de faux positifs (non-m T).

Le rôle de la prévalence Il est souvent difficile de connaître la prévalence (M) avec précision. Il convient alors d examiner le test pour différentes valeurs de (M). ar exemple, si (T M)0.95 et (non-t non-m)0.99 ( M ) ( M T) ( M T) /'000 000 0.9999 0.00000 /00 000 0.999 0.00000 /0 000 0.9906 0.0000 / 000 0.93 0.00005 /500 0.840 0.0000 /00 0.6769 0.0005 /00 0.503 0.0005 Le rôle de la prévalence Le taux de faux négatifs est bon : moins de 5 malades sur 0 000 (~0.0005) échappent au test. ar contre, le taux de faux positifs est élevé : sur 00 individus positifs plus de 50 (~0.503) sont sains. La décision de maintenir un tel test dépendra de l importance de la maladie, des conséquences du test, des coûts des examens complémentaires et de l éventuel traitement, des chances de succès du traitement, ect. Il est important de savoir qu on peut réduire les taux d erreur en combinant (ou en répétant) deux ou plusieurs tests.

Combinaisons de deux ou plusieurs tests Notations : M le patient est malade T le premier test est positif T le deuxième test est positif non-m le patient n est pas malade non-t le premier test est négatif non-t le deuxième test est négatif Hypothèse : Les résultats des deux tests sont indépendants. Combinaisons de deux ou plusieurs tests Données : (M) prévalence 0% (T M) sensibilité du premier test 75% (non-t non- M) spécificité du premier test 80% (T M) sensibilité du deuxième test 90% (non-t non- M) spécificité du deuxième test 95% Valeur prédictive positive (probabilité a posteriori) du premier test, (M T )?

Combinaisons de deux ou plusieurs tests ( M T ) ( M T ) ( M ) ( M ) ( M ) ( M ) + ( M) ( M) T T 0.75 0.0 0.75 0.0 + 0.0 0.90 ( M T) 0. 94 Valeur prédictive positive de la combinaison remière approche, grâce à l indépendance des résultats : ( et T M ) ( T M ) ( T M ) T ( et T M) ( M) ( T M) 0.0 0.05 0. 00 T et donc : 0.75 0.90 0.675 ( M T et T ) ( et T M ) ( M ) ( et T M ) ( M ) + ( T et T M) ( M) T T 0.675 0.00 0.675 0.00 + 0.00 0.900 ( M T et T ) 0. 88

Valeur prédictive positive de la combinaison Deuxième approche : ( M T ) ( T M ) ( M ) ( T ) ( ) ( ) ( ) M T M + T T M T M 0.900 0.94 ( M T ) 0. 88 0.900 0.94 + 0.050 0.706 Valeur prédictive positive de la combinaison Deuxième approche : Après avoir obtenu le résultat T, nous interprétons (M)(M T ) comme prévalence de M parmi les résultats T ( M T ) ( T M ) ( M ) ( T M ) T ( M ) + T ( T M) T ( M) 0.900 0.94 ( M T ) 0. 88 0.900 0.94 + 0.050 0.706

Valeur prédictive positive de la combinaison Deuxième approche : Après avoir obtenu le résultat T, nous interprétons (M)(M T ) comme prévalence de M parmi les résultats T ( M T ) ( T M ) ( M ) ( T M ) T ( M ) + T ( T M) T ( M) Grâce à l indépendance des résultats, (T M)(T M) 0.900 0.94 ( M T ) 0. 88 0.900 0.94 + 0.050 0.706 Les affaires de paternité et la jurisprudence en Suisse Le théorème de Bayes est accepté. CC art. 54. Empreinte génétique. L analyse dite ADN est une méthode scientifique nouvelle, reconnue pour l essentiel, pour constater la paternité. Revue Suisse de Jurisprudence 88 (99) 4 : 430-434.

La conclusion dans les affaires de paternité «Dans le trio X [enfant], Y [mère] et Z [père présumé], la probabilité de paternité selon Essen- Möller est très largement supérieure à 99.999%. L évaluation est donc : paternité pratiquement prouvée.» Le processus du raisonnement 50% 99.999% robabilités a priori Rapport de Autres informations (dossier) se combinent avec vraisemblance rofils génétiques de la M,E et robabilités a posteriori Décision sur la paternité

Le rôle de l expert Expert robabilités a se combinent avec priori Rapport de vraisemblance Le juge ou la Cour robabilités a posteriori Le juge ou la Cour La odds form du théorème de Bayes ( A B) ( B A) ( A) ( B) ( ) ( ) ( ) B A A A B ( A B) ( ) A B ( B) ( B A) ( A ) ( ) ( ) A A B

La odds form du théorème de Bayes Bayes factor ( A B) ( B A) ( A) ( B) ( ) ( ) ( ) B A A A B ( A B) ( ) A B ( B) ( B A) ( A ) ( ) ( ) A A B Likelihood ratio