Evaluation d un test diagnostique - Concordance
|
|
- Thibault Poitras
- il y a 8 ans
- Total affichages :
Transcription
1 Evaluation d un test diagnostique - Concordance Michaël Genin Université de Lille 2 EA Santé Publique : Epidémiologie et Qualité des soins michaelgenin@univ-lille2fr
2 Plan 1 Introduction 2 Evaluation d un test diagnostique 3 Concordance Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
3 Introduction Motivations 1 Evaluation d un nouveau test : Référence (Gold Standard) binaire Malade (M) / Non malade ( M) Nouveau test M / M Quantifier le pouvoir diagnostic du nouveau test 2 Variable numérique (ex : dosage biologique) On désire utiliser cette variable pour séparer les M des M Déterminer un seuil optimal Quantifier le pouvoir discriminant de X 3 2 tests destinés à classer les patients (M et M) Evaluation de la concordance = similitude entre les 2 tests Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
4 Définitions Définitions 1 On cherche à séparer les malades (M) des non-malades ( M) 2 On dispose d une référence qui permet de les classer de manière certaine (Gold Standard) Considérons un test : T + : test positif en faveur de M T : test négatif en faveur de M Considérons N patients N M : nombre de malades (référence) N M N T + N T : nombre de non-malades (référence) : nombre de tests positifs : nombre de tests négatifs M M T + vp fp N T + T fn vn N T N M N M N vp : vrai-positifs vn : vrai-négatifs fp : faux-positifs fn : faux négatifs Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
5 Définitions Définitions - Validité intrinsèque du test (Probabilités pré-test) Le pourcentage de bien classés défini par vp+vn N ne reflète pas les 2 types d erreurs qui peuvent avoir des conséquence très 1 Dire que le patient est non-malade à tort (fn) 2 Dire que le patient est malade à tort (fp) Ces 2 types d erreur sont quantifiés par Sensibilité (Se) Pourcentage de vrai-positifs (vp) chez les malades : vp N M = P(T + /M) Spécificité (Sp) Pourcentage de vrai-négatifs (vn) chez les non-malades : vn N M = P(T / M) Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
6 Définitions Un test est caractérisé par ces deux paramètres (Se,Sp) Remarque 1 Les tests très sensibles sont utiles pour s assurer que la maladie n est pas présente (peu de faux négatifs) La maladie est grave et ne doit pas être ignorée Les tests très spécifiques sont utiles pour s assurer que la maladie est bien présente (peu de faux positifs) Maladie incurable, traitement lourd Remarque 2 Ces 2 paramètres sont indépendants de la prévalence de la maladie pas besoin de respecter la prévalence de la population (échantillon représentatif) En général, on trouve 100 M et 100 M Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
7 Définitions Définitions - Validité extrinsèque du test (Probabilités post-test) Valeur Prédictive Positive (VPP) Probabilité qu un individu soit réellement malade sachant que le test est positif : Valeur Prédictive Négative (VPN) P(M/T + ) = vp N T + Probabilité qu un individu soit réellement non-malade sachant que le test est négatif : P( M/T ) = vn N T Très important en situation clinique car on ignore très souvent le diagnostic de référence Ces formules sont utilisables lorsque l échantillon est représentatif de la population!! Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
8 Définitions Remarque 1 Une VPP faible examens supplémentaires lourds chez des non-malades Une VPN faible rassurer des patients à tort Indice de fiabilité du test Remarque 2 Ces deux paramètres dépendent de l échantillon étudié (prévalence de la maladie) Donc si l échantillon n est pas représentatif (prévalence) : Calcul de VPP et VPN en utilisant une formule faisant intervenir Se, Sp et prévalence de la maladie (Formule de Bayes) Un prévalence importante va améliorer la VPP mais diminuer la VPN Un prévalence faible va diminuer la VPP mais améliorer la VPN Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
9 Définitions Exemple : Se = 08 et Sp = 09 Echantillon 1 M M T T Echantillon 2 M M T T VPP = VPN = VPP = VPN = Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
10 Définitions En situation clinique, on ne dispose pas du diagnostic de référence mais on dispose de Sensibilité et Spécificité du test La prévalence de la maladie dans la population (P(M) = p) On souhaite calculer la VPP et la VPN en utilisant ces informations : VPP = P(M/T + ) = P(T + /M)P(M) P(T + ) VPP = = P(T + /M)P(M) P(T + /M)P(M) + P(T + / M)P( M) Sep Sep + (1 Sp)(1 p) VPN = P( M/T ) = P(T / M)P( M) P(T ) VPN = = P(T / M)P( M) P(T / M)P( M) + P(T /M)P(M) Sp(1 p) Sp(1 p) + (1 Se)p Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
11 Analyse ROC Problématique On dispose d une variable quantitative X (ex : dosage biologique) On souhaite : Déterminer le seuil optimal (pour séparer les M des M) Quantifier le pouvoir diagnostic de X Le seuil optimal est celui qui sépare au mieux les M des M en respectant les deux types de risques (fp,fn) max(se, Sp) Problème : les deux paramètres varient en sens contraire!! Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
12 Analyse ROC Exemple - 2 cas extrêmes vp pour s 1 M M vn pour s 1 s 1 fp pour s 1 X Seuil s 1 : Si X < s 1 alors M (pas de fn) Si X s 1 alors M et M (bcp de fp) Se = 1 mais Sp mauvaise M M T + (X s 1) vp fp T (X < s 1 ) 0 vn Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
13 Analyse ROC Exemple - 2 cas extrêmes fn pour s 2 M M vp pour s 2 Seuil s 2 : vn pour s 2 Si X < s 2 alors M et M (bcp de fn) Mais si X s 2 alors M (pas de fp) Sp = 1 mais Se mauvaise X s 2 M M T + (X s 2 ) vp 0 T (X < s 2 ) fn vn Nécessité de trouver un compromis!! Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
14 Analyse ROC Courbe ROC (Receiver Operating Characteristic) Se Point idéal (0,1) s2 s Objectif : déterminer le seuil s qui sépare au mieux les M des M 1 Sp Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
15 Analyse ROC Courbe ROC (Receiver Operating Characteristic) Se Point idéal (0,1) s2 Seuil s optimal s Sp Solution : déterminer le seuil s qui minimise la distance euclidienne du point (0, 1) d((0, 1), s) = (0 x s ) 2 + (1 y s ) 2 Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
16 Analyse ROC Courbe ROC (Receiver Operating Characteristic) La courbe ROC présente 2 intérêts : Choix du meilleur seuil Permet de visualiser puis quantifier le pouvoir discriminant de X Calcul de l aire sous la courbe ROC (AUC) Se Sp Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
17 Analyse ROC Courbe ROC (Receiver Operating Characteristic) Se Se Se Sp Sp Sp Discrimination 05 AUC 1 Discrim parfaite Se = 1, Sp = 1 AUC = 1 Discrimination AUC = 05 Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
18 Analyse ROC Courbe ROC (Receiver Operating Characteristic) Remarques : AUC Discrimination 05 Nulle Acceptable Excellente > 09 Exceptionnelle Si AUC = 05 alors on classe de manière complètement aléatoire les observations Si AUC > 09 le classement est très bon, voire trop bon, il faut évaluer s il y a overfitting Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
19 Concordance Introduction Objectif Evaluer la concordance (accord, similitude, ) entre 2 techniques 2 jugements 2 tests par rapport à un critère quantitatif Mesure biologique faite avec 2 appareils différents qualitatif Tests vivant/décès Cette notion inclue celle de reproductibilité (ex : p mesures avec le même appareil validation de l appareil) Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
20 Concordance Introduction Différence entre concordance et liaison Exemple : Accord entre 2 radiologues R 1 et R 2 sur une même série de radiographies R 1 \R 2 Malade Non-Malade Malade 95 8 Non-Malade 5 92 Pour évaluer la concordance entre R 1 et R 2 un test du χ 2 n est pas suffisant car : L existence d une liaison entre R 1 et R 2 n implique pas forcément la concordance entre eux R 1 \R 2 Malade Non-Malade Malade Non-Malade En revanche, une concordance importante un liaison significative Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
21 Concordance Coefficient kappa Concordance entre 2 jugements catégoriels : Coefficient Kappa Considérons 2 tests A et B effectués un échantillon de N individus A\B T + T T + a b n A + T c d n A n B + n B N Idée : La concordance entre A et B peut être décomposée en 1 Une concordance aléatoire (liée au hasard) 2 Une concordance réelle La concordance observée est définie par p o = a + d N Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
22 Concordance Coefficient kappa Concordance entre 2 jugements catégoriels : Coefficient Kappa Sous l hypothèse d indépendance des tests, on peut reconstituer le tableau des effectifs théoriques : A\B T + T T + n A + n B + N T n A n B + N n A + n B N n A + n A n B N n A n B + n B N Et ainsi en déduire la concordance due au hasard : n A + n B + N + n A n B N p c = N Il faut corriger la concordance observée (p o ) en tenant compte de celle qui serait due au hasard (p c ) Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
23 Concordance Coefficient kappa Concordance entre 2 jugements catégoriels : Coefficient Kappa On définit ainsi le coefficient kappa k : k = p o p c 1 p c Interprétation en termes de concordance : k 02 Négligeable 02 < k 04 Faible 04 < k 06 Moyenne 06 < k 08 Bonne 08 < k 1 Excellente On montre que E[K] = κ V[K] = p o(1 p o ) N(1 p c ) 2 Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
24 Concordance Coefficient kappa Concordance entre 2 jugements catégoriels : Coefficient Kappa Exemple Effectifs observés A\B T + T T T Effectifs théoriques A\B T + T T T p o = = 08 p c = k = p o p c = = 06 1 p c = 05 Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
25 Concordance Test de significativité du coefficient Test de significativité du coefficient kappa Condition d application : N 30 Les hypothèses de test sont les suivantes : { H 0 : κ = 0 Concordance aléatoire p o = p c H 1 : κ > 0 Concordance non aléatoire p o > p c Sous H 0, E[K] = 0 et p o = p c donc V[K] = p o(1 p o ) N(1 p c ) 2 = p c(1 p c ) N(1 p c ) 2 = p c N(1 p c ) Sous H 0, pour N 30, la statistique de test est Z = K E[K] = K N (0, 1) V[K] V[K] Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
26 Concordance Test de significativité du coefficient Test de significativité du coefficient kappa Retour à l exemple : p c = 05 s 2 k = = 01 z = k s k = = 6 Donc rejet de H 0 concordance statistiquement significative Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
27 Concordance Intervalle de confiance du coefficient Intervalle de confiance du coefficient kappa Si test est NS STOP Sinon nous devons donner une estimation de la vraie valeur κ IC L intervalle de confiance de κ au niveau de confiance 1 α est donné par : ] IC 1 α p o (1 p o ) κ = [k ± z 1 α/2 N(1 p c ) 2 Retour à l exemple : p o = 08, p c = 05, N = 100, k = 06 [ ] IC 95% κ = 06 ± (1 05) 2 IC 95% κ = [04432; 07568] Michaël Genin (Université de Lille 2) Evaluation d un test diagnostique - Concordance Version - 8 avril / 35
Chapitre 1 Evaluation des caractéristiques d un test diagnostique. José LABARERE
UE4 : Biostatistiques Chapitre 1 Evaluation des caractéristiques d un test diagnostique José LABARERE Année universitaire 2011/2012 Université Joseph Fourier de Grenoble - Tous droits réservés. lan I.
Plus en détailLe Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Plus en détailEVALUATION DES TESTS DE DIAGNOSTIC. Vray M Institut Pasteur 1
EVALUATION DES TESTS DE DIAGNOSTIC Vray M Institut Pasteur 1 Plan de la présentation Introduction Définition Dépistage, D Diagnostique Les ¾ phases de développement d d un d test Phases 1, 2, 3 et 4 Les
Plus en détailEvalua&on tests diagnos&ques. Arnaud Fontanet
Evalua&on tests diagnos&ques Arnaud Fontanet Résultats d un test diagnos&que Maladie «Gold standard» Test expérimental + a b a+b - c d c+d a+c b+d Evaluation tests diagnostiques. Arnaud Fontanet 2 Résultats
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailLa survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Plus en détailChapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE
UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction
Plus en détailFeuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.
Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences
Plus en détailSystèmes de transmission
Systèmes de transmission Conception d une transmission série FABRE Maxime 2012 Introduction La transmission de données désigne le transport de quelque sorte d'information que ce soit, d'un endroit à un
Plus en détailLa problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Plus en détailProjet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Plus en détailLES GENERATEURS DE NOMBRES ALEATOIRES
LES GENERATEURS DE NOMBRES ALEATOIRES 1 Ce travail a deux objectifs : ====================================================================== 1. Comprendre ce que font les générateurs de nombres aléatoires
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailTableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1
UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés
Plus en détailItem 169 : Évaluation thérapeutique et niveau de preuve
Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes
Plus en détailCours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Plus en détailGUIDE DE LECTURE CRITIQUE D'UN ARTICLE MEDICAL ORIGINAL (LCA)
GUIDE DE LECTURE CRITIQUE D'UN ARTICLE MEDICAL ORIGINAL (LCA) Coordinateurs : B. GOICHOT et N. MEYER Faculté de Médecine de Strasbourg Septembre 2011 PLAN L épreuve de lecture critique d article original
Plus en détailChapitre 6 Test de comparaison de pourcentages χ². José LABARERE
UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables
Plus en détailEtude d un cas industriel : Optimisation de la modélisation de paramètre de production
Revue des Sciences et de la Technologie RST- Volume 4 N 1 /janvier 2013 Etude d un cas industriel : Optimisation de la modélisation de paramètre de production A.F. Bernate Lara 1, F. Entzmann 2, F. Yalaoui
Plus en détailRelation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
Plus en détailExploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.
Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Etudes et traitements statistiques des données : le cas illustratif de la démarche par sondage INTRODUCTION
Plus en détailEstimation et tests statistiques, TD 5. Solutions
ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études
Plus en détailIntérêt diagnostic du dosage de la CRP et de la leucocyte-estérase dans le liquide articulaire d une prothèse de genou infectée
Intérêt diagnostic du dosage de la CRP et de la leucocyte-estérase dans le liquide articulaire d une prothèse de genou infectée C. Rondé-Oustau, JY. Jenny,J.Sibilia, J. Gaudias, C. Boéri, M. Antoni Hôpitaux
Plus en détail23. Interprétation clinique des mesures de l effet traitement
23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailProbabilités conditionnelles
Probabilités conditionnelles Exercice Dans une usine, on utilise conjointement deux machines M et M 2 pour fabriquer des pièces cylindriques en série. Pour une période donnée, leurs probabilités de tomber
Plus en détailOptimisation des ressources des produits automobile première
EURIA EURo Optimisation produits automobile première Pauline PERROT promotion 2011 EURIA EURo 1 ère partie : contexte MMA (FFSA) MAAF (GEMA) SGAM : COVEA (AFA) GMF (GEMA) MMA : Plus 3 millions clients
Plus en détailProjet de Loi no 98 Loi modifiant la Loi sur l assurance médicament et d autres dispositions législatives
Projet de Loi no 98 Loi modifiant la Loi sur l assurance médicament et d autres dispositions législatives Présentation à la Commission des affaires sociales Ordre des pharmaciens du Québec 28 mai 2002
Plus en détailTESTS D'HYPOTHESES Etude d'un exemple
TESTS D'HYPOTHESES Etude d'un exemple Un examinateur doit faire passer une épreuve type QCM à des étudiants. Ce QCM est constitué de 20 questions indépendantes. Pour chaque question, il y a trois réponses
Plus en détailTP Modulation Démodulation BPSK
I- INTRODUCTION : TP Modulation Démodulation BPSK La modulation BPSK est une modulation de phase (Phase Shift Keying = saut discret de phase) par signal numérique binaire (Binary). La phase d une porteuse
Plus en détailBaccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé
Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e
Plus en détailLe suivi de la qualité. Méthode MSP : généralités
Le suivi de la qualité La politique qualité d une entreprise impose que celle maîtrise sa fabrication. Pour cela, elle doit être capable d évaluer la «qualité» de son processus de production et ceci parfois
Plus en détailLois de probabilité. Anita Burgun
Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage
Plus en détailApplication des courbes ROC à l analyse des facteurs pronostiques binaires
Application des courbes ROC à l analyse des facteurs pronostiques binaires Combescure C (1), Perneger TV (1), Weber DC (2), Daurès J P (3), Foucher Y (4) (1) Service d épidémiologie clinique et Centre
Plus en détailJulien MATHEVET Alexandre BOISSY GSID 4. Rapport RE09. Load Balancing et migration
Julien MATHEVET Alexandre BOISSY GSID 4 Rapport Load Balancing et migration Printemps 2001 SOMMAIRE INTRODUCTION... 3 SYNTHESE CONCERNANT LE LOAD BALANCING ET LA MIGRATION... 4 POURQUOI FAIRE DU LOAD BALANCING?...
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailExo7. Probabilité conditionnelle. Exercices : Martine Quinio
Exercices : Martine Quinio Exo7 Probabilité conditionnelle Exercice 1 Dans la salle des profs 60% sont des femmes ; une femme sur trois porte des lunettes et un homme sur deux porte des lunettes : quelle
Plus en détailBaccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé
Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue
Plus en détailCAPTEURS - CHAINES DE MESURES
CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,
Plus en détailEVALUER LE JUSTE PRIX D UN CABINET
EVALUER LE JUSTE PRIX D UN CABINET La notion de «fonds libéral», instituée par la Cour de Cassation il y a quelques années simplifie juridiquement la cession des cabinets libéraux. Auparavant, les juristes
Plus en détailTests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
Plus en détailRégression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr
Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R
Plus en détailClasse de première L
Classe de première L Orientations générales Pour bon nombre d élèves qui s orientent en série L, la classe de première sera une fin d étude en mathématiques au lycée. On a donc voulu ici assurer à tous
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailDocument d orientation sur les allégations issues d essais de non-infériorité
Document d orientation sur les allégations issues d essais de non-infériorité Février 2013 1 Liste de contrôle des essais de non-infériorité N o Liste de contrôle (les clients peuvent se servir de cette
Plus en détailchoisir H 1 quand H 0 est vraie - fausse alarme
étection et Estimation GEL-64943 Hiver 5 Tests Neyman-Pearson Règles de Bayes: coûts connus min π R ( ) + ( π ) R ( ) { } Règles Minimax: coûts connus min max R ( ), R ( ) Règles Neyman Pearson: coûts
Plus en détailPartie Agir : Défis du XXI ème siècle CHAP 20-ACT EXP Convertisseur Analogique Numérique (CAN)
1/5 Partie Agir : Défis du XXI ème siècle CHAP 20-ACT EXP Convertisseur Analogique Numérique (CAN) Objectifs : Reconnaître des signaux de nature analogique et des signaux de nature numérique Mettre en
Plus en détailMémoire d actuariat - promotion 2010. complexité et limites du modèle actuariel, le rôle majeur des comportements humains.
Mémoire d actuariat - promotion 2010 La modélisation des avantages au personnel: complexité et limites du modèle actuariel, le rôle majeur des comportements humains. 14 décembre 2010 Stéphane MARQUETTY
Plus en détailUne variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)
CIVILITE-SES.doc - 1 - Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) 1 PRÉSENTATION DU DOSSIER CIVILITE On s intéresse
Plus en détailCALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING
CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING SÉLECTION DES RISQUES PRÉVISION DES DÉFAUTS SUIVI ET CONTRÔLE Pierre-Louis GONZALEZ Différents types de
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailMulford C. (1992). The Mother-Baby Assessment(MBA): An Apgar Score for breastfeeding. Journal of Human Lactation, 8(2), 79-82.
MOTHER-BABY ASSESSMENT SCALE Mulford C. (1992). The Mother-Baby Assessment(MBA): An Apgar Score for breastfeeding. Journal of Human Lactation, 8(2), 79-82. Instrument de Mother-Baby Assessment scale mesure
Plus en détailVI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
Plus en détailSujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante.
Sujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante. Objectifs et formulation du sujet Le syndrome de l apnée du sommeil (SAS) est un problème de santé publique
Plus en détailNOTE SUR LA MODELISATION DU RISQUE D INFLATION
NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui
Plus en détailLes indices à surplus constant
Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté
Plus en détailQuantification Scalaire et Prédictive
Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction
Plus en détailLa Qualité de Service le la Voix sur IP. Principes et Assurance. 5WVOIP rev E
La Qualité de Service le la Voix sur IP Principes et Assurance 5WVOIP rev E Introduction La généralisation des infrastructures IP dans les entreprises s accompagne du développement de techniques d amélioration
Plus en détailDonnées longitudinales et modèles de survie
ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailEstimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison
Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence
Plus en détailAgrégation des portefeuilles de contrats d assurance vie
Agrégation des portefeuilles de contrats d assurance vie Est-il optimal de regrouper les contrats en fonction de l âge, du genre, et de l ancienneté des assurés? Pierre-O. Goffard Université d été de l
Plus en détailÉtudes épidémiologiques analytiques et biais
Master 1 «Conception, évaluation et gestion des essais thérapeutiques» Études épidémiologiques analytiques et biais Roxane Schaub Médecin de santé publique Octobre 2013 1 Objectifs pédagogiques Connaitre
Plus en détailCONTROVERSE : IDR OU QUANTIFERON LORS D'UN CONTAGE EN EHPAD?
CONTROVERSE : IDR OU QUANTIFERON LORS D'UN CONTAGE EN EHPAD? Hélène MANGEARD François MALADRY Tuberculose : infection mycobactérienne Infection mycobactérienne chronique (M. Tuberculosis ++ ou bacille
Plus en détailMETHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES
Enseignement du Deuxième Cycle des Etudes Médicales Faculté de Médecine de Toulouse Purpan et Toulouse Rangueil Module I «Apprentissage de l exercice médical» Coordonnateurs Pr Alain Grand Pr Daniel Rougé
Plus en détailQuantification de l AgHBs Pouquoi? Quand?
Quantification de l AgHBs Pouquoi? Quand? Michelle Martinot-Peignoux Service d Hépatologie Hôpital Beaujon Université Paris-Diderot INSERM U-773/CRB3 Clichy-France Plan Introduction Applications Cliniques
Plus en détailAnnales du Contrôle National de Qualité des Analyses de Biologie Médicale
Annales du Contrôle National de Qualité des Analyses de Biologie Médicale ARN du virus de l hépatite C : ARN-VHC ARN-VHC 03VHC1 Novembre 2003 Edité : mars 2006 Annales ARN-VHC 03VHC1 1 / 8 ARN-VHC 03VHC1
Plus en détailI - CLASSIFICATION DU DIABETE SUCRE
I - CLASSIFICATION DU DIABETE SUCRE 1- Définition : Le diabète sucré se définit par une élévation anormale et chronique de la glycémie. Cette anomalie est commune à tous les types de diabète sucré, mais
Plus en détailAlgorithmes d'apprentissage
Algorithmes d'apprentissage 1 Agents qui apprennent à partir d'exemples La problématique : prise de décision automatisée à partir d'un ensemble d'exemples Diagnostic médical Réponse à une demande de prêt
Plus en détailDASES Réseau tuberculose 10 janvier 2006
DASES Réseau tuberculose 10 janvier 2006 Place des Nouveaux Tests de Dosage de L INTERFERON GAMMA dans le diagnostic de la Tuberculose Fadi ANTOUN, Cellule Tuberculose DASES Le Quotidien du Médecin 2005
Plus en détailLe montant des garanties constituées aux fins du STPGV est-il excessif?
Le montant des garanties constituées aux fins du STPGV est-il excessif? Kim McPhail et Anastasia Vakos* L e système canadien de transfert des paiements de grande valeur (STPGV) sert à effectuer les paiements
Plus en détailCours de Tests paramétriques
Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.
Plus en détailUFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Plus en détail!-.!#- $'( 1&) &) (,' &*- %,!
0 $'( 1&) +&&/ ( &+&& &+&))&( -.#- 2& -.#- &) (,' %&,))& &)+&&) &- $ 3.#( %, (&&/ 0 ' Il existe plusieurs types de simulation de flux Statique ou dynamique Stochastique ou déterministe A événements discrets
Plus en détailChapitre 2/ La fonction de consommation et la fonction d épargne
hapitre 2/ La fonction de consommation et la fonction d épargne I : La fonction de consommation keynésienne II : Validations et limites de la fonction de consommation keynésienne III : Le choix de consommation
Plus en détail«Cours Statistique et logiciel R»
«Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire
Plus en détailDocteur José LABARERE
UE7 - Santé Société Humanité Risques sanitaires Chapitre 3 : Epidémiologie étiologique Docteur José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailÉTAT DES LIEUX. Niveau de preuve et gradation des recommandations de bonne pratique
ÉTAT DES LIEUX Niveau de preuve et gradation des recommandations de bonne pratique Avril 2013 Les recommandations et leur synthèse sont téléchargeables sur www.has-sante.fr Haute Autorité de Santé Service
Plus en détailCours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES
LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,
Plus en détailBaccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
Plus en détailCorrection du baccalauréat ES/L Métropole 20 juin 2014
Correction du baccalauréat ES/L Métropole 0 juin 014 Exercice 1 1. c.. c. 3. c. 4. d. 5. a. P A (B)=1 P A (B)=1 0,3=0,7 D après la formule des probabilités totales : P(B)=P(A B)+P(A B)=0,6 0,3+(1 0,6)
Plus en détailÉvaluation d un test rapide immuno-chromatographique comme aide à la prophylaxie antitétanique dans un service d urgences
Immunoanalyse et biologie spécialisée (2012) 27, 185 190 Disponible en ligne sur www.sciencedirect.com STRATÉGIES D EXPLORATION FONCTIONNELLE ET DE SUIVI THÉRAPEUTIQUE Évaluation d un test rapide immunochromatographique
Plus en détailPROGRAMME (Susceptible de modifications)
Page 1 sur 8 PROGRAMME (Susceptible de modifications) Partie 1 : Méthodes des revues systématiques Mercredi 29 mai 2013 Introduction, présentation du cours et des participants Rappel des principes et des
Plus en détailQu est ce qu un réseau social. CNAM Séminaire de Statistiques Appliquées 13/11/2013. F.Soulié Fogelman 1. Utilisation des réseaux sociaux pour le
Qui je suis Innovation Utilisation des réseaux sociaux pour le data mining Business & Decision Françoise Soulié Fogelman francoise.soulie@outlook.com Atos KDD_US CNAM Séminaire de Statistique appliquée
Plus en détailThéorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France
Théorie et Codage de l Information (IF01) exercices 2013-2014 Paul Honeine Université de technologie de Troyes France TD-1 Rappels de calculs de probabilités Exercice 1. On dispose d un jeu de 52 cartes
Plus en détailAPS résumé partie III
1 APS résumé partie III Les outils d évaluation de l activité physique Le but est de quantifier/ évaluer les activités physiques habituelles (non-structurées).on a plusieurs méthodes : - Indirectes (subjectives)
Plus en détailInformatique Médicale & Ingénierie des Connaissances Pour la e-santé
Li ics Laboratoire d Informatique Médicaleet d Ingénierie des Connaissances en e-santé Projet de création d une UMR Inserm Université Pierre et Marie Curie, Université Paris Nord Informatique Médicale
Plus en détailRéseau SCEREN. Ce document a été numérisé par le CRDP de Bordeaux pour la. Base Nationale des Sujets d Examens de l enseignement professionnel.
Ce document a été numérisé par le CRDP de Bordeaux pour la Base Nationale des Sujets d Examens de l enseignement professionnel. Campagne 2013 Ce fichier numérique ne peut être reproduit, représenté, adapté
Plus en détailAnalyse de grandes bases de données en santé
.. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.
Plus en détailCOMMENT MAITRISER LA GESTION DES APPROVISIONNEMENTS ET DES STOCKS DE MEDICAMENTS
1 sur 9 COMMENT MAITRISER LA GESTION DES APPROVISIONNEMENTS ET DES STOCKS DE MEDICAMENTS (L'article intégral est paru dans Gestions Hospitalières n 357 de juin-juillet 1996) Pour plus d'informations concernant
Plus en détailLISTE D EXERCICES 2 (à la maison)
Université de Lorraine Faculté des Sciences et Technologies MASTER 2 IMOI, parcours AD et MF Année 2013/2014 Ecole des Mines de Nancy LISTE D EXERCICES 2 (à la maison) 2.1 Un particulier place 500 euros
Plus en détailIntroduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Plus en détailCas clinique Enquête autour d un cas IDR vs IGRA Pr Emmanuel Bergot
Cas clinique Enquête autour d un cas IDR vs IGRA Pr Emmanuel Bergot Service de Pneumologie, CHU Côte de Nacre Centre de compétence régionale de l HTAP UMR INSERM 1086 «Cancers et Préventions», Université
Plus en détailQu est-ce-qu un Warrant?
Qu est-ce-qu un Warrant? L epargne est investi dans une multitude d instruments financiers Comptes d epargne Titres Conditionnel= le detenteur à un droit Inconditionnel= le detenteur a une obligation Obligations
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailDétection de la défaillance des entreprises tunisiennes par la régression logistique semi paramétrique et les réseaux de neurones
Détection de la défaillance des entreprises tunisiennes par la régression logistique semi paramétrique et les réseaux de neurones Abdeljelil Farhat Unité de recherche EAS-Mahdia Faculté des sciences économiques
Plus en détailCorrection du bac blanc CFE Mercatique
Correction du bac blanc CFE Mercatique Exercice 1 (4,5 points) Le tableau suivant donne l évolution du nombre de bénéficiaires de minima sociaux en milliers : Année 2002 2003 2004 2005 2006 2007 2008 2009
Plus en détail