Comment évaluer les méthodes de détermination de volumes métaboliquement actifs en Tomographie par Emission de Positons (TEP)?

Documents pareils

Pierre OLIVIER - Médecine Nucléaire

Intérêt de la TEP-FDG dans les cancers de l ovaire

PET/CT et Sarcoïdose. Daniel O Slosman

CORRELATION RADIO-ANATOMIQUE DANS LE CARCINOME HEPATOCELLULAIRE TRAITE PAR TRANSPLANTATION HEPATIQUE : IMPACT SUR LA RECIDIVE

Introduction à l approche bootstrap

Les atouts et faiblesses des caméras TEP dédiées, TEP corps entier, TEP-CT, TEMP pour la quantification

Valorisation d une publication scientifique: Bibliographies (IF, H, SIGAPS)

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Cancer du sein. Du CA15-3 à la tomographie à émission de positons.

Tout ce que vous avez toujours voulu savoir sur la scintigraphie osseuse et le TEP-SCAN

Sujets présentés par le Professeur Olivier CUSSENOT

Les sciences de l ingénieur appliquées à la prise en charge du

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

UE2 CANCEROLOGIE Place de la Médecine Nucléaire

PLACE DE L IRM DANS LE BILAN D EXTENSION DU CANCER DU RECTUM. Professeur Paul LEGMANN Radiologie A - Cochin Paris

Nouvelles caméras CZT cardiaques: une seconde vie pour le thallium 201?

ASSURANCE POUR TOUS PARTOUT DANS LE MONDE

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

BERTHIER E, CHRISTIANO M, PHILIPPE M O, IEHL J, TATARU N, DECAVEL P, VUILLIER F, ELISEEF A, MOULIN T. Introduction (1). Contexte de l étude

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Simulation d'un examen anthropomorphique en imagerie TEMP à l iode 131 par simulation Monte Carlo GATE

Bases physiques de l imagerie en

Traitement bas-niveau

Outils d évaluations de la simulation en équipe: Évaluation de performance en formation interprofessionnelle. Martina ESDAILE SFAR 19 septembre 2012

L IRM pas à pas Un module d enseignement interactif des bases physiques de l Imagerie par Résonance Magnétique.

Quel apport de l imagerie dans les traitements anti-angiogéniques?

Le point sur les techniques d embolisation des hépatocarcinomes

Essais cliniques de phase 0 : état de la littérature

Projet de Traitement du Signal Segmentation d images SAR

Rad4Med.be, premier acteur global dans le nucléaire médical

F-FLUORODÉOXYGLUCOSE EN ONCOLOGIE Expérience en Ile de France

Échographie normale et pathologique du grand pectoral

UN SYSTÈME POLYVALENT D'IMAGERIE ORL ET DENTAIRE. CS 9300 / CS 9300C

La fusion des images en Médecine Nucléaire. Situation actuelle. La fusion des images en Médecine Nucléaire. Situation actuelle.

Superstrat tout Dielectrique Pour le Contrôle de l Ouverture Angulaire d'une Antenne à Double Polarisation

Test de terrain ou test de laboratoire pour la performance en endurance?

Cercle de certification GREEN BELT e édition

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Foscolo (1), J Felblinger (2), S Bracard (1) CHU Hôpital central, service de neuroradiologie, Nancy (1) CHU BRABOIS, Centre d investigation clinique

Etude des propriétés empiriques du lasso par simulations

Projet ROC Réunion de lancement des groupes de travail Présentation du projet aux établissements de santé

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Comprendre vos relevés de comptes CFD/FOREX:

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Cas clinique Enquête autour d un cas IDR vs IGRA Pr Emmanuel Bergot

Document d information dans le cadre de l installation d un cyclotron. à Saint-Louis

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Recommandations régionales Prise en charge des carcinomes cutanés

TABLE DES MATIERES. C Exercices complémentaires 42

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Étude de la faisabilité de l auto-compression en A MOISEI, S KINZELIN, P TROUFLEAU, B BOYER, L LEMOINE, P HENROT

Fête de la science Initiation au traitement des images

TRAUMATISME CRANIEN DE L ENFANT : conduite à tenir?

La prévention des intoxications dans les silos à fourrage

Nouvelles stratégies et nouveaux impacts de l imagerie des cancers

La Recherche du Point Optimum de Fonctionnement d un Générateur Photovoltaïque en Utilisant les Réseaux NEURO-FLOUS

LES MODELES DE SCORE

Problème d ordonnancement de véhicules en variables booléennes

Leadership, innovation, réussite L A N O U V E L L E R É F É R E N C E E N M AT I È R E D E T E C H N O L O G I E D E L A S A N T É.

Essais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire

OSSIFICATION DU LIGAMENT VERTEBRAL COMMUN POSTERIEUR ET DU LIGT JAUNE: MYELOPATHIE CERVICALE SUBAIGUE

2.4. Les médicaments de la «liste en sus»

Évaluation (HTA) de l'imagerie 3D à faisceau conique (CBCT) pour l'imagerie dentomaxillofaciale. Emmanuel Charpentier, Anne-Florence Fay, Natalie

Master ès Sciences en sciences infirmières

Le grand écart de la recherche fondamentale vers l application biomédicale

Table des matières: Guidelines Fonds de Pensions

Bienvenue à l Eye Tracking Day 2015

MCMC et approximations en champ moyen pour les modèles de Markov

Traitements néoadjuvants des cancers du rectum. Pr. G. Portier CHU Purpan - Toulouse

Les exploitations de grandes cultures face à la variabilité de leurs revenus : quels outils de gestion des risques pour pérenniser les structures?

MULTITEL, votre partenaire en R&D et innovation

La diffusion des résultats statistiques du recensement de la population

Chapitre 1 : Introduction au contrôle de gestion. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 1

Résumé du projet (french) Karl Krajic Jürgen Pelikan Petra Plunger Ursula Reichenpfader

Actualités IRM dans la SEP Thomas Tourdias 1, 2

Mesure agnostique de la qualité des images.

Chapitre 7 : Intégration sur un intervalle quelconque

Validation clinique des marqueurs prédictifs le point de vue du méthodologiste. Michel Cucherat UMR CNRS Lyon

Sur certaines séries entières particulières

Radionucléides à usage médical Aspects diagnostiques et thérapeutiques

Chapitre 1 Evaluation des caractéristiques d un test diagnostique. José LABARERE

MASTER CLASS UBA 16 juin 2009

de calibration Master 2: Calibration de modèles: présentation et simulation d

Evaluation péri-opératoire de la tolérance à l effort chez le patient cancéreux. Anne FREYNET Masseur-kinésithérapeute CHU Bordeaux

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Pathologies tumorales thoraciques : intérêt de l IRM de perfusion et de diffusion avant biopsie

Excel Avancé. Plan. Outils de résolution. Interactivité dans les feuilles. Outils de simulation. La valeur cible Le solveur

Radiologie Interven/onnelle sur les nodules pulmonaires. J. Palussière, X. Buy Département imagerie

Industrie des cartes de paiement (PCI) Norme de sécurité des données Récapitulatif des modifications de

DOCUMENT DE TRAVAIL DES SERVICES DE LA COMMISSION RÉSUMÉ DE L'ANALYSE D'IMPACT. Accompagnant le document

WHITE PAPER Une revue de solution par Talend & Infosense

Qu est-ce qu un sarcome?

Artéfact en queue de comète à l échographie hépatique: un signe de maladie des voies biliaires intra-hépatiques

TEPOSSE : TEP dans les OstéoSarcomes et Sarcomes dʼewing. TEP/TDM au FDG et évaluation précoce de la réponse à la chimiothérapie néoadjuvante

INF6304 Interfaces Intelligentes

PROGRAMME DETAILLE DU «STAGE MASTER DE REPRISE D ENTREPRISE»

Transcription:

Comment évaluer les méthodes de détermination de volumes métaboliquement actifs en Tomographie par Emission de Positons (TEP)? Irène Buvat Imagerie et Modélisation en Neurobiologie et Cancérologie UMR 8165 CNRS - Paris 7 - Paris 11 buvat@imnc.in2p3.fr http://www.guillemet.org/irene Journée GDR - 9 décembre 2009-1

Problématique Plus de 20 méthodes ont été proposées pour délimiter le volume tumoral métaboliquement actif : - seuil fonction du pourcentage du max (quel pourcentage?) - seuil fonction du pourcentage du max et de l activité environnante (quelle fonction?) Nestle et al 2005, David et al 2006, Nestle et al 2007 - seuil ajusté itérativement (quelle fonction?) Daisne et al 2003, Jentzen et al 2007, Drever et al 2007, van Dalen et al 2007, Black et al 2004, Green et al 2008 - méthodes de détection de contours Geets et al 2007, Drever et al 2007, Li et al 2008 - méthodes de classification de voxels Hatt et al 2007, Zhu et al 2003, Aristophanous et al 2007, Hatt et al 2009, Montgomery et al 2007 Quelles méthodes sont les plus fiables dans telle et telle circonstances? Journée GDR - 9 décembre 2009-2

Première option : méta-analyse de la littérature (1) Variété des données Variété de l optimisation Variété des figures de mérite Journée GDR - 9 décembre 2009-3

Première option : méta-analyse de la littérature (2) Variété des données Variété de l optimisation Variété des figures de mérite Journée GDR - 9 décembre 2009-4

Première option : méta-analyse de la littérature (3) Variété des données Variété de l optimisation Variété des figures de mérite Journée GDR - 9 décembre 2009-5

Première option : méta-analyse de la littérature (4) Discussion : impossibilité de comparer les performances des différentes approches uniquement sur la base des données de la littérature du fait de : - la variété des données utilisées - la variété des approches d optimisation des paramètres - la variété des figures de mérite Nécessité de comparer les méthodes à partir des mêmes données, en utilisant la même approche d optimisation et les mêmes figures de mérite pour statuer sur leurs performances respectives Quelles données? Journée GDR - 9 décembre 2009-6

Données pour l évaluation Fantômes : + accessibles à tous - trop simples (sphères homogènes, parois de plexiglas) Données simulées - pas forcément simples à générer + possiblement très réalistes (tumeurs non sphériques, hétérogènes) Données cliniques + représentatives de la réalité clinique - quel gold standard? Journée GDR - 9 décembre 2009-7

Impact des données sur lesquelles on évalue Seuillage à 40% du SUVmax Les performances des méthodes dépendent fortement des données sur lesquelles elles opèrent Stute et al, IEEE NSS-MIC Conf Records 2008 Journée GDR - 9 décembre 2009-8

Optimisation des méthodes à évaluer (1) La plupart des méthodes implique un ou plusieurs paramètres : Zhu et Jiang, 2003 Hatt et al, 2009 Dewalle et al, 2008 Journée GDR - 9 décembre 2009-9

Optimisation des méthodes à évaluer (2) Comment fixer ces paramètres? Plusieurs stratégies : prendre les valeurs de la littérature - non optimisées pour le type de données à traiter, pénalise la méthode calibrer avec un fantôme + le plus réaliste optimiser sur les données à traiter - biaisé Les performances des méthodes dépendent de la façon dont les paramètres sont optimisés Journée GDR - 9 décembre 2009-10

Impact de la méthode d optimisation des méthodes à évaluer Black 2004 Green 2008 Nestle 2005 Tylski 2007 Optimisation leave-one out : Méthodes donnant leurs meilleurs résultats Optimisation sur un échantillon d apprentissage et évaluation sur un échantillon test Optimisation sur un fantôme (tumeurs sphériques) et évaluation sur un patient simulé Tylski et al, J Nucl Med, Feb 2010 Journée GDR - 9 décembre 2009-11

Figure de mérite à considérer Le plus souvent : erreur sur le volume 100 * (volume estimé - volume vrai) volume vrai Adapté pour la caractérisation des tumeurs ou de leur évolution Pour la définition de volume cible, une erreur de classification est plus pertinente Faux positif (FP) = volume identifié comme appartenant à la tumeur à tort Faux négatif (FN) = volume tumoral non identifié comme tel Daisne et al, Radiology 2004 Erreur de classification = (FP + FN)/volume tumoral Hatt et al, Phys Med Biol 2007 Journée GDR - 9 décembre 2009-12

Pistes à considérer pour aller plus loin dans l évaluation Caractériser les performances conjointement sur différents types de données Bases de données partagées, fantômes, simulées ou cliniques Evaluation clinique sans gold standard Journée GDR - 9 décembre 2009-13

Caractériser les performances sur différents types de données Les résultats sont différents suivant le type de données Erreurs sur le volume Simulations analytiques : -3,2% (4,2 ml) à +1,8% (51 ml) Fantômes : -20% (2,1 ml) à -10% (92,9 ml) Patients (vs volume de la pièce chirurgicale) : +15% (4,1 ml) à -10% (30,9 ml) mais +47% (17,3 ml)* Geets et al, EJNMMI 2007 Fantômes : 11,6% ( 7,4 ml) à -3,9% (171,3 ml) Patients (vs volume TDM) : +1,3% (66,4 ml) à -27,8% (12,7 ml) mais 0% (5,5 ml)* Schaefer et al, EJNMMI 2008 Fantômes : > 50% ( 0,48 ml) à <10% (26,52 ml) Patients (vs volume TDM) : ~20% (~2,5 ml) à -25% (17.5 ml)* Jentzen et al, JNM 2007 * Pas d évolution monotone de l erreur en fonction du volume de la tumeur Journée GDR - 9 décembre 2009-14

Caractériser les performances sur différents types de données Option : commencer par classer les méthodes plutôt que de chercher à caractériser leurs performances absolues, pour dégager une cohérence Tylski 2007 Nestle 2005 Green 2008 Black 2004 Optimisation leave-one out : Méthodes donnant leurs meilleurs résultats Optimisation sur un échantillon d apprentissage et évaluation sur un échantillon test Moindre dépendance à la façon dont les méthodes sont optimisées si l optimisation des différentes méthodes est consistante (toutes optimisées suivant le même critère) Tylski et al, J Nucl Med, Feb 2010 Journée GDR - 9 décembre 2009-15

Caractériser les performances sur différents types de données Révèle aussi la robustesse des méthodes vis-à-vis de différents jeux de données Tylski 2007 Nestle 2005 Green 2008 Black 2004 Optimisation sur un échantillon d apprentissage et évaluation sur un échantillon test, fantôme Optimisation sur un fantôme et évaluation sur des données cliniques simulées Tylski et al, J Nucl Med, Feb 2010 Journée GDR - 9 décembre 2009-16

Caractériser les performances sur différents types de données Exemple : comparaison de 5 méthodes de délimitation de volumes sur les mêmes données (issues de fantômes variés) et avec différentes procédures d optimisation mais beaucoup d autres méthodes prometteuses mériteraient d être testées, et des données encore plus réalistes (avec mvt respiratoire et fixations hétérogènes) mériteraient d être considérées Tylski et al, J Nucl Med, Feb 2010 Journée GDR - 9 décembre 2009-17

Base de données partagées Motivation : étendre la comparaison de méthodes incluant celles qu on n a pas reprogrammées - Construire des bases de données suffisamment représentatives : fantômes, données simulées, données cliniques Nécessité de fournir les données afférentes permettant d optimiser les méthodes Action dans le cadre du GDR (recenser puis compiler)? Journée GDR - 9 décembre 2009-18

Evaluation clinique Par rapport à des spécimens chirurgicaux : caractériser la fiabilité de la référence d abord Evaluations sans gold standard qui méritent d être explorées davantage - GEWAGS - STAPLE Journée GDR - 9 décembre 2009-19

Evaluation sans gold standard (1) Hypothèses : 1) Au moins 2 méthodes m d estimation du même paramètre x i 2) y im = a m x i 2 + b m x i + c m + ε mi pour m = 1, 2, et ε mi ~ N(0,σ m ) y x = vraie valeur? Hoppin, Kupinski, Kastis, Clarkson, Barrett. IEEE Trans Med Imaging 21: 441-449, 2002 Kupinski, Hoppin, Clarkson, Barrett, Kastis. Acad Radiol 9: 290-297, 2002 Buvat et al, J Nucl Med 48: 44P, 2007 Journée GDR - 9 décembre 2009-20

Evaluation sans gold standard (2) Hypothèses : 3) x i suit une distribution beta θ définie par 2 paramètres inconnus π 1 et π 2 Les valeurs min et max de la distribution sont approximativement connues nombre de valeurs x Journée GDR - 9 décembre 2009-21

Evaluation sans gold standard (3) Méthode : 1) Maximisation de la log-vraisemblance des paramètres du modèle L( {a m, b m, c m, σ m } {y im }) 2) Calcul de smse m = Σ i=1,x (y im -x i ) 2 /X comme figure de mérite y y=x x = vraie valeur? 3) Calcul d intervalles de confiance autour de smse m au moyen d une approche bootstrap non paramétrique Journée GDR - 9 décembre 2009-22

Evaluation sans gold standard (4) Plus on dispose de méthodes d estimation répondant au modèle, meilleur sera l ajustement, mais 2 méthodes sont suffisantes Au moins 25 cas sont nécessaires La méthode est robuste même lorsque l hypothèse sur la distribution des x i est approximative Hoppin, Kupinski, Kastis, Clarkson, Barrett. IEEE Trans Med Imaging 21: 441-449, 2002 Kupinski, Hoppin, Clarkson, Barrett, Kastis. Acad Radiol 9: 290-297, 2002 Journée GDR - 9 décembre 2009-23

Exemple d application d : mesure du potentiel de liaison en SPECT Patients simulés PL estimé no CVP CVP PL estimé GEWAGS Vraie relation smse = 27.33 smse = 0.90 p<0.01 «Vrai» PL Patients réels «Vrai» PL PL estimé PL estimé smse = 50.78 smse = 3.50 p<0.01 «Vrai» PL «Vrai» PL Soret et al. J Nucl Med 44: 1184-1193, 2003 Soret et al. Nucl Instrum Meth Phys Res A, 2007 Journée GDR - 9 décembre 2009-24

Evaluation sans gold standard STAPLE Warfield, Zou, Wells, IEEE Trans Med Imaging 23: 903-921, 2004 Journée GDR - 9 décembre 2009-25

Conclusions Nécessité de mener des études comparatives des méthodes de segmentation des volumes cibles pour clarifier leurs performances respectives L évaluation doit inclure la caractérisation des biais ET la robustesse (variabilité des résultats) en fonction de l optimisation et des données traitées Tendre vers l évaluation sur des données réalistes voire réelles Journée GDR - 9 décembre 2009-26

Remerciements Perrine Tylski Institut Jules Bordet, Bruxelles Université Catholique de Louvain, Bruxelles Journée GDR - 9 décembre 2009-27