Semi-Parametric Dose Finding Methods



Documents pareils
Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Principe de symétrisation pour la construction d un test adaptatif

Introduction : Essais de phase I

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Espaces probabilisés

Essais cliniques de phase 0 : état de la littérature

(VM(t i ),Q(t i+j ),VM(t i+j ))

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Essais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Retournement Temporel

Limites finies en un point

Item 169 : Évaluation thérapeutique et niveau de preuve

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Couples de variables aléatoires discrètes

Image d un intervalle par une fonction continue

GENIE STATISTIQUE GESTION DES RISQUES ET INGENIERIE FINANCIERE MARKETING QUANTITATIF ET REVENUE MANAGEMENT

Année Universitaire 2009/2010 Session 2 de Printemps

APPLICATION DU SCN A L'EVALUATION DES REVENUS NON DECLARES DES MENAGES

Introduction au datamining

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Construction de l'intégrale de Lebesgue

Intégration et probabilités TD1 Espaces mesurés Corrigé

Ordonnancement. N: nains de jardin. X: peinture extérieure. E: électricité T: toit. M: murs. F: fondations CHAPTER 1

Recherche dans un tableau

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

LE PROBLEME DU PLUS COURT CHEMIN

Introduction à la relativité générale

Modélisation aléatoire en fiabilité des logiciels

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

3 Approximation de solutions d équations

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Texte Agrégation limitée par diffusion interne

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

a) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées :

TP2 - Conguration réseau et commandes utiles. 1 Généralités. 2 Conguration de la machine. 2.1 Commande hostname

LA SURVEILLANCE ET LE SUIVI DE L'ENVIRONNEMENT. Pierre Guimont Conseiller en environnement Unité Environnement Division Équipement, Hydro-Québec

Conduite et Gestion de Projet - Cahier des charges

Algorithmes d'apprentissage

Programmes des classes préparatoires aux Grandes Ecoles

2. RAPPEL DES TECHNIQUES DE CALCUL DANS R

NOTATIONS PRÉLIMINAIRES

COMMENT MAITRISER LA GESTION DES APPROVISIONNEMENTS ET DES STOCKS DE MEDICAMENTS

Nombre de marches Nombre de facons de les monter

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

TP3 : Creation de tables 1 seance

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

Moments des variables aléatoires réelles

3 Les premiers résultats des plans d'actions

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Création de procédures inter-services pour la gestion des essais de phase I à l Institut Gustave Roussy

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

Équations non linéaires

2. Activités et Modèles de développement en Génie Logiciel

Condition de stabilité d'un réseau de les d'attente à deux stations et N classes de clients 1

Critère du choix des variables auxiliaires à utiliser dans l'estimateur par calage

Document d orientation sur les allégations issues d essais de non-infériorité

3. Conditionnement P (B)

NOTIONS DE PROBABILITÉS

Conception d'un réseau de transport d'électricité

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

INTELLIGENCE ECONOMIQUE : ENJEUX ET RETOUR D EXPERIENCE PILOTE DANS SEPT PMI DE BOURGOGNE

Compte-rendu de projet de Système de gestion de base de données

Apport de la simulation de conduite dans le cadre de l'action 2

Guide de configuration de SQL Server pour BusinessObjects Planning

Intégration et probabilités TD1 Espaces mesurés

Utilisation des médicaments au niveau des soins primaires dans les pays en développement et en transition

Problème : Calcul d'échéanciers de prêt bancaire (15 pt)

TP : Shell Scripts. 1 Remarque générale. 2 Mise en jambe. 3 Avec des si. Systèmes et scripts

RAPID Prenez le contrôle sur vos données

CONFERENCE PALISADE. Optimisation robuste d un plan d expériences par simulation Monte-Carlo Concepts de «Design Space» et de «Quality by Design»

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

D'UN THÉORÈME NOUVEAU

Modélisation géostatistique des débits le long des cours d eau.

Régression linéaire. Nicolas Turenne INRA

Les conducteurs automobiles évaluent-ils correctement leur risque de commettre un accident?

Examen optimisation Centrale Marseille (2008) et SupGalilee (2008)

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

Deuxième partie. Approche globale d'implémentation d'un projet PLM

Copropriété: 31, rue des Abondances Boulogne-Billancourt

Dualité dans les espaces de Lebesgue et mesures de Radon finies

APPORT DES RESEAUX BAYESIENS DANS LA PREVENTION DE LA DELINQUANCE

DYNAMIQUE DE FORMATION DES ÉTOILES

Algèbre 40 Analyse Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS

Cours Langage C/C++ Programmation modulaire

Domaine 1 : S approprier un environnement informatique de travail. Domaine 3 : Créer, produire, traiter et exploiter des données.

ANTISELECTION ET CHOIX D'ASSURANCE : LE CAS DU VOL EN HABITATION UNE APPROCHE DE LA MESURE DU PHENOMENE

chapitre 4 Nombres de Catalan

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

Résolution d équations non linéaires

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

Probabilités conditionnelles Loi binomiale

INF6304 Interfaces Intelligentes

Chapitre 6 Apprentissage des réseaux de neurones et régularisation

COMMISSION DES NORMES COMPTABLES. Avis CNC 138/5 Logiciels

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

La mesure de Lebesgue sur la droite réelle

Transcription:

Semi-Parametric Dose Finding Methods Matthieu Clertant 1 & John O'quigley 2 1 Université Pierre et Marie Curie, Laboratoire de Statistique Théorique et appliquée, 4 place Jussieu, Tour 15-25, 2e étage, 75252 Paris Cedex 05, matthieu.clertant@upmc.fr 2 Université Pierre et Marie Curie, Laboratoire de Statistique Théorique et appliquée, 4 place Jussieu, Tour 15-25, 2e étage, 75252 Paris Cedex 05, john.oquigley@upmc.fr Résumé. On décrit un cadre général de méthodes permettant de répondre au problème de positionnement de dose. Celui-ci revient à localiser la racine d'une fonction de régression. Ces méthodes sont très utiles en phase I d'essai clinique car elles respectent les contraintes éthiques inhérentes à ce type d'étude. Sous des conditions paramétriques de forte dépendance, la classe de méthode envisagée est équivalente à celle de la CRM. Si, l'on assoupli la structure sous-jacente, on retrouve le mtpi, la CCD et le BOIN. Ces méthodes sont non-paramétriques par nature tandis que la CRM peut-être vue comme fortement paramétrique. Le cadre proposé repose sur un principe semi-paramétrique puisqu'il correspond à la CRM muni d'un paramètre de nuisance. Les performances obtenues sont bonnes, généralement comparables à celles de la CRM et parfois supérieures. La structure générale permet d'aborder plus facilement certaines questions théoriques et de mieux comprendre comment les diérentes méthodes sus-citées sont reliées entre elles. Mots-clés. Phase I, CRM, mtpi, modéle bayésien hiérarchique, modélisation semiparamétrique. Abstract. We describe a class of dose nding methods to be used in Phase I clinical trials. Under some added parametric conditions the class is equivalent to the family of continual reassessment method (CRM) designs. Under some relaxation of the underlying structure the method is equivalent to the MTPI, BOIN or CCD classes of designs. These latter designs are non-parametric in nature whereas the CRM class can be viewed as being strongly parametric. The proposed class is characterized as being semi-parametric since it corresponds to CRM with a nuisance parameter. Performance is good, generally matching that of the CRM class although improving on it in some cases. The structure allows theoretical questions to be more easily investigated and to better understand how dierent classes of methods related to one another. Keywords. Phase I, CRM, mtpi, hierarchical bayesian model, semi-parametrical modelisation. 1

Semi-Parametric Dose Finding Methods Matthieu Clertant 1 & John O'quigley 2 1 Université Pierre et Marie Curie, Laboratoire de Statistique Théorique et appliquée, 4 place Jussieu, Tour 15-25, 2e étage, 75252 Paris Cedex 05, matthieu.clertant@upmc.fr 2 Université Pierre et Marie Curie, Laboratoire de Statistique Théorique et appliquée, 4 place Jussieu, Tour 15-25, 2e étage, 75252 Paris Cedex 05, john.oquigley@upmc.fr Résumé. On décrit un cadre général de méthodes permettant de répondre au problème de positionnement de dose. Celui-ci revient à localiser la racine d'une fonction de régression. Ces méthodes sont très utiles en phase I d'essai clinique car elles respectent les contraintes éthiques inhérentes à ce type d'étude. Sous des conditions paramétriques de forte dépendance, la classe de méthode envisagée est équivalente à celle de la CRM. Si, l'on assoupli la structure sous-jacente, on retrouve le mtpi, la CCD et le BOIN. Ces méthodes sont non-paramétriques par nature tandis que la CRM peut-être vue comme fortement paramétrique. Le cadre proposé repose sur un principe semi-paramétrique puisqu'il correspond à la CRM muni d'un paramètre de nuisance. Les performances obtenues sont bonnes, généralement comparables à celles de la CRM et parfois supérieures. La structure générale permet d'aborder plus facilement certaines questions théoriques et de mieux comprendre comment les diérentes méthodes sus-citées sont reliées entre elles. Mots-clés. Phase I, CRM, mtpi, modéle bayésien hiérarchique, modélisation semiparamétrique. Abstract. We describe a class of dose nding methods to be used in Phase I clinical trials. Under some added parametric conditions the class is equivalent to the family of continual reassessment method (CRM) designs. Under some relaxation of the underlying structure the method is equivalent to the MTPI, BOIN or CCD classes of designs. These latter designs are non-parametric in nature whereas the CRM class can be viewed as being strongly parametric. The proposed class is characterized as being semi-parametric since it corresponds to CRM with a nuisance parameter. Performance is good, generally matching that of the CRM class although improving on it in some cases. The structure allows theoretical questions to be more easily investigated and to better understand how dierent classes of methods related to one another. Keywords. Phase I, CRM, mtpi, hierarchical bayesian model, semi-parametrical modelisation. Contexte Les premières phases d'étude d'un médicament - aussi appelée phase I ou phase I/II d'essai clinique - sont particulièrement importantes. C'est notamment le cas en oncologie 2

où l'on admet couramment que l'échec des essais cliniques ultérieurs s'explique, pour une bonne part, par l'imprécision des résultats de phase I. La dose recommandée sera trop élevée, et mal tolérée, ou trop faible et, en conséquence, inapte à produire un eet approprié. Les statisticiens et les cliniciens savent bien que la méthode la plus employée, nommée la "3+3", est imparfaite et ne s'ajuste pas au but recherché. Aussi, de nombreuses recherches ont eu lieu sur ce sujet durant les trente dernières années, donnant naissance à des méthodes plus ecaces et qui tiennent compte des contraintes éthiques d'une telle étude. Les diérentes approches se partagent en deux classes ; les premières, incluant le 3+3 et le Rolling Six, sont dites algorithmiques. Elles n'utilisent pas de modèles et le positionnement de la dose est eectué sur la base d'un ensemble d'observations récentes. Elles possèdent une propriété markovienne à laquelle on fait parfois référence sous le nom de lack-of-memory property. Celles de la deuxième classe sont appelées "méthodes basées sur des modèles" (model-based designs). Leur principe est d'imposer une plus grande structure sur la prise en compte des observations an d'obtenir de meilleures propriétés de convergence. La propriété de convergence presque sûre est bien sûr importante car, il est dicile, sans elle, d'avoir conance dans le résultat obtenu. Dans le même temps, dans les essais réels, la taille de l'échantillon est souvent de l'ordre d'une trentaine de sujets et il devient alors crucial d'obtenir des résultats satisfaisants pour un faible nombre d'observations. Les simulations sur des gammes variées d'observations sont alors des outils de premiers ordres pour développer des méthodes. Deux critères sont couramment envisagés : (T R, traitement) : on souhaite que le plus grand nombre possible de patients soient traités à la bonne dose au cours de l'étude ; (RE, recommandation) : on souhaite parvenir le plus souvent possible à la détermination nale de la bonne dose. La méthode la plus connue, parmi celles basées sur un modèle, est la CRM (continual reassessment method) introduite par O'quigley, Pepe et scher (1990). Cette méthode est très ecace, mais, bien que ses performances surpassent celles du "3+3", elle est toujours beaucoup moins utilisée que celle-ci. Une explication pratique est liée à la plus grande complexité de la CRM qui nécessite le travail d'un statisticien pour être mise en place dans un contexte précis. Mais il y a d'autres arguments statistiques, concernant notamment sa convergence, qui ont conduit aux développements de beaucoup de méthodes concurrentes. Parmi, celles-ci, on dénombre le mtpi (Ji, Liu, Li et Bekele (2010)), la CCD (Ivanova, Flournoy et Chung (2007)) ou la BOIN (Liu et Yuan (2013)). Malgré tout, aucune des méthodes performantes aux critères (RE) et (TR) ne permet à ce jour de fournir un estimateur convergeant presque sûrement. La CRM est basée sur une forte dépendance des toxicités associées aux doses, de sorte qu'elle est souvent décrite comme une méthode sous-paramétrée. Le principe de fonctionnement du mtpi, de la CCD ou du BOIN est le même que celui de la CRM et ces approches peuvent être vues comme étant non-paramétriques. Cette présentation aura pour but de proposer un cadre général de méthodes de positionnement de dose pouvant être caractérisée comme étant semi-paramétriques. Le mtpi, la CCD et le BOIN peuvent 3

être alors envisagés comme des cas particuliers sous certaines restrictions (prise d'information partielle, fonction de perte) ; la CRM est aussi un cas particulier de cette classe de méthode lorsque l'on spécie des liens paramétriques. L'exploration de ce cadre nous permet de proposer de nouvelles méthodes possédant de meilleures propriétés de convergence et des performances comparables ou légèrement meilleures pour les critères (TR) et (RE). Cette classe générale nous permet de mieux appréhender le fonctionnement des "modelbased designs" ; il est alors possible de répondre ou poser des questions transversales aux méthodes utilisées dans les problèmes de positionnement de dose. Mots Clefs : Phase I, CRM, mtpi, modèle bayésien hiérarchique, modélisation semiparamétrique. Le problème de positionnement de dose L'objectif est d'approximer la racine d'une fonction de régression modélisant une suite d'observations couplées (X n, Y n ) n N. Au rang n, la variable X n est la dose sélectionnée parmi une gamme D = {1,..., m} et la variable Y n est la réponse obtenue à cette dose en terme de toxicité (ou d'ecacité). Celle-ci est à valeur dans {0, 1} (1 pour une réaction toxique, 0 sinon). La loi de Y n conditionnée à X n = d est une loi de Bernoulli de paramètre β d, ce qui suppose qu'à chaque dose du traitement soit associée une probabilité de toxicité indépendante du mode de sélection du patient dans le panel d'étude. D 1. n N, β d = P(Y n = 1 X n = d). Approcher une racine de la fonction de régression revient à déterminer parmi la gamme de dose D, celle dont la toxicité probable se rapproche le plus d'un seuil α préalablement xé. Cette dose est appelée la MTD (Maximum Tolerated Dose), et sera notée d. On suppose que la gamme D a été triée par expertise médicale selon un ordre croissant de probabilité d'une réponse toxique. D 2. (d, d ) D 2, d < d β d < β d. Cette hypothèse prend d'autant plus d'importance que les patients sont inclus séquentiellement dans l'étude : on suppose que l'ensemble de l'information donnée par l'échantillon, (X1 n, Y1 n ) = ((X 1,..., X n ), (Y 1,..., Y n )) est disponible pour sélectionner la dose X n+1. La nature de l'expérience menée nous impose alors d'utiliser le meilleur parti de l'information pour traiter le prochain patient. La méthode que choisira le praticien doit donc, à chaque étape de l'étude, sélectionner la dose paraissant la meilleure candidate pour la MTD. La dénition et l'hypothèse qui suivent sont en lien avec cet objectif. Denition 1. Une méthode, M, est dite cohérente si le choix de la prochaine dose en fonction de l'échantillon au rang n, M(X n 1, Y n 1 ) = X n+1, vérie : (X n, Y n ) = (d, 0) M(X n 1, Y n 1 ) d et (X n, Y n ) = (d, 1) M(X n 1, Y n 1 ) d. 4

Cette dénition ne sous-entend pas que la dose à l'étape n doivent être entièrement déterminée par l'échantillon déjà observé. Cependant les méthodes abordées dans cette article vérient cette hypothèse : M 1. M(X n 1, Y n 1 ) σ(x n 1, Y n 1 ), où σ(x n 1, Y n 1 ) est la tribu engendrée par l'échantillon. Sous cette condition, on obtient des propriétés asymptotiques classiques pour les estimateurs fréquentistes β d,n dénis par : β d,n = n1 d n 0 d + n1 d = n1 d n d, avec n i d = n 1 {Xn=d,Yn=i}, i {0, 1}. (1) j=1 Lemme 1. Pour toute méthode vériant M1, on a : (i) La loi des grands nombres, β d,n (ii) La loi du logarithme itéré, pour β d ]0, 1[, ) nd ( βd,n β d lim sup n d + σ d 2 log (log(nd )) β d, ps. n d + = 1 et lim inf n d + nd ( βd,n β d ) σ d 2 log (log(nd )) = 1, ps, avec : σ d = β d (1 β d ). Ce résultat très général ne fourni aucun moyen constructif de méthodes raisonnables. En eet, l'événement {n d + } est aléatoire. Il dépend du vecteur β = (β d ) d D et de la méthode employée. Il n'est donc pas évident d'obtenir un estimateur consistant de la MTD, car on ne souhaite pas que toute dose soit inniment observée. En particulier, l'optimisation conjointe des critères (RE) et (TR) crée des dicultés spéciques aux études de positionnement de dose. On rappelle à ce propos un théorème d'impossibilité, démontré par Azriel et al (2011), susceptible de mettre en lumière la qualité des résultats asymtotiques obtenus pour les méthodes présentées ici. Celui-ci montre qu'il n'existe pas de méthode permettant d'assurer, pour la suite des doses recommandées, la convergence presque sûre vers la MTD pour toute réalité β. Seule des congurations particulières de ses composantes, au regard de la méthode employée, peuvent mener à une consistance forte. Theorem 1. Soient M vériant M1, il existe β vériant D2 tel que : P β ( N : n > N, M(X n 1, Y n 1 ) = d ) < 1. En eet, si à partir d'un certain rang, la méthode ne préconise plus qu'une dose, l'information obtenue sur les doses concurrentes est nie et donc potentiellement trompeuse. Cela peut aboutir asymptotiquement à une mauvaise recommandation. 5

Exemple 1 Soit β = (0.05, 0.10, 0.20, 0.35, 0.55, 0.7) et α = 0.2. Supposons, qu'à partir d'un certain rang N, la méthode ne recommande que la dose 2 et que les résultats pour la dose 3 soient : n 1 3 = 2, n 3 = 5 et β 3,n = 0.4, pour n > N. Dans de telles circonstances, les estimateurs fréquentistes, βd,n, ne sont pas ables pour les doses d diérentes de 2, car celles-ci ne sont plus expérimentées. En particulier la toxicité à la dose 3 est mal estimée. On note cependant que la réalisation de l'événement {n 2 + } et l'hypothèse de croissance D2 permettent d'éliminer presque sûrement la dose 1 parmi les candidates à la MTD. D'après l'hypothèse de croissance D2, les deux doses associées à des toxicités de part et d'autre de α sont consécutives. Il est alors légitime de souhaiter que la méthode ait pour propriété asymptotique de se concentrer sur ces doses. Commentaires La méthodologie utilisée pour la construction de la SPM (méthodes semi-paramétriques en étude de phase I) se situe à la frontière des modèles bayésiens hiérarchiques et de l'estimation non-paramétrique. Elle utilise le calcul d'un a posteriori hiérarchique pour comparer diérentes classes indexées par un paramètre d'intérêt. Ces classes sont structurées par un a priori que l'on nomme pseudo-modèle, car l'un de ses objectifs est de pouvoir imiter les qualités d'extrapolation du à l'utilisation d'un modèle. Le support topologique de cet a priori est vaste et correspond à une structuration non-informative du problème de positionnement de dose. Pour commencer, on considère que notre phénomène aléatoire est modélisé par un m-uplet de lois de Bernoulli quelconque. Dans ce contexte, le terme semi-paramétrique peut sembler abusif car le phénomène aléatoire est restreint à l'observation de m lois paramétriques. Par ce terme, nous voulons rendre compte de la méthodologie utilisée et dont la nature reste inchangée lorsque l'on passe à un espace d'observations innis. Si l'espace des doses ou des réponses avait été continue, il aurait été possible de recourir au même principe de modélisation et la méthode en résultant aurait été pleinement semi-paramétrique. C'est une voie de généralisation intéressante et que nous choisirons d'inclure à la présentation en fonction de l'avancée de nos travaux. Bibliographie [1] Anastasia Ivanova and Nancy Flournoy and Yeonseung Chung (2007), Cumulative cohort design for dose-nding, Journal of Statistical Planning and Inference, 137(7), 2316-2327. 6

[2] Liu, S. and Yuan, Y. (2014), Bayesian Decision-optimal Interval Designs for Phase I Clinical Trials, Arxiv. [3] Ji, Yuan and Liu, Ping and Li, Yisheng and Bekele, B. Nebiyou (2010), A modied toxicity probability interval method for dose-nding trials, Clinical Trials,7 : 653-663. [4] Azriel, D. and Mandel, M. and Rinott, Y.(2011), The treatment versus experimentation dilemma in dose nding studies, Journal of Statistical Planning and Inference, 141(8), 27592768. [5] David Azriel (2013), A note on the robustness of the continual reassessment method, Statistics and Probability Letters, 82(5), 0167-7152. [6] O'Quigley, John and Pepe, Margaret and Fisher, Lloyd (1990), Continual reassessment method : a practical design for phase 1 clinical trials in cancer, Biometrics, 46(1), 3348. 7