Équivalence et Non-infériorité



Documents pareils
Essais thérapeutiques d équivalence et de non infériorité

Document d orientation sur les allégations issues d essais de non-infériorité

Item 169 : Évaluation thérapeutique et niveau de preuve

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Essais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Essais cliniques de phase 0 : état de la littérature

Validation clinique des marqueurs prédictifs le point de vue du méthodologiste. Michel Cucherat UMR CNRS Lyon

Principe d un test statistique

Valeur ajoutée relative basée sur les comparaisons indirectes Giens 2008, TR 5

La Gestion des Données Cliniques

Le dropéridol n est pas un traitement à considérer pour le traitement de la migraine à l urgence

La recherche clinique au cœur du progrès thérapeutique

Avis 29 mai XYZALL 5 mg, comprimé B/14 (CIP : ) B/28 (CIP : ) Laboratoire UCB PHARMA SA.

Placebo Effet Placebo. Pr Claire Le Jeunne Hôtel Dieu- Médecine Interne et Thérapeutique Faculté de Médecine Paris Descartes

Doit on et peut on utiliser un placebo dans la prise en charge de la douleur?

COMMISSION DE LA TRANSPARENCE

Qu avez-vous appris pendant cet exposé?

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Lecture critique d article ou comment briller en société sans en avoir trop l air

Traitement de l hépatite C: données récentes

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

COMMISSION DE LA TRANSPARENCE. AVIS 1 er février 2012

secutrial Gestion des données d'études cliniques Les Colloques de l'uic Novembre 2012 Khaled Mostaguir, Ph.D,

«Quelle information aux patients en recherche biomédicale? Quels enseignements en retirer pour la pratique quotidienne?»

équilibre glycémique du diabétique insuliné

L abus médicamenteux Critères IHS : 1. La prise médicamenteuse est régulière et dure depuis plus de 3 mois

LES NOUVEAUX ANTICOAGULANTS

Le RIVAROXABAN (XARELTO ) dans l embolie pulmonaire

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Rencontres AcaDM des juin 2014 Dijon. Impact du Risk Based Monitoring sur le Data Management. Nicolas Gane ARCAGY-GINECO 25/06/2014

Responsabilité du promoteur et obligations des soustraitants. cliniques : conformité aux Bonnes Pratiques Cliniques et point de vue de l inspection

TMS les données belges relatives à la lombalgie

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES

Format de l avis d efficience

LECTURE CRITIQUE 1 ER PAS

CE QU IL FAUT SAVOIR PARTICIPATION À UN ESSAI CLINIQUE SUR UN MÉDICAMENT

Révision des descriptions génériques Comment monter un dossier?

M.Benmimoun MD,MBA Medical Operations Director

Revue des données probantes l utilité et les limites des différentes approches

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Introduction à l approche bootstrap

Analyse de la variance Comparaison de plusieurs moyennes

Evidence-based medicine en français

S. Kernéis, T. Ancelle, V. Naneix-Laroche, N. Amrane, JP. Leroy, T. Hanslik, O. Launay

Objectifs pédagogiques Lecture critique d article

Docteur José LABARERE

QUEL PROTOCOLE DE REENTRAINEMENT PROPOSER AUX PATIENTS INSUFFISANTS CARDIAQUES?

Introduction : Essais de phase I

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Communiqué de presse. Direction Communication Externe/Interne Sylvie Nectoux TEL : sylvie.nectoux@boehringeringelheim.

Supplément du BDK 24 : Aide à la recherche bibliographique

Précision d un résultat et calculs d incertitudes

Partie 1. Principes. Karmela Krleža-Jerić, An-Wen Chan, Kay Dickersin, Ida Sim, Jeremy Grimshaw, Christian Gluud, for the Ottawa GroupT 1

ÉTAT DES LIEUX. Niveau de preuve et gradation des recommandations de bonne pratique

Faciliter la transition de la guérison à la palliation en favorisant la communication entourant le choix de soins 16 avril e congrès du Réseau

Otite Moyenne Aiguë. Origine bactérienne dans 70 % des cas. Première infection bactérienne tous âges confondus

Estimation et tests statistiques, TD 5. Solutions

Exemple PLS avec SAS

Avis 23 avril BARITEKAL 20 mg/ml, solution injectable Boîte de 10 ampoules de 5 ml (CIP : ) Laboratoire NORDIC PHARMA

23. Interprétation clinique des mesures de l effet traitement

QUEL AVENIR POUR LA PHARMACIE HOSPITALIERE EN SUISSE?

PARTICIPATION À UN ESSAI CLINIQUE SUR UN MÉDICAMENT CE QU IL FAUT SAVOIR

Recherche documentaire et autoformation. Lecture critique d un article médical. Recommandations pour la pratique. Les maladies orphelines

Package TestsFaciles

Evaluation de critères res de substitution de la survie globale dans les cancers bronchiques localement avancés

COMMISSION DE LA TRANSPARENCE AVIS. 1 er octobre 2008

clinique d un médicament

EVALUATION DES TECHNOLOGIES DE SANTÉ ANALYSE MÉDICO-ÉCONOMIQUE. Efficacité et efficience des hypolipémiants Une analyse centrée sur les statines

EFFICACITÉ ET INNOCUITÉ D UN MÉDICAMENT CONTRE LA MPOC COMPARATIVEMENT À UN CONTRÔLE

Introduction aux Statistiques et à l utilisation du logiciel R

Méthodologie des Essais thérapeutiques

Que représentent les Spondyloarthrites Axiales Non Radiographiques? Pascal Claudepierre CHU Mondor - Créteil

Traitement médical de l incontinence SIFUD PP FMC

Etude MAPT (Multidomain Alzheimer Preventive Trial)

Principe de symétrisation pour la construction d un test adaptatif

Rapport sur les nouveaux médicaments brevetés Iressa

Procédure normalisée de fonctionnement du RCBT Demande d informations additionnelles Version

ÉVALUATION DE L UTILISABILITÉ D UN SITE WEB : TESTS D UTILISABILITÉ VERSUS ÉVALUATION HEURISTIQUE

Les lésions musculosquelettiques chez les éboueurs : des pistes de prévention à la gestion du retour au travail

Mortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine

Migraines, céphalées et statut hormonal

COMMISSION NATIONALE D EVALUATION DES DISPOSITIFS MEDICAUX ET DES TECHNOLOGIES DE SANTE. AVIS DE LA COMMISSION 08 février 2011 CONCLUSIONS

Avis 17 octobre 2012

Etude de la prise en charge par acupuncture des troubles musculo-squelettiques. Cohorte observationnelle d évaluation des pratiques de soin

LES CO-INFECTIONS VIH-VHC. EPIDEMIOLOGIE, INTERFERENCES. Patrice CACOUB La Pitié Salpêtrière, Paris

Les nouveaux concepts de gestion de la qualité pharmaceutique ICH Q8, Q9 et Q10

27 ème JOURNEE SPORT ET MEDECINE Dr Roukos ABI KHALIL Digne Les Bains 23 novembre 2013

La réadaptation professionnelle des travailleurs lombalgiques : Présentation d'un modèle canadien

MEM vs entrevues traditionnelles pour l admission en médecine :

Audit et Inspection Les contraintes extérieures B.Malivoir

Cours de Tests paramétriques

Les systèmes CDMS. et les logiciels EDC

La recherche clinique de demain ne se fera pas sans les paramédicaux

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

CREODEV technical auditors of international projects training session 2013

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

COMMISSION DE LA TRANSPARENCE AVIS. 31 janvier 2007

Transcription:

Équivalence et Non-infériorité Éléments d Introduction Lionel RIOU FRANÇA INSERM U669 Mars 2009

Essais cliniques de supériorité Exemple d Introduction Données tirées de Brinkhaus B et al. Arch Intern Med. 2006;166:450-57. Évaluation de l acupuncture dans le traitement de la lombalgie : Acupuncture, Acupuncture «minimale» (aiguilles en dehors des points d acupuncture), «Liste d attente» (pas d acupunture avant 8 semaines). Critère de jugement : intensité de la douleur (VAS).

Essais cliniques de supériorité Taille d Échantillon «The study was powered to detect a group difference of 10 mm in the main outcome measure with 80% power, assuming an SD of 22.5 mm in the primary outcome in both groups and a 2-sided significance level of 5%.» n = ( Z 1 α + Z ) 2 σ0 2 + σ1 2 2 22.52 1 β 2 2 = (1.96+0.84)2 79 (µ 0 µ 1 ) 10 2 N.B. Les auteurs optent pour un schéma de randomisation 2:1:1 (!), on a au final 140 acupunctures, 70 minimaux et 74 témoins évalués (resp. 147, 75 et 79 randomisés).

Essais cliniques de supériorité Décision Classique 2 hypothèses en compétition : H 0 : µ 0 = µ 1 (pas de différence entre les groupes), H 1 : µ 0 µ 1 (les deux groupes diffèrent). 2 risques d erreur : Accepter H 1 alors que H 0 est vraie (erreur α de type I), Accepter H 0 alors que H 1 est vraie (erreur β de type II 1 β = puissance du test), Décision : Calcul de p, la probabilité d observer une différence au moins aussi importante que celle de l essai, si H 0 est vraie, p < α rejet de H 0.

Essais cliniques de supériorité Résultats 8 e semaine Critère de jugement : évolution de la douleur depuis la randomisation (D t0 D t8 ). Témoins : ˆµ 0 = 6.9, ˆσ 0 = s 0 = 22.0, n 0 = 74, Minimalistes : ˆµ 1 = 23.6, ˆσ 1 = s 1 = 31.0, n 1 = 70, Acupuncture : ˆµ 2 = 28.7, ˆσ 2 = s 2 = 30.3, n 2 = 140. Test t de Student : t = µ 0 µ 1 (n 0 1)s 2 0 +(n 1 1)s 2 1 n 0 +n 1 2 1 n 0 + 1 n 1 Acupuncture vs. Témoins : t = 5.47, p < 0.01, Acupuncture vs. Minimalistes : t = 1.14, p = 0.26. N.B. Tests multiples!

Essais cliniques de supériorité Les Essais de Supériorité Gold Standard : Essai contre Placebo. Contrôle : l évolution spontanée de la maladie, la régression vers la moyenne, l effet placebo. Permet, avec une taille d échantillon minimale (différentiel d efficacité maximisé), de démontrer la supériorité de l intervention testée. Mais problèmes éthiques et pratiques : Pertes de chance si traitement efficace existe, Recrutement difficile si le patient sait qu il risque d être dans un bras placebo, Arrêts de traitement plus fréquents si inefficacité perçue.

Principe Alternatives et Nomenclature Essai de supériorité : B est plus efficace que A. Essai d équivalence : B et A sont thérapeutiquement équivalents. Essai de non-infériorité : B n est pas plus mauvais que A. L essai de supériorité demande de définir une différence minimale d efficacité sup que l on veut mettre en évidence avec une puissance suffisante (calcul de taille d échantillon). L essai d équivalence demande de définir une marge d équivalence à partir d une grandeur eq qui correspond à la plus grande perte d efficacité que l on peut tolérer pour conclure que l un des traitements n est pas inférieur à l autre. eq < sup.

Principe Justification d un Essai de Non-Infériorité/Équivalence Il existe déjà un traitement comparateur ayant fait la preuve de son efficacité contre placebo, L innovation n est pas supérieure en efficacité, mais apporte d autres avantages (tolérance, coût, facilité d utilisation...).

Procédure de Test : Non-Infériorité Essai de Non-Infériorité On veut montrer que les deux traitements sont comparables, mais on accepte que le traitement fasse un peu moins bien que la référence : = µ 1 µ 0 > eq. H 0 : eq (traitement inférieur à référence). H 1 : > eq (non-infériorité).

Procédure de Test : Non-Infériorité Démonstration de la Non-Infériorité Procédure de test (unilatéral) : = µ 1 µ 0. ˆ t = ( ) suit une loi de Student décentrée à s 2 1 + 1 n 0 n 1 paramètre de décentrage h = eq s 2 ( 1 n 0 + 1 n 1 ). t = t h suit une loi de Student centrée à (n 1 + n 0 2) ddl. Approche par intervalle de confiance à 1 α 1 de : 1 Controversé. L EMEA recommande un IC unilatéral à 1 α 2 ou un IC bilatéral à 1 α, la coutume en bioéquivalence est d utiliser l IC bilatéral à 1 2α.

Procédure de Test : Non-Infériorité Démonstration de la Non-Infériorité

Procédure de Test : Équivalence Essai d Équivalence On veut montrer que = µ 1 µ 0 < eq. H 0 : eq ou eq (non équivalence). H 1 : eq < < eq (équivalence).

Procédure de Test : Équivalence Démonstration de l Équivalence Procédure de test (bilatéral) : = µ 1 µ 0. 2 hypothèses nulles : H 0 : = eq, H 0 : = eq. 2 paramètres de décentrage h et h et 2 statistiques de test t ( = t h et t = t + h. p = max p, p ). Approche par intervalle de confiance à 1 2α de :

Procédure de Test : Équivalence Démonstration de l Équivalence

Taille d Échantillon Nombre de Sujets Nécessaire Le calcul dépend : Du risque α de rejeter H 0 à tort, Du risque β qui détermine la puissance 1 β de montrer l équivalence/non-infériorité quand elle existe, De la différence δ d efficacité entre les deux traitements (en général, on postule δ = 0), De σ δ, De la marge d équivalence et donc de eq.

Taille d Échantillon Nombre de Sujets Nécessaire Dans le cas d une différence de moyennes, ( Supériorité : n = 2σ2 ( sup) 2 z1 α + z ) 2, 1 β 2 ) 2, Équivalence : n = z 1 α + z 1 β Non-infériorité : n = ( 2σ2 ( eq δ) 2 2σ2 (z ( eq δ) 2 1 α + z 1 β ) 2. Comme sup >> eq, les tailles d échantillon sont plus importantes en non-infériorité qu en supériorité. 2

Design d Étude Aspects du Protocole Essais très sensibles à la qualité du protocole. Calquer au maximum l essai qui a établi la supériorité du traitement de référence ( démontrer l équivalence du nouveau traitement dans le contexte où on sait le traitement de référence efficace). Mêmes critères d inclusion, mêmes patients que dans l essai de supériorité, Même critère de jugement, Bon choix du traitement de référence, Bon choix de la marge d équivalence.

Design d Étude Choix du Traitement de Référence Efficacité établie, contre placebo (non-inférieur à un traitement évalué contre placebo ne suffit pas), Mêmes conditions d usage (dose, administration...) que dans l essai de supériorité, «Assay sensitivity» : capacité de l étude à distinguer un traitement efficace d un traitement inefficace. Validation interne (mieux) : bras placebo dans l essai d équivalence. Validation externe (moins bon) : montrer que l efficacité du traitement de référence dans l essai de non-infériorité est la même que dans l essai de supériorité.

Analyse Population d Analyse : Recommandations Analyse en Intention de Traiter (ITT) : tous les patients randomisés, dans leur groupe de randomisation. Recommandé pour l essai de supériorité, déconseillé en équivalence. Analyse Per Protocole (PP) : patients n ayant pas eu de changement/arrêt de traitement, ni violation de protocole. Recommandée en équivalence, mais à compléter par une analyse ITT.

Analyse Population d Analyse : Justification ITT : déviations au protocole semblables (en principe) dans les 2 groupes homogénéisation des réponses diminution de l efficacité estimée. Souhaitable (conservateur) en supériorité, mauvais en équivalence. PP augmentation du contraste entre les groupes attendue. Souhaitable (conservateur) en équivalence. Mais risque de surestimation de l efficacité d un traitement où les non-répondeurs arrêteraient systématiquement (i.e. conclure à la non-infériorité alors qu il y avait infériorité). Les essais d équivalence/non-infériorité doivent se faire en PP, mais très important de décrire la population PP!

Marge d Équivalence Qui Détermine la Marge d Équivalence? Bouvenot & Villani : «La méthode consiste à faire définir par les cliniciens (et non par les statisticiens) (...), une zone dite d équivalence, c est-à-dire un intervalle dans lequel il est raisonnable que se situe la différence d effet observée entre les deux traitements, si l on admet qu ils sont également efficaces.» D Agostino : «To the dismay of some, the statisticians seem to have taken control of this issue.» EMEA : «The selection of the non-inferiority margin is based upon a combination of statistical reasoning and clinical judgement.»

Marge d Équivalence Comment Déterminer la Marge d Équivalence? Deux contraintes : Montrer que le traitement évalué à une efficacité non nulle (i.e. supériorité par rapport à placebo) étape statistique inutile si validation interne (bras placebo), Montrer qu il n est pas inférieur au traitement de référence étape clinique : eq doit être «cliniquement négligeable». En pratique, énorme variabilité dans les méthodes de détermination de eq et dans les recommandations officielles sur ces méthodes.

Marge d Équivalence Recommandations EMEA (Étape Statistique) Méta-analyse estimation de (R-P), l effet du traitement de référence (R) vs. Placebo (P). L essai d équivalence donnera directement (T-R), l effet du traitement évalué (T) vs. R et, par comparaison indirecte, (T-P). eq : plus petite valeur acceptable pour l IC de (T-R) qui assure que l IC de (T-P) ne contienne pas 0. N.B. Hypothèse de «constancy» : l efficacité du comparateur contre placebo (essais de supériorité) se maintiendra dans l étude d équivalence.

Marge d Équivalence Comparaisons Indirectes : Principe Soit µ RP = µ R µ P l effet du traitement R par rapport au traitement P, et V [µ RP ] sa variance, Soit µ TR = µ T µ R l effet du traitement T par rapport au traitement R, et V [µ RP ] sa variance. Alors : µ TP = µ TR + µ RP, V [µ TP ] = V [µ TR ] + V [µ RP ].

Marge d Équivalence Autres Méthodes pour Déterminer eq Prendre la plus petite de toutes les bornes des IC de (R-P), T doit conserver λ% de l efficacité relative de R. Coutume : λ = 50%. «This non-inferiority margin cannot be greater than the smallest effect size that the active drug would be reliably expected to have compared with placebo in the setting of a placebo-controlled trial.» (guidelines ICH 2 ). 2 International Conference on Harmonisation of Technical Requirements for Registration of Pharmaceuticals for Human Use

Changement d Analyse Ah Ben J m a Trompé! Passage non-infériorité supériorité : Non-infériorité démontrée, δ > 0 (par intervalle de confiance, ou par test statistique de supériorité). Passage supériorité non-infériorité : jamais 3. 3 Certains l admettent si eq est déterminé a priori et si on argumente que H 0 du test supériorité n est pas rejeté car manque de puissance et pas de différence entre les traitements.

Protocole Exemple d Introduction Données tirées de Leblan D et al. Rev Rhum. 2000;67:634-40. Évaluation de l harpagophyton dans le traitement de la gon/coxarthrose : Diacerhéine 100 mg/j, Harpagophyton 2 610 mg/j. Critère de jugement : intensité de la douleur (VAS).

Protocole Motivation de la non-infériorité «Le but de cet essai était de démontrer l efficacité de l harpagophyton dans l arthrose pendant une durée de traitement suffisamment longue, égale à quatre mois. Il n a pas été inclus de groupe placebo dans cette étude car il est souvent difficile de recruter des patients lorsqu ils sont informés du risque (égal à 50 %) d être dans un groupe placebo, et ce d autant plus que la durée de traitement est particulièrement longue (quatre mois). Il a donc été choisi comme traitement comparateur un anti-arthrosique d effet différé et prolongé de référence, la diacerhéine, qui a fait l objet de nombreux essais cliniques, démontrant son efficacité à la fois dans des études contre placebo ou contre anti-inflammatoires non stéroïdiens».

Protocole Taille d Échantillon «En posant l hypothèse que la différence vraie entre les traitements était nulle avec un de 10 mm, un test d équivalence unilatéral avec un risque α à 0,05, un risque β à 0,10 et un écart type de 18 mm, nécessitait l inclusion de 56 patients par groupe.» n = 2σ2 ( eq δ) 2 (z 1 α + z 1 β ) 2 = 2 182 10 2 (1,64+1,28) 2 = 55,5. «Cent vingt-deux patients ont été randomisés dont 92 ont terminé l essai conformément au protocole.»

Protocole Protocole d Analyse «L hypothèse principale à tester était la suivante : essai d équivalence unilatérale ou de non infériorité de l harpagophyton par rapport à la diacerhéine sur la douleur spontanée mesurée à l aide d une EVA (100 mm).» «L analyse statistique a été réalisée perprotocole et en intention de traiter. Le test d équivalence a été répété pour ces deux populations.»

Résultats Non-infériorité On mesure l évolution de la douleur entre l inclusion et J120. Comme une différence négative indique une diminution de la douleur, un δ négatif indique qu Harpagophyton est plus efficace que la Diacerhéine pour diminuer la douleur. La non-infériorité est rejettée si l intervalle de confiance coupe la valeur eq = +10. Analyse Harpagophyton Diacerhéine δ IC 90% PP -30,6-25,5-5,1 (-13,1 ; 3,0) ITT -28,8-22,1-6,7 (-14,2 ; 0,9) N.B. IC à 1 2α = 90% employé.

Résultats Avantages Comparés «La différence de la consommation d AINS durant les quatre mois de traitement était significative entre les deux groupes, au profit du groupe harpagophyton». «Le nombre de patients ayant présenté au moins un événement indésirable a été significativement plus faible dans le groupe harpagophyton».

Résultats «Putative Placebo Analysis» «Par ailleurs, l appréciation de l intensité de l effet placebo dans l arthrose a récemment été étudiée. Une revue portant sur 457 patients traités par placebo dans le cadre de six essais contrôlés d anti-arthrosiques symptomatiques d action lente a montré que sous placebo, la baisse moyenne de la douleur à l EVA était de l ordre de 10 à 16 mm [12]. Par conséquent, la baisse observée dans le groupe harpagophyton (-30,6 mm) est nettement supérieure à celle habituellement observée sous placebo.»

Pour aller plus loin... Bibliographie Bouvenot G, Villani P. Les essais cliniques d équivalence en rhumatologie. Rev Rhum. 2000;67:569-72. Brinkhaus B, Witt CM, Jena S, et al. Acupuncture in patients with chronic low back pain. A randomized controlled trial. Arch Intern Med. 2006;166:450-57. D Agostino RB, Massaro JM, Sullivan LM. Non-inferiority trials: design concepts and issues the encounters of academic consultants in statistics. Statist. Med. 2003;22:169-86. Elie C, De Rycke Y, Jais JP, et al. Aspects méthodologiques et statistiques des essais d équivalence et de non-infériorité. RESP. 2008;56:267-77. EMEA/CHMP. Points to consider on switching between superiority and non-inferiority. July 2000. EMEA/CHMP. Guideline on the choice of the non-inferiority margin. July 2005. Leblan D, Chantre P, Fournié B. L harpagophyton dans le traitement de la gonarthrose et de la coxarthrose. Résultats à quatre mois d une étude prospective multicentrique, contrôlée en double aveugle, versus diacerhéine. Rev Rhum. 2000;67:634-40.