Équivalence et Non-infériorité Éléments d Introduction Lionel RIOU FRANÇA INSERM U669 Mars 2009
Essais cliniques de supériorité Exemple d Introduction Données tirées de Brinkhaus B et al. Arch Intern Med. 2006;166:450-57. Évaluation de l acupuncture dans le traitement de la lombalgie : Acupuncture, Acupuncture «minimale» (aiguilles en dehors des points d acupuncture), «Liste d attente» (pas d acupunture avant 8 semaines). Critère de jugement : intensité de la douleur (VAS).
Essais cliniques de supériorité Taille d Échantillon «The study was powered to detect a group difference of 10 mm in the main outcome measure with 80% power, assuming an SD of 22.5 mm in the primary outcome in both groups and a 2-sided significance level of 5%.» n = ( Z 1 α + Z ) 2 σ0 2 + σ1 2 2 22.52 1 β 2 2 = (1.96+0.84)2 79 (µ 0 µ 1 ) 10 2 N.B. Les auteurs optent pour un schéma de randomisation 2:1:1 (!), on a au final 140 acupunctures, 70 minimaux et 74 témoins évalués (resp. 147, 75 et 79 randomisés).
Essais cliniques de supériorité Décision Classique 2 hypothèses en compétition : H 0 : µ 0 = µ 1 (pas de différence entre les groupes), H 1 : µ 0 µ 1 (les deux groupes diffèrent). 2 risques d erreur : Accepter H 1 alors que H 0 est vraie (erreur α de type I), Accepter H 0 alors que H 1 est vraie (erreur β de type II 1 β = puissance du test), Décision : Calcul de p, la probabilité d observer une différence au moins aussi importante que celle de l essai, si H 0 est vraie, p < α rejet de H 0.
Essais cliniques de supériorité Résultats 8 e semaine Critère de jugement : évolution de la douleur depuis la randomisation (D t0 D t8 ). Témoins : ˆµ 0 = 6.9, ˆσ 0 = s 0 = 22.0, n 0 = 74, Minimalistes : ˆµ 1 = 23.6, ˆσ 1 = s 1 = 31.0, n 1 = 70, Acupuncture : ˆµ 2 = 28.7, ˆσ 2 = s 2 = 30.3, n 2 = 140. Test t de Student : t = µ 0 µ 1 (n 0 1)s 2 0 +(n 1 1)s 2 1 n 0 +n 1 2 1 n 0 + 1 n 1 Acupuncture vs. Témoins : t = 5.47, p < 0.01, Acupuncture vs. Minimalistes : t = 1.14, p = 0.26. N.B. Tests multiples!
Essais cliniques de supériorité Les Essais de Supériorité Gold Standard : Essai contre Placebo. Contrôle : l évolution spontanée de la maladie, la régression vers la moyenne, l effet placebo. Permet, avec une taille d échantillon minimale (différentiel d efficacité maximisé), de démontrer la supériorité de l intervention testée. Mais problèmes éthiques et pratiques : Pertes de chance si traitement efficace existe, Recrutement difficile si le patient sait qu il risque d être dans un bras placebo, Arrêts de traitement plus fréquents si inefficacité perçue.
Principe Alternatives et Nomenclature Essai de supériorité : B est plus efficace que A. Essai d équivalence : B et A sont thérapeutiquement équivalents. Essai de non-infériorité : B n est pas plus mauvais que A. L essai de supériorité demande de définir une différence minimale d efficacité sup que l on veut mettre en évidence avec une puissance suffisante (calcul de taille d échantillon). L essai d équivalence demande de définir une marge d équivalence à partir d une grandeur eq qui correspond à la plus grande perte d efficacité que l on peut tolérer pour conclure que l un des traitements n est pas inférieur à l autre. eq < sup.
Principe Justification d un Essai de Non-Infériorité/Équivalence Il existe déjà un traitement comparateur ayant fait la preuve de son efficacité contre placebo, L innovation n est pas supérieure en efficacité, mais apporte d autres avantages (tolérance, coût, facilité d utilisation...).
Procédure de Test : Non-Infériorité Essai de Non-Infériorité On veut montrer que les deux traitements sont comparables, mais on accepte que le traitement fasse un peu moins bien que la référence : = µ 1 µ 0 > eq. H 0 : eq (traitement inférieur à référence). H 1 : > eq (non-infériorité).
Procédure de Test : Non-Infériorité Démonstration de la Non-Infériorité Procédure de test (unilatéral) : = µ 1 µ 0. ˆ t = ( ) suit une loi de Student décentrée à s 2 1 + 1 n 0 n 1 paramètre de décentrage h = eq s 2 ( 1 n 0 + 1 n 1 ). t = t h suit une loi de Student centrée à (n 1 + n 0 2) ddl. Approche par intervalle de confiance à 1 α 1 de : 1 Controversé. L EMEA recommande un IC unilatéral à 1 α 2 ou un IC bilatéral à 1 α, la coutume en bioéquivalence est d utiliser l IC bilatéral à 1 2α.
Procédure de Test : Non-Infériorité Démonstration de la Non-Infériorité
Procédure de Test : Équivalence Essai d Équivalence On veut montrer que = µ 1 µ 0 < eq. H 0 : eq ou eq (non équivalence). H 1 : eq < < eq (équivalence).
Procédure de Test : Équivalence Démonstration de l Équivalence Procédure de test (bilatéral) : = µ 1 µ 0. 2 hypothèses nulles : H 0 : = eq, H 0 : = eq. 2 paramètres de décentrage h et h et 2 statistiques de test t ( = t h et t = t + h. p = max p, p ). Approche par intervalle de confiance à 1 2α de :
Procédure de Test : Équivalence Démonstration de l Équivalence
Taille d Échantillon Nombre de Sujets Nécessaire Le calcul dépend : Du risque α de rejeter H 0 à tort, Du risque β qui détermine la puissance 1 β de montrer l équivalence/non-infériorité quand elle existe, De la différence δ d efficacité entre les deux traitements (en général, on postule δ = 0), De σ δ, De la marge d équivalence et donc de eq.
Taille d Échantillon Nombre de Sujets Nécessaire Dans le cas d une différence de moyennes, ( Supériorité : n = 2σ2 ( sup) 2 z1 α + z ) 2, 1 β 2 ) 2, Équivalence : n = z 1 α + z 1 β Non-infériorité : n = ( 2σ2 ( eq δ) 2 2σ2 (z ( eq δ) 2 1 α + z 1 β ) 2. Comme sup >> eq, les tailles d échantillon sont plus importantes en non-infériorité qu en supériorité. 2
Design d Étude Aspects du Protocole Essais très sensibles à la qualité du protocole. Calquer au maximum l essai qui a établi la supériorité du traitement de référence ( démontrer l équivalence du nouveau traitement dans le contexte où on sait le traitement de référence efficace). Mêmes critères d inclusion, mêmes patients que dans l essai de supériorité, Même critère de jugement, Bon choix du traitement de référence, Bon choix de la marge d équivalence.
Design d Étude Choix du Traitement de Référence Efficacité établie, contre placebo (non-inférieur à un traitement évalué contre placebo ne suffit pas), Mêmes conditions d usage (dose, administration...) que dans l essai de supériorité, «Assay sensitivity» : capacité de l étude à distinguer un traitement efficace d un traitement inefficace. Validation interne (mieux) : bras placebo dans l essai d équivalence. Validation externe (moins bon) : montrer que l efficacité du traitement de référence dans l essai de non-infériorité est la même que dans l essai de supériorité.
Analyse Population d Analyse : Recommandations Analyse en Intention de Traiter (ITT) : tous les patients randomisés, dans leur groupe de randomisation. Recommandé pour l essai de supériorité, déconseillé en équivalence. Analyse Per Protocole (PP) : patients n ayant pas eu de changement/arrêt de traitement, ni violation de protocole. Recommandée en équivalence, mais à compléter par une analyse ITT.
Analyse Population d Analyse : Justification ITT : déviations au protocole semblables (en principe) dans les 2 groupes homogénéisation des réponses diminution de l efficacité estimée. Souhaitable (conservateur) en supériorité, mauvais en équivalence. PP augmentation du contraste entre les groupes attendue. Souhaitable (conservateur) en équivalence. Mais risque de surestimation de l efficacité d un traitement où les non-répondeurs arrêteraient systématiquement (i.e. conclure à la non-infériorité alors qu il y avait infériorité). Les essais d équivalence/non-infériorité doivent se faire en PP, mais très important de décrire la population PP!
Marge d Équivalence Qui Détermine la Marge d Équivalence? Bouvenot & Villani : «La méthode consiste à faire définir par les cliniciens (et non par les statisticiens) (...), une zone dite d équivalence, c est-à-dire un intervalle dans lequel il est raisonnable que se situe la différence d effet observée entre les deux traitements, si l on admet qu ils sont également efficaces.» D Agostino : «To the dismay of some, the statisticians seem to have taken control of this issue.» EMEA : «The selection of the non-inferiority margin is based upon a combination of statistical reasoning and clinical judgement.»
Marge d Équivalence Comment Déterminer la Marge d Équivalence? Deux contraintes : Montrer que le traitement évalué à une efficacité non nulle (i.e. supériorité par rapport à placebo) étape statistique inutile si validation interne (bras placebo), Montrer qu il n est pas inférieur au traitement de référence étape clinique : eq doit être «cliniquement négligeable». En pratique, énorme variabilité dans les méthodes de détermination de eq et dans les recommandations officielles sur ces méthodes.
Marge d Équivalence Recommandations EMEA (Étape Statistique) Méta-analyse estimation de (R-P), l effet du traitement de référence (R) vs. Placebo (P). L essai d équivalence donnera directement (T-R), l effet du traitement évalué (T) vs. R et, par comparaison indirecte, (T-P). eq : plus petite valeur acceptable pour l IC de (T-R) qui assure que l IC de (T-P) ne contienne pas 0. N.B. Hypothèse de «constancy» : l efficacité du comparateur contre placebo (essais de supériorité) se maintiendra dans l étude d équivalence.
Marge d Équivalence Comparaisons Indirectes : Principe Soit µ RP = µ R µ P l effet du traitement R par rapport au traitement P, et V [µ RP ] sa variance, Soit µ TR = µ T µ R l effet du traitement T par rapport au traitement R, et V [µ RP ] sa variance. Alors : µ TP = µ TR + µ RP, V [µ TP ] = V [µ TR ] + V [µ RP ].
Marge d Équivalence Autres Méthodes pour Déterminer eq Prendre la plus petite de toutes les bornes des IC de (R-P), T doit conserver λ% de l efficacité relative de R. Coutume : λ = 50%. «This non-inferiority margin cannot be greater than the smallest effect size that the active drug would be reliably expected to have compared with placebo in the setting of a placebo-controlled trial.» (guidelines ICH 2 ). 2 International Conference on Harmonisation of Technical Requirements for Registration of Pharmaceuticals for Human Use
Changement d Analyse Ah Ben J m a Trompé! Passage non-infériorité supériorité : Non-infériorité démontrée, δ > 0 (par intervalle de confiance, ou par test statistique de supériorité). Passage supériorité non-infériorité : jamais 3. 3 Certains l admettent si eq est déterminé a priori et si on argumente que H 0 du test supériorité n est pas rejeté car manque de puissance et pas de différence entre les traitements.
Protocole Exemple d Introduction Données tirées de Leblan D et al. Rev Rhum. 2000;67:634-40. Évaluation de l harpagophyton dans le traitement de la gon/coxarthrose : Diacerhéine 100 mg/j, Harpagophyton 2 610 mg/j. Critère de jugement : intensité de la douleur (VAS).
Protocole Motivation de la non-infériorité «Le but de cet essai était de démontrer l efficacité de l harpagophyton dans l arthrose pendant une durée de traitement suffisamment longue, égale à quatre mois. Il n a pas été inclus de groupe placebo dans cette étude car il est souvent difficile de recruter des patients lorsqu ils sont informés du risque (égal à 50 %) d être dans un groupe placebo, et ce d autant plus que la durée de traitement est particulièrement longue (quatre mois). Il a donc été choisi comme traitement comparateur un anti-arthrosique d effet différé et prolongé de référence, la diacerhéine, qui a fait l objet de nombreux essais cliniques, démontrant son efficacité à la fois dans des études contre placebo ou contre anti-inflammatoires non stéroïdiens».
Protocole Taille d Échantillon «En posant l hypothèse que la différence vraie entre les traitements était nulle avec un de 10 mm, un test d équivalence unilatéral avec un risque α à 0,05, un risque β à 0,10 et un écart type de 18 mm, nécessitait l inclusion de 56 patients par groupe.» n = 2σ2 ( eq δ) 2 (z 1 α + z 1 β ) 2 = 2 182 10 2 (1,64+1,28) 2 = 55,5. «Cent vingt-deux patients ont été randomisés dont 92 ont terminé l essai conformément au protocole.»
Protocole Protocole d Analyse «L hypothèse principale à tester était la suivante : essai d équivalence unilatérale ou de non infériorité de l harpagophyton par rapport à la diacerhéine sur la douleur spontanée mesurée à l aide d une EVA (100 mm).» «L analyse statistique a été réalisée perprotocole et en intention de traiter. Le test d équivalence a été répété pour ces deux populations.»
Résultats Non-infériorité On mesure l évolution de la douleur entre l inclusion et J120. Comme une différence négative indique une diminution de la douleur, un δ négatif indique qu Harpagophyton est plus efficace que la Diacerhéine pour diminuer la douleur. La non-infériorité est rejettée si l intervalle de confiance coupe la valeur eq = +10. Analyse Harpagophyton Diacerhéine δ IC 90% PP -30,6-25,5-5,1 (-13,1 ; 3,0) ITT -28,8-22,1-6,7 (-14,2 ; 0,9) N.B. IC à 1 2α = 90% employé.
Résultats Avantages Comparés «La différence de la consommation d AINS durant les quatre mois de traitement était significative entre les deux groupes, au profit du groupe harpagophyton». «Le nombre de patients ayant présenté au moins un événement indésirable a été significativement plus faible dans le groupe harpagophyton».
Résultats «Putative Placebo Analysis» «Par ailleurs, l appréciation de l intensité de l effet placebo dans l arthrose a récemment été étudiée. Une revue portant sur 457 patients traités par placebo dans le cadre de six essais contrôlés d anti-arthrosiques symptomatiques d action lente a montré que sous placebo, la baisse moyenne de la douleur à l EVA était de l ordre de 10 à 16 mm [12]. Par conséquent, la baisse observée dans le groupe harpagophyton (-30,6 mm) est nettement supérieure à celle habituellement observée sous placebo.»
Pour aller plus loin... Bibliographie Bouvenot G, Villani P. Les essais cliniques d équivalence en rhumatologie. Rev Rhum. 2000;67:569-72. Brinkhaus B, Witt CM, Jena S, et al. Acupuncture in patients with chronic low back pain. A randomized controlled trial. Arch Intern Med. 2006;166:450-57. D Agostino RB, Massaro JM, Sullivan LM. Non-inferiority trials: design concepts and issues the encounters of academic consultants in statistics. Statist. Med. 2003;22:169-86. Elie C, De Rycke Y, Jais JP, et al. Aspects méthodologiques et statistiques des essais d équivalence et de non-infériorité. RESP. 2008;56:267-77. EMEA/CHMP. Points to consider on switching between superiority and non-inferiority. July 2000. EMEA/CHMP. Guideline on the choice of the non-inferiority margin. July 2005. Leblan D, Chantre P, Fournié B. L harpagophyton dans le traitement de la gonarthrose et de la coxarthrose. Résultats à quatre mois d une étude prospective multicentrique, contrôlée en double aveugle, versus diacerhéine. Rev Rhum. 2000;67:634-40.