Principe des essais contrôlés Dr Roch Giorgi roch.giorgi@ap-hm.fr LERTIM, Faculté de Médecine, Université de la Méditerranée, Marseille, France http://cybertim.timone.univ-mrs.fr
Principe d un essais Population Schéma d étude Tirage au sort Groupe A Groupe B Intervention S :? NS :? Groupe A Groupe B Tests statistiques Interprétations
Schéma d étude Nécessitée d avoir au moins 2 groupes à comparer : existence d une évolution spontanée, naturelle si l étude ne porte que sur 1 seul groupe on n est pas en mesure de différencier ce qui relève d une évolution naturelle ou de l intervention il faut donc au moins 2 groupes comparables en tout sauf à l intervention : Groupe B : effet lié à l évolution naturelle Groupe A : effet lié à l évolution naturelle et à l effet de l intervention
Tirage au sort Indispensable Vise à répartir de manière aléatoire les individus dans les groupes Sert à attribuer aléatoirement l intervention aux sujets Permet d assurer la comparabilité initiale les groupes Permet de porter un jugement de causalité
Intervention Un groupe va bénéficier de l intervention que l on cherche à évaluer : nouveau traitement dans un essai thérapeutique action de santé publique (campagne de dépistage, action de prévention, ) L attribution de l intervention est déterminée lors du tirage au sort
Tests statistiques - Interprétations Significatifs : il faut savoir si cela est dû uniquement à l intervention ou si d autres différences sont intervenues (caractéristiques des populations, interventions intercurrentes, ) Non Significatifs : est-ce explicable par l inefficacité de l intervention, par un manque de puissance du test,...
Champs d applications et avantages Champs d applications d une intervention : évaluation d une action thérapeutique médicale ou chirurgicale (nouveau traitement vs placebo, nouveau traitement vs traitement de référence) évaluation d une action de santé préventive (campagnes de prévention, de dépistage, de vaccinations, ) Avantages des essais contrôlés : égale répartition des facteurs de risque : effet du tirage au sort la seule différence entre les groupes provient de l intervention contrôle du protocole de l intervention et de son déroulement : pour éviter l apparition de différences autres que l intervention en cours d essai interprétation causale : puisque la seule différence entre les groupes provient de l intervention
Types de randomisation Randomisation individuelle : répartition aléatoire des individus dans un groupe d action Population d individus? Tirage au sort Groupe A (intervention) Groupe B (référence)
Types de randomisation Randomisation de groupes : répartition aléatoire de groupes d individus dans un groupe d action Groupe = département hôpital ville école...? Tirage au sort Groupe A (intervention) Groupe B (référence)
Schéma d étude Objectif de l étude explicatif : l efficacité du traitement ou de l intervention est inconnue; on recherche l existence d un effet pragmatique : l efficacité du traitement ou de l intervention est déjà prouvée; on recherche à vérifier sont application en pratique Formulation de l objectif objectif principal : effet de l intervention objectifs secondaires : ne doivent pas être trop nombreux Interventions comparées pas d action vs placebo vs référence
Schéma d étude Formulation de l essai : schématiquement la formulation dépend de la question posée par l essai : situation unilatérale : «le nouveau traitement est-il efficace?» effet moyen de A > effet moyen d un placebo situation bilatérale : «le nouveau traitement est-il plus ou moins efficace que le produit de référence?» effet moyen de A effet moyen du produit de référence
Schéma d étude Type d essai : essai d efficacité : question : «l effet de l intervention évaluée est-il supérieur à celui de l intervention de référence?» non prise en compte des effets secondaires, du coût, de la faisabilité de la nouvelle intervention essai d équivalence : question : «l effet de l intervention évaluée est-il ou pas différent de celui de l intervention de référence?» l efficacité de l intervention évaluée doit déjà être prouvée gains en terme d effets secondaires, de coûts, de la faisabilité, Les tests statistiques ne seront pas les mêmes en fonction du type d essai
Type de schéma d étude Parallèle: tous les patients restent dans le groupe dans lequel ils ont été tirés au sort jusqu à la fin de l étude Tirage au sort Début de l étude Intervention A Intervention B Intervention A Fin de l étude Intervention B
Type de schéma d étude Croisé : tous les patients reçoivent successivement les deux interventions Tirage au sort Intervention A Début de l étude Intervention B Intervention A Fin de l étude Intervention B
Schéma d étude Notion d «aveugle» : objectif : maintenir la comparabilité entre l administration des traitements et l évaluation du critère de jugement double aveugle : ni le médecin ni le patient ne connaît la nature du traitement administré simple aveugle : seul le patient ne connaît pas la nature du traitement administré
L intervention et les mesures associées Définir précisément l intervention but et déroulement de l intervention essai thérapeutique traitements évalués posologie fréquence administration voies et forme d administration durée d administration effets secondaires... traitements associés : leurs effets ne doivent pas interférer avec ceux des traitements évalués liste des traitements autorisés et circonstances de leur administration listes des traitements interdits
Sujets éligibles Définir la maladie : doit être claire et précis critères cliniques? critères biologiques, histologiques, radiologiques? affection aiguë, chronique? 1 ère évènement, récidive? formes déjà traitées? Si oui, période de sevrage? problèmes des affections associées? Caractéristiques des malades : sexe, âge, (selon l essai) Définir des critères d inclusion et d exclusion Il faut pouvoir respecter la clause d ambivalence (un patient doit pouvoir recevoir indifféremment l un ou l autre des 2 traitements)
Critères de jugement C est ce sur quoi portera l analyse. Dépendent des objectifs. Critère de jugement principal : en fonction de l objectif principal protocole bâti autour de lui permet de déterminer le nombre de sujets nécessaires analyse faite autour de lui Critère(s) de jugement(s) secondaire(s) : pour apprécier les autres effets de l intervention permettent d exprimer des conclusions sous forme d hypothèses
Le tirage au sort Principe Randomisation : répartition aléatoire d individus ou de groupes d individus Tirage au sort équilibré n A = n ou B n A n B Tirage au sort déséquilibré n k x = k = 1, 2, 3 (rarement plus) A n B Tirage au sort stratifié sur des sous-groupes de sujets homogènes. On constitue pour cela des listes distinctes de tirage au sort pour chacune des strates exemple : dans un essai multicentrique, le centre constitue une strate de tirage au sort
Le tirage au sort Méthodes Tables de permutation de n éléments (1, 2,, n) : les n nombres de 1 à n sont répartis aléatoirement (permutation des n nombres) on associe un traitement à un groupe d éléments (par exemple numéro pairsimpairs) on lit dans la table de manière séquentielle afin de déterminer le traitement à administrer Algorithmes informatiques
Le tirage au sort : exemple Exemple avec une table de permutation de 6 éléments : 421536 154623 145362 513642 132654 324615 213564 124536 543216 364521 254631 452316 * 243516 43256 52163 235641 135246 531246 154623 635241 263541 642315 623514 132654 142635 134562 316425 514362 426135 241356 615243 126345 523614 156324 246315 541326 653412 425361 213645 523641 425361 126435 351624 156423 625431 245613 621345 641532 364215 461325 524361 216543 152346 651234 1 On décide de donner le traitement A (B) si le numéro lu dans la table est pair (impair) 2 On commence à lire dans la table à partir d une ligne déterminée au hasard (marquée par * dans cet exemple) 3 Le premier patient aura donc le traitement B, le 2 ème également, le 3 ème le traitement A,...
Le tirage au sort Moment du tirage au sort : le plus tard possible afin d éviter la survenue d événements susceptibles d empêcher l administration du traitement (prise de médicaments contres indiqués, décès, ) quand le sujet est déclaré bon pour l essai après vérification des critères d inclusion et d exclusion après avoir obtenu le consentement du sujet (des parents si mineur) juste avant le début du traitement Réalisation pratique du tirage au sort conditionnement identique des traitements procédure centralisée (Internet, un standard téléphonique, )
Nombre de sujets nécessaires C est le nombre minimum de sujet à inclure pour pouvoir mettre en évidence une différence (si elle existe) Calculé avant le début de l étude Dépend du problème clinique : bénéfice minimum cliniquement intéressant : diminution d une manifestation clinique de x % par exemple. variabilité de la réponse entre les sujets au traitement Dépend de certains paramètres statistiques : risque de 1 ère espèce : α, risque de conclure à une différence qui n existe pas risque de 2 ème espèce : β, risque de ne pas conclure à une différence alors qu elle existe Pour comprendre ces 2 notions de statistique il nous faut introduire les Principes d un test statistique
Principes d un test statistique Situation : on s intéresse aux patients ayant un pneumothorax spontané traité par talcage et aux patients ayant un pneumothorax spontané traité par drainage. Problématique : le nombre moyen de récidives de pneumothorax est-il différent selon le traitement du premier pneumothorax? Indicateurs : nombre moyens de récidive et intervalles de confiance à partir d un échantillon de patients
Principes d un test statistique Idée générale : la zone de recouvrement des intervalles de confiance est : «grande» : la différence observée entre les moyennes est due aux fluctuations d échantillonnage ; les 2 échantillons proviennent d une même population. Voir l exemple «petite» : il est «peu» probable que la différence observée entre les deux moyennes soit due au hasard ; la probabilité que les 2 échantillons proviennent de la même population est «faible». Voir l exemple Problème : définir une limite entre zone de recouvrement «grande» et «petite» valeur vérifiant l hypothèse que la différence observée entre les moyennes est due aux fluctuations d échantillonnage : hypothèse nulle (H 0 )
Zone de recouvrement «grande» Estimation de la moyenne Bornes des intervalles de confiance Zone de recouvrement des intervalles de confiance
Zone de recouvrement «petite» Estimation de la moyenne Bornes des intervalles de confiance Zone de recouvrement des intervalles de confiance
Test statistique : exemple Groupe A : traitement par talcage ; nombre moyen de récidive = m A Groupe B : traitement par drainage ; nombre moyen de récidive = m B H Hypothèse nulle (H 0 ) : µ A = µ B, il n y a pas de différence entre les traitements Hypothèse alternative (H 1 ) : µ A < µ B, le traitement par talcage donne moins de récidives (exemple en situation unilatérale) Statistique du test : d = M A -M B On détermine un seuil de signification L à partir duquel d est considérée comme étant «trop grande», c est-à-dire tel que : α = Pr[ d > L sous H 0 ] (de manière arbitraire, α = 5 %) On réalise le test de comparaison de 2 moyennes : si le degré de signification du test p est > à Pr[ d > L sous H 0 ], on accepte H 0, sinon on rejette H 0.
Principes d un test statistique : notion de risque = β =Pr[ M A -M B < L sous H 1 : (µ A - µ B ) = ] α = Pr[ M A -M B > L sous H 0 ] Notations : M A -M B : variables aléatoires µ A - µ B : différence théorique m A -m B : différence observée
Principes d un test statistique : notion de risque Une décision de rejet ou de non rejet de H 0 est faite sous certains risques puisque l état réel est inconnu : Décision Réalité H 0 vraie H 1 vraie Rejet de H 0 Non rejet de H 0 Erreur de 1 ère espèce Probabilité = α Seuil du test Décision correcte Probabilité = 1 - β Puissance du test Décision correcte Probabilité = 1 α Seuil de confiance Erreur de 2 ème espèce Probabilité = β
Interprétation d un test statistique Degré de signification d un test : p p = Pr[(M A -M B ) > d sous H 0 ] Interprétation d un test : si p > α : on ne rejette pas H 0 (ns) si p α : on rejette H 0 (s) L application «Principe d un test statistique» vous permettra de mieux comprendre ces différentes notions et de voir l effet qu ont certains paramètres sur les calculs. Cliquez sur ce lien pour la télécharger. Remarque : vous devez posséder au moins la version d Excel 97.
Principes d un test statistique D p IC 95% Conclusion Risque d erreur 3,3 10-4 2,4 4,2 Différence importante Statistiquement significative Estimation précise 3,3 0,02 0,2 6,4 Différence importante Statistiquement significative Estimation imprécise 3,3 0,06-0,8 7,4 Différence importante Statistiquement non significative Estimation imprécise 0,4 10-4 0,2 0,6 Différence faible Statistiquement significative Estimation précise 0,4 0,06-0,1 0,9 Différence faible Statistiquement non significative Estimation précise 0,4 0,42-3,7 4,5 Différence faible Statistiquement non significative Estimation imprécise 1 ère espèce 1 ère espèce 2 ème espèce 1 ère espèce 2 ème espèce 2 ème espèce Salmi LR, Lecture critique et rédaction médicale scientifique, 1998, Elsevier.
Nombre de sujets nécessaires Les méthodes de calcul tiennent compte : du type de variable : qualitative ou quantitative de la formulation de l essai : unilatéral ou bilatéral de la répartition égale ou non entre les groupes Le nombre de sujets nécessaires varie en fonction : de la différence minimum intéressante de la variabilité de la réponse du risque de 1 ère espèce et de la puissance définie a priori
Nombre de sujets nécessaires : exemple Nombre de sujets par groupes pour la comparaison de 2 moyennes Situation unilatérale avec α = 5 % m A m B σ 1-β n 25 20 10 0,90 69 25 15 10 0,90 18 25 20 4 0,90 12 25 20 10 0,80 50
Sujet pris comme son propre témoin Le même patient reçoit simultanément ou successivement les deux traitements Intérêt : clinique : les mesures sont faites sur le même sujet statistique : tests plus puissants Conditions : affection chronique, évolution de la maladie par phases de même intensité mesure du critère de jugement invariable pas d interférence entre l effet des traitements et leur ordre d administration (nécessité d une période de sevrage lors du changement de traitements) ou entre les effets propres des traitements lors d une administration simultanée le même patient doit pouvoir recevoir les deux traitements
Sujet pris comme son propre témoin Nombre de sujets nécessaire n N 2 N : nombre total de sujets pour 2 groupes parallèles Tirage au sort (TAS) quand le sujet est «bon pour l essai» Il faut pouvoir tenir compte d un effet possible de l ordre d administration des traitements traitements successifs : TAS pour le 1 er traitement traitements simultanés : TAS pour le 1 er côté
Surveillance Elle doit être identique quel que soit le groupe de randomisation afin d assurer la comparabilité entre les groupes Il faut au préalable avoir préciser : son rythme la nature des examens à pratiquer la durée totale de suivi Il faut être vigilant en ce qui concerne : les non-respects du protocole sujets inclus à tord sujets pour lesquels le traitement reçu n est pas celui prévu les perdus de vue les re-convoquer rechercher leurs motifs d abandon
Analyse d un essai Décrire : les sujets inclus caractéristiques telles que le sexe, l âge, ; en fonction des variables recueillies et à analyser buts : vérifier la qualité du tirage au sort, savoir sur quelle population s appliquent les résultats les écarts au protocole sujets inclus à tord non respect de la randomisation perdus de vue
Analyse d un essai Analyse des écarts au protocole : sujets inclus à tord les garder sauf si l inclusion à tord est dépendante du traitement non respect de la randomisation analyse en intention de traiter : les sujets randomisés dans un groupe et recevant finalement le traitement prévu pour l autre groupe doivent être analysés dans leur groupe prévu lors de la randomisation perdus de vue les prévoir dans le calcul du nombre de sujets nécessaires on peut soit les exclure de l analyse (on considère alors qu ils se répartissent de la même manière dans les groupes), soit les considérer tous comme des succès ou des échecs (hypothèse du biais maximum)
Analyse d un essai Comment? sur le critère de jugement principal défini dans le protocole sur les bons groupes avec les tests appropriés et dans des conditions d application valides technique d ajustement : but : connaître l effet d un facteur conditionnellement aux différents niveaux d autre(s) facteur(s). Exemple : connaître les effets des traitements sur la régression tumorale en fonction de l âge des individus ajustement avant l analyse : mesures des facteurs pronostiques connus avant l administration de l intervention étudiée tirage au sort stratifié sur ces facteurs ajustement lors de l analyse : test statistique unique permettant de prendre en compte un facteur qui augmente la variabilité du critère de jugement il s agit de réaliser une analyse dite multivariée
Analyse d un essai Moments de l analyse : analyse en fin d essai critère de jugement recueilli chez tous les sujets inclusion du nombre de sujets nécessaire total calculé N analyse avant la fin de l essai = analyses intermédiaires but : conclure avant la fin de l essai. Trois situations décisionnelles possibles : rejet de H 0 acceptation de H 0 continuer le recueil des données le seuil de signification de chaque test α doit être diminué pour conserver un risque globale d erreur α 5 %
Analyses intermédiaires : exemple α : seuil de signification global si chaque test est réalisé au seuil de 5 % α : seuil de signification de chaque test pour avoir un risque d erreur global 5 % Nombre de tests α α 1 0,05 0,0500 2 0,08 0,0294 3 0,11 0,0221 4 0,13 0,0182 5 0,14 0,0158 10 0,19 0,0106 Source : Pocock SJ, Biometrika, 1997
Analyse d un essai (analyses intermédiaires) le nombre de sujets nécessaire total est plus grand que lors d une analyse unique le nombre et le type d analyse est à prévoir avant de commencer l étude analyse séquentielle de groupe» x analyses tous les n sujets analyse séquentielle» x analyses pour chaque paire de résultats méthodes flexibles» la date de l analyse n est pas prédéterminée avantages : éthique : faire profiter le plus tôt possible d un traitement efficace peut diminuer le temps de recueil des donnée économie des moyens inconvénients : il sont spécifiques aux différentes méthodes existantes
Conclusion d un essai Résultats significatifs : confronter les connaissances antérieures et le degré de signification p la différence est-elle observée par hasard? y a-t-il un biais? la différence est-elle réellement un effet du traitement? Résultats non significatifs : ne conclu pas à l égalité des variables testées quelle est la puissance du test?
Critères de lecture d un essai randomisé Catégorie Formulation générale du critère Si non-respect Section Schéma Interventions comparées définies et justifiées Rejet de l article Introduction, Méthodes Principe d ambivalence respecté Rejet de l article Introduction Tirage au sort décrit Rejet de l article Méthodes TAS fait en insu par un centre indépendant Rejet ou prudence Méthodes Sélection Pertinence de l indication Rejet ou prudence Introduction, Méthodes Conduite Description des modalités d intervention Rejet de l article Méthodes, Résultats Effets observés définis et pertinents Rejet de l article Méthodes, Discussion Mesure fiable et valide des effets observés Rejet ou prudence Méthodes, Résultats Evaluation en insu des effets observés Rejet ou prudence Méthodes Résultats de la randomisation cachée aux individus Rejet ou prudence méthodes Résultats de la randomisation cachée aux soignants Prudence Méthodes Durée de suivi précisée et suffisamment longue Rejet de l article Méthodes Analyse Comparabilité des groupes à l entrée Rejet ou prudence Résultats Analyse en intention de traiter Rejet de l article Méthodes, Résultats Prise en compte du suivi Rejet ou prudence Méthodes, Résultats Résultat de la randomisation cachée au statisticien Prudence Méthodes Autres interventions surveillées et décrites Rejet ou prudence Méthodes, Résultats Effets secondaires évalués et décrits Prudence Méthodes, Résultats Adhésion surveillée et décrite Prudence Méthodes, Résultats Divers Applicabilité hors du contexte expérimentale Prudence Méthodes, Discussion Description des violations de protocole Prudence Résultats, Discussion Apport de l intervention par rapport à l existant Prudence Introduction, Discussion Salmi LR, Lecture critique et rédaction médicale scientifique, 1998, Elsevier.
Quelques références Laplanche A, Com-Nougué C, Flamant R. Méthodes statistiques appliquées à la recherche clinique. Médecine-Sciences, Flammarion, Paris. Schwartz D, Flamant R, Lellouch J. L essai thérapeutique chez l homme. Médecine-Sciences, Flammarion, Paris.