La puissance statistique d une étude (clinique)

La puissance statistique d une étude (clinique) Loïc Desquilbet Département des Sciences Biologiques et Pharmaceutiques Ecole Nationale Vétérinaire d Alfort loic.desquilbet@vet-alfort.fr Module Bases en Biostatistique Semestre S5 (015-016) Version v3 Remarque d introduction pour tout le cours Les illustrations porteront sur des moyennes (et non sur des pourcentages), avec le test de Student pour séries non appariées - Car le raisonnement est plus simple à établir avec des variables quantitatives - Mais le raisonnement serait bien entendu le même avec des pourcentages Le risque d erreur de 1 ère espèce α est fixé à 5%

Contexte des tests statistiques On veut montrer avec force (conviction) que la valeur d un indicateur* entre deux populations diffère d une population à l autre Au niveau échantillon Inférence Au niveau population * moyenne, pourcentage, médiane, 3 Rappel du principe du test de Student On pose l hypothèse que 8* = 0 (hypothèse nulle H 0 ) Soit D H0 = ensemble de toutes les différences de moyennes observables sous H 0 D H0 s D Valeurs de toutes les différences observables sous H 0 0 s D = s 1 + n1 n 1 tot s tot = ( n 1. ) s + ( n 1. ) 1 1 1 n + n s * 8 = µ 1 µ 4

Rappel du principe du test de Student Soit d,5% la valeur telle qu observer une différence d,5% arrive dans 5% des cas lorsque H 0 est vraie D H0,5%,5% -d,5% 0 d,5% Valeurs de toutes les différences observables sous H 0 5 De quoi dépend d,5%? Réponse : de s D! D H0 D H0 S D S D d obs,5%,5% Valeurs de toutes les différences observables sous H 0 -d,% -d,5% 0 d,5% d,5% Avec pour conséquence, une possible modification dans la conclusion! Avec un écart-type s D, d obs < d,5% On accepte H 0 Avec un écart-type s D, d obs > d,5% On rejette H 0 au risque d erreur 5% 6

De quoi dépend s D? De la variabilité du caractère quantitatif mesuré (s 1 et s ) De la taille des deux échantillons n 1 et n Avec pour conséquences s tot = s D = s 1 + n1 n 1 tot ( n 1. ) s + ( n 1. ) 1 1 1 n + n s s D quand la variabilité du caractère mesuré s D quand n 1 et/ou n 7 Pensez-vous qu il existe une association réelle entre le port de lunettes de votre meilleur(e) ami(e) et la présence d arthrose de votre grand-père?? 8

Impact sur le rejet ou l acceptation de H 0 Si en vrai, H 0 est fausse, d obs a d autant plus de chances d être > d,5% ( rejet de H 0 ) que La variabilité du caractère mesuré est faible (variabilité naturelle + variabilité instrument de mesure) La taille des deux échantillons n 1 et n est importante Si en vrai, H 0 est vraie, il y aura toujours 5% de risques de rejeter (à tort, donc) H 0, Quelles que soient la variabilité du caractère mesuré et la taille des échantillons!! 10

Risque d erreur β (rappel) Supposons qu il existe une différence réelle 8 0 (hypothèse H 8 ) Soit D H8 = ensemble de toutes les différences de moyennes observables sous D H8 D H0 D H8 Valeurs de toutes les différences observables -d,5% 0 d,5% 8 β = Probabilité d observer une différence qui conduit à accepter H 0 (car d obs serait < d,5% ) quand H 8 est vraie Erreur (en %) que l on commet en affirmant que H 0 est vraie (car acceptée) alors qu elle est fausse 11 Puissance statistique Une analyse statistique est «puissante» si elle est grandement capable de mettre en évidence statistiquement une différence qui existe réellement Puissance = Pr(conclure que θ 1 θ quand réellement θ 1 θ ) = 1 Pr(conclure que θ 1 = θ quand réellement θ 1 θ ) = 1 β D H0 D H8 Valeurs de toutes les différences observables -d,5% 0 d,5% 8 1 β = puissance de l étude 1

De quoi dépend la puissance statistique? De 8 : plus 8, plus la puissance statistique D H0 D H8 Valeurs de toutes les différences observables -d,5% 0 d,5% 8 puissance de l étude 13 De quoi dépend la puissance statistique? De 8 : plus 8, plus la puissance statistique De d,5% : plus d,5%, plus la puissance statistique D H0 D H8 Valeurs de toutes les différences observables -d,5% 0 d,5% 8 puissance de l étude Or d,5% dépend de S D, qui dépend de la variabilité du caractère mesuré et de la taille des échantillons 14

En résumé!... S il existe une réelle différence 8 entre les deux indicateurs comparés, On aura beaucoup plus de chances de le montrer statistiquement (en rejetant H 0 ), que La différence réelle (8) est grande La variabilité du caractère mesuré est faible La taille des échantillons est grande Puissance statistique de l étude 15 Conséquences Pour avoir de grandes chances de montrer une différence significative (rejet de H 0 ) lorsqu il existe une réelle différence, et si la différence réelle (8) est faible il va falloir des tailles d échantillons importantes les tailles d échantillons sont faibles il faut espérer que la différence réelle soit importante La flamme de l espoir 16

Critères de mise en place d une étude Etre faisable & ne pas coûter plus chère que les budgets ne le permettent Protocole acceptable d un point de vue éthique Avoir de grandes chances de montrer statistiquement une différence que l on pense réelle Sinon, il ne sert à rien de mettre en place cette étude si on est sûr d aller «droit dans le mur»! (Dépenses de temps et d argent inutiles) 17 Une étude est puissante, statistiquement parlant, si 18

Comment augmenter la puissance statistique d une étude?

Manque de puissance stat A la vue des résultats d une analyse statistique, on invoque le manque de puissance statistique quand «on n a pas réussi à montrer statistiquement qu il existe une différence réelle» p < 0,05 p > 0,05 (mais quand même < 0,10) Quand la différence observée laisse penser à l existence d une réelle différence (c est-à-dire, une différence observée de moyennes ou de % cliniquement importante) 4

Vous faites votre thèse en chirurgie canine dont l objectif est de montrer que le geste opératoire A provoque moins de complications post-opératoires que le geste B Votre directrice/teur de thèse vous dit plus que vous ne pourrez pas travailler sur plus de 8 chiens par groupe (geste A ou geste B) 5

C est fini! Mais n oubliez pas le travail à faire chez vous!... Avant la séance de TD n 5 (1h30 max de travail à faire à la maison) - Lire le document Powerpoint «Autres tests statistiques» - Lire le document «Tutoriel statistiques de base avec Excel et BiostatGV» - Visionner le tutoriel vidéo sur les tableaux croisés dynamiques dans Excel 7