Notions de base en statistique. Dr Cécile Couchoud

Documents pareils
Principe d un test statistique

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

TESTS D'HYPOTHESES Etude d'un exemple

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Équivalence et Non-infériorité

Essais cliniques de phase 0 : état de la littérature

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Document d orientation sur les allégations issues d essais de non-infériorité

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Lois de probabilité. Anita Burgun

Biostatistiques : Petits effectifs

Analyse de la variance Comparaison de plusieurs moyennes

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Cours de Tests paramétriques

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

Item 169 : Évaluation thérapeutique et niveau de preuve

Docteur José LABARERE

TABLE DES MATIERES. C Exercices complémentaires 42

VI. Tests non paramétriques sur un échantillon

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Validation clinique des marqueurs prédictifs le point de vue du méthodologiste. Michel Cucherat UMR CNRS Lyon

Estimation et tests statistiques, TD 5. Solutions

23. Interprétation clinique des mesures de l effet traitement

Degré de confiance pour les indicateurs de performance : degré de fiabilité du processus de production et écart significatif 1

Relation entre deux variables : estimation de la corrélation linéaire

L obésité et le diabète de type 2 en France : un défi pour la prochaine décennie. DANIEL RIGAUD CHU de Dijon

COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES

Introduction à l approche bootstrap

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Marche à suivre pour importer votre base de données Guide santé CV MC ) (Réservé à l usage de Clinemetrica)

Introduction à la Statistique Inférentielle

Chapitre 3. Les distributions à deux variables

Format de l avis d efficience

Lecture critique et pratique de la médecine

«Cours Statistique et logiciel R»

Dr Laurence FAYARD- JACQUIN Cœurs du Forez Mise à jour

LECTURE CRITIQUE 1 ER PAS

EVALUATION DES TECHNOLOGIES DE SANTÉ ANALYSE MÉDICO-ÉCONOMIQUE. Efficacité et efficience des hypolipémiants Une analyse centrée sur les statines

T de Student Khi-deux Corrélation

Évaluation du risque cardiovasculaire dans le contexte de l hypertension artérielle et de son traitement

1 Définition de la non stationnarité

5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: F:

L axe 5 du Cancéropole Nord Ouest

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Introduction aux Statistiques et à l utilisation du logiciel R

Ischémie myocardique silencieuse (IMS) et Diabète.

FORMULAIRE DE STATISTIQUES

Modèles prédictifs belges de l absentéisme pour cause de maladie ou d accident.

Guide de rédaction d un protocole de recherche clinique à. l intention des chercheurs évoluant en recherche fondamentale

SYNOPSIS INFORMATIONS GÉNÉRALES

Contenu. Introduction. Établissement des priorités pour l élaboration des indicateurs. Retrait de certains indicateurs. Répondants au sondage

Santé des TPE face à la crise

Les défibrillateurs cardiaques implantables

choisir H 1 quand H 0 est vraie - fausse alarme

Montréal, 24 mars David Levine Président et chef de la direction DL Strategic Consulting. DL Consulting Strategies in Healthcare

Evidence-based medicine en français

Guide du/de la candidat/e pour l élaboration du dossier ciblé

Études épidémiologiques analytiques et biais

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

4. Résultats et discussion

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

Probabilités sur un univers fini

SOMMAIRE I. INTRODUCTION 4 II. SOURCES D INFORMATION 5

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

La crise économique vue par les salariés français

Traitement de l insuffisance rénale chronique terminale: Place de la greffe de donneur vivant

Nouveau Barème W.B.F. de points de victoire 4 à 48 donnes

Assurance maladie grave

La fumée de tabac secondaire (FTS) en Mauricie et au Centre-du- Québec, indicateurs du plan commun tirés de l ESCC de

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

ALTO : des outils d information sur les pathologies thromboemboliques veineuses ou artérielles et leur traitement

Cours 9 : Plans à plusieurs facteurs

Brock. Rapport supérieur

I. Une nouvelle loi anti-discrimination

Coûts, avantages et inconvénients des différents moyens de paiement

Cet article s attache tout d abord

27 ème JOURNEE SPORT ET MEDECINE Dr Roukos ABI KHALIL Digne Les Bains 23 novembre 2013

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

L hôpital de jour ( HDJ ) en Hôpital général Intérêt d une structure polyvalente? Dr O.Ille Centre hospitalier Mantes la Jolie, Yvelines

Les Français et le don d organes

Essais thérapeutiques d équivalence et de non infériorité

Nouveau plan greffe : Axes stratégiques pour l avenir

Thérapeutique anti-vhc et travail maritime. O. Farret HIA Bégin

First Line and Maintenance in Nonsquamous NSCLC: What Do the Data Tell Us?

Mortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine

AJO/ BJO/ Retina Oct 2014 Par Wilfried Minvielle

Chapitre 3 : INFERENCE

COMMISSION DE LA TRANSPARENCE AVIS DE LA COMMISSION. 10 octobre 2001

STATISTIQUES. UE Modélisation pour la biologie

Annexe B : Exemples. Avis de vente aux enchères liées Système de plafonnement et d échange de droits d émission de gaz à effet de serre (GES)

Télé-expertise et surveillance médicale à domicile au service de la médecine générale :

Transcription:

Notions de base en statistique Dr Cécile Couchoud

Démarche déductive «Vraie» valeur prévoir la valeur sur un échantillon futur < fluctuations d échantillonnage Intervalle de fluctuation Formule générale : A +/- z α/2 varα A: moyenne du paramètre α : risque d erreur que l on consent (5%) z α/2 : donné par la table de la loi normale centrée réduite varα : variance du paramètre

Démarche inductive Valeur observée sur un échantillon : Estimation ponctuelle p 0 Estimation par intervalle : intervalle de confiance p 0 +/- z α/2 var p 0 Interprétation : pour α=5%, z α/2 = 1.96 «sur 100 échantillons successifs pris dans la population, 95 (en moyenne) conduisent à un intervalle de confiance qui contient le vrai pourcentage»

Quelques exemples de variances Prévalence : Var(p 0 ) = p 0.(1-p 0 )/n Taux d incidence : Var (TI) = m / PA² Moyenne : Var (m) = s² / n Odds ratio : Var (LnOR) = 1/a+1/b+1/c+1/d

Étapes d un test statistique

Hypothèses à priori Ho : hypothèse nulle pas de vraie différence : ce qu on observe est purement liée au hasard p 0 = p x (hypothèse d égalité) Celle que l on cherche à réfuter Celle qui est «vraie» tant qu on a pas démonter le contraire p x = valeur théorique (population de référence) ou valeur obtenue dans un autre échantillon

Hypothèses à priori H1 : hypothèse alternative p 0 p x : bilatéral p 0 > p x : unilatéral p 0 < p x : unilatéral

Risques d erreurs associés à un test Risque d erreur α (1 espèce) : probabilité de rejeter Ho si Ho est vrai Probabilité de trouver une différence significative alors qu il n y en a pas Risque d erreur β (2 espèce) : probabilité de ne pas rejeter Ho si H1 est vrai Puissance = 1 - β : probabilité de rejeter Ho si H1 est vrai Aptitude à mettre en évidence un différence lorsqu elle existe

Résultats d un test Valeur du test : la statistique observée Comparaison à une valeur théorique donnée par une table Fonction d un risque α fixé à priori Règle de décision (Neyman-Pearson) Si statistique observée supérieure à valeur théorique Test significatif : rejet H0 Si inférieure Test non significatif : non rejet de H0

Interprétation Différence observée Test p<5% p>5% Il est peu probable que la différence observée soit due au hasard Différence significative (On rejette H0) la probabilité que la différence observée soit due au hasard est forte Différence non significative (On ne peut rejeter H0) Degré de signification p : quantifie le «désaccord» entre ce qu on observe et H0

Exemple : comparaison de 2 pourcentages % d insuffisance coronarienne plus élevé chez les diabétiques? Insuf Coro Oui Non Diabète Oui 39 163 202 Non 47 679 726 86 842 928 19,3% d insuffisance coronarienne chez les diabétiques 6,5% chez les non diabétiques Est ce que 19,3% est significativement supérieur à 6,5%? Test Χ2 à 1 ddl (col-1) * (lignes-1)

Exemple : comparaison de 2 pourcentages Insuf Coro OBSERVE Oui Non Oui Non Diabète Oui 39 163 202 Oui a b n3 Non 47 679 726 Non c d n4 86 842 928 n1 n2 T Insuf Coro ATTENDU si indépendance Oui Non Oui Non Diabète Oui 18,7 183,3 202 Oui n1*n3/t n2*n3/t n3 Non 67,3 658,7 726 Non n1*n4/t n2*n4/t n4 86 842 n1 n2 T Χ2 = Σ (Oi Ei)² / Ei = (18,7-39)²/18,7 + (183,3-163)²/183,3+ (67,3-47)²/67,3 + (679-658,7)²/679 = 30,95

Seuil décision, degré de signification Seuil de décision α = 5%, 1 ddl Valeur théorique = 3.84 La statistique 30.95 > 3.84 : on rejette H0 Différence significative ou les 2 variables ne sont pas indépendants Degré de signification statistique 30.95, 1 ddl p < 0.001

Comparaisons entre 2 échantillons (1) Comparaison de 2 pourcentages Variables dichotomiques : Test Χ2 à 1 ddl Variables à plusieurs classes Test Χ2 à (l 1)(c 1) ddl Attention si effectifs attendus sous H 0 <5 X2 corrigé (Yates) Test Fisher Si appariement (cas-témoins) : test X2 appariés

Lien entre diabète et insuffisance coronarienne

Comparaisons entre 2 échantillons (2) Une variable quantitative + une variable qualitative Comparaison de 2 moyennes Test t de Student à n1+n2-2 ddl Comparaison de plusieurs moyennes ANOVA (test F) Attention si variances différentes Si appariement (cas-témoins) : test Student à n- 1 ddl

Poids selon Statut diabétique

Comparaisons entre 2 échantillons (3) Deux variables quantitatives Coefficient de corrélation linéaire test Student à n 2 ddl Attention si relation non linéaire

Lien entre poids et taille

Application à l essai thérapeutique L essai clinique est utilisé pour montrer l effet d un traitement Risque alpha : considérer comme efficace un traitement qui ne l est pas Risque bêta : ne pas conclure alors que le traitement est efficace Puissance : montrer l efficacité d un traitement réellement efficace

Comparaisons multiples Aux dés, la probabilité d obtenir un six est plus forte avec 3 dés qu avec un seul Test 1 Test 2 Test 3 Test 4 Risque de conclure à tort à une différence = 5% Risque de conclure à tort à une différence = 5% Risque de conclure à tort à une différence = 5% Risque de conclure à tort à une différence = 5% n risque global 2 0.10 3 0.13 5 0.23 10 0.40 Globalement, le risque de conclure à tort à une différence lors de ces 4 comparaisons est bien plus important que 5%. Inflation du risque alpha

Répétition des tests Conclusion basée non pas sur un seul test mais sur plusieurs Conclusion à un effet à partir du moment où il existe au moins un test significatif Le risque α de la conclusion est bien supérieure à 5% Inflation du risque alpha

Critère de jugement principal Décès de toute cause Décès cardiovasculaire Mort subite Infarctus Accident vasculaire cérébraux Chirurgie Pas de définition de critère principal 7 tests statistiques Risque de conclure à tort à l efficacité du traitement = 30% Critère principal Décès de toute cause Critères secondaires Décès cardiovasculaire Mort subite Infarctus Accident vasculaire cérébraux Définition a priori Chirurgie d un critère principal Un seul test statistique Risque de conclure à tort à l efficacité du traitement = 5%

Essai de confirmation Formulation a priori d'une hypothèse objectif de l'essai Démarche hypothético-déductive confrontation à la réalité d'une hypothèse par une expérience conçue spécialement pour cela Valeur méthodologique du résultat

Essai exploratoire Pas d'hypothèse préalablement fixé Grand nombre de comparaison possible inflation du risque alpha Epistémologiquement non valide induction observation d'un fait particulier --> loi générale Pêche à la ligne Sert à générer de nouvelles hypothèses

Hypothèse post hoc Formulée d'après les résultats Vérifiée sur les mêmes données Situation tautologique

Analyses en sous groupes De nature exploratoire Ne donne pas de démonstration Suggèrent des variations d'efficacité

Différence significative Résultat significatif Significativité clinique Taille d effet? Degré de signification (p) : ne renseigne pas sur l importance de la différence!!

Validité interne le résultat est très probablement réel il est statistiquement significatif obtenu sur le critère de jugement principal il est méthodologiquement valide (hypothèse formulée a priori) il n'a pas été obtenu par une analyse en sous groupes le résultat est sûr (exempt de biais) le plan d expérience choisi évite les biais et l étude a été correctement réalisée

Différence non significative Résultat non significatif Absence réelle d'effet (H0 vraie)? Manque de puissance Impossible de conclure Ne prouve pas qu'il n'y a pas d'effet

Puissance La seule chose que l on démontre par des observations est qu une hypothèse est fausse. On ne peut démontrer qu elle est vraie. «Elle n est pas contredite par l expérience». Minimisation de α : évidence forte en faveur de l hypothèse nulle Mais aussi maximiser la puissance

Calculer la puissance d une étude à priori Approximation car repose sur des estimations : tests bruts, écarts attendus, suivis, données manquantes Calcul de la puissance Calcul du nombre de sujets nécessaires Calcul de la différence minimum que l on peut mettre en évidence Éviter une puissance à priori < 80% càd prendre un risque β<20%

Comment améliorer la puissance d une étude Si α diminue, puissance diminue Unilatéral > bilatéral (puissance augmente) Si grande variance, puissance faible : homogénéité des sujets, stratification, ajustement (attention surajustement!) Puissance maximale quand les effectifs des 2 groupes sont égaux (cohorte, cas-témoins) Si différence à mettre en évidence est grande, puissance plus grande : contraste des groupes comparés (attention biais!) Puissance d autant plus grande que le nombre de sujets est important : attention PDV, données manquantes Biais de mesure : dilution

Test unilatéral / bilatéral Si unilatéral : augmentation de la puissance, moins de sujets nécessaires Mais!!!! Si H1 p1>p2 et que l on observe p1<p2 Non rejet de H0 (P1=P0) quelque soit l écart entre p1 et p2

Exemple : Lupus Critère de jugement principal : nombre de rémissions à 6 mois TT1 : faibles doses, TT2 : fortes doses Objectif : montrer qu avec TT1 ont a moins de rémissions qu avec TT2 Comparaison de 2 proportions H0 : P1=P2 H1 : P1 < P2 (test unilatéral) H1 : P1 P2 (test bilatéral)

Calcul du nombre de sujets nécessaires pour la comparaison de 2 proportions N 1 = k+1 (z α/2 z 1-β )² k 2 (arcsin P 2 arcsin P 1 )² Table de la loi normale centrée réduite test bilatéral N 2 = k N 1 % vraie sous H 0 et H 1 Si effectifs inégaux

Calcul du nombre de sujets nécessaires (unilatéral) N 1 =N 2 = (z α z 1-β )² 2 (arcsin P 2 arcsin P 1 )² Effectifs égaux dans chaque groupe Puissance minimale 80% (z α z 1-β )² =(1,645 + 0,842) 2 = (2,487) 2 = 6,185 P1 = 50%, arcsin P 1 = 0,785 P2= 70%, arcsin P 2 = 0,991 N 1 =N 2 = 6,185 / 0,084872 = 73

Calcul du nombre de sujets nécessaires (bilatéral) N 1 =N 2 = (z α/2 z 1-β )² 2 (arcsin P 2 arcsin P 1 )² Effectifs égaux dans chaque groupe Puissance minimale 80% (z α/2 z 1-β )² =(1,960 + 0,842) 2 = (2,802) 2 = 7,851 P1 = 50%, arcsin P 1 = 0,785 P2= 70%, arcsin P 2 = 0,991 N 1 =N 2 = 7,851/ 0,084872 = 93

Houssiau Critère de jugement : échec du traitement A priori : P1 = 30%, P2= 15% Si puissance à priori 80% Bilatéral : 119 patients dans chaque groupe Unilatéral : 94 patients dans chaque groupe Avec 45 patients dans chaque groupe arcsin P 2 arcsin P 1 / 1/2n = 1,72 Puissance à priori = 40% bilatéral, 53% unilatéral A postériori : P1 = 16%, P2= 20% Avec 45 patients dans chaque groupe Puissance à postériori = 3% bilatéral, 5% unilatéral!!!! Au final, que 40 et 38 patients dans les groupes..

Conséquences Manque de puissance : ne pas rejeter H0 si H1 est vrai Houssiau : La probabilité que le test de comparaison des fréquences soit significatif est égale à 22% Il y avait 22% de chance que cette étude puisse monter un effet!!! Il y avait 78% de risque que l on conclut à l absence de différence

Bibliographie Falissard B. Comprendre et utiliser les statistiques dans les sciences de la vie. 2ème édition. Paris : Masson; 1998. 332 pages (Abrégés). Bouyer J, Hémon D, Cordier S, Derriennic F, Stücker I, Stengel B, Clavel J. Epidémiologie. Principes et méthodes quantitatives. Paris : INSERM; 1995. 498 pages. Schwartz D. Méthodes statistiques à l'usage des médecines et des biologistes. 4ème édition. Flammarion 1995. Bouyer J. Méthodes statistiques. Médecine - Biologie. Paris : INSERM; 1996. 353 pages.