STAT-I301 Chapitre IV: Tests d hypothèse. Caroline Verhoeven



Documents pareils
Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Analyse de la variance Comparaison de plusieurs moyennes

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Principe d un test statistique

Estimation et tests statistiques, TD 5. Solutions

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

FORMULAIRE DE STATISTIQUES

FONCTION DE DEMANDE : REVENU ET PRIX

VI. Tests non paramétriques sur un échantillon

Chapitre 3. Les distributions à deux variables

Annexe commune aux séries ES, L et S : boîtes et quantiles

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

QUESTIONNAIRE DE PRE-AUDIT. Rubrique n 1 : Présentation de l entreprise

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Introduction à l approche bootstrap

Exercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA

R.C. Professionnelle Proposition

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Hier, Mathilde rencontrer son professeur. A pu A pue. Les animaux.malades pendant une courte période. Sont été Ont été Sont étés

Dans une année, il y a 12 mois. Dans une année, il y a 52 semaines. Dans une année, il y a 4 trimestres. Dans une année, il y a 365 jours.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Otite Moyenne Aiguë. Origine bactérienne dans 70 % des cas. Première infection bactérienne tous âges confondus

Introduction aux Statistiques et à l utilisation du logiciel R

1. QU'EST CE QUE LE TABLEAU DE BORD D UN PROJET?

BTS Banque session 2011 EP 5 : Techniques bancaires Corrigé indicatif CORRIGE INDICATIF BANQUE PARIS MÉDICIS

TSTI 2D CH X : Exemples de lois à densité 1

Chapitre 2. Eléments pour comprendre un énoncé

Cours de Tests paramétriques

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Application sur le Dispositif en Blocs Complètement Randomisés

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Lire ; Compter ; Tester... avec R

Le chi carré. Le sommaire. Approche quantitative

La classification automatique de données quantitatives

L ANALYSE COUT-EFFICACITE

Examen de Logiciels Statistiques

T de Student Khi-deux Corrélation

Exercices de Statistique HEI /2015 A. RIDARD

COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

OSGOODE HALL LAW SCHOOL Université York MÉMOIRE PRIVILÉGIÉ ET CONFIDENTIEL

La Celle Saint-Cloud, ville fibrée

1 Définition de la non stationnarité

Attirez-vous les Manipulateurs? 5 Indices

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Transgene accorde une option de licence exclusive pour le développement et la commercialisation de son produit d immunothérapie TG4010

Biostatistiques : Petits effectifs

TESTS D'HYPOTHESES Etude d'un exemple

Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire :

Analyse trimestrielle du marché des jeux en ligne en France

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

BOURSES DU GOUVERNEMENT DU JAPON Questions Fréquemment Posées / Réponses indicatives

Nom Prénom :... Mon livret de stage

OUVERTURE ET MISE EN PLACE

Les probabilités. Chapitre 18. Tester ses connaissances

Statistique Bayésienne

PEUT- ON SE PASSER DE LA NOTION DE FINALITÉ?

Analyse en Composantes Principales

LES DECIMALES DE π BERNARD EGGER

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Stéphanie Dupays. du fait de stratégies individuelles ou familiales ou bien de contraintes liées aux changements

Transfusions sanguines, greffes et transplantations

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Première partie: Restitution + Compréhension (08 points)

Introduction à la statistique non paramétrique

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Science et technique. La température et la durée de stockage sont des facteurs déterminants. Viande bovine et micro-organisme pathogène

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

Plan. - La VaR. - Introduction à l FRTB. - Principales révisions Frontières Banking / Trading book l Expected Shortfall Les horizons de liquidité

Liste de contrôle à utiliser pour les ménages privés

Surveillance consolidée des banques et des négociants en valeurs mobilières

Université Paris 8 Introduction aux probabilités Licence Informatique Exercices Ph. Guillot. 1 Ensemble fondamental loi de probabilité

Relation entre deux variables : estimation de la corrélation linéaire

Sondage sur les expériences d hospitalisation des patients canadiens Foire aux questions

REGLEMENT INTERIEUR. En cas d erreur, d omission ou de contradiction entre un article du présent règlement et les statuts, ces derniers font foi.

Construction d un fichier de zone Déboguage et dépannage

EXERCICES : MECANISMES DE L IMMUNITE : pages

FORMULAIRE DE DECLARATION DE RISQUE ART ET PRECIEUX TOUS RISQUES EXPOSITIONS

Questionnaire de vérification pour l implantation de la norme ISO dans une entreprise

Item 169 : Évaluation thérapeutique et niveau de preuve

F-150 xlt 4X plus gros événement de l année Carrosserie et plateau en alliage d aluminium haute densité

Enquête 2014 «Digital et R.O.I» «Digital et R.O.I» Enquête FNIM - Doctors 2.0 & You

Evaluation quantitative du risque - critères d acceptabilité

CorDial 2010 Gouvernement d entreprise. Constat / Propositions

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

DEBAT PHILO : L HOMOSEXUALITE

L analyse économique est-elle transposable à l éducation?

1. Assurance-invalidité : si vous devenez incapable de travailler

Dérivés Financiers Contrats à terme

STATISTIQUES. UE Modélisation pour la biologie

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

Analyse trimestrielle du marché des jeux en ligne en France. Autorité de régulation des jeux en ligne Données T2 2013

Transcription:

STAT-I301 Chapitre IV: Tests d hypothèse Caroline Verhoeven

Table des matières 1 Principe Significativité Puissance d un test Etapes d un test d hypothèse 2 Tests statistiques Test t pour 1 échantillon Tests z pour les proportions Test t pour échantillons appariés Test t pour 2 échantillons indépendants Test du χ 2 Caroline Verhoeven STAT-I301 2 / 59

Principe de base : exemples Exemple 1 En 2002, 2 chercheurs français ont étudié l impact de l entraînement intensif sur les jeunes gymnaste féminines. Question : Les jeunes gymnastes sont elles plus petites que les jeunes filles de leur age? H 0 : µ gym = µ controle H a : µ gym < µ controle Exemple 2 On étudie l expression moyenne d un gène sous un certain traitement. A priori on ne sait pas si l expression sera plus grande ou plus petite sous le traitement H 0 : µ traitement = µ controle H a : µ traitement µ controle Caroline Verhoeven STAT-I301 3 / 59

1. Principe Principe de base But : Utiliser les données d un échantillon afin d étudier une hypothèse sur un paramêtre de la population Comparaison de 2 hypothèses contradictoires : Hypothèse nulle (H 0 ) : Hypothèse selon laquelle la population suit une loi donnée. Formulée comme une égalité Exemple : le traitement n a pas d effet, effet=0 Hypothèse alternative (H a ) : Hypothèse selon laquelle la population ne suit pas une loi donnée. Formulée comme <, > ou En général : ce que le chercheur espère Exemple : effet 0, effet> 0 ou effet< 0 Après le test on rejette H 0 (RH 0 ) ou on ne rejette pas H 0 (NRH 0 ) Caroline Verhoeven STAT-I301 4 / 59

Erreurs de test hypothèse 1. Principe 1. Significativité NRH 0 RH 0 H 0 vraie Erreur du type I Réalité H 0 fausse Erreur du type II Caroline Verhoeven STAT-I301 5 / 59

1. Principe 1. Significativité Erreur du type I : Exemple I Exemple 3 Résultat d un essai antibiotique sur des souris 60 souris ont été inoculées avec une souche potentiellement mortelle de Salmonelle sp. Après cette injection : 30 souris tirées au hasard (lot témoin) sont laissées tranquille 30 autres (lot traité) reçoivent une dose de pentacycline (un antibiotique à large spectre) Résultat Dans le groupe traité, 19 souris (63,3%) ont survécus Dans le groupe non traité, 14 souris (46,7%) ont survécus Conclusion : le traitement a un effet positif Caroline Verhoeven STAT-I301 6 / 59

1. Principe 1. Significativité Erreur du type I : Exemple II Exemple 3 Résultat Dans le groupe traité, 19 souris (63,3%) ont survécus Dans le groupe non traité, 14 souris (46,7%) ont survécus Conclusion : le traitement a un effet positif FAUX Ce n est pas une expérience réelle Ce sont 2 30 nombres générés aléatoirement (0 pour mort, 1 pour en vie) Equivalent à lancer 2 30 fois une pièce Caroline Verhoeven STAT-I301 7 / 59

1. Principe 1. Significativité Erreurs de type I Erreur du type I : Rejeter H 0 si elle est vraie Exemple : Conclure que le traitement a un effet alors que non Il faut éviter ce type d erreur Limiter le fait que la différence entre le résultat obtenu et H 0 est dû au hasard En général on accepte que la probabilité de se tromper est α = 0.05 α : le seuil significatif Caroline Verhoeven STAT-I301 8 / 59

1. Principe 1. Significativité Seuil significatif : Exemple Exemple 4 QI moyen de la population : µ 0 = 100, écart-type pour la population : σ 0 = 15. Des chercheurs développe un médicament pour augmenter artificiellement le QI. 30 personnes prennent ce médicament, ensuite on teste leur QI. QI moyen de ces 30 personnes : x = 140. Ce médicament augmente-t-il en moyenne le QI? Formulation de l hypothèse nulle : H 0 : µ = 100 H a : µ > 100 Les données donnent x > µ 0 Doit-on rejeter H 0 ou non? Caroline Verhoeven STAT-I301 9 / 59

Seuil significatif I 1. Principe 1. Significativité On a des données d un échantillon et on veut conclure si : H 0 : µ = µ 0 H a : µ > µ 0 Supposons que les données donnent x > µ 0 Doit-on rejeter H 0 ou non? 1 Α Α Μ 0 NRH 0 q RH 0 Distribution d échantillonnage si H 0 vraie α = P(Y q H 0 vraie) q : le quantile de niveau 1 α x q RH 0 x < q NRH 0 Caroline Verhoeven STAT-I301 10 / 59

Seuil significatif II 1. Principe 1. Significativité H 0 : µ = µ 0, H a : µ < µ 0 Α 1 Α Μ 0 RH 0 q NRH 0 H 0 : µ = µ 0, H a : µ µ 0 Α 2 1 Α Α 2 Μ 0 RH 0 NRH q 0 RH 1 q 0 2 Distribution d échantillonnage si H 0 vraie α = P(Y q H 0 vraie) q : le quantile de niveau α x q RH 0 x > q NRH 0 Distribution d échantillonnage si H 0 vraie α = P(Y q 1 ou q 2 H 0 vraie) q 1 : le quantile α/2 q 2 : le quantile 1 α/2 x q 1 ou x q 2 RH 0 q 1 < x < q 2 NRH 0 Caroline Verhoeven STAT-I301 11 / 59

1. Principe 1. Significativité Seuil significatif : Résolution de l exemple On choisit α = 0,05 On centre et réduit en supposant que H 0 est vraie : z = x µ 0 σ 0 N = 140 100 = 14,61 15 30 0.4 Z N(0,1) si H 0 vrai q : 95ème centile q = 1,64 0.2 z > q RH 0 z 15 10 5 0 q 5 10 15 Caroline Verhoeven STAT-I301 12 / 59

1. Principe 1. Significativité La valeur p (p-value) : unilatéral I Supposons que H 0 : µ = µ 0 H a : µ > µ 0 Nous avons x des données Μ 0 x x p Distribution d échantillonnage si H 0 vraie p = P(Y x H 0 vraie) p : une probabilité p α RH 0 p > α NRH 0 Caroline Verhoeven STAT-I301 13 / 59

1. Principe 1. Significativité La valeur p (p-value) : unilatéral II Si H 0 : µ = µ 0 H a : µ < µ 0 x p = P(Y < x H 0 vraie) p p α RH 0 p > α NRH 0 x Μ 0 Caroline Verhoeven STAT-I301 14 / 59

1. Principe 1. Significativité La valeur p (p-value) : bilatéral Si H 0 : µ = µ 0 H a : µ µ 0 x > µ 0 : p/2 = P(Y x H 0 vraie) x p 2 et x < µ 0 : p/2 = P(Y x H 0 vraie) p α RH 0 Μ 0 x 2 p > α NRH 0 Caroline Verhoeven STAT-I301 15 / 59

1. Principe 1. Significativité La valeur p : Résolution de l exemple On centre et réduit en supposant que H 0 est vraie : z = x µ 0 σ 0 N = 140 100 = 14,61 15 30 Exercice Caroline Verhoeven STAT-I301 16 / 59

Erreurs de test hypothèse 1. Principe 2. Puissance d un test NRH 0 RH 0 H 0 vraie Erreur du type I Réalité H 0 fausse Erreur du type II Caroline Verhoeven STAT-I301 17 / 59

1. Principe 2. Puissance d un test Erreur du type II Erreur du type II : Ne pas rejeter H 0 si H 0 est incorrect Exemple : Conclure que le traitement n a pas d effet alors qu il en a. β : P(NRH 0 H 0 fausse), risque de faire une erreur du type II 1 β : P(RH 0 H 0 fausse), puissance du test On ne sait calculer β que si on a une valeur précise µ a Caroline Verhoeven STAT-I301 18 / 59

1. Principe 2. Puissance d un test Erreur du type II : Exemple I Exemple 5 En 2002, 2 chercheurs français ont étudié l impact de l entraînement intensif sur les jeunes gymnaste féminines de haut niveau. Ces jeunes gymnastes de haut niveau sont-elles en moyennes plus petites que la moyenne des filles de 15 ans? En moyenne les filles de 15 ans ont une taille µ 0 = 161cm, σ = 10cm On regarde 30 gymnastes de 15 ans. Déterminons β pour de valeurs différentes de µ a Α Β 153 161 RH 0 NRH 0 β = P(Y x H a vraie ), x : quantile α si H 0 vraie µ 0 = 161cm, µ a = 157cm β = 0,293 µ 0 = 161cm, µ a = 155cm β = 0,050 µ 0 = 161cm, µ a = 153cm β = 0,003 Caroline Verhoeven STAT-I301 19 / 59

1. Principe 2. Puissance d un test Erreur du type II : Exemple II On peut diminuer β en agrandissant N Α Β 157 161 µ 0 = 161cm, µ a = 157cm N = 30 β = 0,293 N = 50 β = 0,118 N = 100 β = 0,009 Caroline Verhoeven STAT-I301 20 / 59

1. Principe 3. Etapes d un test d hypothèse 1 Choisir le seuil significatif α 2 Formuler H 0 et H a 3 Choisir le test approprié 4 Calculer la valeur p et comparer avec α 5 Formuler une conclusion Caroline Verhoeven STAT-I301 21 / 59

Types de tests 2. Tests statistiques Test de conformité : Comparaison entre 1 échantillon et 1 population Test servant à vérifier si l échantillon qu on considère est bien issu de la population considérée Test d égalité : Comparaison entre 2 échantillons Test permettant de comparer 2 populations Test d indépendance Test pour des données qualificatives Test permettant de de contrôler l indépendance de plusieurs critères de classification Caroline Verhoeven STAT-I301 22 / 59

2. Tests statistiques Test pour z pour 1 échantillon pour la moyenne Nous venons de faire un test z pour 1 échantillon pour la moyenne : l exemple des QI Caroline Verhoeven STAT-I301 23 / 59

2. Tests statistiques 1. Test t pour 1 échantillon Test t pour 1 échantillon : Exemple Exemple 6 Retournons à l exemple 4 Question : Les jeunes gymnastes sont elles plus petites que les jeunes filles de leur age? Taille moyenne des jeunes filles de 15 ans µ 0 = 161cm, σ 0 pas connu On considère un échantillon de 7 gymnastes On a x = 146,8cm et s = 8,5cm Cette différence est-elle significative à un seuil α = 0,05? Caroline Verhoeven STAT-I301 24 / 59

2. Tests statistiques 1. Test t pour 1 échantillon Test t pour 1 échantillon : Principe But : Vérifier que la population a une moyenne µ 0, spécifiée à l avance Formulation des hypothèses : H 0 : µ = µ 0 vs H a : µ > µ 0 (ou H a : µ < µ 0, ou H a : µ µ 0 ) Calcul de la mesure statistique t = x µ 0 s/ N, T = X µ 0 s/ N t(df = N 1) Calcul de la valeur p Si H a : µ > µ 0, alors p = P(T t) µ < µ 0, alors p = P(T t) µ µ 0 : si x µ 0, alors p = 2P(T t) si x µ 0, alors p = 2P(T t) p 2 p 2 t Caroline Verhoeven STAT-I301 25 / 59

2. Tests statistiques 1. Test t pour 1 échantillon Test t pour 1 échantillon : Résolution de l exemple Exemple 6 Nous voulons conclure à partir d un échantillon de 7 gymnastes, si les gymnastes de 15 ans sont en moyenne plus petites que la moyenne des jeunes filles de leur âge. Formulation de l hypothèse : H 0 : µ gym = µ 0 et H a : µ gym < µ 0 µ 0 = 161cm, x = 146,8cm et s = 8,5cm Calcul de la mesure statistique : t = x µ 0 s/ N = 4,42 0,3 La variable T t(df = 6) Calcul de la valeur p : p = P(T 4,42) = 0,0024 < α = 0,05 0,2 0,1 p 5t 1,94 5 Caroline Verhoeven STAT-I301 26 / 59

2. Tests statistiques 2. Tests z pour les proportions Test z pour 1 échantillon : Exemple Exemple 7 Dans une étude de 1991, on a regardé si les individus nés au 4ème trimestre avait une probabilité moindre de jouer en Ligue Nationale de Hockey canadienne On s attend à une proportion π 0 = 0,25 de joueurs nés au 4ème trimestre N = 388 joueurs canadiens sont inscrits sur la liste de la Ligue en 1989 69 de ces joueurs sont nés au 4ème trimestre On a donc p = 0.178 A-t-on moins de joueurs nés au 4ème trimestre à un seuil significatif α = 0,05? Caroline Verhoeven STAT-I301 27 / 59

2. Tests statistiques 2. Tests z pour les proportions Test z pour 1 échantillon : Principe But : Décider si la proportion de la population qui satisfait à une certaine caractéristique correspond à une proportion π 0, spécifiée à l avance Formulation des hypothèses H 0 : π = π 0, H a : π > π 0 (ou π < π 0 ou π π 0 ) Calcul de la mesure statistique Z N(0,1) z = p π 0 π 0 (1 π 0 ) N Caroline Verhoeven STAT-I301 28 / 59

2. Tests statistiques 2. Tests z pour les proportions Caroline Verhoeven STAT-I301 29 / 59 On rejette H au niveau α = 0,05 Test z pour 1 échantillon : Résolution de l exemple Exemple 7 A-t-on moins de joueurs nés au 4ème trimestre à un seuil significatif α = 0,05? Formulation des hypothèses H 0 : π = π 0 = 0,25, H a : π < π 0 p = 0,178, N = 388 Calcul de la mesure statistique Calcul de la valeur p z = p π 0 π 0 (1 π 0 ) N = 3,28 p = P(Z 3,28) = 0,0005

2. Tests statistiques 2. Tests z pour les proportions Test z pour 1 échantillon : Conditions Conditions sur les données La population doit être beaucoup plus grande que l échantillon L échantillon ne peut pas être biaisé Nπ 0 10 et N(1 π 0 ) 10 Caroline Verhoeven STAT-I301 30 / 59

2. Tests statistiques 3. Test t pour échantillons appariés Test t pour échantillon appariés : Exemple Exemple 8 On fait une étude pour voir l effet d un traitement contre l hypertension On considères N = 5 individus auxquels on donne dans un 1 er temps un placebo et dans un 2 nd temps un antihypertenseur Voici les résultats : patient placebo traitement différence 1 16 14 2 2 18 15 3 3 17 17 0 4 16 17-1 5 18 17 1 La différence est elle significative au niveau α = 0,05? Caroline Verhoeven STAT-I301 31 / 59

2. Tests statistiques 3. Test t pour échantillons appariés Test t pour échantillons appariés But : Tester si la moyenne reste la même ou non pour les mêmes sujets dans des conditions différentes x (1) j : 1ère mesure du sujet ; j x (2) j : 2ème mesure du sujet j d j = x (1) j x (2) j, d :moyenne des d j Equivalent à un test t pour 1 échantillon avec les d j Formulation des hypothèses : H 0 : δ = µ 1 µ 2 = 0 vs H a : δ > 0 (ou δ < 0 ou δ 0) Calcul de la mesure statistique t = T t(df = N 1) d s d / N, s2 d = 1 N 1 N (d j d) 2 j=1 Caroline Verhoeven STAT-I301 32 / 59

2. Tests statistiques 3. Test t pour échantillons appariés Test t pour échantillons appariés : Résolution de l exemple I Exemple 8 Regardons nos hypertendus d = 1, s d = 1,58 Formulation de l hypothèse : H 0 : δ = 0, H a : δ 0 Calcul de la mesure statistique : T t(df = 4) t = d s d / N = 1,41 Caroline Verhoeven STAT-I301 33 / 59

2. Tests statistiques 3. Test t pour échantillons appariés Test t pour échantillons appariés : Résolution de l exemple II Exemple 8 T t(df = 4) Calcul de la valeur p t = d s d / N = 1,41 p = P(T 1,41) = 0,23 On ne rejette pas H 0 Caroline Verhoeven STAT-I301 34 / 59

2. Tests statistiques 3. Test t pour échantillons appariés Test t pour échantillons appariés : Conditions Conditions sur les données Les sujets doivent être sélectionnés de manière indépendante Les échantillons ne peuvent pas être biaisés Les données doivent être normalement distribuées ou N 15 Caroline Verhoeven STAT-I301 35 / 59

2. Tests statistiques 4. Test t pour 2 échantillons indépendants Test t pour 2 échantillons indépendants : Exemple Exemple 9 En 1996, Solberg a étudié l impact de la pratique de la méditation sur les performances en tir. Un groupe de N 1 = 13 tireurs a suivi un entraînement à la méditation pendant 7 semaines Un groupe de N 2 = 12 tireurs n a pas suivi cet entraînement On enregistre les résultats de ces tireurs en compétition avant et après l intervention L impact est-il significatif au seuil α = 0,05? Moyenne des différences de points (avant-après) pour le groupe 1 : x 1 = 0,6 et s 1 = 2,16 Moyenne des différences de points (avant-après) pour le groupe 2 : x 2 = 1,5 et s 2 = 2,70 Caroline Verhoeven STAT-I301 36 / 59

2. Tests statistiques 4. Test t pour 2 échantillons indépendants Test t pour 2 échantillons indépendants : principe But : Conclure si les moyennes µ 1 et µ 2 de 2 populations sont égales ou non Formulation des hypothèses : H 0 : µ 1 = µ 2 vs H a : µ 1 > µ 2 (ou µ 1 < µ 2, ou µ 1 µ 2 ) On considère 2 échantillons de N 1 et N 2 sujets Caroline Verhoeven STAT-I301 37 / 59

2. Tests statistiques 4. Test t pour 2 échantillons indépendants Test t pour 2 échantillons indépendants : calcul I Calcul de la mesure statistique Si σ 2 1 = σ2 2 (Homocédasticité) : t = T t(df = N 1 + N 2 2) x 1 x 2 ( (N 1 1)s 2 1 +(N 2 1)s 2 2 N 1 +N 2 2 ) 1 N 1 + 1 N 2 Caroline Verhoeven STAT-I301 38 / 59

2. Tests statistiques 4. Test t pour 2 échantillons indépendants Test t pour 2 échantillons indépendants : calcul II Calcul de la mesure statistique Si σ 2 1 σ2 2 (Hétérocédasticité) : T t df = t = x 1 x 2 s 2 1 N 1 + s2 2 N 2 ( s 2 1 N 1 + s2 2 N 2 ) 2 ( ) s 2 2/(N1 ( ) 1 s 2 2/(N2 N 1 1)+ 2 N 2 1) Caroline Verhoeven STAT-I301 39 / 59

2. Tests statistiques 4. Test t pour 2 échantillons indépendants Interlude : Tester l égalité des variances Test préliminiare : Test de Fisher Formulation des hypothèses : H 0 : σ 2 1 = σ2 2, H a : σ 2 1 σ2 2 ou H 0 : σ 2 1 /σ2 2 = 1, H a : σ 2 1 /σ2 2 1 Calcul de la mesure statistique f = s2 1 s 2 2 F F(N 1 1,N 2 1) F(ν 1,ν 2 ) : distribution de Fisher avec ν 1 et ν 2 degrés de liberté 0.8 0.6 0.4 0.2 0 2 4 6 8 10 Distribution de Fisher F(12,12) F(4,4) F(15,5) Caroline Verhoeven STAT-I301 40 / 59

2. Tests statistiques 4. Test t pour 2 échantillons indépendants Test de l égalité des variances : Exemple I Exemple 9 Retournons à nos tireurs Formulation de l hypothèse : Le groupe 1 : N 1 = 13, s 1 = 2,16 Le groupe 2 : N 2 = 12, s 2 = 2,7 Ces 2 variances sont elles différentes à un seuil significatif α = 0,05? Caroline Verhoeven STAT-I301 41 / 59

2. Tests statistiques 4. Test t pour 2 échantillons indépendants Test de l égalité des variances : Exemple I Exemple 9 Calcul de la mesure statistique : f = (2,16)2 (2,70)2 = 0,64 f = (2,70) 2 (2,16) 2 = 1,56 F F(11,12) On regarde si f > 97,5ème centile. f = 1,56 < F 11;12;0,975 = 3,321 0,8 0,4 On ne rejette pas H 0 1 f F 11,12, 97.5 Α 2 Caroline Verhoeven STAT-I301 42 / 59

2. Tests statistiques 4. Test t pour 2 échantillons indépendants Test t pour 2 échantillons indépendants : Résolution de l exemple I Exemple 9 La méditation a-t-elle un impact sur la performance des tireurs? Formulation des hypothèses : H 0 : µ 1 = µ 2, H a : µ 1 µ 2 N 1 = 13, x 1 = 0,6 et s 1 = 2,16 N 2 = 11, x 1 = 1,5 et s 1 = 2,70 Caroline Verhoeven STAT-I301 43 / 59

2. Tests statistiques 4. Test t pour 2 échantillons indépendants Test t pour 2 échantillons indépendants : Résolution de l exemple II Exemple 9 Calcul de la mesure statistique : t = (N 1 1)s 2 1 +(N 2 1)s 2 2 N 1 +N 2 2 x 1 x 2 ( = 2,156 1 + 1 N1 N2) T t(df = N 1 + N 2 2) = t(df = 23) Calcul de la valeur p p = 2P(T 2,156) = 0,041 On rejette H 0 au seuil α = 0,05 Caroline Verhoeven STAT-I301 44 / 59

2. Tests statistiques 4. Test t pour 2 échantillons indépendants Test t pour 2 échantillons indépendants : conditions Conditions sur les données Les échantillons doivent être indépendants Les échantillons ne peuvent pas être biaisés Les données doivent être normalement distribuées pour les 2 échantillons ou N 1 et N 2 doivent être assez grands Si la distribution n est pas trop différente de la normale, N 1 5 et N 2 5 est suffisant Il faut vérifier si σ 1 = σ 2 ou pas Caroline Verhoeven STAT-I301 45 / 59

Tableau de contingence I 2. Tests statistiques 5. Test du χ 2 Un tableau de contingence sert à représenter 2 variables qualitatives de manière à voir si elles sont reliées Exemple 10 L IRM est une technique qui permet de détectés des signaux dans le cerveaux associés avec des dysfonctionnements cognitifs. En 1997, 2 chercheurs se sont demandés si on pouvait détecter des liaisons cérébrales chez des gens subissant fréquemment des chocs à la tête par contact. Ils ont convaincu 18 joueurs de foot américain, 15 footballeurs et 20 non sportifs de passer une IRM et on relevé la présence (ou non) de ces signaux Caroline Verhoeven STAT-I301 46 / 59

Tableau de contingence II 2. Tests statistiques 5. Test du χ 2 Exemple 10 Le résultat signal foot am. foot contrôle oui 7 11 5 non 11 4 15 Totaux marginaux des lignes oui 7+11+5=23 non 11+4+15=30 Totaux marginaux des colonnes foot am. 7+11=18 foot 11+4=15 contrôle 5+15=20 Caroline Verhoeven STAT-I301 47 / 59

2. Tests statistiques 5. Test du χ 2 Tableau de contingence III Exemple 10 La table de contingence signal foot am. foot contrôle total oui 7 11 5 23 non 11 4 15 30 total 18 15 20 53 Caroline Verhoeven STAT-I301 48 / 59

Test du χ 2 : Exemple I 2. Tests statistiques 5. Test du χ 2 Exemple 11 Lien entre les signaux sur l IRM et les chocs à la tête? Les données donnent signal foot am. foot contrôle total oui 7 11 5 23 non 11 4 15 30 total 18 15 20 53 Population 1 : foot am., p 1,oui 7 18 = 0,389 Population 2 : foot, p 2,oui = 11 15 = 0,733 Population 3 : contrôle, p 3,oui = 5 20 = 0,25 H 0 : π 1,oui = π 2,oui = π 3,oui H a : Il y a un lien entre les caractéristiques Caroline Verhoeven STAT-I301 49 / 59

Test du χ 2 : Exemple II 2. Tests statistiques 5. Test du χ 2 H 0 : π 1,oui = π 2,oui = π 3,oui Si H 0 vrai, On s attend à ce que p 1,oui = p 2,oui = p 3,oui. A quoi ressemblerait le tableau? signal foot am. foot contrôle total oui e 11 e 12 e 13 23 non e 21 e 22 e 23 30 total 18 15 20 53 e 11 = 18 23 53 e 11 18 = e 12 15 = e 13 20 = 23 53 e 21 18 = e 22 15 = e 23 20 = 30 53 = 7,81 e 12 = 15 23 53 = 6,51 Caroline Verhoeven STAT-I301 50 / 59

Test du χ 2 : Exemple III 2. Tests statistiques 5. Test du χ 2 Le tableau attendu serait donc : signal foot am. foot contrôle total oui 7,81 6,51 8,68 23 non 10,19 8,49 11,32 30 total 18 15 20 53 Le tableau observé et le tableau attendu sont ils significativement différents? Caroline Verhoeven STAT-I301 51 / 59

test du χ 2 : Principe I 2. Tests statistiques 5. Test du χ 2 But : Conclure si il y a un lien ou non entre 2 caractéristiques Formulation des hypothèses : H 0 : π 1 = π 2 = = π c H a : une de ces proportion est différentes des autres Calcul de la mesure statistique : Considérons le tableau de contigence observé : C 1 C 2... C c total R 1 o 11 o 12... o 1c o 1 R 2 o 21 o 22... o 2c o 2...... R r o r1 o r2... o rc o r total o 1 o 2... o c o e ij = o i o j o Caroline Verhoeven STAT-I301 52 / 59

Test du χ 2 : Principe II 2. Tests statistiques 5. Test du χ 2 Tableau des valeurs attendue (expected values) si H 0 est vraie C 1 C 2... C c total R 1 e 11 e 12... e 1c o 1 R 2 e 21 e 22... e 2c o 2...... R r e r1 e r2... e rc o r total o 1 o 2... o c o χ 2 = r i=1 j=1 c (o ij e ij ) 2 χ 2 χ 2 ((c 1)(r 1)) On rejette H 0 si χ 2 plus grand qu un certain seuil On ne rejette pas H 0 si χ 2 plus petit que ce seuil e ij Caroline Verhoeven STAT-I301 53 / 59

Test du chi 2 : Principe III 2. Tests statistiques 5. Test du χ 2 La distribution χ 2 (df = k) 1.0 0.8 0.6 0.4 0.2 k = 1 k = 3 k = 5 0 2 4 6 8 10 Caroline Verhoeven STAT-I301 54 / 59

2. Tests statistiques 5. Test du χ 2 Test du χ 2 : Résolution de l exemple I Exemple 11 Y a-t-il une différence entre les 2 tableaux au seuil significatif α = 0,05 foot am. foot contrôle total oui 7 11 5 23 Le tableau observé signal non 11 4 15 30 total 18 15 20 53 Le tableau attendu signal foot am. foot contrôle total oui 7,81 6,51 8,68 23 non 10,19 8,49 11,32 30 total 18 15 20 53 Caroline Verhoeven STAT-I301 55 / 59

2. Tests statistiques 5. Test du χ 2 Test du χ 2 : Résolution de l exemple II Exemple 11 La différence entre les 2 tableaux o ij e ij foot am. foot contrôle total oui -0,81 4,49-3,68 0 signal non 0,81-4,49 3,68 0 total 0 0 0 0 Calcul de la statistique : χ 2 = ( 0,81)2 7,81 + (4,49)2 6,51 + ( 3,68)2 + (0,81)2 8,68 10,19 + ( 4,49)2 + (3,68)2 8,49 11,32 = 8,32 χ 2 χ 2 (df = (3 1)(2 1)) = χ 2 (2) Le 95ème centile de la distribution χ 2 : 5,99 On rejette H 0 Caroline Verhoeven STAT-I301 56 / 59

2. Tests statistiques 5. Test du χ 2 Test du χ 2 : conditions Le test du χ 2 est un test non paramétrique : pas de supposition sur la distribution de la population Conditions sur les données : Pas plus d 1 sur 5 e ij < 5 Aucun e ij < 1 Caroline Verhoeven STAT-I301 57 / 59