Psy1004 Section 13: Puissance d'un test

Documents pareils
Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

TESTS D'HYPOTHESES Etude d'un exemple

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Régression linéaire. Nicolas Turenne INRA

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés


Principe d un test statistique

Evaluation de la variabilité d'un système de mesure

Chapitre 3. Les distributions à deux variables

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Faciliter l adhésion à une complémentaire santé

Régime de retraite patronal-syndical (Québec) de l'association internationale des machinistes (A.I.M.)

LE PROBLÈME DE RECHERCHE ET LA PROBLÉMATIQUE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

D'UN THÉORÈME NOUVEAU

Item 169 : Évaluation thérapeutique et niveau de preuve

SONDAGE SUR LA CULTURE FINANCIERE D UNE POPULATION D INTERNAUTES MAROCAINS

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Par combien de zéros se termine N!?

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Comparaison de fonctions Développements limités. Chapitre 10

Analyse de la variance Comparaison de plusieurs moyennes

Coûts, avantages et inconvénients des différents moyens de paiement

La Transparence des Coûts en Microfinance Mise en oeuvre de la Transparence en Afrique de L Ouest

Synthèse enquête CESC Pratique d'internet, du téléphone portable et des jeux vidéo

Statistiques 0,14 0,11

Une réponse (très) partielle à la deuxième question : Calcul des exposants critiques en champ moyen

C R É D I T A G R I C O L E A S S U R A N C E S. Des attitudes des Européens face aux risques

La culture financière des Français

S initier aux probabilités simples «Un jeu de cartes inédit»

La Lettre d Olivier Anger

Probabilités III Introduction à l évaluation d options

Le taux de retour au joueur, un des facteurs de risque du jeu problématique liés à l'offre de jeu

LA SURVEILLANCE ET LE SUIVI DE L'ENVIRONNEMENT. Pierre Guimont Conseiller en environnement Unité Environnement Division Équipement, Hydro-Québec

GEA II Introduction aux probabilités Poly. de révision. Lionel Darondeau

Participation des employeurs publics au financement de la protection sociale complémentaire. L analyse de la MNT sur le projet de décret

DETERMINER LA LARGEUR DE PAGE D'UN SITE et LES RESOLUTIONS d'ecran

Copropriété: 31, rue des Abondances Boulogne-Billancourt

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

CAPTEURS - CHAINES DE MESURES

6. Les différents types de démonstrations

4. L assurance maladie

choisir H 1 quand H 0 est vraie - fausse alarme

Un moyen simple d'être plus favorable aux familles Les points les plus importants du Family Score en un coup d'œil

Rapidolect Les Productions de la Columelle ( ) Page 1

Etude sur l équipement des TPE / PME. en complémentaire santé

Cours de bridge. Guillaume Lafon

Royal (Jordan) Inc RE/MAX. Marché d acheteur. Marché de vendeur. C est lorsque la demande diminue que le surplus

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12

Introduction à la théorie des files d'attente. Claude Chaudet

Complexité. Licence Informatique - Semestre 2 - Algorithmique et Programmation

OPTIMISATION À UNE VARIABLE

Une étude de différentes analyses réalisées par le BIT

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

FAQ Conditions de candidature... 2 Procédure de candidature et remise de prix... 2 Le dossier de candidature... 3

INF2015 Développement de logiciels dans un environnement Agile. Examen intra 20 février :30 à 20:30

FICHE 1 Fiche à destination des enseignants

LE GUIDE COMPLET PRETS A PARIER

COURS GESTION FINANCIERE A COURT TERME SEANCE 2 COUVERTURE DU BESOIN DE FINANCEMENT CHOIX DU NIVEAU DU FONDS DE ROULEMENT

Série TD 3. Exercice 4.1. Exercice 4.2 Cet algorithme est destiné à prédire l'avenir, et il doit être infaillible! Exercice 4.3. Exercice 4.

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Perrothon Sandrine UV Visible. Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6

Introduction à la Statistique Inférentielle

Raisonnement par récurrence Suites numériques

Introduction à l approche bootstrap

Est-il possible d'être sur la 1ère page de Google?

Les effets de température

Immersion - Vision 3D dans la RV.

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Programme de réhabilitation respiratoire

POKER ET PROBABILITÉ

Cours 9 : Plans à plusieurs facteurs

Théorie des sondages : cours 5

RETIRER DE L ARGENT DE VOTRE SOCIÉTÉ

Fonctions de plusieurs variables

ELEC2753 Electrotechnique examen du 11/06/2012

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

Pourquoi l apprentissage?

Association des juristes de justice. Lignes directrices sur les médias sociaux

LES DECIMALES DE π BERNARD EGGER

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Calcul élémentaire des probabilités

En face du commanditaire, on met un chef de projet qui connait le domaine (banque, administration, etc.)

La correction des erreurs d'enregistrement et de traitement comptables

DEVENEZ UN POKER-KILLER AU TEXAS HOLD EM!

A. Définition et formalisme

Document de réflexion - RACHETER OU NE PAS RACHETER?

A toute personne active dans le domaine des assurances, qu elle soit du service interne ou externe.

Introduction a l'algorithmique des objets partages. Robert Cori. Antoine Petit. Lifac, ENS Cachan, Cachan Cedex. Resume

Bien comprendre et bien choisir votre complémentaire santé

L endettement chez les jeunes Rapport final

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Annexe A de la norme 110

Protection sociale complémentaire : les dispenses d'affiliation de vos salariés (retraite, prévoyance, mutuelle)

A.-M. Cubat PMB - Import de notices à partir d un tableur Page 1 Source :

Rapport d'expérience final

Chapitre 1 Régime transitoire dans les systèmes physiques

Transcription:

Psy1004 Section 13: Puissance d'un test Plan du cours: Varia 13.1: Efficacité d'un test 13.2: Puissance d'un test 13.3: Comment rendre un test plus puissant 13.4: Méthode de Cohen 13.5: Exemples 13.6: Synthèse des différents tests statistiques Période de questions Disponible sur: http://mapageweb.umontreal.ca/cousined/home/course/psy1004

Varia L'examen a lieu au prochain cours. Pour l'examen: L'examen débute à 13h00 et se termine à 16h00. Une feuille 8 ½ x 5 ½ avec des notes personnelles est permise. Ainsi que la calculatrice. PSY1004 A02 - Section 13 p. 2

Varia PSY1004 A02 - Section 13 p. 3

13.1: Efficacité d'un test (1/4) Quel est le but d'un test statistique? Rendre une décision à savoir si une hypothèse semble vraie ou semble fausse: Dans la réalité, H 0 est: basé sur un échantillon: VRAI FAUX Décision: non-rejet H 0 aucun effet sig. erreur β rejet de H 0 erreur α effet significatif Sera publié! Quelle est la procédure de décision? PSY1004 A02 - Section 13 p. 4 Mesurer une statistique de la population Connaître comment varie cette statistique (les postulats) dans le but de fixer un seuil de décision Rejet de H 0 si une formule impliquant la statistique est supérieure au seuil de décision: on confronte la réalité avec nos attentes; La dernière étape fait le lien entre l'empirique et le théorique.

13.1: Efficacité d'un test (2/4) Par exemple, pour un test sur une moyenne: Population N(100,10) Question: "Est-ce que la moyenne est de 100?" PSY1004 A02 - Section 13 p. 5 95 101 94 98 La population contient 1 million de nombres, on va en échantillonner 25. ERREUR! erreur de type I ou erreur alpha 127 Procedure: a) H 0 : µ = 100 b) α =.05 c) test t X µ d) échantillonner et rejet de H 0 si > s( α / 2) SEX Tests: 1. X = 103.948, calcul=1.89, non rejet 2. X = 98.9632, calcul=0.68, non rejet 8. X = 95.7251, calcul=2.22, REJET!

13.1: Efficacité d'un test (3/4) PSY1004 A02 - Section 13 p. 6 95 101 Population N(100,10) 94 98 La population contient 1 million de nombres, on va en échantillonner 25. 127 Tests: 1. X = 103.948, calcul=1.89, non rejet 2. X = 98.9632, calcul=0.68, non rejet 8. X = 95.7251, calcul=2.22, REJET! 10000. X = 101.91, calcul=1.05, non rejet Total: sur 10 000 essais, j'ai obtenu 515 rejets (soit 515 décisions erronées), soit un pourcentage de 5.15 % Ce pourcentage est très proche du seuil α. Est-ce un hasard?

13.1: Efficacité d'un test (4/4) Non. Si l'hypothèse est vraie, elle me dit exactement tout ce dont j'ai besoin pour savoir la probabilité d'obtenir une moyenne extrême. Selon le théorème central limite, une moyenne se distribue comme une distribution t de Student, ce qui permet de fixer un seuil de décision. Selon H 0 s(α) En principe, notre calcul doit donner une valeur proche de zéro. La probabilité d'elle soit plus grande qu'une valeur x est calculable puisqu'on connaît sa distribution. Dans notre cas, on veut que la probabilité qu'elle soit plus grande que s(5%) soit de 5%. Donc, s(5%) = 2.015 (si unicaudal). PSY1004 A02 - Section 13 p. 7 Le seuil α est la probabilité de faire une erreur alpha. La probabilité de faire l'erreur a résulte d'un choix éclairé.

13.2: Puissance d'un test (1/4) Quand est-il si H 0 n'est pas vrai? Population N(110,10) Question: "Est-ce que la moyenne est de 100?" PSY1004 A02 - Section 13 p. 8 111 99 108 98 La population contient 1 million de nombres, on va en échantillonner 25. ERREUR! erreur de type II ou erreur beta 127 Procedure: a) H 0 : µ = 100 b) α =.05 c) test t X µ d) échantillonner et rejet de H 0 si > s( α / 2) SEX Tests: 1. X = 117.598, calcul=9.21, rejet 2. X = 115.652, calcul=7.65, rejet 854. X = 104.442, calcul=2.04, NON REJET!

13.2: Puissance d'un test (2/4) Quand est-il si H 0 n'est pas vrai, mais de très peu? Population N(105,10) Question: "Est-ce que la moyenne est de 100?" PSY1004 A02 - Section 13 p. 9 92 95 103 98 La population contient 1 million de nombres, on va en échantillonner 25. erreur beta très commune: souvent, je conserve H 0 de façon erronée. 127 Procedure: a) H 0 : µ = 100 b) α =.05 c) test t X µ d) échantillonner et rejet de H 0 si > s( α / 2) SEX Tests: 1. X = 107.395, calcul=3.62, rejet 2. X = 105.768, calcul=2.64, rejet 3. X = 102.415, calcul=1.16, NON REJET!

13.2: Puissance d'un test (3/4) Les erreurs beta peuvent être rares ou très fréquentes, et on a peu de contrôle, car si notre hypothèse est fausse, on ne connaît pas la vraie réalité. Probabilité de faire l'erreur alpha 1 Probabilité de faire l'erreur beta si la vraie moyenne est proche de notre hypothèse (beaucoup d'erreur beta faible "puissance") PSY1004 A02 - Section 13 p. 10 Pourcentage de reje t de H 0: M oyenne = 10 0 0.8 0.6 0.4 0.2 100 102 104 106 108 110 112 114 Vraie moyenne Probabilité de faire l'erreur beta si la vraie moyenne est très différente de notre hypothèse (peu d'erreur beta bonne "puissance")

13.2: Puissance d'un test (4/4) Autrement dit: Si H 1, la vérité, est vraiment différente de H 0 : Selon H 0 s(α) H 1 Vraie distribution de notre statistique élaborée, à notre insu La probabilité de faire une erreur β est la probabilité que notre moyenne soit très basse étant donnée qu'il y a un effet. La probabilité de faire une erreur β est très faible (ici, de l'ordre de 1 %00) Si H 1, la vérité, diffère seulement légèrement de H 0 : PSY1004 A02 - Section 13 p. 11 s(α) Selon H 0 H 1 La probabilité de faire une erreur β est très grande (ici, de l'ordre de 30%), à peu prés une fois sur trois, je vais dire qu'il n'y a pas d'effet alors qu'il y a un effet.

En résumé PSY1004 A02 - Section 13 p. 12 L'erreur β est la probabilité de dire que H 0 est vraie (non rejet de H 0 ) alors qu'elle ne l'est pas. L'erreur β est difficile à évaluer car on ne sait pas, quand effet il y a, quelle est son ampleur (faible, modéré, fort). On appelle la puissance d'un test la probabilité de ne pas faire l'erreur β, c'est à dire, la probabilité de dire que H 1 est vraie (rejet de H 0 ) alors qu'elle est belle et bien vraie. Autrement dit, 1 β = puissance; si la probabilité de faire l'erreur β est de 20%, la puissance du test est de 80%. Quelle devrait être la puissance idéale d'un test? 99%, 95%, 90% i.e. la probabilité de l'erreur β 1%, 5%, 10% On recommande en générale d'avoir une puissance de 80% (évidemment, 90%, 95% et même 99% sont mieux, mais ). L'erreur α doit être contrôlé plus sérieusement que l'erreur β car dès qu'un effet est trouvé, il est publié dans les revues scientifiques. L'erreur β peut être plus tolerée car si le chercheur a la conviction d'avoir raison, il peut toujours refaire l'expérience.

Anecdote Un chercheur (Cohen) a estimé la puissance de tous les tests statistiques publiés dans l'année 1962, puis aussi en 1988. en supposant que tous les effets, s'il y en a, sont modéré, en regardant le nombre de sujets utilisé n, il obtient: que la puissance, en moyenne, était de 50%! c.à.d. que lorsqu'il y a bel et bien un effet de la variable étudiée, il existe une chance sur deux que le chercheur décide que l'effet n'est pas significatif (sur la base du test statistique). PSY1004 A02 - Section 13 p. 13 s(α) Selon H 0 H 1

13.3: Comment rendre un test plus puissant? (1/3) a) Changer le seuil α pour un seuil plus bas En rapprochant α de H 0, je réduit le risque d'erreur β, mais! le test sera moins sévère. s(10%) Selon H 0 H 1 s(5%) PSY1004 A02 - Section 13 p. 14 b) Accroître le nombre d'observation n En utilisant un n plus grand, la distribution de l'hypothèse H 0 et de l'hypothèse H 1 devient moins variable, et donc, il y a moins de chevauchement entre les deux, mais! est plus coûteux. s(α) Selon H 0 H 1

13.3: Comment rendre un test plus puissant? (2/3) c) Réduire l'erreur expérimentale En contrôlant tous les facteurs qui peuvent nuire à la concentration des sujets, en prenant le plus possible des sujets identiques (âge, heure, etc.), ou en entraînant les sujets pour qu'ils performent avec moins de variabilité. s(α) Selon H 0 H 1 PSY1004 A02 - Section 13 p. 15 d) Accroître la taille de l'effet En étudiant des effets importants, (par exemple, en changeant la difficulté, la dose, etc.), on accroît la distance entre les distributions pour H 0 et H 1, donc moins de chevauchement, mais! parfois difficile (par exemple, dans l'étude sur le stress, la performance grimpe, puis redescend; il n'y a pas d'effet plus fort qu'au niveau 3). s(α) Selon H 0 H 1

13.3: Comment rendre un test plus puissant? (3/3) Quelle méthode préférer? Accroître la taille de l'effet est la meilleure solution, mais pas toujours possible Accroître le nombre d'observation est toujours une bonne solution, et presque toujours possible (mais coûteux) Réduire l'erreur expérimental est souhaitable, mais il est difficile de prévoir toutes les causes possibles de variance entre les sujets Réduire le seuil α est non recommandé, car on troque une source possible d'erreur pour une autre PSY1004 A02 - Section 13 p. 16

13.4: Méthode de Cohen Si vous choisissez d'accroître le nombre d'observation, Cohen a développer une méthode simple pour trouver le nombre de sujets tel que la puissance soit de.80. PSY1004 A02 - Section 13 p. 17 Si vous connaissez bien le domaine de recherche: a) faites un estimé de ce que serait l'effet s'il existait; b) regardez dans la Table 7a s'il s'agit d'un effet considéré comme "petit", "moyen", ou "grand". Si vous ne connaissez pas le domaine de recherche: supposez qu'il s'agirait d'un effet "moyen", comme très souvent en psychologie. Selon votre seuil α et la taille de l'effet ("petit", "moyen", "grand"), lire dans la Table 7b le nombre de sujets requis.

13.5: Exemples (1/3) Soit une étude sur le Q.I. lors d'une période de deuil. On veut savoir si le Q.I. baisse. H 0 : Q.I. moyen = 100 H 1 : Q.I. moyen < 100 (selon des études, la maladie et le stress baisse le Q.I. de 5, donc, vous espéré un Q.I. d'à peu près 95) En regardant la table 7a, première ligne, la taille de l'effet d serait d'environ 0.50 (car l'écart type d'un test de Q.I. est toujours de 10), soit un effet moyen. PSY1004 A02 - Section 13 p. 18 En regardant la table 7b, avec α = 5% et effet moyen, il faudrait étudier 64 personnes en deuil.

13.5: Exemples (2/3) Il semble que le nombre de semaine depuis lequel la personne est en deuil ait une influence. Vous refaites donc l'expérience avec 4 durée de deuil différentes: depuis 1 semaine, depuis 2 semaines, depuis 3 semaines, et depuis 4 semaines. H 0 : µ 1sem =µ 2sem =µ 3sem =µ 4sem. H 1 : il existe au moins une paire où µ i sem µ j sem (vous vous attendez, si effet il y a, à ce genre de résultats: 94, 96, 98, et 100 de Q.I. pour les niveaux dans l'ordre). Pour utiliser la table 7a avec les ANOVA, il faut calculer PSY1004 A02 - Section 13 p. 19 a) quelles serait l'erreur expérimentale, σ S A, facile ici puisque l'écart type lors d'un test de Q.I. est toujours de 10. b) quelles serait l'écart type des prédictions (94, 96, 98, 100). Avec une calculatrice, on obtient: 2.58. La valeur f serait donc: 2.58 / 10 = 0.258, soit un effet "large". Dans la table 7b avec une ANOVA à 4 groupes, on trouve 18 sujets par groupe (soit 72 personnes en deuil, peut être difficile à trouver ).

13.5: Exemples (3/3) Vous voulez plutôt connaître de combien le Q.I. baisse pour chaque semaine de convalescence après le deuil. Pour ce faire, vous faîtes une étude de corrélation et extrayez la pente de la droite de régression. H 0 : r deuil, QI = 0 H 1 : r deuil, QI 0 (s'il y avait un effet, l'effet la corrélation serait autour de.20, selon ce que vous savez du domaine). Dans la Table 7a, on voit qu'un r de.20 est considéré "moyen" PSY1004 A02 - Section 13 p. 20 Dans la Table 7b, pour un r moyen, avec α =.05, on trouve qu'il faut étudier environ 85 personnes au total pour établir si le r est significatif ou pas avec une puissance de.80.

13.6: Synthèse des différents tests statistiques Voir Tableau de synthèse PSY1004_1a13 PSY1004 A02 - Section 13 p. 21

Période de questions PSY1004 A02 - Section 13 p. 22

Merci. PSY1004 A02 - Section 13 p. 23