Méthodologie de la recherche. Université Lille 2

Documents pareils
Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Analyse de la variance Comparaison de plusieurs moyennes

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Probabilités III Introduction à l évaluation d options

Restaurer la confiance? Etudes Empiriques Conclusion et ouverture

Consolidation de fondamentaux

TESTS D'HYPOTHESES Etude d'un exemple

Il y a trois types principaux d analyse des résultats : l analyse descriptive, l analyse explicative et l analyse compréhensive.

MATHS FINANCIERES. Projet OMEGA

AJO/ BJO/ Retina Oct 2014 Par Wilfried Minvielle

Principe d un test statistique

Web Science. Master 1 IFI. Andrea G. B. Tettamanzi. Université de Nice Sophia Antipolis Département Informatique andrea.tettamanzi@unice.

Consolidation de fondamentaux

Annexe. Système de primes pour les animateurs d AGPA. Adding a bonus for savings performance

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Disparités entre les cantons dans tous les domaines examinés

Présentation de la démarche et méthodologie qualitative Claire Boileau Anthropologue


Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Module d Electricité. 2 ème partie : Electrostatique. Fabrice Sincère (version 3.0.1)

NOM : Prénom : Date de naissance : Ecole : CM2 Palier 2

La nouvelle planification de l échantillonnage

Coûts, avantages et inconvénients des différents moyens de paiement

Biostatistiques : Petits effectifs

Item 169 : Évaluation thérapeutique et niveau de preuve

Format de l avis d efficience

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Lecture critique et pratique de la médecine

Document d orientation sur les allégations issues d essais de non-infériorité

Introduction aux Statistiques et à l utilisation du logiciel R

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

DP 500/ DP 510 Appareils de mesure du point de rosée mobiles avec enregistreur

EVOLUTION DE L'ÂGE DE LA RETRAITE : IMPACT SUR LES RÉGIMES PRÉVOYANCE (Régimes collectifs de salariés)

Le chi carré. Le sommaire. Approche quantitative

SEMINAIRE REGIONAL AFRICAIN SUR LA GOUVERNANCE LOCALE Octobre 2008 a Saly Portudal - Senegal L initiative d Apprentissage Mutuel entre Pairs

Mauriac, samedi 30 mai , rue Galilée PARIS Tél. : Web : Mail : cmk@cabinetmichelklopfer.

Activité 38 : Découvrir comment certains déchets issus de fonctionnement des organes sont éliminés de l organisme

Techniques d interaction dans la visualisation de l information Séminaire DIVA

CENTRE DE POLITIQUE ET D ADMINISTRATION FISCALES

Attitude des ménages face au risque. M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014

ORGANISME DE PLACEMENT COLLECTIF DE TYPE A

L empreinte carbone des banques françaises. Résultats commentés

Modélisation géostatistique des débits le long des cours d eau.

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Article 173 de la Loi ALUR du 24 mars 2014 sur la réforme des sites et sols pollués

Introduction à la statistique non paramétrique

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Rapport de Post- Campagne 1

Pilotage de la masse salariale Déploiement de l outil de budgétisation

COMITE DEPARTEMENTAL DU TOURISME DES PYRENEES ORIENTALES

ECOLE NATIONALE SUPERIEURE DE COGNITIQUE. Paul Bui- Quang & Joachim Yerusalmi 03/01/2011

Essais cliniques de phase 0 : état de la littérature

CONSOMMATION INTERTEMPORELLE & MARCHE FINANCIER. Epargne et emprunt Calcul actuariel

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Classe de première L

Bologne à l EPFL. Réforme de Bologne Implications pour l EPFL. Prof. Dominique Bonvin, Doyen Bachelor-Master

FIPROTEC, PIPETTES CONTRE PUCES ET TIQUES :

BTS OPTICIEN LUNETIER Economie et Gestion de l Entreprise SESSION 2012

Cours de Tests paramétriques

Mr le Depanneur. Le depanneur est un membre de la disposisition de secours financier Mr le Depanneur ayant un compte depanneur actif ou approuvé.

ARRÊTÉ du. Projet d arrêté fixant le programme d'enseignement de santé et social en classe de seconde générale et technologique

SOCLE COMMUN: LA CULTURE SCIENTIFIQUE ET TECHNOLOGIQUE. alain salvadori IA IPR Sciences de la vie et de la Terre ALAIN SALVADORI IA-IPR SVT

Epargne, Retraite, Prévoyance et Santé

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

REPUBLIQUE FRANCAISE AU NOM DU PEUPLE FRANCAIS. LA COUR DE CASSATION, PREMIÈRE CHAMBRE CIVILE, a rendu l arrêt suivant :

Infospot. Les nouveaux anticoagulants oraux (NACOs) Octobre - Novembre - Decembre 2014

Clément Prudhomme, Emilie Lenel

UNE ÉVALUATION SOUS FORME NUMÉRIQUE EST-ELLE COMPARABLE À UNE ÉVALUATION DE TYPE «PAPIER-CRAYON»?

Annonces internes SONATRACH RECHERCHE POUR SON ACTIVITE COMMERCIALISATION :

Délibération n 39 Conseil municipal du 29 juin 2012

Contribution à la conception par la simulation en électronique de puissance : application à l onduleur basse tension

RAPPORT FINAL. Étude sur la littératie financière chez les jeunes POR #

PROBABILITES ET STATISTIQUE I&II

D r o i t s D r o i t s Q u i z z : i n t e r n e t t e x t e

Lignes directrices sur les modalités des interventions en prêt et en capital de la SOGEPA

Salon Progiciels 2007 Conférence «La description visuelle des flux d information» Avec le témoignage de la société

DIRECTIVES PEDAGOGIQUES CHEF(FE) DE PROJET E-BUSINESS RNCP AU NIVEAU II*

ACCOUNTING CONSULTING MANAGEMENT Cabinet d Expertise Comptable et Fiscale Audit Conseils en Management et Finance Formations Recrutements

Processus de validation des coûts à l appui de l attestation par l DPF

La conciliation bancaire

Année propédeutique santé Présentation générale du programme

1. QU'EST CE QUE LE TABLEAU DE BORD D UN PROJET?

INDIVIDUAL CONSULTANT PROCUREMENT NOTICE

Cours de méthodes de scoring

Garanties dans le secteur principal de la construction

ROLAND-GARROS DU 24 MAI AU 7 JUIN 2015 SPORTS HOSPITALITY & TRAVEL

LA MESURE DE PRESSION PRINCIPE DE BASE

Révision des équations hédoniques relatives aux prix des ordinateurs

VI. Tests non paramétriques sur un échantillon

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

A o û t Article Vedette: Marche à suivre pour réussir le développement d un produit.

Transcription:

Méthodologie de la recherche Université Lille 2

Plan du cours 1. La loi normale et l erreur l d éd échantillonnage 2. Comparaison de deux échantillons 3. Comparaison de trois échantillons ou plus 4. Corrélation et régression

Plan du cours 1. La loi normale et l erreur l d éd échantillonnage 1. La loi normale 2. Théorème de la limite centrale 3. Tests d hypothèses d et inférence statistique 4. Interprétation 1. Deux types d erreurd 2. La puissance d un d test

Quelques références www.amazon.fr www.humankinetics.com

Et sites Internet www.sportsci.org

Quelques logiciels Statistica (www.statsoft.com) SPSS (www.spss.com) Sigmastat (www.spss.com) etc

Plan du cours 1. La loi normale et l erreur l d éd échantillonnage 1. La loi normale 2. Théorème de la limite centrale 3. Tests d hypothèses d et inférence statistique 4. Interprétation 1. Deux types d erreurd 2. La puissance d un d test

Deux objectifs Obtenir une information descriptive sur la population à partir de laquelle l échantillon a été constitué Tester des hypothèses

Distribution de la taille des martiens Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw Hill, New York, 1996.

Distribution de la taille des martiens 68% Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw Hill, New York, 1996. Effectif de la population = 200 sujets Moyenne de la taille de la population = 40 cm Écart type de la taille de la population = 5 cm

Distribution de la taille des martiens 68% 95% Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw Hill, New York, 1996. Effectif de la population = 200 sujets Moyenne de la taille de la population = 40 cm Écart type de la taille de la population = 5 cm

Cote Z (ou Score Z) Z = x " µ Z = x! x! sd Pour une Population Pour un Échantillon

Cote Z (ou Score Z) Z = x " µ Z = 46! 40! 5 µ = 40 cm Soit Z = 1.2 σ = 5 cm

Emprunté à Vincent WJ. Statistics in kinesiology. Human Kinetics, Champaign, Illinois, 1999.

Emprunté à Vincent WJ. Statistics in kinesiology. Human Kinetics, Champaign, Illinois, 1999.

Plan du cours 1. La loi normale et l erreur l d éd échantillonnage 1. La loi normale 2. Théorème de la limite centrale 3. Tests d hypothèses d et inférence statistique 4. Interprétation 1. Deux types d erreurd 2. La puissance d un d test

Population : Groupe de personnes (ou autre) qui ont au moins une caractéristique en commun. Définie par deux paramètres : µ et σ Exemple : hommes âgés de 31 à 40 ans qui ne pratiquent aucune activité physique. Varier genre, âge ou niveau d activité physique Échantillon : Groupe de personnes (ou autre) tirées de la population. Définie par deux statistiques : ξ et SD Exemple : réentraînement post-chirurgical du membre inférieur

Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw Hill, New York, 1996. Population n = 200 µ = 40 cm σ = 5 cm Échantillon 1 n = 10 ξ = 41.5 cm SD = 5 cm

Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw Hill, New York, 1996. Population n = 200 µ = 40 cm σ = 5 cm Échantillon 2 n = 10 ξ = 36 cm SD = 5 cm

Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw Hill, New York, 1996. Population n = 200 µ = 40 cm σ = 5 cm Échantillon 3 n = 10 ξ = 39.5 cm SD = 5 cm

Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw Hill, New York, 1996. Population n = 200 µ = 40 cm σ = 5 cm 10 16 possibilités n = 10 ξ = 40 cm Suit loi normale

Théorie de la limite centrale La distribution des moyennes d éd échantillons est approximativement normale, quelle que soit la population à partir de laquelle les échantillons sont constitués. La moyenne de l ensemble l de toutes les moyennes d échantillons possibles est égale à la moyenne de la population.

Plan du cours 1. La loi normale et l erreur l d éd échantillonnage 1. La loi normale 2. Théorème de la limite centrale 3. Tests d hypothèses d et inférence statistique 4. Interprétation 1. Deux types d erreurd 2. La puissance d un d test

Hypothèse nulle (notée H 0 ) Il n existe aucune relation ou aucune différence entre les groupes. Exemple : il n existe pas de différence de force maximale des membres inférieurs entre les garçons et les filles de 10 ans. Hypothèse alternative (notée H 1 ) Il existe une relation ou une différence entre les groupes. Exemple : il existe une différence de force maximale des membres inférieurs entre les garçons et les filles de 10 ans.

Sous H 0 : Garçons et filles appartiennent à la même population. Les différences observées sont dues à l erreur l d éd échantillonnage Sous H 1 : Garçons et filles appartiennent à deux populations distinctes Les différences observées sont dues à l erreur l d éd échantillonnage et à la différence imputable au genre QUELLE LIMITE?

EXEMPLE : Consommation annuelle d anti-inflammatoires d dans deux populations différentes (Rugbymen vs Footballeurs) Deux échantillons R1 et F1 : Différence D1. Deux échantillons R2 et F2 : Différence D2. Et ainsi de suite

Rugby vs Footballeurs: même population?? Rugbymen Dosage (mg) Footballeurs Dosage (mg) R-F Dosage (mg) R1 F1 D1 R2 F2 D2 R3 F3 D3 R4 F4 D4 R5 F5 D5 R6 F6 D6 R. F. D. R100 F100 D100

Théorie de la limite centrale La distribution des différences (D1, D2,, Dn) suit une loi normale La moyenne de toutes les différences est égale à la différence moyenne entre les deux populations.

Si Si la la population population est est la differente même F R E Q U E N C E S Proche 0 VALEURS DES DIFFERENCES 0

Emprunté à Vincent WJ. Statistics in kinesiology. Human Kinetics, Champaign, Illinois, 1999. La différence entre les deux populations est nulle Erreur d éd échantillonnage : même s il s n y n y pas de différence entre les deux populations, la probabilité de trouver Z = 0 est très faible

H 1 H 0 H 1 Existence d un % d erreur

Plan du cours 1. La loi normale et l erreur l d éd échantillonnage 1. La loi normale 2. Théorème de la limite centrale 3. Tests d hypothèses d et inférence statistique 4. Interprétation 1. Deux types d erreurd 2. La puissance d un d test

Deux types d erreur d statistique Erreur de type I (ou de première espèce, ou faux positif) L expérimentateur conclue à une différence entre les groupes alors qu en réalité il n y n y en a pas. Risque α (5%, ou 0.05) Erreur de type II (ou de seconde espèce, ou faux négatif) L expérimentateur conclue à l absence l de différence entre les groupes alors qu en réalité il y en a une. Risque β (20%, ou 0.20)

Réalité H 0 est vraie H 0 est fausse H 0 est acceptée H 0 est rejetée Conclusion correcte Erreur de type I Erreur de type II Conclusion correcte

α et β sont déterminés en fonction du risque d erreur qui est le moins coûteux. Qu est ce qui est le plus grave : accepter l hypothèse nulle alors qu elle est fausse, ou la rejeter alors qu elle est vraie?

Sources d erreurd Type I Erreur de mesure Échantillon non aléatoire α trop grand (0.10) Biais induit par le chercheur Utilisation incorrecte d und test unilatéral Type II Erreur de mesure β trop petit (pas assez sujets) α trop petit (0.01) Traitement mal appliqué

Sources d erreurd Type I Erreur de mesure Échantillon non aléatoire α trop grand (0.10) Biais induit par le chercheur Utilisation incorrecte d und test unilatéral Type II Erreur de mesure β trop petit (pas assez sujets) α trop petit (0.01) Traitement mal appliqué

Sources d erreurd Type I Erreur de mesure Échantillon non aléatoire α trop grand (0.10) Biais induit par le chercheur Type II Erreur de mesure β trop petit (pas assez sujets) α trop petit (0.01) Traitement mal appliqué

Sources d erreurd Type I Erreur de mesure Échantillon non aléatoire α trop grand (0.10) Biais induit par le chercheur Type II Erreur de mesure β trop petit (pas assez sujets) α trop petit (0.01) Traitement mal appliqué

Plan du cours 1. La loi normale et l erreur l d éd échantillonnage 1. La loi normale 2. Théorème de la limite centrale 3. Tests d hypothèses d et inférence statistique 4. Interprétation 1. Deux types d erreurd 2. La puissance d un d test

La puissance d un d test statistique Capacité de rejeter l hypothèse l nulle lorsqu elle est fausse (évite de commettre une erreur de type 2) Puissance = 1 - β (soit 0.80, ou 80%) Paramètres de la puissance : la taille de l él échantillon l effet minimum recherché la variabilité du paramètre mesuré le risque α retenu (5%, 0.05)

Intérêt de la puissance statistique Contrôler le risque de commettre une erreur de type II Estimer le nombre de sujets nécessaires pour garantir une puissance supérieure ou égale à 80% (comité d éd éthique, organismes subventionnaires)