Méthodologie de la recherche. Université Lille 2

Méthodologie de la recherche Université Lille 2

Plan du cours 1. La loi normale et l erreur l d éd échantillonnage 2. Comparaison de deux échantillons 3. Comparaison de trois échantillons ou plus 4. Corrélation et régression

Plan du cours 1. La loi normale et l erreur l d éd échantillonnage 1. La loi normale 2. Théorème de la limite centrale 3. Tests d hypothèses d et inférence statistique 4. Interprétation 1. Deux types d erreurd 2. La puissance d un d test

Quelques références www.amazon.fr www.humankinetics.com

Et sites Internet www.sportsci.org

Quelques logiciels Statistica (www.statsoft.com) SPSS (www.spss.com) Sigmastat (www.spss.com) etc

Deux objectifs Obtenir une information descriptive sur la population à partir de laquelle l échantillon a été constitué Tester des hypothèses

Distribution de la taille des martiens Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw Hill, New York, 1996.

Distribution de la taille des martiens 68% Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw Hill, New York, 1996. Effectif de la population = 200 sujets Moyenne de la taille de la population = 40 cm Écart type de la taille de la population = 5 cm

Distribution de la taille des martiens 68% 95% Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw Hill, New York, 1996. Effectif de la population = 200 sujets Moyenne de la taille de la population = 40 cm Écart type de la taille de la population = 5 cm

Cote Z (ou Score Z) Z = x " µ Z = x! x! sd Pour une Population Pour un Échantillon

Cote Z (ou Score Z) Z = x " µ Z = 46! 40! 5 µ = 40 cm Soit Z = 1.2 σ = 5 cm

Emprunté à Vincent WJ. Statistics in kinesiology. Human Kinetics, Champaign, Illinois, 1999.

Population : Groupe de personnes (ou autre) qui ont au moins une caractéristique en commun. Définie par deux paramètres : µ et σ Exemple : hommes âgés de 31 à 40 ans qui ne pratiquent aucune activité physique. Varier genre, âge ou niveau d activité physique Échantillon : Groupe de personnes (ou autre) tirées de la population. Définie par deux statistiques : ξ et SD Exemple : réentraînement post-chirurgical du membre inférieur

Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw Hill, New York, 1996. Population n = 200 µ = 40 cm σ = 5 cm Échantillon 1 n = 10 ξ = 41.5 cm SD = 5 cm

Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw Hill, New York, 1996. Population n = 200 µ = 40 cm σ = 5 cm Échantillon 2 n = 10 ξ = 36 cm SD = 5 cm

Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw Hill, New York, 1996. Population n = 200 µ = 40 cm σ = 5 cm Échantillon 3 n = 10 ξ = 39.5 cm SD = 5 cm

Emprunté à Glantz SA. Introduction aux biostatistiques. McGraw Hill, New York, 1996. Population n = 200 µ = 40 cm σ = 5 cm 10 16 possibilités n = 10 ξ = 40 cm Suit loi normale

Théorie de la limite centrale La distribution des moyennes d éd échantillons est approximativement normale, quelle que soit la population à partir de laquelle les échantillons sont constitués. La moyenne de l ensemble l de toutes les moyennes d échantillons possibles est égale à la moyenne de la population.

Hypothèse nulle (notée H 0 ) Il n existe aucune relation ou aucune différence entre les groupes. Exemple : il n existe pas de différence de force maximale des membres inférieurs entre les garçons et les filles de 10 ans. Hypothèse alternative (notée H 1 ) Il existe une relation ou une différence entre les groupes. Exemple : il existe une différence de force maximale des membres inférieurs entre les garçons et les filles de 10 ans.

Sous H 0 : Garçons et filles appartiennent à la même population. Les différences observées sont dues à l erreur l d éd échantillonnage Sous H 1 : Garçons et filles appartiennent à deux populations distinctes Les différences observées sont dues à l erreur l d éd échantillonnage et à la différence imputable au genre QUELLE LIMITE?

EXEMPLE : Consommation annuelle d anti-inflammatoires d dans deux populations différentes (Rugbymen vs Footballeurs) Deux échantillons R1 et F1 : Différence D1. Deux échantillons R2 et F2 : Différence D2. Et ainsi de suite

Rugby vs Footballeurs: même population?? Rugbymen Dosage (mg) Footballeurs Dosage (mg) R-F Dosage (mg) R1 F1 D1 R2 F2 D2 R3 F3 D3 R4 F4 D4 R5 F5 D5 R6 F6 D6 R. F. D. R100 F100 D100

Théorie de la limite centrale La distribution des différences (D1, D2,, Dn) suit une loi normale La moyenne de toutes les différences est égale à la différence moyenne entre les deux populations.

Si Si la la population population est est la differente même F R E Q U E N C E S Proche 0 VALEURS DES DIFFERENCES 0

Emprunté à Vincent WJ. Statistics in kinesiology. Human Kinetics, Champaign, Illinois, 1999. La différence entre les deux populations est nulle Erreur d éd échantillonnage : même s il s n y n y pas de différence entre les deux populations, la probabilité de trouver Z = 0 est très faible

H 1 H 0 H 1 Existence d un % d erreur

Deux types d erreur d statistique Erreur de type I (ou de première espèce, ou faux positif) L expérimentateur conclue à une différence entre les groupes alors qu en réalité il n y n y en a pas. Risque α (5%, ou 0.05) Erreur de type II (ou de seconde espèce, ou faux négatif) L expérimentateur conclue à l absence l de différence entre les groupes alors qu en réalité il y en a une. Risque β (20%, ou 0.20)

Réalité H 0 est vraie H 0 est fausse H 0 est acceptée H 0 est rejetée Conclusion correcte Erreur de type I Erreur de type II Conclusion correcte

α et β sont déterminés en fonction du risque d erreur qui est le moins coûteux. Qu est ce qui est le plus grave : accepter l hypothèse nulle alors qu elle est fausse, ou la rejeter alors qu elle est vraie?

Sources d erreurd Type I Erreur de mesure Échantillon non aléatoire α trop grand (0.10) Biais induit par le chercheur Utilisation incorrecte d und test unilatéral Type II Erreur de mesure β trop petit (pas assez sujets) α trop petit (0.01) Traitement mal appliqué

Sources d erreurd Type I Erreur de mesure Échantillon non aléatoire α trop grand (0.10) Biais induit par le chercheur Type II Erreur de mesure β trop petit (pas assez sujets) α trop petit (0.01) Traitement mal appliqué

La puissance d un d test statistique Capacité de rejeter l hypothèse l nulle lorsqu elle est fausse (évite de commettre une erreur de type 2) Puissance = 1 - β (soit 0.80, ou 80%) Paramètres de la puissance : la taille de l él échantillon l effet minimum recherché la variabilité du paramètre mesuré le risque α retenu (5%, 0.05)

Intérêt de la puissance statistique Contrôler le risque de commettre une erreur de type II Estimer le nombre de sujets nécessaires pour garantir une puissance supérieure ou égale à 80% (comité d éd éthique, organismes subventionnaires)