Chacune des valeurs d une variable en est une modalité particulière.



Documents pareils
Statistiques Descriptives à une dimension

Séries Statistiques Simples

Statistique : Résumé de cours et méthodes

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Représentation d une distribution

Annexe commune aux séries ES, L et S : boîtes et quantiles

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Statistique Descriptive Élémentaire

LES DIFFERENTS TYPES DE MESURE

Logiciel XLSTAT version rue Damrémont PARIS

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Chapitre 3 : INFERENCE

1. Vocabulaire : Introduction au tableau élémentaire

Probabilités conditionnelles Loi binomiale

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Principe d un test statistique

EXERCICES - ANALYSE GÉNÉRALE

TABLE DES MATIERES. C Exercices complémentaires 42

CHAPITRE 2. Les variables

CAPTEURS - CHAINES DE MESURES

Collecter des informations statistiques

Classe de première L

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Élément 424b Introduction à la statistique descriptive

Probabilités (méthodes et objectifs)

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

STATISTIQUES DESCRIPTIVES

Relation entre deux variables : estimation de la corrélation linéaire

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Introduction aux Statistiques et à l utilisation du logiciel R

SERIE 1 Statistique descriptive - Graphiques

Introduction à l approche bootstrap

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Estimation et tests statistiques, TD 5. Solutions

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Item 169 : Évaluation thérapeutique et niveau de preuve

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Réseau SCEREN. Ce document a été numérisé par le CRDP de Bordeaux pour la. Base Nationale des Sujets d Examens de l enseignement professionnel.

TSTI 2D CH X : Exemples de lois à densité 1

IBM SPSS Statistics Base 20

Biostatistiques : Petits effectifs

Table des matières. I Mise à niveau 11. Préface

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

3. Caractéristiques et fonctions d une v.a.

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Loi binomiale Lois normales

MATHÉMATIQUES. Mat-4104

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

La pratique du coaching en France. Baromètre 2010

Lois de probabilité. Anita Burgun

VI. Tests non paramétriques sur un échantillon

Statistiques 0,14 0,11

FORMULAIRE DE STATISTIQUES

Statistiques avec la graph 35+

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Impact du mobile banking sur les comportements d épargne et de transferts à Madagascar. Florence Arestoff Baptiste Venet

Résumé du Cours de Statistique Descriptive. Yves Tillé

9.11 Les jeux de hasard et d argent

Traitement des données avec Microsoft EXCEL 2010

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

T de Student Khi-deux Corrélation

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

Les devoirs en Première STMG

Document d orientation sur les allégations issues d essais de non-infériorité

Probabilités sur un univers fini

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Aide-mémoire de statistique appliquée à la biologie

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

quelques Repères pour Doctorants

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

Exercices sur le chapitre «Probabilités»

Bulletin d information statistique

Les probabilités. Guide pédagogique Le présent guide sert de complément à la série d émissions intitulée Les probabilités produite par TFO.

Unité E Variation et analyse statistique

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

23. Interprétation clinique des mesures de l effet traitement

LA MESURE EN PSYCHOLOGIE Didier Delignières Université Montpellier I

Précision d un résultat et calculs d incertitudes

FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1

A quels élèves profite l approche par les compétences de base? Etude de cas à Djibouti

Fluctuation d une fréquence selon les échantillons - Probabilités

Introduction à la statistique descriptive

REGARDS SUR L ÉDUCATION 2013 : POINTS SAILLANTS POUR LE CANADA

Thème 1: MÉNAGES ET CONSOMMATION

Université Paris 8 Introduction aux probabilités Licence Informatique Exercices Ph. Guillot. 1 Ensemble fondamental loi de probabilité

Observatoire Economique et Statistique d Afrique Subsaharienne

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Correction du baccalauréat ES/L Métropole 20 juin 2014

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

BACCALAURÉAT PROFESSIONNEL SUJET

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES

Transcription:

Psychologie générale Jean Paschoud STATISTIQUE Sommaire Rôle de la statistique Variables Échelles de mesure Résumer, décrire Comparer Rôle de la statistique La statistique est avant tout un outil permettant de communiquer, de synthétiser, de résumer, de comparer ou de mettre en relation des données multiples. Sans recours à la statistique, le chercheur et le praticien sont contraints à un discours approximatif qui prête à caution et à confusion. La statistique permet d instrumenter l analyse ou la communication des résultats en dépassant le sens commun. Comment situer et exprimer les résultats d un individu par rapport à un groupe ; peut on vraiment affirmer la supériorité d un groupe ; existe-t-il une relation entre les différents tests utilisés ; mesurentils la même chose ; le progrès après apprentissage est-il effectif? Variables Les données qui sont susceptibles de prendre des valeurs différentes dans une recherche, une expérience ou une enquête constituent des variables. Chacune des valeurs d une variable en est une modalité particulière. Si l on enregistre le QI en fonction de l âge et du sexe, variables sont en présence : L âge qui peut prendre plusieurs valeurs (7ans, huit ans et mois, ) ; Le sexe qui possède deux modalités : masculin ou féminin ; et les scores du test de QI ( points, 7 points, ). La variable qui constitue la réponse des sujets est appelée variable dépendante. C est cette variable que l on cherche à expliquer par les conditions de l expérience. Dans l exemple ci-dessus, on va chercher à expliquer les variations du QI en fonction du sexe ou de l âge. Ici, la variable dépendante est donc le QI. La variable expérimentale dont on postule qu elle influence les résultats de la variable dépendante est appelée variable indépendante. Sans qu il y ait nécessairement de liaison causale directe entre elles, c est cette variable qui est sensée conditionner les variations de réponse des sujets. Dans l exemple qui précède, le sexe et l âge sont supposés influencer la mesure de l intelligence. Les variables âge et sexe sont dites indépendantes. D une manière générale, une variable peut être continue, si elle peut prendre n importe quelle valeur entre deux autres. C est le cas de la taille, de l âge, de l intelligence, du temps, de l anxiété, Elle peut être discontinue, si elle présente des sauts, des ruptures dans ses modalités (classes de salaires dans la fonction publique). Elle peut être discrète, si toutes ses modalités sont des éléments séparés (sexe, origine sociale, profession, ).. Échelles de mesure Pour traiter statistiquement des données, il est indispensable de connaître les propriétés de l échelle de mesure sur laquelle les valeurs ont été enregistrées. Le type d échelle conditionne en effet le traitement ultérieur des données. Certaines opérations ne sont possibles que pour des échelles de mesure particulières. On ne peut calculer une moyenne sur des professions, on ne peut évaluer le lien entre le sexe et les choix politiques de la même manière qu entre les notes en français et en math.

Modalité F. abs. F. cum. 1 7 11 16 19 1 0 Tableau de fréquence 0 1 10 0 0 1 10 0 Histogramme 1 Histogramme Courbe 1 % 1% Courbe % Secteurs 1 1% Secteurs 0% 1 nominale si chacune de ses modalités est une simple «étiquette» permettant de qualifier une modalité de la situation expérimentale ou une réponse du sujet. On constate la présence ou l absence d une qualité, ce qui permet de catégoriser la variable en deux, trois, classes. Le sexe, le fait de consommer ou non de l alcool, la religion sont des mesures qui s inscrivent sur une échelle nominale. ordinale si ses modalités peuvent être hiérarchisées, c est-à-dire si elles présentent entre elles une relation d ordre. Cette affirmation décrit «très bien/bien/mal/très mal» mon comportement habituel ; grades militaires ; degré de scolarité ;, évaluation EVM, sont des mesures qui s inscrivent sur une échelle ordinale. d intervalle si les écarts entre les modalités sont comparables, c està-dire si les distances qui les séparent sont régulières. L échelle présente alors une certaine homogénéité, chaque valeur étant à distance fixe ou proportionnelle des autres. Les résultats d un test s inscrivent généralement dans une telle échelle de mesure. C est également le cas de la température exprimée en degré Celsius ou Fahrenheit. Échelle de rapport L échelle de rapport possède toutes les propriétés des échelles d intervalle à quoi s ajoute l existence signifiante d un zéro absolu. Ce type d échelle est toutefois rare en sciences humaines. De plus, l unité peut, ou non, avoir une signification. La mesure de la température en degré Kelvin, le temps de réaction, relèvent de cette catégorie. Dans les échelles utilisées en démographie, on peut en outre noter que l unité a une réelle signification par exemple dans le dénombrement des «âmes» d une population.. Résumer, décrire Représenter Les données brutes d une variable peuvent être résumées et présentées sous la forme d un tableau de fréquence, c est-à-dire un tableau indiquant «combien» de sujets sont concernés par chacune des modalités de la variable. La fréquence peut être absolue (nombre) ou relative (%). Pour les échelles ordinales, la fréquence peut être cumulée. Elle indique alors combien d individus sont en dessous du score mentionné. Les logiciels courants offrent plusieurs représentations des données : histogramme, diagramme en bâtons, courbe, secteur ou «pies». Le choix de la représentation dépend du type de données, mais aussi de la lisibilité du graphique. Selon la nature des données, il peut être utile de préciser l étendue des scores, c est-à-dire le minimum et le maximum réalisés. Dans l exemple ci-dessus, les scores se répartissent entre «1» et. Compte tenu de l effectif total, il n y a pas de légitimité à calculer la fréquence relative (%).

Tendance centrale Les données brutes se répartissent sur les différentes modalités. Il est utile de définir un indice traduisant la tendance générale de la distribution. Cet indice va être fonction de l échelle de mesure utilisée. Mode : modalité la plus fréquente. Médiane : modalité qui partage au mieux la population en deux groupes de 0%. La moitié de la population se situe donc en dessous de cette valeur. Le mode peut également être défini. Moyenne (arithmétique) : La moyenne correspond au centre de gravité de la distribution. Elle est obtenue en pondérant la somme des scores par le nombre de scores. Le mode et la médiane peuvent également être définis. Dispersion L indice de tendance centrale définit le comportement général des données. Mais les données peuvent varier beaucoup autour de cette tendance. On doit donc définir un indice qui traduise la dispersion des données. Cet indice est également fonction de l échelle de mesure utilisée. Entropie: En physique, l entropie est une mesure de la richesse d une information, elle évalue le hasard et le désordre d un système. En statistique, cet indice indique si la répartition des modalités est équiprobable ou si au contraire une catégorie est fortement représentée. Un dé normal devrait se caractériser par une entropie maximale. S il est pipé et tombe systématiquement sur la même face, son entropie sera nulle. Cet indice est rarement utilisé. Quartiles: modalités de la variable qui partagent l effectif de la distribution respectivement en % et 7%. Un quart de la population se situe en dessous du premier quartile. La moitié se situe en dessous du e quartile (médiane) et trois quarts de la population se situe en dessous du e quartile. Écart-type : L écart-type évalue la tendance générale des écarts à la moyenne. Comme la moyenne arithmétique des écarts ne peut être calculée directement (les écarts positifs compensant les écarts négatifs), on calcule cet indice sur la base des carrés des écarts qui sont toujours positifs, puis on prend la racine carrée de cet indice. La variance est la moyenne des carrés des écarts à la moyenne. L écart-type est la racine carrée de la variance. Autres D autres indices peuvent être calculés pour les échelles d intervalle. Ils évaluent notamment la dissymétrie de la distribution. Ils font appel aux puissance e et e des écarts à la moyenne (Kurtosis, Skewness). On utilise parfois les moyennes géométrique ou harmonique. L espace semi-inter-quartile représente la moitié de la distance entre le premier et le e quartile. Minimum 1 Maximum Etendue Mode Kurtosis -0.997 Médiane Quartile 1 Quartile Espace semi-inter-quartile 0. Moyenne.0000 Ecart-type 1.1707867 Variance 1.17897 Moyenne géométrique.819701 Moyenne harmonique 1.97697 Statistiques descriptives Ces deux courbes représentent des distributions qui ont la même moyenne et des écarts-types différents.

Comparer Principe général Si deux échantillons ont été tirés au hasard d une même population d origine, leurs paramètres descriptifs devraient présenter des différences minimes explicables par les seuls effets du hasard. Si les deux groupes présentent des divergences importantes, on peut raisonnablement penser qu ils ne sont pas issus d une seule et même population d origine et on doit admettre que les différences sont, par conséquent, attribuables à une cause extérieure (sexe, âge, effet d un médicament, ). Pour prendre scientifiquement cette décision (hasard ou effet?), il est possible de calculer un indice statistique sur les distributions. Le type d indice dépend notamment du nombre d échantillons comparés et de l échelle de mesure des variables un groupe à une population de référence (les données observées sont-elles conformes à celles qui ont été publiées au niveau international?) ; deux groupes indépendants (les résultats des garçons sont-ils différents de ceux des filles?); un groupe comparé à lui-même, mais dans des conditions différentes (les sujets font-ils de meilleurs résultats après avoir reçu une information ou un médicament?) ; des groupes qui différent selon un seul critère (les résultats d un test sont-ils différents dans groupes constitués à partir du niveau socioéconomique?); des groupes qui différent selon deux critères croisés (en considérant conjointement le sexe et le niveau socio-économique, les résultats à un examen sont-ils comparables d un groupe à l autre ou peut-on affirmer l effet d une des variables, voire même l interaction des deux variables?). Dans tous les cas qui précèdent, l indice calculé sur les données empiriques est comparé à une valeur critique obtenue dans une table ou calculée par le logiciel statistique utilisé. Ceci permet de décider si la valeur observée est trop importante pour être imputée au hasard. Généralement, si la valeur de l indice calculé apparaît moins de fois sur cent dans un tirage aléatoire, on considère qu il est trop important pour être attribué au hasard. En d autres termes, la différence entre les groupes est trop importante pour que le seul hasard puisse être invoqué pour expliquer les différences entre les groupes. Dans ce cas, on rejette alors l idée d une origine commune des groupes et on affirme donc un effet de la variable indépendante sur les résultats observés. Les critères peuvent, dans certains cas, être plus ou moins sévères (1%,.%, ). La lecture des tables indique la valeur critique en fonction des risques acceptés par le chercheur (.%, %, ) et des degrés de liberté du système, c est-à-dire des contraintes imposées par le nombre de groupes en présence. Le type d indice dépend en outre de l échelle de mesure utilisée pour la variable dépendante : les tests peuvent être paramétriques ou non-paramétriques.

Résumé des différents tests de statistique inférentielle Échelle de mesure de la variable dépendante Nominale Fréquences observées/fréquences théoriques Fréquences observées/fréquences théoriques pour une variable à modalités groupes indépendants pour une variable à deux modalités Plusieurs données appariées pour des variables à modalités Ordinale Fréquence cumulée/fréquence théorique cumulée Test Chi carré Binomial Wald-Wolfowitz, «Runs test» (Z) Cochran (Q) Kolmogorov-Smirnoff (Z) groupes indépendants Mann-Whitney (U) groupes appariés Wilkoxen (W) Plusieurs groupes indépendants Plusieurs groupes appariés Test de la médiane pour données indépendantes Test de la médiane pour données appariées groupes appariés Test du signe Plusieurs groupes pour variables indépendantes croisées Kruskal-Wallis (H), analyse de variance sur des rangs 1 ou plusieurs groupes appariés Kendall (W) Paramétrique 1 groupe / distribution théorique Student (t) groupes indépendants Student pour données indépendantes 1 groupe sous deux conditions Student pour données appariées Plusieurs groupes pour 1 variable indépendante Plusieurs groupes pour variables indépendantes croisées Fisher (F), analyse de variance Fisher pour données indépendantes 1 ou plusieurs groupes sous des conditions différentes Fisher pour données appariées