T.P. 1 Exercice 1 Pourquoi les statistiques? (Corrigé)



Documents pareils
Statistique : Résumé de cours et méthodes

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Statistiques Descriptives à une dimension

Je découvre le diagramme de Venn

SERIE 1 Statistique descriptive - Graphiques

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

S initier aux probabilités simples «Question de chance!»

Introduction à la statistique descriptive

T de Student Khi-deux Corrélation

Annexe commune aux séries ES, L et S : boîtes et quantiles

Logiciel XLSTAT version rue Damrémont PARIS

CHAPITRE 2. Les variables

Document d accompagnement. de la 1 re à la 8 e année. Exemples de tâches et corrigés. 1 re année Tâche Corrigé... 7 Tâche Corrigé...

Représentation d une distribution

Rédiger et administrer un questionnaire

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Petit lexique de calcul à l usage des élèves de sixième et de cinquième par M. PARCABE, professeur au collège Alain FOURNIER de BORDEAUX, mars 2007

S initier aux probabilités simples «Question de chance!»

EVALUATIONS MI-PARCOURS CM2

Lois de probabilité. Anita Burgun

1. Vocabulaire : Introduction au tableau élémentaire

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

23. Interprétation clinique des mesures de l effet traitement

Note de cours. Introduction à Excel 2007

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Précision d un résultat et calculs d incertitudes

Infolettre #18 : Les graphiques avec Excel 2010

Fluctuation d une fréquence selon les échantillons - Probabilités

TSTI 2D CH X : Exemples de lois à densité 1

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Critères de Choix d une Echelle de Qualité De Vie. Etudes cliniques dans l autisme. Introduction

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

La définition La méthode. Les échelles de mesure L ENQUETE PAR SONDAGE : LA METHODE

Utilisez les mots-ressources pour identifier les parties de la tête selon les numéros.

Il y a trois types principaux d analyse des résultats : l analyse descriptive, l analyse explicative et l analyse compréhensive.

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Probabilités conditionnelles Loi binomiale

I. LE CAS CHOISI PROBLEMATIQUE

Mathématiques financières

LES GENERATEURS DE NOMBRES ALEATOIRES

Traitement des données avec Microsoft EXCEL 2010

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

COR-E : un modèle pour la simulation d agents affectifs fondé sur la théorie COR

Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»

fiche m mo technique

Statistiques avec la graph 35+

Mesures et incertitudes

Bien-être et information sur la santé

Statistique Descriptive Élémentaire

INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX

LES DIFFERENTS TYPES DE MESURE

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).

Items étudiés dans le CHAPITRE N5. 7 et 9 p 129 D14 Déterminer par le calcul l'antécédent d'un nombre par une fonction linéaire

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Analyse de l enquête de consommation de boissons énergisantes

MATHÉMATIQUES. Mat-4104

Fête de la science Initiation au traitement des images

Priorités de calcul :

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

QUE PENSEZ-VOUS DE VOTRE CLUB? Un outil indispensable pour évaluer les clubs

Formation tableur niveau 1 (Excel 2013)

L analyse de la gestion de la clientèle

Correction du baccalauréat ES/L Métropole 20 juin 2014

Relation entre deux variables : estimation de la corrélation linéaire

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

9.11 Les jeux de hasard et d argent

TD : Codage des images

Réseau SCEREN. Ce document a été numérisé par le CRDP de Bordeaux pour la. Base Nationale des Sujets d Examens de l enseignement professionnel.

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

EXCEL PERFECTIONNEMENT CALCULS AVANCES

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Logiciel Le Sphinx Plus 2 version 5. Le Sphinx Développement Chavanod

STATISTIQUES DESCRIPTIVES

IBM SPSS Direct Marketing 21

Unité 4 : En forme? Comment est ton visage?

Excel 2007 Niveau 3 Page 1

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Entre mal-être et bien être : comment vont les étudiants. Premiers résultats. Damien BERTHILIER Président La Mutuelle des Étudiants LMDE-EPSE

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Et si j étais Marty Mac Fly Ou comment remonter le temps avec une tablette tactile (Ipad)

Classe de première L

Séries Statistiques Simples

EXERCICIOS AUTOAVALIABLES. 1.- Écris le nom des parties du corps que les flèches indiquent :

Feuille d exercices 2 : Espaces probabilisés

Collecter des informations statistiques

Opérations de base sur ImageJ

ANAMNÈSE Création : Dre Josée Douaire, psychologue

Ministère des Affaires étrangères et européennes. Direction de la politique culturelle et du français. Regards VII

Paroisses réformées de la Prévôté - Tramelan. Album de baptême

UNITÉ 3. comme ça! Colle, dessine, écris... tout ce que tu veux. Cette page est pour toi!

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

REGARDS SUR L ÉDUCATION 2013 : POINTS SAILLANTS POUR LE CANADA

Transcription:

T.P. 1 Exercice 1 Pourquoi les statistiques? (Corrigé) Connaissances préalables : Buts spécifiques : Outils nécessaires : Consignes : Notions d hypothèse et d échantillon aléatoire Évaluer la compréhension des notions d hypothèse et d échantillon aléatoire Annexe 1, cours Prenez le temps de réfléchir avant de regarder le corrigé Lorsque nous faisons des statistiques, notamment en psychologie, nous sommes amenés à vérifier des hypothèses à propos d une population sur base d un échantillon dit représentatif. 1. Des chercheurs s intéressent à la notion de dépression chez les adolescents résidents en Belgique. Formulez une hypothèse par rapport à ce thème de recherche. Exemples de réponse : - Les adolescents dont les parents sont divorcés ont plus tendance à souffrir de dépression. - La dépression touche davantage les adolescents de plus de 15 ans que les adolescents jeunes. - La dépression touche davantage les filles que les garçons Il est important de noter la différence entre une affirmation et une hypothèse : l hypothèse est une prédiction qui a pour but d être vérifiée et qui pourrait s avérer fausse. 2. Ces chercheurs font leur étude sur base d un échantillon de 200 adolescents de 15 ans qu ils ont choisis au hasard dans un établissement d enseignement secondaire général de Virton. Peut-on considérer que cet échantillon est représentatif des adolescents scolarisés en Belgique? Cet échantillon n est pas représentatif. Il aurait fallu puiser l échantillon dans les différentes communautés linguistiques du pays, dans des grosses villes et de petits villages, dans des milieux socio-économiques, culturels et religieux différents, choisir des adolescents d âges différents TP 1 2006/2007 (Corrigé) 1/18

T.P. 1 Exercice 2 Les variables (Corrigé) Connaissances préalables : Variables dépendantes et indépendantes ; quantitatives et qualitatives Buts spécifiques : Manipuler les notions de variables dépendantes et indépendantes ; quantitatives et qualitatives Outils nécessaires : Annexe 1, cours Consignes : euh Aucune, si ce n est de répondre aux questions!? 1. Des chercheurs s intéressent à l obésité chez les jeunes. Donnez deux exemples de variables (et leur codage) quantitatives et qualitatives qui pourraient être utilisées dans le cadre de cette étude. Exemples de réponse : Variables qualitatives : genre (féminin, masculin); fumeur (oui, non); pratique d un sport (oui, non); personnalité dépressive (oui, non) Variables quantitatives : nombre de repas pris sur la journée ; nombre d heures passées devant la télévision par semaine ; poids ; taille ; âge ; taux de l hormone x dans le sang ; pratique d un sport par semaine (pas du tout, un peu, beaucoup) 2. Des chercheurs s intéressent à l obésité chez les jeunes. Donnez deux exemples de variables indépendantes et dépendantes qui pourraient être utilisées dans le cadre de cette étude. Exemples de réponse : Variable dépendante : poids en kg avec variable indépendante : milieu socioéconomique. Variable dépendante : poids en kg avec variable indépendante : culture d origine. Variable dépendante : poids en kg avec variable indépendante : nombre de repas par jour. Variable dépendante : nombre de repas par jour avec variable indépendante : structure familiale. TP 1 2006/2007 (Corrigé) 2/18

T.P. 1 Exercice 3 Les échelles de mesure (Corrigé) Connaissances préalables : Buts spécifiques : Outils nécessaires : Les échelles de mesure Manipuler les différentes échelles de mesure Annexe 1, cours 1. Un instituteur note l ordre dans lequel ses élèves terminent leur interrogation. Le premier à finir, le deuxième Quelle échelle de mesure est utilisée? Une échelle ordinale 2. Dans une étude sur la perception des expressions faciales, les participants doivent classer les photographies qu on leur montre dans une des 3 catégories d expression émotionnelle suivantes : triste, joyeux ou neutre. Sur quelle échelle est mesurée l expression émotionnelle? Une échelle nominale 3. Un questionnaire porte sur (a) l âge, (b) le genre, (c) la profession, (d) la taille, (e) le nombre d enfants d une personne. Quelles sont les échelles utilisées pour ces différentes mesures? Réponses : A et D : échelle de rapports B et C : échelle nominale E : échelle absolue TP 1 2006/2007 (Corrigé) 3/18

T.P. 1 Exercice 4 Vocabulaire statistique descriptive (Corrigé) Connaissances préalables : Outils nécessaires : Consignes : Notions de fréquence, diagramme en barres, histogramme, variables qualitatives et quantitatives, échelles de mesure Annexe 2 + calculatrice, cours Réfléchir et arrondir à 2 décimales Observons le tableau de données ci-joint (Annexe 2). Utilisons notre bon sens pour l analyser. Une première approche des statistiques peut se faire de manière très intuitive. 1. Chaque ligne du tableau (sauf la première) représente : Un sujet, un cas ou en l occurrence ici, un étudiant différent. 2. D une ligne à l autre, les valeurs attribuées à un sujet différent peuvent varier. Chaque colonne représente donc : Une variable Le tableau que nous sommes en train d analyser est intéressant, mais peu économique et peu lisible en tant que tel. 3. Comment pourrions-nous représenter la variable «cheveux» de manière plus «économique»? Placez ces données dans un tableau au nombre de lignes le plus limité possible. En regroupant les données sous forme d une distribution de fréquences, c est-à-dire en comptant le nombre de personnes ayant des cheveux bruns, blonds, châtains et noirs représentés dans notre échantillon, nous obtenons le tableau de distribution de fréquences suivant : j Cheveux Fréquences absolues (oueffectifs) n j 1 bruns 5 = n 1 2 blonds 3 = n 2 3 noirs 1 = n 3 4 châtains 3 = n 4 Total = N 12 = n 5 La fréquence absolue, ou effectif, se note n j où l indice j indique le numéro de la variable recodée ou simplement un indice muet représentant le numéro attribué à la catégorie. Par exemple, la fréquence absolue du groupe «cheveux bruns» se note n 1 = 5 et correspond au nombre de sujets ayant les cheveux bruns dans l échantillon. TP 1 2006/2007 (Corrigé) 4/18

4. Donnez les fréquences relatives et les fréquences relatives exprimées en pourcentages pour cette variable. Tableau : j Cheveux Fréquences relatives f j Fréquences relatives en % 5 1 bruns f = = 0,42 42 % 12 1 3 2 blonds f = = 0,25 25 % 12 2 1 3 noirs f = = 0,08 8 % 12 3 3 4 châtains f = = 0,25 25 % 12 4 Total 1 100 % 5. Quelles valeurs représentent les notations suivantes et quelle est la signification de ces valeurs? Réponses : n 2 f 3 = n blonds = 3 = nombre de personnes ayant les cheveux blonds dans l échantillon. f = 0,08 = proportion de personnes ayant les cheveux noirs dans l échantillon. = noirs N.B. : Vos réponses pourraient être différentes selon l ordre dans lequel vous avez placé les données dans le tableau. Dans ce cas-ci, puisque c est une variable nominale, ça n a pas d importance. 6. Représentez les données que vous avez regroupées à l exercice 4 sous la forme de deux diagrammes en barres, l un pour les fréquences absolues (nombre absolu de personnes concernées), l autre pour les fréquences relatives (exprimées en %). Comparez les deux graphiques. Notez sur chaque graphe la légende, le titre, le sens et l échelle de l axe Y. Fréquences absolues : Répartition des différentes couleurs de cheveux dans l'échantillon 6 5 nombre de personnes 4 3 2 1 0 blonds bruns chatains noirs Couleur de cheveux N =12 TP 1 2006/2007 (Corrigé) 5/18

Fréquences relatives : Répartition des différentes couleurs de cheveux dans l'échantillon % 45 40 35 30 25 20 15 10 5 0 blonds bruns chatains noirs couleur de cheveux N = 12 Répartition des différentes couleurs de cheveux dans l'échantillon 100 90 80 70 60 % 50 40 30 20 10 0 blonds bruns chatains noirs couleur de cheveux N = 12 TP 1 2006/2007 (Corrigé) 6/18

Commentaires : Ces graphiques ne sont pas fondamentalement différents. Les deux premiers ont exactement la même apparence puisque les proportions sont les mêmes ; ils auraient pu être un peu différents, mais du moment qu on garde une échelle proportionnellement identique, ces graphiques auront la même forme. Dans le deuxième et le troisième nous perdons l information concernant le nombre absolu de personnes concernées, mais des pourcentages sont parfois plus faciles à interpréter. Pour avoir une idée des fréquences absolues on peut aussi ajouter la valeur de «N» à la légende du graphique. «N» désigne le nombre total d individus dans l échantillon. On peut énumérer les classes dans n importe quel ordre, on peut les disposer n importe comment sur l axe horizontal d un diagramme en barres puisqu il s agit d une variable nominale. L apparence globale du graphique ne peut être utilisée. L espace entre les barres est arbitraire mais il en faut un, la largeur des barres n a pas d importance non plus. La seule chose qui puisse être comparée est la hauteur des différentes barres qui représente le nombre ou la fréquence relative de personnes qui se trouvent dans une catégorie ou une autre. Le troisième diagramme est un peu «écrasé». Tout dépend de l échelle dont il faut tenir compte. L échelle est arbitraire, mais peut influencer (et donc fausser) l impression donnée par un graphique. 7. Repérez dans le tableau (Annexe 2) les variables qualitatives et quantitatives. A quelles échelles de mesure renvoient-elles? Donnez les 2 méthodes utilisées pour coder les variables qualitatives. Réponses : - Variables qualitatives (échelle nominale) : groupe, genre, couleur de cheveux, couleur d yeux, lunettes. - Variables quantitatives : âge (échelle de rapports), taille (échelle de rapports), poids (échelle de rapports), sport (échelle ordinale), fumer (échelle ordinale), note (échelle de rapports), nombre de frères (échelle absolue). N.B. : Une variable qualitative peut être codée alphabétiquement ou numériquement. 8. Dressez le tableau des fréquences des notes en complétant le tableau suivant (cf. annexe 2) : j Notes Fréq. abs. Fréq. abs. cum. Fréq. rel. en % Fréq. rel. cum. 1 11 2 2 16.67% 16.67% 2 12 3 5 25% 41.67% 3 14 1 6 8.33% 50% 4 15 2 8 16.67% 66.67% 5 16 2 10 16.67% 83.34% 6 18 2 12 16.67% 100,01% 100% total 12 100,01% TP 1 2006/2007 (Corrigé) 7/18

9. Représentez graphiquement les fréquences absolues de la variable «note». N oubliez pas d indiquer un titre, le sens des axes et une légende. Comment s appelle un tel graphe? Comment s appelle l axe horizontal et que représente-t-il? Graphique : Histogramme fréquences absolues des valeurs non groupées de la variable note mesurée en points pour les 12 élèves 3 Fréquences 2 1 0 11 12 13 14 15 16 17 18 Cotes Cette représentation graphique s appelle un histogramme. Dans un histogramme, on indique les valeurs non observées dans l échantillon (parce que l axe horizontal représente une mesure continue) d où l apparition d intervalles vides. De plus, les rectangles des classes adjacentes se touchent, il n y a d espace entre les colonnes que s il y a des classes vides. 10. Que peut-on dire par rapport à la surface de chaque rectangle de l histogramme ci-dessus et par rapport à la surface totale des rectangles? - Les surfaces des rectangles sont proportionnelles aux fréquences des observations - La surface totale obtenue en sommant les surfaces de tous les rectangles de l histogramme correspond donc à la fréquence absolue cumulée de toutes les observations. N.B. : Si tous les rectangles ont la même base, on peut se contenter d en regarder la hauteur. 11. Représentez sous la forme d une distribution de fréquence groupée en classes de 2 points la variable note. Indiquez les fréquences absolues, relatives, relatives cumulées et relatives cumulées exprimées en %. Fréq. abs. Fréq. rel. Fréq. rel. cum. Fréq. rel. cum. en % 10,5-12,5 5 0,42 0,42 42 % 12,5-14,5 1 0,08 0,50 50 % 14,5-16,5 4 0,33 0,83 83 % 16,5-18,5 2 0,17 1,00 100 % 12 1,00 TP 1 2006/2007 (Corrigé) 8/18

T.P. 1 Exercice supplémentaire 1 Pourquoi les statistiques? (Corrigé) Connaissances préalables : Notions d hypothèse et d échantillon aléatoire. Buts spécifiques : Evaluer le compréhension des notions d hypothèse et d échantillon aléatoire. Outils nécessaires : Annexe 1. Consignes : Réfléchissez avant de regarder le corrigé. 1. Dans quelles conditions l ensemble des étudiants de l ULB seraient-ils considérés comme une population? Dans tous les cas où on veut étudier uniquement les résultats des étudiants de l ULB. 2. Dans quelles conditions l ensemble des étudiants de l ULB seraient-ils considérés comme un échantillon? Dans tous les cas où l étude porte sur une population plus large qu uniquement les étudiants de l ULB. 3. Si l ensemble des étudiants de l ULB était considéré comme un échantillon, s agirait-il d un échantillon aléatoire? Expliquez votre réponse. Il s agirait d un échantillon non aléatoire car l ensemble des étudiants (par exemple de Belgique) n a pas une chance égale d être inclus dans l échantillon. TP 1 2006/2007 (Corrigé) 9/18

T.P. 1 Exercice supplémentaire 2 Les variables (Corrigé) Connaissances préalables : Variables dépendantes et indépendantes ; quantitatives et qualitatives Buts spécifiques : Manipuler les notions de variables dépendantes et indépendantes ; quantitatives et qualitatives Outils nécessaires : Annexe 1 1. Une hypothèse peut être définie comme une prédiction à propos des effets d une variable (a) sur une variable (b). Réponses : a) variable indépendante b) variable dépendante 2. Des chercheurs désirent comparer les capacités d interactions sociales d un groupe d enfants de 3 ans qui sont allés à la crèche avec celles d un groupe d enfants de 3 ans qui n y sont pas allés. Quelle est la variable dépendante dans cette étude? Quelle est la variable indépendante? Réponses : La fréquentation d une crèche = variable indépendante Les capacités d interactions sociales = variable dépendante 3. Dans une étude sur les capacités mnésiques, les participants doivent mémoriser en soirée une liste de 20 mots qu on leur demande de rappeler après un intervalle de 8 heures. Un groupe de participants dort pendant cet intervalle, l autre groupe est maintenu éveillé. L expérimentateur désire investiguer si le type d activité (sommeil vs veille) pendant l intervalle influence le nombre de mots correctement rappelés. Dans cette étude, quelles sont les variables dépendante et indépendante? Réponses : variable indépendante = le type d activité pendant l intervalle variable dépendante = nombre de mots correctement rappelés TP 1 2006/2007 (Corrigé) 10/18

T.P. 1 Exercice supplémentaire 3 Les échelles de mesure (Corrigé) 1. Un chercheur a une liste avec la taille en cm d un groupe d enfants de 8 ans ; par exemple 123 cm, 146 cm, 130 cm Quelle échelle de mesure est utilisée? Une échelle de rapport. Le zéro correspond à l absence de taille (zéro absolu) et on peut utiliser ces tailles pour former des rapports. Un enfant de 80 cm est 2 fois plus petit qu un enfant d 1m60. 2. Ce chercheur convertit ces tailles sur une nouvelle échelle en calculant la différence pour chaque enfant entre sa taille et la taille moyenne du groupe. Un enfant qui a exactement la taille moyenne du groupe a un score de 0 ; un enfant qui a 1 cm de plus que la taille moyenne du groupe obtient un score de +1 ; en enfant qui a 2 cm de moins obtient un score de -2 Quelle échelle est utilisée? Une échelle d intervalle. En effet, un score de 0 ne correspond plus à l absence de taille mais à la taille moyenne. De plus, un enfant qui a un score de +9 n est pas 3 fois plus grand qu un enfant qui a un score de +3. Les rapports sur les tailles n ont donc plus de sens mais sur les différences, ils continuent à avoir du sens. 3. Sur quelle échelle de mesure ces variables sont-elles habituellement mesurées? N.B. : les échelles de mesure étant hiérarchisées, indiquez le niveau le plus élevé. Echelle nominale Echelle ordinale Echelle d intervalles Echelle de rapports Echelle absolue Groupe sanguin Nationalité Température en Kelvin Température en degrés Celsius Connaissance en informatique évaluée sur une échelle à quatre points. Couleur des yeux Heure à laquelle une personne va dormir Nombre d heures de sommeil Latéralité Ancienneté Intelligence (Q.I.) 1 1 Le QI n est qu une échelle ordinale mais par convention dans les études statistiques on a tendance à se comporter comme s il s agissait d une échelle de rapports. TP 1 2006/2007 (Corrigé) 11/18

T.P. 1 Exercice supplémentaire 4 Distribution observée des fréquences absolues et relatives Diagramme en barres (Corrigé) La clinique de santé mentale d une université utilise les lettres suivantes pour coder les principaux types de problèmes poussant les patients à demander une assistance : A : Anxiété générale B : Dépression générale C : Problèmes liés à la sexualité D : Problèmes liés à l alcool et aux stupéfiants E : Problème de comportement social F : Problèmes familiaux G : Autres problèmes Cinquante-quatre patients se sont rendus à la clinique un jour donné. On a attribué à chacun d eux une lettre en fonction du problème dont ils souffraient. A B B E B D B G F G B B C E B B A B B B G B C F D G G D D G G B F G A G A F G G G C D E B B B G G G A B C B 1. Sur quel type d échelle nous situons-nous dans cet exercice? Sur une échelle qualitative (nominale, catégorielle). 2. Construisez le tableau de la distribution des fréquences absolues et relatives associé à ces observations. Nombre de catégories distinctes : 7 Nombre d observations : N = 54 Catégories de la variable type de problèmes Fréquences absolues (Effectifs) Fréquences relatives 1 A 5 5/54 = 0,09 2 B 18 18/54 = 0,33 3 C 4 4/54 = 0,07 4 D 5 5/54 = 0,09 5 E 3 3/54 = 0,06 6 F 4 4/54 = 0,07 7 G 15 15/54 = 0,28 N=54 54/54 = 1 TP 1 2006/2007 (Corrigé) 12/18

3. Dessinez le diagramme en barres des fréquences relatives correspondant. Graphique : Fréquences relatives 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 A B C D E F G Motif de la demande 4. Commentez les résultats des deux points précédents. Commentaires : Cinq des sept catégories ne recouvrent chacune que moins de 10% des motifs de consultation ce jour-là. Ces cinq catégories réunies ne reprennent que 39% des patients. Les 61 autres pour cent relèvent de deux catégories seulement, puisque 33% des sujets consultent pour une dépression générale et 28% pour d autres raisons. L ordre des barres sur le graphique n a pas d importance puisque nous sommes sur une échelle nominale, donc en deçà d une échelle ordinale. TP 1 2006/2007 (Corrigé) 13/18

T.P. 1 - Exercice supplémentaire 5 Variable quantitative : Distribution observée groupée des fréquences absolues et relatives Histogramme et polygone des effectifs (Corrigé) Considérons la série statistique ordonnée suivante relative aux âges des membres d un club sportif : 17 18 19 20 22 22 23 23 24 25 25 26 26 27 27 27 27 27 28 28 28 28 28 29 29 29 29 30 30 30 30 30 31 31 31 31 31 32 32 33 33 34 35 35 36 36 38 39 40 41 1. Sur quel type d échelle nous situons-nous dans cet exercice? Sur une échelle de rapports. 2. Groupez cette série en classes et construisez le tableau de la distribution observée des fréquences absolues (effectifs) et relatives correspondant. Prenez, pour ce faire, 5 classes de même largeur. Nombre de classes construites : 5 (classes de même largeur) 41-17 Valeur approchée de la largeur des classes = = 4, 8 5 Largeur des classes = 5 Limite inférieure de la première classe = 16,5 Nombre d observations = N = 50 j Classes Fréquences absolues (effectifs) Fréquences Relatives 1 16,5 21,5 4 4/50 0,08 2 21,5 26,5 9 9/50 0,18 3 26,5 31,5 24 24/50 0,48 4 31,5 36,5 9 9/50 0,18 5 36,5 41,5 4 4/50 0,08 N=50 50/50 = 1 TP 1 2006/2007 (Corrigé) 14/18

3. Dessinez l histogramme de cette distribution observée. Graphique : Histogramme des âges des membres du club sportif : N = 50 30 25 20 15 10 5 0 16,5-21,5 21,5-26,5 26,5-31,5 31,5-36,5 36,5-41,5 4. Commentez vos résultats. Commentaires : Les âges des membres de ce club sportif se distribuent de façon symétrique de part et d autre de la classe "centrale", la classe 26,5 31,5. La classe 26,5 31,5 compte le plus grand effectif : c est la classe modale (cf. TP2). N.B. : L ordre des rectangles est important. Les rectangles doivent être collés les uns aux autres parce qu il s agit d une variable continue. La base des rectangles doit être identique si les classes ont la même largeur. Un trou entre deux rectangles signifierait que la classe est vide : il n y a que dans ce cas que deux rectangles pourraient ne pas se toucher. TP 1 2006/2007 (Corrigé) 15/18

T.P. 1 : Annexe 1 Rappel des notions théoriques importantes vues au TP 1 Outils nécessaires : Cours théorique de Daniel Holender, pages 1 à +/- 20.? Hypothèse : prédiction par rapport aux résultats de l étude (qui pourrait à l issue de l étude s avérer vraie ou fausse voire être nuancée).? Population : ensemble de tous les individus (ou évènements ou objets) qui nous intéressent pour une étude particulière.? Echantillon : une partie des individus sélectionnés dans la population? Echantillon aléatoire : échantillon pris au hasard. Chaque élément de la population a une chance égale d être pris dans l échantillon.? Variable : propriété d un objet (la couleur des cheveux, le genre ) ou d un événement qui peut prendre différentes valeurs (qui peut donc varier). Chaque élément de la population prend une valeur pour chaque variable.? Variable qualitative = catégorielle = nominale : variable dont les valeurs sont des noms, des étiquettes.? Variable quantitative : variable dont les valeurs sont le résultat d une mesure.? Variable indépendante: variable manipulée ou contrôlée par l expérimentateur.? Variable dépendante : variable dont on observe les changements (= les données).? Echelle nominale : étiquette qui catégorise les observations (féminin- masculin ; blondbrun-roux ).? Echelle ordinale : range les personnes, objets ou événements le long d un continuum.? Echelle d intervalles : des différences ou intervalles égaux entre les nombres sur l échelle reflètent des différences égales en termes de magnitude mais pas en terme de rapport.? Echelle de rapport : les rapports entre les nombres sur l échelle reflètent les rapports en magnitude. Echelle possédant un vrai zéro (zéro absolu), qui correspond à l absence de la chose mesurée.? Echelle absolue : échelle basée sur des nombres entiers réels positifs, possédant un vrai zéro, dont la fonction est le dénombrement (comptage).? Distribution de fréquences : répartition organisée du nombre d individus appartenant à chacune des catégories de l échelle de mesure.? Distribution de fréquences groupées : lorsque la variable compte un nombre important de valeurs, il peut être plus approprié (pour plus de clarté) de grouper certaines valeurs entre elles et de créer ainsi des classes ( de catégories).? Fréquence absolues = n j ou n i : effectif, c est à dire le nombre d observations dans chaque catégorie ou classe. n j f j =. Si N on multiplie la fréquence relative par 100, on obtient la fréquence relative exprimée en %.? Fréquence relative = f j : rapport entre l effectif d une classe et l effectif total. TP 1 2006/2007 (Corrigé) 16/18

? Fréquence relative cumulée : le pourcentage cumulé pour une certaine valeur de la variable est égal à la somme des pourcentages des cas atteignant ce niveau et des pourcentages des cas atteignant les niveaux inférieurs de la variable. La notion de distribution cumulée s applique aux cas des fréquences absolues et relatives, et de la probabilité.? Diagramme en bâtons : graphe représentant un tableau de distribution de fréquences utilisé lorsque les données se mesurent sur une échelle nominale ou ordinale. La hauteur de chaque barre correspond à la fréquence (absolue ou relative, exprimée en % ou pas). Il y a un espace entre chaque barre.? Histogramme : graphe représentant un tableau de distribution de fréquences utilisé lorsque les données se mesurent sur une échelle d intervalle ou de rapport. La hauteur de chaque barre correspond à la fréquence (absolue ou relative, exprimée en % ou pas). Les barres sont «collées» ; il n y a d espace vide que pour les valeurs non représentées dans l échantillon.? Abscisse : axe des (axe horizontal).? Ordonnée : axe des Y (axe vertical). TP 1 2006/2007 (Corrigé) 17/18

T.P. 1 : Annexe 2 Exemple de tableau de données Num Groupe Âge genre Taille (cm) Poids (kg) Yeux Cheveux Sport Fumer Lunettes note /20 nombre de frères 1 1 22 F 166 55 bleus blonds 1 1 1 18 1 2 1 19 M 165 59 bleus blonds 2 4 1 12 0 3 1 22 F 173 86 marrons bruns 2 1 0 11 2 4 1 20 M 178 55 bruns bruns 2 2 0 14 1 5 2 20 M 178 61 bleus bruns 1 1 1 15 1 6 2 19 F 155 58 bruns châtains 2 1 1 16 2 7 2 19 F 171 70 verts bruns 2 3 0 15 2 8 2 20 F 165 58 verts blonds 3 1 0 18 0 9 3 21 F 170 58 bruns noirs 2 3 1 12 3 10 3 19 M 181 74 bruns bruns 4 3 0 12 0 11 3 19 F 159 52 verts châtains 2 1 0 11 0 12 3 19 F 162 45 verts châtains 3 1 1 16 2 TP 1 2006/2007 (Corrigé) 18/18