Ceci est un corrigé type. D autres procédures peuvent être utilisées pour obtenir des résultats semblables.



Documents pareils
Séries Statistiques Simples

Annexe commune aux séries ES, L et S : boîtes et quantiles

Statistique : Résumé de cours et méthodes

Statistiques Descriptives à une dimension

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Analyse des mesures anthropométriques et de la composition corporelle des cégépiens et des cégépiennes

SUGARCRM MODULE RAPPORTS

BACCALAURÉAT PROFESSIONNEL EPREUVE DE TRAVAUX PRATIQUES DE SCIENCES PHYSIQUES SUJET A.1

Statistique Descriptive Élémentaire

1 Objectifs. Traitement statistique des données d enquête avec introduction à SPSS. Plan

Catalogue des connaissances de base en mathématiques dispensées dans les gymnases, lycées et collèges romands.

1 Importer et modifier des données avec R Commander

IBM SPSS Statistics Base 20

à moyen Risque moyen Risq à élevé Risque élevé Risq e Risque faible à moyen Risq Risque moyen à élevé Risq

Résumé du Cours de Statistique Descriptive. Yves Tillé

Biostatistiques : Petits effectifs

Représentation d une distribution

Utilisation du Logiciel de statistique SPSS 8.0

Introduction aux Statistiques et à l utilisation du logiciel R

Statistiques avec la graph 35+

Mini_guide_Isis.pdf le 23/09/2001 Page 1/14

Statistiques descriptives

Lire ; Compter ; Tester... avec R

Optimiser ses graphiques avec R

TABLE DES MATIÈRES 1. DÉMARRER ISIS 2 2. SAISIE D UN SCHÉMA 3 & ' " ( ) '*+ ", ##) # " -. /0 " 1 2 " 3. SIMULATION 7 " - 4.

Analyse de donnés sur les ménages à l aide de SPSS pour Windows

Surveillance des troubles musculo-squelettiques dans les Bouches-du-Rhône

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

3. Caractéristiques et fonctions d une v.a.

Mini_guide_Isis_v6.doc le 10/02/2005 Page 1/15

1 Démarrer L écran Isis La boite à outils Mode principal Mode gadget Mode graphique...

PLATEFORME MÉTIER DÉDIÉE À LA PERFORMANCE DES INSTALLATIONS DE PRODUCTION

Peyre-Brosson Clothilde Tutoriel configuration Borne Wifi D-Link DWL-2000AP TUTORIEL CONFIGURATION BORNE WIFI D- LINK DWL-2000AP

TP 7 : oscillateur de torsion

FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1

Soutenance de stage Laboratoire des Signaux et Systèmes

La place de SAS dans l'informatique décisionnelle

CONTRAT DE MAINTENANCE STANDARD DES LOGICIELS CERMIADATA

FEN FICHE EMPLOIS NUISANCES

Conseil économique et social. Document établi par le Bureau central de statistique d Israël

Clé USB. Quel type de données peut contenir une clé USB?

Partie 1 - Séquence 3 Original d une fonction

REPERTOIRE DES INTERPRETATIONS DE LA CCT DU SECTEUR SANITAIRE PARAPUBLIC VAUDOIS ETAT au

Les technologies pour la santé, une discipline transversale pour la pédagogie en EEA : application aux troubles du sommeil

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

1. Vocabulaire : Introduction au tableau élémentaire

ÉVALUATION FORMATIVE. On considère le circuit électrique RC représenté ci-dessous où R et C sont des constantes strictement positives.

CAC, DAX ou DJ : lequel choisir?

MATHÉMATIQUES. Mat-4104

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Le patrimoine des ménages retraités : résultats actualisés. Secrétariat général du Conseil d orientation des retraites

1 CRÉER UN TABLEAU. IADE Outils et Méthodes de gestion de l information

Planche n o 22. Fonctions de plusieurs variables. Corrigé

10 CONSEILS POUR AMÉLIORER SA PRÉSENCE WEB

Relation entre deux variables : estimation de la corrélation linéaire

quelques Repères pour Doctorants

Fiche pédagogique Réaliser une FSE en Tiers-Payant Intégral ACS

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

Fonctions homographiques

CESI Bases de données

Aide-mémoire de statistique appliquée à la biologie

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

GLPI Les entités. Dans l exemple ci-dessous, GLPI gère une structure répartie sur trois pays, eux-mêmes structurés par villes ou par région / villes.

Propriétés des options sur actions

Visual Taxe 4.1.0B04 minimum

Master Exploration Informatique des données Data Mining & Business Intelligence. Evelyne CHARIFOU Priscillia CASSANDRA

Activité 4. Tour de cartes Détection et correction des erreurs. Résumé. Liens pédagogiques. Compétences. Âge. Matériels

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

LES TYPES DE DONNÉES DU LANGAGE PASCAL

Micro ordinateur & Périphériques Mémoire de masse Disque dur (SOLUTION)

Travaux pratiques avec RapidMiner

EPFL TP n 3 Essai oedomètrique. Moncef Radi Sehaqui Hamza - Nguyen Ha-Phong - Ilias Nafaï Weil Florian

Chapitre 6 La lumière des étoiles Physique

Cours d électricité. Circuits électriques en courant constant. Mathieu Bardoux. 1 re année

Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire :

L obésité et le diabète de type 2 en France : un défi pour la prochaine décennie. DANIEL RIGAUD CHU de Dijon

Logiciel XLSTAT version rue Damrémont PARIS

Séquence 4. Statistiques. Sommaire. Pré-requis Médiane, quartiles, diagramme en boîte Moyenne, écart-type Synthèse Exercices d approfondissement

Séance 0 : Linux + Octave : le compromis idéal

RÉPUBLIQUE ET CANTON DE GENÈVE Echelle des traitements 2015 Valable dès le Office du personnel de l'etat Indexation de 0.

Pour un bronzage sage. Guide pour un utilisateur averti de banc solaire

Vos clients sont satisfaits... Et après? Gilles Granger - Vinivi

Compte TOURISME PORTS ENVIRONNEMENT UPPC RÉSEAU EXEMPLAIRE DES VILLES PORTS - TERROIRS CULTURELS DE CORSE TIC PORTO- VECCHIO

Introduction à SPSS. Guy Mélard, U.L.B. Mars 2006 Guy Mélard, ULB 1. Introduction à SPSS. Objectif de la leçon.

Table des matières. Relation entre le syndrome d'apnées du sommeil et les maladies. But de l'étude, hypothèses de recherche et objectifs 46

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

En proposant une formation souvent moins onéreuse et plus

Statistiques sur la sécurité routière et l indemnisation des dommages corporels

La responsabilité civile des experts comptables. Intervention du 05 Septembre

Chaînes de Markov au lycée

FIMA, 7 juillet 2005

COMMANDER la puissance par MODULATION COMMUNIQUER

Estimation et tests statistiques, TD 5. Solutions

Cours de Master Recherche

Analyse exploratoire des données

Traitement des données avec Microsoft EXCEL 2010

1 Modélisation d être mauvais payeur

Mesure du volume d'un gaz, à pression atmosphérique, en fonction de la température. Détermination expérimentale du zéro absolu.

Transcription:

1 TP 1 : Correction Manipulations de base dans SPSS Ceci est un corrigé type. D autres procédures peuvent être utilisées pour obtenir des résultats semblables. 1. Faire une analyse descriptive (résumés numériques et graphiques) des variables Poids, Taille, Sexe et Fumeur. La fonction FREQUENCIES (Analyse -> Statistiques_descriptives -> Effectifs) permet d obtenir à la fois des résumés numériques, des graphiques et des tableaux de fréquences. On l utilise deux fois, tout d abord pour les deux variables numériques (Poids, Taille) en demandant des résumés numériques, des histogrammes, mais pas de tableaux de fréquences (trop de modalités), puis pour les variables catégorielles (Sexe, Fumeur) en demandant les tableaux de fréquence, des graphiques en bâtons et seulement le mode comme résumé numérique. Poids et Taille : Statistiques Poids en livres Taille en pouces N Valide 16976 16991 Manquante 54 39 Moyenne 165.030 65.438 Médiane 160.450 65.300 Ecart-type 39.5675 3.9139 Variance 1565.586 15.318 Minimum 48.0 46.7 Maximum 532.0 81.3 Centiles 25 137.400 62.600 50 160.450 65.300 75 186.500 68.200 Il y a quelques données manquantes pour chaque variable (54 et 39). Le poids est distribué de manière légèrement asymétrique avec un étalement vers les grandes valeurs, alors que la taille est beaucoup plus symétrique. On peut voir cela soit sur les histogrammes, soit en comparant dans chaque cas la moyenne avec la médiane (moyenne = médiane -> symétrie, ). Les deux variables n étant pas dans la même unité, il n est pas possible de comparer directement leurs résumés numériques.

2 Sexe et Fumeur : Sexe Effectifs valide cumulé Valide femme 9077 53.3 53.3 53.3 homme 7953 46.7 46.7 100.0 Total 17030 100.0 100.0 Il y a un peu plus de femmes que d hommes (53.3% contre 46.7%).

3 Etre fumeur Effectifs valide cumulé Valide Non 8403 49.3 49.3 49.3 Ancien 4255 25.0 25.0 74.3 Oui 4371 25.7 25.7 100.0 Total 17029 100.0 100.0 Manquante -99 1.0 Total 17030 100.0 Il y a une donnée manquante. La modalité la plus fréquente est «non-fumeur» (49.3%), suivie de «fumeur» (25.7%) et «ancien fumeur» (25.0%).

4 2. Refaire l analyse des variables Poids, Taille et Fumeur en effectuant les calculs séparément pour les femmes et les hommes et en comparant les résultats obtenus. On utilise la fonction EXAMINE (Analyse -> Statistiques_descriptives -> Explorer) en utilisant la variable Sexe comme facteur et en sélectionnant à la fois des résumés numériques descriptifs et un graphique de type boxplot (boîte à moustaches). Récapitulatif du traitement des observations Observations Valide Manquante Total Sexe N Pourcent N Pourcent N Pourcent Poids en livres femme 9036 99.5% 41.5% 9077 100.0% homme 7932 99.7% 21.3% 7953 100.0% Taille en pouces femme 9036 99.5% 41.5% 9077 100.0% homme 7932 99.7% 21.3% 7953 100.0% Etre fumeur femme 9036 99.5% 41.5% 9077 100.0% homme 7932 99.7% 21.3% 7953 100.0% Descriptives Sexe Statistique Erreur standard Poids en livres femme Moyenne 155.220.4137 Intervalle de confiance à 95% pour la moyenne Borne inférieure 154.409 Borne supérieure 156.031 Moyenne tronquée à 5% 152.626 Médiane 148.000 Variance 1546.747 Ecart-type 39.3287 Minimum 48.0 Maximum 469.7 Intervalle 421.7 Intervalle interquartile 47.5 Asymétrie 1.171.026 Aplatissement 2.401.052 homme Moyenne 176.208.4128 Intervalle de confiance à 95% pour la moyenne Borne inférieure 175.399 Borne supérieure 177.017 Moyenne tronquée à 5% 174.082 Médiane 171.600 Variance 1351.325 Ecart-type 36.7604

5 Minimum 84.3 Maximum 532.0 Intervalle 447.7 Intervalle interquartile 44.0 Asymétrie 1.310.027 Aplatissement 4.928.055 Taille en pouces femme Moyenne 63.009.0301 Intervalle de confiance à Borne inférieure 62.950 95% pour la moyenne Borne supérieure 63.068 Moyenne tronquée à 5% 63.023 Médiane 63.000 Variance 8.185 Ecart-type 2.8610 Minimum 46.7 Maximum 74.4 Intervalle 27.7 Intervalle interquartile 3.9 Asymétrie -.089.026 Aplatissement.315.052 homme Moyenne 68.217.0336 Intervalle de confiance à Borne inférieure 68.151 95% pour la moyenne Borne supérieure 68.283 Moyenne tronquée à 5% 68.210 Médiane 68.100 Variance 8.949 Ecart-type 2.9915 Minimum 54.9 Maximum 81.3 Intervalle 26.4 Intervalle interquartile 4.0 Asymétrie.029.027 Aplatissement.130.055 Etre fumeur femme Moyenne 1.60.009 Intervalle de confiance à 95% pour la moyenne Borne inférieure 1.58 Borne supérieure 1.62 Moyenne tronquée à 5% 1.55 Médiane 1.00 Variance.667 Ecart-type.816 Minimum 1

6 Maximum 3 Intervalle 2 Intervalle interquartile 1 Asymétrie.856.026 Aplatissement -.963.052 homme Moyenne 1.95.009 Intervalle de confiance à 95% pour la moyenne Borne inférieure 1.93 Borne supérieure 1.97 Moyenne tronquée à 5% 1.95 Médiane 2.00 Variance.660 Ecart-type.812 Minimum 1 Maximum 3 Intervalle 2 Intervalle interquartile 2 Asymétrie.088.027 Aplatissement -1.480.055 Les hommes ont tendance à être un peu plus lourds et un peu plus grands que les femmes. En revanche, il y a moins de différences au niveau de la dispersion pour ces deux variables. Sur les boxplots, les données représentées par des points sont des données extrêmes (beaucoup plus grandes ou petites que les autres observations). Attention, la variable «Fumeur» étant ordinale et non-numérique, la plupart des résultats donnés par SPSS ne font pas de sens et ne doivent pas être considérés! Il faudrait refaire des analyses séparées par sexe en utilisant la fonction FREQUENCIES pour obtenir quelque chose d utile!

7 3. Créer une nouvelle variable Poids2 contenant le poids en kilos et une nouvelle variable Taille2 contenant la taille en mètres. On utilise dans les deux cas la fonction COMPUTE (Transformer -> Calculer la variable). Pour transformer le poids de livres en kilos, il faut multiplier le poids en livres par 0.45359 : COMPUTE Poids2=0.45359 * Poids. VARIABLE LABELS Poids2 'Poids en kilos'. EXECUTE. Pour transformer la taille de pouces en mètres, il faut multiplier la taille en pouces par 0.0254 : COMPUTE Taille2=0.0254 * Taille. VARIABLE LABELS Taille2 'Taille en mètres'. EXECUTE.

8 4. Calculer l indice de masse corporelle à partir de Poids2 et Taille2, puis analyser la distribution du résultat. On utilise à nouveau la fonction COMPUTE pour calculer l IMC : COMPUTE IMC=Poids2/(Taille2 ** 2). VARIABLE LABELS IMC 'Indice de masse corporelle'. EXECUTE. On utilise ensuite la fonction FREQUENCIES pour obtenir une analyse descriptive de l IMC, à nouveau sans table de fréquences en raison du grand nombre de valeurs différentes possibles : Statistiques Indice de masse corporelle N Valide 16969 Manquante 61 Moyenne 27.0330 Médiane 26.1377 Ecart-type 5.83345 Variance 34.029 Minimum 11.68 Maximum 79.38 Centiles 25 22.9974 50 26.1377 75 29.9419 L IMC est asymétrique avec un étalement sur la droite. Il vaut 27.03 en moyenne pour un intervalle s étendant de 11.68 à 79.38 (valeur extrêmement élevée).