Exercice : l indice de Quételet

Documents pareils
Initiation à l analyse en composantes principales

Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas

Première session de travail

Extraction d information des bases de séquences biologiques avec R

Optimiser ses graphiques avec R

Manipuler des données calendaires

Lire ; Compter ; Tester... avec R

Fiche TD avec le logiciel. Courbes de niveau. D. Chessel

Régression non linéaire

Ajustement au modèle de Lotka-Volterra

Annexe commune aux séries ES, L et S : boîtes et quantiles

Introduction aux Statistiques et à l utilisation du logiciel R

Statistiques avec la graph 35+

Un exemple de régression logistique sous

Analyse exploratoire des données


ACP Voitures 1- Méthode

O, i, ) ln x. (ln x)2

Aide-mémoire de statistique appliquée à la biologie

SIMULATIONS, ALGORITHMES EN PROBABILITÉS ET STATISTIQUE(S) AU LYCÉE ET AVEC R

Plan. Notes de Cours sur le logiciel R. Documentations. Installation. Anne PHILIPPE. 26 septembre Documents sur le logiciel R :

OBESITE ET EPS. Cf national, nutrition santé, courbe de corpulence)

Limites finies en un point

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire :

Leslie REGAD ; Gaëlle LELANDAIS. leslie.regad@univ- paris- diderot.fr ; gaelle.lelandais@univ- paris- diderot.fr

Introduction à. Julien Barnier Centre Max Weber CNRS UMR 5283 Version septembre

SEMIN- Gestion des couleurs sous R. Michel BAYLAC. MNHN Département Systématique et Evolution OSEB

Méthode de Monte Carlo pour le calcul d'options

Continuité et dérivabilité d une fonction

Comparaison de fonctions Développements limités. Chapitre 10

TP1 : LOGICIEL R ET PRÉDICTION DE L EFFLORESCENCE ALGALE

Raisonnement par récurrence Suites numériques

Guide de correction TD 6

Gestion mémoire et Représentation intermédiaire

Statistique : Résumé de cours et méthodes

Logiciel XLSTAT version rue Damrémont PARIS

Quoi de neuf en LabVIEW FPGA 2010?

Algorithmes de Transmission et de Recherche de l Information dans les Réseaux de Communication. Philippe Robert INRIA Paris-Rocquencourt

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours.

Monitoring des données relatives au poids effectué par les services médicaux scolaires des villes de Bâle, Berne et Zurich

Intégrales doubles et triples - M

Statistique Descriptive Élémentaire

Année de parution 2 numéro 2 avril-mai-juin 2004

Planche n o 22. Fonctions de plusieurs variables. Corrigé

Revue de la jurisprudence récente du TAQ en matière d affaires sociales. M e Lucie Allard et M e Laurence Ferland 29/11/12

AP1.1 : Montages électroniques élémentaires. Électricité et électronique

Terminale SMS - STL

Exemples d Analyses de Variance avec R

PRECISION - REJET DE PERTURBATIONS T.D. G.E.I.I.

Objectif. Cette formation doit permettre au client d être autonome dans la création de ses rapports avancés en utilisant la fonctionnalité Excel +.

IdR Trading et Microstructure CA Cheuvreux. Charles-Albert Lehalle

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Langage Perl. Introduction & Retour d'expérience. Journée du 30/11/ S. Gallina - GEPV - 1/42

Du bon usage de gnuplot

Fiche d utilisation du logiciel. 1 - Installation. J. Thioulouse & D. Chessel

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

BACCALAURÉAT PROFESSIONNEL SUJET

3 ème 2 DÉVELOPPEMENT FACTORISATIONS ET IDENTITÉS REMARQUABLES 1/5 1 - Développements

Une introduction au langage R

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Séance 0 : Linux + Octave : le compromis idéal

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Technologies de la Recherche et standards du Web: Quel impact sur l Innovation?

2010 Minitab, Inc. Tous droits réservés. Version Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

MIS 102 Initiation à l Informatique

2 Exploration de données et méthodes statistiques

Exo7. Limites de fonctions. 1 Théorie. 2 Calculs

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Dépistage et gestion du diabète

1 Importer et modifier des données avec R Commander

Croissance et vieillissement cellulaires Docteur COSSON Pierre Nb réponses = 81 sur 87. Résultats des questions prédéfinies

Microsoft Excel : tables de données

Modélisation du risque opérationnel Approche Bâle avancée

Développement d une application pilote

FIMA, 7 juillet 2005

TD d économétrie appliquée : Introduction à STATA

Exercice 1 Trouver l équation du plan tangent pour chaque surface ci-dessous, au point (x 0,y 0,z 0 ) donné :

INTRODUCTION AU LOGICIEL R

Corrigé des TD 1 à 5

introduction Chapitre 5 Récursivité Exemples mathématiques Fonction factorielle ø est un arbre (vide) Images récursives

Compilation (INF 564)

L inégale répartition de l énergie solaire est à l origine des courants atmosphériques

Compréhension de lecture

Distinctions et classements

Notice technique. Système de surveillance MAS 711

TD 1 - Structures de Traits et Unification

Le Système d Information Routier

Cartographie des Hotspots Démographiques et du Changement Climatique: Pérou

ABS 2RM : quels effets observés sur la fréquence accident?

VOLT LA NOUVELLE CHEVROLET

Programmation Objet - Cours II

Schréder partenaire des villes et communes. Nivelles grand place

Analyse des correspondances avec colonne de référence

Architecture matérielle des systèmes informatiques

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Gestion des données avec R

ESIEA PARIS

Transcription:

Fiche TD avec le logiciel : tdr15 Eercice : l indice de Quételet A.B. Dufour, D. Chessel & J.R. Lobry La masse corporelle d un individu est mesurée à partir du poids et de la taille. L indice le plus utilisé est celui proposé par Adolphe Quételet (1796-1874), astronome et mathématicien belge (http://statbel.fgov.be/info/quetelet_ fr.asp) 1 Questions 1. Construire la variable indice de Quételet à partir des données de t3var (fiche 1.2). = poids taille 2 La taille est eprimée en mètre et le poids en kilogrammes. Cet indice s appelle aujourd hui indice de masse corporelle () ou body mass inde (bmi). Il permet de mesurer la corpulence de l homme adulte. L Organisation Mondiale de la Santé a défini les critères suivants : maigreur (inférieur à 18.5), normal (de 18.5 à 25), risque de surpoids (de 25 à 30), obésité (supérieur à 30). Mais l indice de Quételet n a qu une valeur indicative. Pour déterminer l eistence d une obésité réelle, il faut faire d autres mesures destinées à établir eactement la proportion de masse grasse, car c est l ecès de masse grasse qui représente un facteur de risque. 2. Calculer les paramètres statistiques élémentaires de cette nouvelle variable sur l ensemble des individus et en fonction de chaque see. 3. Construire l histogramme de cette nouvelle variable sur l ensemble des individus. 4. Comparer graphiquement les indices de masse corporelle chez les hommes et chez les femmes à l aide d histogrammes et de fonctions de répartitions empiriques (utiliser la fonction ecdf de la librairie stepfun). 5. En utilisant la fonction boplot, représenter l indice de Quételet en fonction du see. 6. Construire sur un seul graphique les nuages de points de l indice de Quételet en fonction de la taille, en fonction du poids, pour chaque see. Commenter. 1

7. Représenter, sur un seul graphique, le nuage de points de l indice de Quételet en spécifiant hommes et femmes. Placer les bornes des critères de l O.M.S. Commenter. 2 Réponses 1. Les données options(digits = 4) t3var <- read.table("http://pbil.univ-lyon1.fr/r/donnees/t3var.tt", h = T) poi <- t3var$poi tai <- t3var$tai * 0.01 see <- factor(t3var$see) <- poi/(tai^2) [1] 20.76 19.96 17.24 18.17 17.72 19.29 18.29 20.16 20.31 20.90 19.47 26.77 19.92 [14] 23.04 21.46 20.43 19.71 24.66 22.34 20.48 19.63 18.82 25.01 23.37 18.34 23.04 [27] 21.60 20.16 23.66 20.48 19.25 22.09 23.99 18.07 17.99 22.27 19.95 19.49 22.31 [40] 21.22 23.15 19.05 16.92 19.26 18.38 21.74 22.40 21.56 21.67 20.37 22.41 24.93 [53] 21.97 18.13 24.96 22.22 19.82 21.88 25.66 22.28 23.20 25.96 23.80 20.52 20.89 [66] 21.39 2. Paramètres statistiques élémentaires summary() Min. 1st Qu. Median Mean 3rd Qu. Ma. 16.9 19.5 20.9 21.2 22.4 26.8 mean() [1] 21.16 var() [1] 5.137 sd() [1] 2.267 s <- split(, see) s [1] 19.96 17.24 18.17 17.72 19.29 18.29 20.31 19.47 20.43 19.71 19.63 18.82 18.34 [14] 23.66 20.48 18.07 17.99 22.27 19.95 19.49 22.31 19.05 16.92 18.13 20.89 [1] 20.76 20.16 20.90 26.77 19.92 23.04 21.46 24.66 22.34 20.48 25.01 23.37 23.04 [14] 21.60 20.16 19.25 22.09 23.99 21.22 23.15 19.26 18.38 21.74 22.40 21.56 21.67 [27] 20.37 22.41 24.93 21.97 24.96 22.22 19.82 21.88 25.66 22.28 23.20 25.96 23.80 [40] 20.52 21.39 lapply(s, mean) [1] 19.46 [1] 22.19 lapply(s, var) Logiciel R version 2.6.1 (2007-11-26) tdr15.rnw Page 2/7 Compilé le 2008-01-25

[1] 2.673 [1] 3.858 lapply(s, sd) [1] 1.635 [1] 1.964 lapply(s, summary) Min. 1st Qu. Median Mean 3rd Qu. Ma. 16.9 18.2 19.5 19.5 20.3 23.7 Min. 1st Qu. Median Mean 3rd Qu. Ma. 18.4 20.8 22.0 22.2 23.2 26.8 3. Histogramme sur l ensemble des individus hist(, col = grey(0.8)) Histogram of Frequency 0 2 4 6 8 10 12 16 4. Représentations graphiques par see lapply(s, range) [1] 16.92 23.66 [1] 18.38 26.77 Logiciel R version 2.6.1 (2007-11-26) tdr15.rnw Page 3/7 Compilé le 2008-01-25

par(mfcol = c(2, 2)) par(mar = c(5, 4, 3, 2)) hist([see == "h"], main = "Hommes", lab = "", lim = c(16, 27), col = grey(0.9)) hist([see == "f"], main = "Femmes", lab = "", lim = c(16, 27), col = grey(0.9)) plot(ecdf([see == "h"]), main = "") plot(ecdf([see == "f"]), main = "") Hommes Frequency 0 2 4 6 8 16 Femmes Frequency 0 2 4 6 8 16 18 20 22 24 Passage à la modélisation par(mfcol = c(2, 2)) par(mar = c(5, 4, 3, 2)) hist(h <- [see == "h"], main = "Hommes", lab = "", lim = c(16, 27), col = grey(0.9), prob = T) lines(0 <- seq(16, 28, le = 50), dnorm(0, mean(h), sd(h)), lwd = 2, col = "red") hist(f <- [see == "f"], main = "Femmes", lab = "", lim = c(16, 27), col = grey(0.9), prob = T) lines(1 <- seq(16, 26, le = 50), dnorm(1, mean(f), sd(f)), lwd = 2, col = "red") plot(ecdf(h), main = "") lines(0, pnorm(0, mean(h), sd(h)), lwd = 2, col = "red") plot(ecdf([see == "f"]), main = "") lines(1, pnorm(1, mean(f), sd(f)), lwd = 2, col = "red") Logiciel R version 2.6.1 (2007-11-26) tdr15.rnw Page 4/7 Compilé le 2008-01-25

Hommes Density 0.00 0.10 0.20 16 Femmes Density 0.00 0.10 0.20 0.30 16 18 20 22 24 5. Boîte à moustaches boplot( ~ see, col = grey(0.8)) f h 6. Relation entre l, la taille et le poids par(mfcol = c(2, 2)) par(mar = c(5, 4, 2, 2)) plot([see == "h"], tai[see == "h"], lim = c(min(), ma()), ylim = c(min(tai), ma(tai)), pch = 20, lab = "", ylab = "taille", main = "hommes") plot([see == "h"], poi[see == "h"], lim = c(min(), ma()), ylim = c(min(poi), ma(poi)), pch = 20, lab = "", ylab = "poids") plot([see == "f"], tai[see == "f"], lim = c(min(), ma()), ylim = c(min(tai), ma(tai)), pch = 20, lab = "", ylab = "taille", main = "femmes") plot([see == "f"], poi[see == "f"], lim = c(min(), ma()), ylim = c(min(poi), ma(poi)), pch = 20, lab = "", ylab = "poids") Logiciel R version 2.6.1 (2007-11-26) tdr15.rnw Page 5/7 Compilé le 2008-01-25

A.B. Dufour, D. Chessel & J.R. Lobry hommes femmes taille 1.5 1.6 1.7 1.8 1.9 2.0 taille 1.5 1.6 1.7 1.8 1.9 2.0 poids 50 60 70 80 poids 50 60 70 80 7. Un seul graphique Version de base plot(, pch = 19, ce = 2, col = c("deeppink3", "blue")[unclass(see)]) abline(h = 18.5) abline(h = 25) title("indice de masse corporelle") ll0 = c("femmes", "hommes") legend(1, 24.8, ll0, pch = 21, pt.ce = 2, ce = 1.25, col = c("deeppink3", "blue"), pt.bg = c("deeppink3", "blue")) indice de masse corporelle femmes hommes 0 10 20 30 40 50 60 Inde Version Graphe de Cleveland neo = c(sort(f), sort(h)) neose = as.factor(rep(c("f", "h"), c(25, 41))) moyennes = c(mean(f), mean(h)) dotchart(neo, main = "indice de masse corporelle", pch = 21, bg = grey(0.8), ce = 1.25, groups = neose, gdata = moyennes, gpch = 19, gcol = c("deeppink3", "blue")) abline(v = 18.5, lwd = 2, col = grey(0.6)) abline(v = 25, lwd = 2, col = grey(0.6)) Logiciel R version 2.6.1 (2007-11-26) tdr15.rnw Page 6/7 Compilé le 2008-01-25

indice de masse corporelle f h Logiciel R version 2.6.1 (2007-11-26) tdr15.rnw Page 7/7 Compilé le 2008-01-25