Croisement de deux variables quantitatives



Documents pareils
Chapitre 3. Les distributions à deux variables

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Le Test d effort. A partir d un certain âge il est conseillé de faire un test tous les 3 ou quatre ans.

Items étudiés dans le CHAPITRE N5. 7 et 9 p 129 D14 Déterminer par le calcul l'antécédent d'un nombre par une fonction linéaire

Test de terrain ou test de laboratoire pour la performance en endurance?

Leçon N 4 : Statistiques à deux variables

Correction du bac blanc CFE Mercatique

Relation entre deux variables : estimation de la corrélation linéaire

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

BACCALAUREAT GENERAL MATHÉMATIQUES

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Complément d information concernant la fiche de concordance

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Initiation à l analyse en composantes principales

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Correction du baccalauréat STMG Polynésie 17 juin 2014

Seconde Généralités sur les fonctions Exercices. Notion de fonction.

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LE PROCESSUS ( la machine) la fonction f. ( On lit : «fonction f qui à x associe f (x)» )

1 Importer et modifier des données avec R Commander

L'identité de l'entreprise

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

INTRODUCTION AU DATA MINING

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

Le mouvement vitalité! Un pas vers la forme! Sport-Santé. Acti March

L analyse de la gestion de la clientèle

Le sport de haut niveau à l UPMC

Nombre dérivé et tangente

Les devoirs en Première STMG

Chapitre 3 : Le budget des ventes. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 3

LES DIFFERENTS TYPES DE MESURE

LE CYCLISME POUR TOUS EN 2013

SPORT ET PERSONNALITE

Annexe commune aux séries ES, L et S : boîtes et quantiles

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

B = A = B = A = B = A = B = A = Recopier sur la copie chaque expression numérique et la réponse exacte. Réponse A Réponse B Réponse C Solution

a et b étant deux nombres relatifs donnés, une fonction affine est une fonction qui a un nombre x associe le nombre ax + b

Statistique : Résumé de cours et méthodes

MASTER 2 SCIENCES HUMAINES ET SOCIALES Mention Psychologie. Spécialité : Recherches en psychologie

MATHÉMATIQUES. Mat-4104

Année de campagne : 2015 N appel à candidatures : 1520 Publication : Publication prévue le : 21/04/2015

Lecture graphique. Table des matières

Les fonction affines

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Théorie des sondages : cours 5

Analyse des mesures anthropométriques et de la composition corporelle des cégépiens et des cégépiennes

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Mise à jour de la réglementation du cyclisme pour tous

PROGRAMME RADAR DE RCA ROWING ATHLETE DEVELOPMENT AND RANKING (Développement et classement des athlètes d aviron) pour les athlètes de développement

OBESITE ET EPS. Cf national, nutrition santé, courbe de corpulence)

C f tracée ci- contre est la représentation graphique d une

Manutentions manuelles Statistique nationale / Ile de France 1992

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Baccalauréat ES Amérique du Nord 4 juin 2008

Principes de mathématiques 12 SÉRIE DE PROBLÈMES. Septembre Student Assessment and Program Evaluation Branch

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

Dr Laurence FAYARD- JACQUIN Cœurs du Forez Mise à jour

Exemples d utilisation de G2D à l oral de Centrale

Introduction au datamining

BACCALAURÉAT GÉNÉRAL SÉRIE SCIENTIFIQUE

Le Data WareHouse à l INAMI Exploitation des données

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Oscillations libres des systèmes à deux degrés de liberté

BONUS MALUS. Voici, la façon de calculer la prime : Le montant de la prime à acquitter est égale à : P = PB. C où : P

APS résumé partie III

INF6304 Interfaces Intelligentes

Chapitre 4 : Régression linéaire

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Chapitre 2 Le problème de l unicité des solutions

Logiciel XLSTAT version rue Damrémont PARIS

Classe de première L

Questionnaire de vérification pour l implantation de la norme ISO dans une entreprise

Mesures et incertitudes

ntred 2007 Résultats de l étude Description des personnes diabétiques

Introduction à l approche bootstrap

Ressources pour le lycée général et technologique

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Compte rendu de LA37 B, TP numéro 1. Evolution de la température et du degrée d'hydratation

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Trépier avec règle, ressort à boudin, chronomètre, 5 masses de 50 g.

BTS Groupement A. Mathématiques Session Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

TSTT ACC OUTILS DE GESTION COMMERCIALE FICHE 1 : LES MARGES

Statistiques à deux variables

PRÉPARATION TERMINALE AVANT UNE ÉCHÉANCE MAJEURE

2 / ENONCER ET DECRIRE LES FONCTIONS DE SERVICE A REALISER

Collecter des informations statistiques

PLAN ENTRAINEMENT TRAIL LONG (>60 KM) FORTE DÉNIVÉLATION (>2 KM D+)

INFLUENCE DU TERRAIN LORS D UN EFFORT RÉALISÉ À PUISSANCE MAXIMALE AÉROBIE EN CYCLISME

COURSE D ORIENTATION

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Statistique Descriptive Élémentaire

Licence MASS (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Transcription:

Fiche TD avec le logiciel : tdr206 Croisement de deux variables quantitatives A.B. Dufour & M. Royer L objectif de cette séance est d étudier la relation entre deux variables quantitatives. Les notions abordées sont détaillées sur le site dans le cours BS02. Table des matières Principe Général 2 Exercice 1 3 Exercice 2 4 Exercice 3 5 Annexe : éléments d interprétation de la fréquence cardiaque 6 1

Principe Général A.B. Dufour & M. Royer Recherche des paramètres qui minimisent les écarts entre les valeurs observées et les valeurs modélisées. Pour cela, nous donnons un exemple de relation entre deux variables X et Y. Après avoir construit le nuage de points, nous proposons comme paramètres initiaux, pour la droite de régression, une pente b = 1 6 et une ordonnée à l origine a = 17. Puis nous calculons la moyenne des carrés des écarts entre les valeurs observées et les valeurs modélisées. x <- c(61, 67, 32, 43, 57, 44, 39, 38, 42, 51) y <- c(30, 33, 15, 23, 26, 18, 23, 17, 27, 37) plot(x, y, xlim=c(20, 80), ylim=c(10,40), pch=15, las = 1, main = "Le critère d'ajustement") b <- 1/6 a <- 17 ytheo <- b*x + a abline(a,b) points(x, ytheo, pch=20, col="blue", cex=1.5) segments(x,ytheo,x,y) mess <- paste("ecart = ",round(mean((y-ytheo)^2),dig=2)) text(50,12,mess) 1) Faire varier les paramètres de la pente b et de l ordonnée à l origine a. 2) Regarder la valeur des écarts entre les valeurs observées et les valeurs modélisées. Les énoncés des exercices suivants sont tirés du livre Statistique Vraiment appliquée au sport. Cours et Exercices. écrit par S. Champely aux éditions De boeck et Larcier en 2003. Logiciel R version 3.0.2 (2013-09-25) tdr206.rnw Page 2/6 Compilé le 2014-01-31

Exercice 1 La Fréquence Cardiaque Maximum, notée FCM, est un paramètre essentiel pour permettre au coureur de fond d élaborer des plans d entraînement efficaces. Cette fréquence peut se mesurer, soit en laboratoire sur tapis roulant, soit sur le terrain à l aide d un cardio-fréquencemètre. 1) Une première étude a été faite auprès de 13 hommes s entraînant régulièrement (2 à 4 fois par semaine), et participant à de petites compétitions. On a mesuré leur fréquence cardiaque maximum. On souhaite étudier une relation éventuelle entre l âge d un individu et sa fréquence cardiaque maximum. Voici pour chaque individu son âge et sa fréquence cardiaque maximum. Age 40 36 51 49 47 51 32 55 55 FCM 187 195 180 190 185 183 195 185 189 23 49 52 35 201 189 185 195 a) Tracer le nuage de points, avec l âge en abscisse et la FCM en ordonnée. b) Calculer le coefficient de corrélation linéaire entre la variable âge et la variable FCM. Que constatez-vous? Peut-on dire que la fréquence cardiaque est fortement corrélée à l âge des sportifs? c) Calculer l équation de la droite de régression linéaire. Tracer cette droite sur le même graphe que le nuage de points. d) Utiliser cette relation pour donner une estimation de votre FCM. e) Peter Snell (Nouvelle-Zelande) a été 6 fois recordman du monde en demifond, du 800m au mile (1609m), à l âge de 26 ans (26,6 exactement). A l époque, sa FCM était de 192. Placer ce point sur le graphique. D après la droite de régression, quelle FCM devrait-il avoir pour son âge? Commenter. 2) Lors d un entraînement en endurance, la fréquence cardiaque du sportif se situe entre 70 % et 80 % de la FCM. a) Pour vous entraîner en endurance, dans quel intervalle doit se situer, lors de l effort, votre fréquence cardiaque? b) Pour s entraîner en endurance, dans quel intervalle doit se situer, lors de l effort, la fréquence cardiaque d un sportif qui a une FCM de 185? 3) Dans la littérature, on trouve une formule appelée formule d Astrand qui relie la FCM à l âge : FCM = 220 âge a) Ajouter cette autre droite sur le graphe. b) Utiliser la formule d Astrand pour prédire votre FCM. Logiciel R version 3.0.2 (2013-09-25) tdr206.rnw Page 3/6 Compilé le 2014-01-31

c) Le calcul de la droite de régression a-t-il donné le même genre de relation? d) Pour un coureur de 105 ans, quelle est la FCM prédite? Que pensez-vous de cette prédiction? 4) La régression linéaire de l âge par rapport à la fréquence cardiaque a-t-elle un sens biologique? Exercice 2 On rappelle que l indice de Quételet, appelé encore indice de masse corporelle (IMC) est donné par : IMC = poids (taille) où la taille est exprimée en mètre et le 2 poids en kilogrammes. Il est défini comme le standard pour évaluer les risques liés au surpoids chez l adulte. (18 à 65 ans). Attention! Il ne prend pas en compte la proportion de masse musculaire ni de masse osseuse. Il est donc inadapté sur certaines populations et en particulier les sportifs qui se retrouvent alors très souvent en surpoids alors que leur forme physique est souvent meilleure que la moyenne des individus (http://fr.wikipedia.org/wiki/indice_de_masse_corporelle). 1) On va utiliser les données qui se trouvent dans le fichier L3APA06.txt, c està dire les réponses au questionnaire des étudiants de la licence Activités Physiques Adaptées, promotion 2006. a) Calculer l IMC des étudiants et étudier cette variable. b) Tracer l IMC en fonction de la taille de chaque étudiant. Est-il pertinent de faire une régression de l IMC par rapport à la taille? c) Tracer l IMC en fonction du poids de chaque étudiant. Que pouvez-vous remarquer? d) D après la droite de régression de l IMC par rapport au poids, quel IMC devriez-vous avoir pour votre poids? Qu est-ce que cela signifie? 2) Considérons maintenant un échantillon très particulier, réunissant les médaillés (or) masculins français lors des Jeux Olympiques de Sydney en 2000. Pour les épreuves par équipe, on a retenu un seul médaillé, le premier dans l ordre alphabétique. Nom Taille Poids Spécialité Andrieux 192 97 Aviron Asloum 165 63 Boxe Bette 186 70 Aviron Douillet 196 125 Judo Dumoulin 171 64 Tir Estanguet 182 75 Canoê-Kayak Ferrari 187 83 Escrime Gané 176 79 Cyclisme sur Piste Martinez 164 50 VTT Rousseau 182 85 Cyclisme sur Piste Logiciel R version 3.0.2 (2013-09-25) tdr206.rnw Page 4/6 Compilé le 2014-01-31

a) Calculer l IMC de ces champions olympiques. b) Calculer la droite de régression de l IMC par rapport au poids de ces sportifs. Cette droite de régression est-elle pertinente? c) Quel est le point le moins bien représenté par la droite de régression? Exercice 3 Attention!!! Corrélation n est pas Causalité. Il existe de nombreuses situations où, malgré un coefficient de corrélation élevé entre 2 variables quantitatives, on ne peut pas établir de relation de cause à effet entre elles. L exemple suivant illustre ces propos. On a relevé la production de bière alsacienne et le nombre de licences sportives des fédérations françaises entre 1960 et 1995. Années Nombre de licences Production de bière en Belgique (en milliers) (en millions d hectolitres) 1960 1640 3.3 1960 1640 3.3 1965 2220 4.1 1970 3240 5.6 1975 4620 8.0 1980 6300 9.6 1985 8340 10.2 1990 8980 11.3 1995 9210 11.2 Calculer la corrélation entre les variables Licences et Bières. Peut-on en déduire que la pratique du sport conduit à boire de la bière? Logiciel R version 3.0.2 (2013-09-25) tdr206.rnw Page 5/6 Compilé le 2014-01-31

Annexe : éléments d interprétation de la fréquence cardiaque Afin d interpréter judicieusement l exercice 1, nous donnons quelques extraits d un document rédigé par Michel LESBATS (http://hse.iut.u-bordeaux1. fr/lesbats/physiosite/physiowhtm/phyw3.htm)....a partir de 40 ans la fréquence cardiaque de repos s accroît et le débit cardiaque diminue (baisse d efficacité du travail cardiaque). Pour une même contrainte musculaire, le coeur bat d autant plus vite que le sujet est plus âgé. Or la fréquence cardiaque maximale décroit avec l âge (195Rc/mn à 20 ans, 185 Rc/mn à 30 ans, 165 Rc/mn à 60 ans). La conjonction de ces divers phénomènes entraîne une sérieuse limitation de la puissance maximale fournie......les individus âgés ont une fréquence cardiaque de repos (fcra) plus élevée que celle d un individu jeune (fcrj). Les individus âgés ont une fréquence cardiaque maximale (fcma) plus faible que celle d un individu jeune (fcmj). Logiciel R version 3.0.2 (2013-09-25) tdr206.rnw Page 6/6 Compilé le 2014-01-31