VARIABLES QUANTITATIVES CONTINUES

Documents pareils
Statistique : Résumé de cours et méthodes

Statistiques Descriptives à une dimension

Annexe commune aux séries ES, L et S : boîtes et quantiles

Représentation d une distribution

Statistiques 0,14 0,11

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Séries Statistiques Simples

Statistique Descriptive Élémentaire

Séquence 4. Statistiques. Sommaire. Pré-requis Médiane, quartiles, diagramme en boîte Moyenne, écart-type Synthèse Exercices d approfondissement

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

1. Vocabulaire : Introduction au tableau élémentaire

3. Caractéristiques et fonctions d une v.a.

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

STATISTIQUES DESCRIPTIVES

INFIRMIER(E) GRADUE(E) SPECIALISE(E) EN SANTE COMMUNAUTAIRE HAUTE ECOLE DE LA PROVINCE DE LIEGE PROFESSEUR : RENARD X.

Evolution des risques sur les crédits à l habitat

BACCALAURÉAT PROFESSIONNEL SUJET

Statistiques avec la graph 35+

Leçon N 4 : Statistiques à deux variables

Introduction à la statistique descriptive

UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1

Inégalités de salaires et de revenus, la stabilité dans l hétérogénéité

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

Bulletin d information statistique

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

Les fonction affines

- Ressources pour les classes

Classe de première L

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Strasbourg. De la statistique. aux probabilités. en lycée. De la statistique. aux probabilités. en lycée. Octobre 2006

Résumé du Cours de Statistique Descriptive. Yves Tillé

Lire ; Compter ; Tester... avec R

Étude sur les taux de revalorisation des contrats individuels d assurance vie au titre de 2013 n 26 mai 2014

Correction du bac blanc CFE Mercatique

Indications pour une progression au CM1 et au CM2

Logiciel XLSTAT version rue Damrémont PARIS

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

Items étudiés dans le CHAPITRE N5. 7 et 9 p 129 D14 Déterminer par le calcul l'antécédent d'un nombre par une fonction linéaire

Correction : E = Soit E = -1,6. F = 12 Soit F = y = 11. et G = -2z + 4y G = 2 6 = 3 G = G =

La nouvelle planification de l échantillonnage

Statistiques - Cours. 1. Gén éralités. 2. Statistique descriptive univari ée. 3. Statistique descriptive bivariée. 4. Régression orthogonale dans R².

glossaire Appellation commerciale Voir nom de marque.

ÉTUDE. SECTEUR Santé PHARMACIES D OFFICINE. Portrait de branche

MATHÉMATIQUES. Mat-4104

Les devoirs en Première STMG

Calculs de probabilités avec la loi normale

Le patrimoine des ménages retraités : résultats actualisés. Secrétariat général du Conseil d orientation des retraites

Tableau de Bord. Clas 1.1 Conduite d'un projet de communication

COMMUNICATION PREPAREE PAR M. BRUNO ROBINE AU NOM DE LA COMMISSION DE L EMPLOI ET DU DEVELOPPEMENT ECONOMIQUE

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Dares Analyses. Les bas salaires en France entre 1995 et 2011

OM 1 Outils mathématiques : fonction de plusieurs variables

Traceur de courbes planes

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ

NOUVEAU COMPATIBLE COFRAC. Validez la conformité de vos échantillons en un seul geste. Le tube témoin enregistreur de température

Les paradoxes des marchés de bureaux et du logement Les prévisions IEIF : l année dangereuse Entre rechute et guérison?

Notion de fonction. Série 1 : Tableaux de données. Série 2 : Graphiques. Série 3 : Formules. Série 4 : Synthèse

Marché de l occasion et exigences de rénovation énergétique. Rencontre de l Observatoire 21 mai 2015

Du Premier au Second Degré

Statistiques descriptives

Différentiabilité ; Fonctions de plusieurs variables réelles

Logistique, Transports

Aide-mémoire de statistique appliquée à la biologie

à moyen Risque moyen Risq à élevé Risque élevé Risq e Risque faible à moyen Risq Risque moyen à élevé Risq

Notion de fonction. Résolution graphique. Fonction affine.

Les problèmes de la finale du 21éme RMT

Je fais le point 1. PrénoM :... Il y a... oiseaux. Guide de l enseignant p.64. Écris les nombres dictés. Écris les nombres effacés par Gribouille.

Les salaires réels ont ils été affectés par les évolutions du chômage en France avant et pendant la crise?

Chapitre 3 : Le budget des ventes. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 3

C11.2 Identifier les solutions à mettre en œuvre C11.3 Préparer le cahier des charges

Les algorithmes de base du graphisme

Élément 424b Introduction à la statistique descriptive

STATISTIQUES DESCRIPTIVES

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Factorisation Factoriser en utilisant un facteur commun Fiche méthode

Image d un intervalle par une fonction continue

Séquence 6. Justice sociale et inégalités. Sommaire

Qui épargne? Qui désépargne?

TSTI 2D CH X : Exemples de lois à densité 1

EXERCICES DE REVISIONS MATHEMATIQUES CM2

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Précision d un résultat et calculs d incertitudes

MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .

MATHS FINANCIERES. Projet OMEGA

NOTES DE COURS STT1700. Introduction à la statistique. David Haziza

OUTILS STATISTIQUES ET NUMÉRIQUES

- affichage digital - aiguille

Analyse exploratoire des données

Traitement des données avec Microsoft EXCEL 2010

Introduction aux Statistiques et à l utilisation du logiciel R

Chapitre 2 Le problème de l unicité des solutions

«FLOTTE AUTOMOBILE & AUTO-MISSION»

ÉVALUATION EN FIN DE CM1. Année scolaire LIVRET DE L'ÉLÈVE MATHÉMATIQUES

d. Tendances du marché...22 e. Une vision européenne...22 III. La distribution en France... 23

FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1

AMELIORATIONS DES FONCTIONNALITES DISPONIBLES

Transcription:

L1 Psycho Statistiques descriptives VARIABLES QUANTITATIVES CONTINUES 1. Exercices de synthèse...................... 1 2. Boîtes à moustaches et intervalles de variation......... 8 3. Changement d unités...................... 11 1. Exercices de synthèse Exercice 1.1. La répartition des salariés français en 2004 selon la durée de trajet (en minute) pour se rendre à leur travail est donné par le tableau suivant : durée 0 ; 5 5 ; 10 10 ; 15 15 ; 20 20 ; 25 25 ; 30 30 ; 40 40 ; 50 50 ; 70 70 ; 120 pourcentage 2,85 9,96 13,58 12,86 11,41 9,47 13,61 8,15 7,96 10,15 Source : DADS, 2004 (INSEE). (La durée de trajet maximale a été arbitrairement choisie à 120 min pour les besoins de l exercice.) (a) Déterminer la population et la variables étudiée (en précisant son type). (b) Représenter graphiquement la distribution des proportions. (c) Déterminer la classe modale de la variable. (d) Représenter graphiquement la proportion de salariés ayant un trajet compris entre 7 et 22 minutes. Calculer cette proportion. (e) Calculer, à l aide de la fonction de répartition, la proportion de salariés mettant moins de 35 minutes pour aller à leur lieu de travail. Même question pour un temps de trajet compris entre 17 et 35 minutes. ( f) Déterminer la moyenne et l écart-type de la variable. (g) Déterminer la médiane, les quartiles ainsi que les premier et neuvièmes déciles. (h) Représenter graphiquement la fonction de répartition. 1

Corrigé de l exercice 1.1. (a) Population : salariés Français en 2004. Individu : un salarié Français en 2004. Variable étudiée : «temps de trajet» ; c est une variable quantitative continue qui prend des modalités entre 0 et 200 minutes. (b) La variable étant continue, on va la représenter graphiquement à l aide d un histogramme. Pour cela on a besoin de déterminer les densités de proportion des classes et donc de calculer les amplitudes. Vu les questions suivantes (sur la fonction de répartition, la moyenne, la médiane), on met également dans le tableau les proportions cumulées ainsi que les centre des classes. durée 0 ; 5 5 ; 10 10 ; 15 15 ; 20 20 ; 25 25 ; 30 30 ; 40 40 ; 50 50 ; 70 70 ; 120 prop. (%) 2,85 9,96 13,58 12,86 11,41 9,47 13,61 8,15 7,96 10,15 amplitude 5 5 5 5 5 5 10 10 20 50 dens. prop.(%) 0,57 1,992 2,716 2,572 2,282 1,894 1,361 0,815 0,398 0,203 prop. cum.(%) 2,85 12,81 26,39 39,25 50,66 60,13 73,74 81,89 89,85 100 centre 2,5 7,5 12,5 17,5 22,5 27,5 35 45 60 95 On trace l histogramme. Le choix de l échelle sur l axe des abscisses doit permettre d aller de 0 à 200 et le choix sur l axe des ordonnées d aller de 0 à la plus grande densité de proportion, à savoir 2,719. Les rectangles de l histogramme ont pour largeur l amplitude de la classe et pour hauteur la densité de proportion : 2

densité de proportion (en %) 3,0 2,5 2,0 1,5 1,0 0,5 0 0 10 20 30 40 50 60 70 80 90 100 110 120 durée du trajet (en min) (c) La classe modale est la classe qui a la plus grande densité de proportion, donc c est 10 ; 15. (d) Sur l histogramme précédent on a mis les salariés dont le temps de trajet est compris entre 7 et 22 minutes en grisé. Calculons la proportion correspondante (rappelons que l aire d un rectangle est égale à sa base multipliée par sa hauteur) : P(7 X 22) = aire de la partie hachurée = somme des aires des rectangles hachurés = 3 1,992 + 5 2,716 + 5 2,572 + 2 2,282 = 5,976 + 13,580 + 12,860 + 4,564 = 36,98 Il y a environ 36,98 % de salariés français dont le temps de trajet est compris entre 7 et 22 minutes. (e) La classe contenant x = 35 est a ; b = 30 ; 40 donc a = 30 et b = 40 d où F(a) = P(X 3

30) = 60,13 et F(b) = P(X 40) = 73,74. Appliquons la formule : F(35) = F(x) = F(a) + (F(b) F(a)) x a b a 35 30 = F(30) + (F(40) F(30)) 40 30 = 60,13 + (73,74 60,13) 5 10 = 60,13 + 13,61 1 2 = 60,13 + 6,805 = 66,935 Il y a environ 66,935 % de salariés français dont le temps de trajet est inférieur à 35 minutes. Pour calculer P(17 X 35), on utilise la formule P(17 X 35) = F(35) F(17). On a déjà calculé F(35), donc il ne nous manque que F(17). La classe contenant x = 17 est a ; b = 15 ; 20 donc a = 15 et b = 20 d où F(a) = P(X 15) = 26,39 et F(b) = P(X 20) = 39,25. Appliquons la formule : F(17) = F(x) = F(a) + (F(b) F(a)) x a b a 17 15 = F(15) + (F(20) F(15)) 20 15 = 26,39 + (39,25 26,39) 2 5 = 26,39 + 12,86 0,4 = 26,39 + 5,144 = 31,534 Il y a environ 31,534 % de salariés français dont le temps de trajet est inférieur à 17 minutes. On a donc : P(17 X 35) = F(35) F(17) = 66,935 31,534 = 35,401. Il y a environ 35,401 % de salariés français dont le temps de trajet est compris entre 17 et 35 minutes. ( f) Puisqu on n a pas les effectifs mais uniquement les proportions, on utilise la formule µ = k p i x i, i=1 4

où p i est la proportion de la i-ième classe (exprimée comme un nombre compris entre 0 et 1 et non comme un pourcentage) et x i le centre de la i-ième classe. Cela donne : µ = 0,0285 2,5 + 0,0996 7,5 + 0,1358 12,5 + 0,1286 17,5 + 0,1141 22,5 + 0,0947 27,5 + 0,1361 35 + 0,0815 45 + 0,0796 60 + 0,1015 95 = 32.7873 Le temps de trajet moyen des salariés français est de 32,7873 minutes. L écart-type est donné par la formule ( k ) σ = p i (xi 2) µ 2 i=1 = (0,0285 2,5 2 + 0,0996 7,5 2 + 0,1358 12,5 2 + 0,1286 17,5 2 + 0,1141 22,5 2 + 0,0947 27,5 2 + 0,1361 35 2 + 0,0815 45 2 + 0,0796 60 2 + 0,1015 95 2 ) 32,7873 2 = 1730,12 1075,0038 = 655,1162 = 25,60. La dispersion du temps de trajet des salariés français autour de la moyenne est 25,60. (g) Calcul de la médiane La proportion cumulée de 50 % correspond à la classe a ; b = 20 ; 25 donc la médiane est donnée par la formule 50 P(X a) médiane = a + (b a) 50 39,25 = 20 + (25 20) 50,66 39,25 = 20 + 5 10,75 11,41 = 20 + 5 0,9422 = 20 + 4,71 = 24,71. Au moins la moité des temps de trajet est 24,71 minutes et au moins la moité des temps de trajet est 24,71 minutes. Calcul du premier quartile La proportion cumulée de 25 % correspond à la classe a ; b = 5

10 ; 15 donc le premier quartile est donné par la formule 25 P(X a) Q 1 = a + (b a) 25 12,81 = 10 + (15 10) 26,39 12,81 = 10 + 5 12,19 13,58 = 10 + 5 0,8976 = 10 + 4,49 = 14,49. Au moins un quart des temps de trajet est 14,49 minutes et au moins trois quart des temps de trajet est 14,49 minutes. Calcul du troisième quartile La proportion cumulée de 75 % correspond à la classe a ; b = 40 ; 50 donc le troisième quartile est donné par la formule 75 P(X a) Q 3 = a + (b a) 75 73,74 = 40 + (50 40) 82,89 73,74 = 40 + 10 1,26 8,15 = 40 + 10 0,1377 = 40 + 1,38 = 41,38. Au moins trois quart des temps de trajet est 41,38 minutes et au moins un quart des temps de trajet est 41,38 minutes. Calcul du premier décile La proportion cumulée de 10 % correspond à la classe a ; b = 5 ; 10 donc le premier décile est donné par la formule 10 P(X a) D 1 = a + (b a) 10 2,85 = 5 + (10 5) 12,81 2,85 = 5 + 5 7,15 9,96 = 5 + 5 0,7179 = 5 + 3,59 = 8,59. Au moins 10 % des temps de trajet est 8,59 minutes et au moins 90 % des temps de trajet est 8,59 minutes. 6

Calcul du neuvième décile La proportion cumulée de 90 % correspond à la classe a ; b = 70 ; 120 donc le premier décile est donné par la formule 90 P(X a) D 9 = a + (b a) 90 89,85 = 70 + (120 70) 100 89,85 = 70 + 50 0,15 10,15 = 70 + 50 0,0148 = 70 + 0,74 = 70,74. Au moins 90 % des temps de trajet est 70,74 minutes et au moins 10 % des temps de trajet est 70,74 minutes. (h) Pour représenter la fonction de répartition, on place, pour chacune des bornes des classes, la proportion cumulée (par exemple, le point 25 a pour ordonnée 50,66 %) puis on les relie par des segments de droites : proportion (en %) 100 90 80 70 60 50 40 30 20 10 0 0 10 20 30 40 50 60 70 80 90 100 110 120 durée du trajet (en min) 7

2. Boîtes à moustaches et intervalles de variation Exercice 2.1. Le temps de trajet domicile-travail (en minutes) déclaré par les travailleurs américains a été récolté en 2000 par l U.S. Census Bureau : durée 0 ; 5 5 ; 10 10 ; 15 15 ; 20 20 ; 25 25 ; 30 30 ; 35 35 ; 45 45 ; 60 60 ; 90 90 ; 150 prop. cum.(%) 3,37 14,4 29,4 45,22 59,71 65,5 78,69 84,6 92,01 97,22 100 (a) Représenter la boîte à moustache. Source : http://www.census.gov/prod/2004pubs/c2kbr-33.pdf (b) Déterminer l intervalle de variation à 75 %. (c) Déterminer l intervalle de variation à 95 %. Corrigé de l exercice 2.1. (a) Pour dessiner la boîte à moustache, on a besoin des trois quartiles : Q 1, la médiane et Q 3. Calcul de la médiane. La proportion cumulée de 50 % correspond à la classe a ; b = 20 ; 25 donc la médiane est donnée par la formule 50 P(X a) médiane = a + (b a) 50 45,22 = 20 + (25 20) 59,71 45,22 = 20 + 5 4,78 14,49 = 20 + 5 0,3299 = 20 + 1,65 = 21,65. Calcul du premier quartile. La proportion cumulée de 25 % correspond à la classe a ; b = 10 ; 15 donc le premier quartile est donnée par la formule 25 P(X a) Q 1 = a + (b a) 25 14,40 = 10 + (15 10) 29,40 14,40 = 10 + 5 10,60 15,00 = 10 + 5 0,7067 = 10 + 3,53 = 13,53. Calcul du troisième quartile. La proportion cumulée de 75 % correspond à la classe 8

a ; b = 30 ; 35 donc le troisième quartile est donnée par la formule 75 P(X a) Q 3 = a + (b a) 75 65,50 = 30 + (35 30) 78,69 65,50 = 30 + 5 9,50 13,19 = 30 + 5 0,7202 = 30 + 3,60 = 33,60. Boîte à moustache Voici la boîte à moustache représentant l intervalle interquartile pour la durée du trajet : 0 50 100 150 13,53 21,65 33,60 (b) Rappelons que 75 % = 0,75. Pour déterminer l intervalle de variation à 1 α = 0,75, on calcule d abord α = 1 0,75 = 0,25 puis α/2 = 0,125 et 1 α/2 = 0,875. L intervalle de variation à 75 % est alors l intervalle q 0,125 ; q 0,875. Il nous reste donc à calculer les quantiles d ordre 0,125 et 0,875. Calcul du quantile d ordre 0,125. La proportion cumulée de 12,5 % correspond à la classe a ; b = 5 ; 10 donc le quantile d ordre 0,125 est donnée par la formule 12,5 P(X a) q 0,125 = a + (b a) 12,5 3,37 = 5 + (10 5) 14,40 3,37 = 5 + 5 9,13 11,03 = 5 + 5 0,8277 = 5 + 4,14 = 9,14. Calcul du quantile d ordre 0,875. La proportion cumulée de 87,5 % correspond à la 9

classe a ; b = 45 ; 60 donc le quantile d ordre 0,875 est donnée par la formule 87,5 P(X a) q 0,875 = a + (b a) 87,5 84,60 = 45 + (60 45) 92,01 84,60 = 45 + 15 2,90 7,41 = 45 + 15 0,3914 = 45 + 5,87 = 50,87. Conclusion L intervalle de variation à 75 % est 9,14 ; 50,87 ; cet intervalle contient 75 % des données. (c) Rappelons que 95 % = 0,95. Pour déterminer l intervalle de variation à 1 α = 0,95, on calcule d abord α = 1 0,95 = 0,05 puis α/2 = 0,025 et 1 α/2 = 0,975. L intervalle de variation à 95 % est alors l intervalle q 0,025 ; q 0,975. Il nous reste donc à calculer les quantiles d ordre 0,025 et 0,975. Calcul du quantile d ordre 0,025. La proportion cumulée de 2,5 % correspond à la classe a ; b = 0 ; 5 donc le quantile d ordre 0,025 est donnée par la formule 2,5 P(X a) q 0,025 = a + (b a) = 0 + (5 0) 2,5 0 3,37 0 = 0 + 5 2,50 3,37 = 0 + 5 0,7418 = 0 + 3,71 = 3,71. Calcul du quantile d ordre 0,975. La proportion cumulée de 97,5 % correspond à la classe a ; b = 90 ; 150 donc le quantile d ordre 0,975 est donnée par la formule 97,5 P(X a) q 0,975 = a + (b a) 97,5 97,22 = 90 + (150 90) 100 97,22 = 90 + 60 0,28 2,78 = 90 + 60 0,1007 = 90 + 6,04 = 96,04. Conclusion L intervalle de variation à 95 % est 3,71 ; 96,04 ; cet intervalle contient 95 % des données. 10

3. Changement d unités Exercice 3.1. La température moyenne à Paris entre 1961 et 1990 est de 11,71 C avec un écart-type de 5,47 tandis que dans la ville de Trappes, elle est de 10,30 C avec un écarttype de 5,35. Sachant que F = C 9 + 32, convertir les données précédentes en degrés 5 Fahrenheit. Corrigé de l exercice 3.1. La température moyenne à Paris est de 11,71 9 + 32 = 53,08 F et 5 celle à Trappes est de 10,30 9 + 32 = 50,54 F. 5 Pour déterminer les écart-types, on ne prend pas en compte le + 32 lors de la conversion. L écart-type à Paris est donc de 5,47 9 = 9,85 F et celui à Trappes de 5,35 9 = 9,63 F. 5 5 11