Méthodes statistiques. Solutions des exercices du chapitre 1

Documents pareils
Statistique : Résumé de cours et méthodes

Statistiques Descriptives à une dimension

Séries Statistiques Simples

Représentation d une distribution

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Statistiques 0,14 0,11

Annexe commune aux séries ES, L et S : boîtes et quantiles

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

3. Caractéristiques et fonctions d une v.a.

Les couleurs. Un peintre distrait a oublié les noms des couleurs de sa palette : tu peux l aider à reconstituer l ordre correct (de gauche à droite)?

Statistiques avec la graph 35+

Logiciel XLSTAT version rue Damrémont PARIS

Traitement des données avec Microsoft EXCEL 2010

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

Fluctuation d une fréquence selon les échantillons - Probabilités

MATHÉMATIQUES. Mat-4104

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

1 Savoirs fondamentaux

Plus petit, plus grand, ranger et comparer

Feuille d exercices 2 : Espaces probabilisés

Statistique Descriptive Élémentaire

LES GRADES PROGRAMME D EXAMEN DE LA CEINTURE JAUNE A LA CEINTURE MARRON

Infolettre #18 : Les graphiques avec Excel 2010

SVP ISO - Sécurité & Protection

Opérations de base sur ImageJ

Jean Dubuffet AUTOPORTRAIT II

Table des matières IDENTIFICATION DE VOS SALARIÉS ET VISITEURS IDENTIFICATION POUR VOS ÉVÈNEMENTS ET CONFÉRENCES OUTILS DE PERFORATIONS DE TABLE

Indications pour une progression au CM1 et au CM2

Clés USB rotatives basiques. Clés USB rotatives métallisées IMPORT ASIE IMPORT ASIE. A partir de 1Z Z Z Z Z41009

STATISTIQUES DESCRIPTIVES

BACCALAURÉAT PROFESSIONNEL SUJET

ROTOLINE NOTICE DE POSE

1 Grand sac d'école (minimum 10" x 14") (suggestion : un sac solide et imperméable) 1 Couvre-tout (sarrau) à manches longues

Série limitée Classe C 250 CDI BlueEFFICIENCY Prime Edition

Chapitre 3. Les distributions à deux variables

Table des matières. Télécharger MetaTrader 4. Première connexion à MetaTrader 4. Se connecter à MetaTrader 4. Modifier la langue

Organisme certificateur : 10 rue Galilée Champs sur Marne Tél : +33 (0) Fax : +33 (0)

Atelier n 12 : Assistance à distance

Tuto pour connecter une source RVB RGB à un moniteur Commodore / Amiga

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Flow 2 Introduction du Produit

Chapitre 02. La lumière des étoiles. Exercices :

EXERCICE 2 : SUIVI CINETIQUE D UNE TRANSFORMATION PAR SPECTROPHOTOMETRIE (6 points)

La recherche d'indices par fluorescence

AP1.1 : Montages électroniques élémentaires. Électricité et électronique

Lire ; Compter ; Tester... avec R

PASSAGE A NIVEAU HO/N

1S9 Balances des blancs

Infos. Indicateurs analogiques encastrables pour installation à courants forts. Série M W/P/ LSP BWQ BGQ TP TG WQ /0S WQ /2S FQ /2 W BI BIW DFQ

Baccalauréat ES Amérique du Nord 4 juin 2008

GUIDE ÉLÈVE. Mes identifiants : J'inscris mes identifiant et mot de passe personnels transmis par mon professeur :

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Comment insérer une image de fond?

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Fiche pédagogique : ma famille et moi

Séquence 4. Statistiques. Sommaire. Pré-requis Médiane, quartiles, diagramme en boîte Moyenne, écart-type Synthèse Exercices d approfondissement

Calculs de probabilités avec la loi normale

Quad 110 cc - 4 temps - 60 Km/h - QUAD1101 (Lot 10 pcs)

Ecran : Processeur : OS : Caméra : Communication : Mémoire : Connectique : Audio : Batterie : Autonomie : Dimensions : Poids : DAS :

Fête de la science Initiation au traitement des images

Nom : Groupe : Date : 1. Quels sont les deux types de dessins les plus utilisés en technologie?

PLAN D ATHLETISATION PROTOCOLES D EVALUATION DES QUALITES PHYSIQUES DES JOUEURS INTERNATIONAUX

Sommaire Table des matières

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

LISTE DES PRIX PORTE-BADGE.BE

Leçon N 4 : Statistiques à deux variables

Accessibilité ERP Guide des obligations liées à l accessibilité des personnes handicapées dans les bâtiments ERP existants.*

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

FÉDÉRATION INTERNATIONALE DE PÉTANQUE ET JEU PROVENÇAL REGLEMENT DU CHAMPIONNAT DU MONDE DE TIR INDIVIDUEL

FICHE 1 Fiche à destination des enseignants

Spectrophotométrie - Dilution 1 Dilution et facteur de dilution. 1.1 Mode opératoire :

GÉODÉSIE, COORDONNÉES ET GPS

Le seul ami de Batman

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

Séverine Chevalier RECLUSES. Écorce / noir

Mathématiques et petites voitures

Savoir lire une carte, se situer et s orienter en randonnée

VISITE DE L EXPOSITION AU THÉÂTRE DE PRIVAS :

Vous incarnez un surdoué en informatique qui utilise son ordinateur afin de pirater des comptes bancaires un peu partout dans le monde et s en mettre

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Nom : Prénom :. Date :..Classe : 2 TECHNIQUES DE MODIFICATION DE LA COULEUR DES CHEVEUX

Relation entre deux variables : estimation de la corrélation linéaire

SECURIT GSM Version 2

enquête pour les fautes sur le fond, ce qui est graves pour une encyclopédie.

TSTI 2D CH X : Exemples de lois à densité 1

COMFORTLIFT ONE VOTRE MONTE-ESCALIER DISCRET.

Roues Clients stockage & gestion

ELEC2753 Electrotechnique examen du 11/06/2012

Résumé du Cours de Statistique Descriptive. Yves Tillé

Support de formation Notebook

AUTOPORTE III Notice de pose

Consigne : je remplis le tableau en tenant compte des informations de la ligne supérieure et de la colonne de gauche (droite pour les gauchers)

Petit lexique de calcul à l usage des élèves de sixième et de cinquième par M. PARCABE, professeur au collège Alain FOURNIER de BORDEAUX, mars 2007

DOSSIER TECHNIQUE R-GO SPA. Production et assemblage 100 % Française. 3 Rue Pierre Mendès France ARGENTAN

TEST 17 FORCE 2. gums. chewing gums. Russie : badge. rouge. trompé.

15 rue de l Industrie - BP HOERDT CEDEX marketing@oppermann.fr

TOUJOURS A VOTRE ECOUTE

Retrouvez l ensemble des productions et services Gipen sur Ferme comble perdu (EV : avec débord queue de vache) Ferme comble habitable

ibridge la clé USB pour appareils ios.

Baccalauréat L spécialité, Métropole et Réunion, 19 juin 2009 Corrigé.

Transcription:

STT-1920 Méthodes statistiques Solutions des exercices du chapitre 1 Numéro 1. Déterminez la nature (quantitative continue, quantitative discrète, qualitative ordinale ou qualitative nominale) de chacune des variables suivantes. (a) La moyenne cumulative d un étudiant de l Université Laval. (b) La cote (A+, A, A-, B+,...) qu un étudiant reçoit dans un cours. (c) La section (A, B, S) du cours STT-1000 à laquelle un étudiant de génie électrique est inscrit. (d) Le nombre de fois qu un étudiant du baccalauréat en agronomie échoue le cours STT-1920 durant son baccalauréat. (e) Le nombre de louveteaux dans la portée d une louve. (f) Le poids d un loup à la naissance. (g) La couleur (blanche, jaune, orange, verte, bleue, marron, noire) de la ceinture d un adepte de karaté Shotokan. (h) La couleur du feu de circulation en arrivant à l intersection du Chemin Ste-Foy lorsque vous roulez sur la rue Myrand en direction nord. (i) Le salaire annuel d un professeur de cégep. (j) Le nombre de tomates produites par un plant de tomate durant le mois d août. (k) La nature d une variable statistique. Réponses : (a) Quantitative continue. (b) Qualitative ordinale. (c) Qualitative nominale. (d) Quantitative discrète. (e) Quantitative discrète. (f) Quantitative continue. (g) Qualitative ordinale. (h) Qualitative ordinale. (i) Quantitative continue. (j) Quantitative discrète. (k) Qualitative nominale. Numéro 2. On a mesuré les diamètres de 34 prunes. Voici les résultats, en centimètres. 4.03 4.05 3.96 4.09 4.28 4.04 4.18 4.23 4.14 4.12 4.03 3.94 4.02 4.08 4.13 4.04 3.93 4.08 4.37 4.07 4.11 4.03 4.00 3.97 4.01 4.09 4.06 3.92 4.19 3.96 4.48 4.24 4.06 3.98 1

(a) Calculez la moyenne. (b) Calculez l écart-type. (c) Calculez le coefficient de variation. (d) Dessinez un histogramme approprié. (e) Calculez le résumé à cinq nombres. (f) Dessinez le diagramme en boîte. (g) Qu arrive-t-il à la moyenne si les valeurs 4.18, 4.23, 4.14 et 4.12 sont remplacées par les valeurs 4.68, 4.73, 4.64 et 4.62? (h) Qu arrive-t-il à la médiane si les valeurs 4.18, 4.23, 4.14 et 4.12 sont remplacées par les valeurs 4.68, 4.73, 4.64 et 4.62? (i) Calculez le 30 e centile. Solutions. (a) Avec la formule x = 1 n n i=1 x i, j obtiens x = 1 n n x i = i=1 4.03 + 4.05 + 3.96 + + 4.06 + 3.98 34 1 (b) Avec la formule s = n n 1 i=1 (x i x) 2, j obtiens s = 1 n (x i x) n 1 2 i=1 = 4.0856 cm. = 1 33 {(4.03 4.0856)2 + + (3.98 4.0856) 2 } = 0.1241 cm. (c) J obtiens s/x = (0.1241 cm)/(4.0856 cm) = 0.03. (d) Avec l aide du logiciel R, j obtiens l histogramme suivant. Vous devriez être capable d obtenir cet histogramme aussi bien à la main qu avec le logiciel R. 2

Fréquence 0 5 10 15 3.9 4.0 4.1 4.2 4.3 4.4 4.5 Diamètre (e) J ordonne mes 34 diamètres, du plus petit au plus grand. Le plus petit diamètre est 3.92 cm et le plus grand est 4.48 cm. J obtiens les quartiles Q1 = q 0.25, Q2 = q 0.50 et Q3 = q 0.75 à l aide de la formule générale Par exemple, pour obtenir Q1, je fais q γ = x (1+(n 1)γ). Q1 = q 0.25 = x (1+(34 1)/4) = x (9.25) = x (9) + {0.25 (x (10) x (9) )}. Comme x (9) = 4.01 et x (10) = 4.02, j obtiens Q1 = 4.0125. De la même façon, j obtiens Q2 = 4.0600 et Q3 = 4.1275. Voici donc mon résumé à cinq nombres : min Q1 Q2 Q3 max 3.92 4.01 4.06 4.13 4.48 (f) Avec l aide de R, j obtiens le diagramme en boîte suivant : 3

Diamètre des prunes 3.9 4.0 4.1 4.2 4.3 4.4 4.5 Vous devriez être capable de tracer ce diagramme en boîte à la main en utilisant la méthode décrite dans les notes de cours. (g) Si on remplace les valeurs 4.18, 4.23, 4.14 et 4.12 par les valeurs 4.68, 4.73, 4.64 et 4.62, la nouvelle moyenne est 4.144. (h) Si on remplace les valeurs 4.18, 4.23, 4.14 et 4.12 par les valeurs 4.68, 4.73, 4.64 et 4.62, la médiane ne change pas. (i) q 0.30 = x 1+(34 1) 0.3 = x 10.9 = x 10 +{0.9 (x 11 x 10 )} = 4.02+{0.9 (4.03 4.02)} = 4.029. Numéro 3. Un biologiste a mesuré les longueurs de 310 perchaudes attrapées dans le Chenal du Moine en août 2006. Le tableau suivant résume ces 310 mesures : Longueur Nombre de perchaudes entre 21.0 et 22.0 cm 50 entre 22.0 et 23.0 cm 90 entre 23.0 et 24.0 cm 70 entre 24.0 et 26.0 cm 60 entre 26.0 et 30.0 cm 40 4

(a) Représentez ces données à l aide d un histogramme. (b) Calculez une approximation pour la moyenne. (c) Calculez une approximation pour l écart-type. (d) Calculez une approximation pour la médiane. (e) Calculez une approximation pour la proportion de perchaudes dont la longueur est située entre 25 et 27 cm. Solution. (a) On peut faire l histogramme à la main. On complète d abord notre tableau des données groupées de la façon suivante : Longueur Nombre de Fréquence Hauteur des perchaudes perchaudes relative de la boîte entre 21.0 et 22.0 cm 50 50/310 h 1 = 50 310 1 = 0.161 entre 22.0 et 23.0 cm 90 90/310 h 2 = 90 310 1 = 0.290 entre 23.0 et 24.0 cm 70 70/310 h 3 = 70 310 1 = 0.226 entre 24.0 et 26.0 cm 60 60/310 h 4 = 60 310 2 = 0.097 entre 26.0 et 30.0 cm 40 40/310 h 5 = 40 310 4 = 0.031 On obtient alors l histogramme suivant : 0.00 0.05 0.10 0.15 0.20 0.25 0.30 22 24 26 28 30 Longueur 5

(b) Avec la formule x = 1 n l j=1 (f j m j ) j obtiens x = 1 n = l j=1 (f j m j ) = 1 310 5 (f j m j ) j=1 (50 21.5) + (90 22.5) + (70 23.5) + (60 25.0) + (40 28.0) 310 = 23.75806 cm. 1 (c) Avec la formule s = l n 1 j=1 (f j (m j x ) 2 )) j obtiens s = = = 1 n 1 1 309 l (f j (m j x ) 2 )) j=1 5 (f j (m j x ) 2 )) j=1 1 309 {(50 (21.5 23.75806)2 ) + + (40 (28 23.75806) 2 )} = 1.98241 cm. (d) On utilise l histogramme. On veut trouver, sur l axe horizontal, la valeur qui est telle que 50% de la surface en est à gauche et 50% en est à droite. Cette valeur est 23 + 15 70 = 23.2143. On peut également faire le raisonnement à partir de notre tableau des données groupées. On veut la valeur qui est telle que 155 observations lui sont inférieures et 155 lui sont supérieures. On note que cette valeur est quelque part entre 23 et 24 puisqu on a 50 + 90 = 140 observations inférieures à 23 et 60 + 40 = 100 observations supérieures à 24. On a 70 observations entre 23 et 24. On voudrait couper ça en un groupe de 15 et un groupe de 55 pour en avoir en tout 50 + 90 + 15 = 155 du côté gauche et 55 + 60 + 40 = 155 du côté droit. On coupe donc notre intervalle (23, 24] en un morceau de longueur 15/70 et un morceau de longueur 55/70. Notre approximation de la médiane est donc 23 + 15 70. (e) On fait comme si la moitié des 60 observations de l intervalle (24, 26] étaient entre 25 et 26 et le quart des 40 observations de l intervalle (26, 30] étaient entre 26 et 27. Notre approximation pour le nombre d observations entre 25 et 27 est donc 30 + 10 = 40. Notre approximation pour la proportion des observations qui sont situées entre 25 et 27 est donc 40/310. Numéro 4. Le diagramme en boîte suivant représente la distribution des poids (exprimés en livres) des 92 joueurs qui se sont présentés au camp d entraînement de l équipe de football du Rouge et Or en juin dernier. 6

185 190 195 200 205 210 215 220 225 230 235 240 245 Les énoncés suivants sont-ils vrais ou faux? (a) La somme des poids des 3 joueurs les plus pesants est inférieure à 720 livres. (b) La moyenne de ces 92 poids est 204 livres. (c) L écart inter-quartile de ces 92 poids est de 15 livres. (d) [Pour les étudiants qui sont familiers avec la loi normale] La loi normale est un bon modèle pour décrire cette distribution de poids. Solution. (a) Vrai! Les trois plus grands poids sont 233, 240 et 245 livres. La somme de ces 3 poids est donc 718 livres. (b) Faux! C est la médiane qui est égale à 204 livres. Et comme la distribution est très asymétrique et étirée vers la droite, la moyenne est supérieure à 204 livres. (c) Vrai! l écart interquartile est EIQ = Q3 Q1 = 213 198 = 15 livres.. (d) Faux! La distribution est très asymétrique. La loi normale n est donc pas un bon modèle pour décrire la distribution de ces poids. Numéro 5. Parmi les 116 étudiants inscrits au cours STT-20694 à l automne 2006, 21 ont reçu un A, 36 ont reçu un B, 27 ont reçu un C, 18 ont reçu un D et 14 ont reçu un E. (a) Représentez ces données à l aide d un diagramme en pointes de tarte. (b) Représentez ces données à l aide d un diagramme en bâtons. 7

Solution. Avec l aide de R, j obtiens le diagramme en pointes de tarte que voici : D C E A B Avec l aide de R, j obtiens le diagramme en bâtons que voici : 0 5 10 15 20 25 30 35 E D C B A 8

Numéro 6. On a mesuré la variable X = longueur (de la tête à la queue) et la variable Y = étendue (du bout d une aile à l autre) de 12 oiseaux d une certaine espèce. Voici les résultats en mm. Longueur 156 154 153 153 155 163 157 155 164 158 158 160 Étendue 245 240 240 236 243 247 238 239 248 238 240 244 (a) Tracez le diagramme de dispersion. (b) Calculez les moyennes x et y. (c) Calculez les écarts-types s x et s y. (d) Calculez le coefficient de corrélation r. (e) Sur le diagramme de dispersion, interprétez les résultats obtenus en (b), (c) et (d). Solution. (a) Avec l aide de R, j obtiens le diagramme de dispersion suivant : Étendue des ailes 236 238 240 242 244 246 248 154 156 158 160 162 164 Longueur de l oiseau 9

(b) x = 157.17 et y = 241.50. (c) s x = 3.64 et s y = 3.83. (d) r = 0.73. (e) Le centre du nuage de points est situé au point (x, y) = (157.17, 241.50). L écarttype s x = 3.64 mesure la dispersion en X alors que l écart-type s y = 3.83 mesure la dispersion en Y. Dans le graphe ci-dessous, la droite verticale pleine est située à la moyenne x et les droites verticales en pointillés sont situées à x s x et x + s x. La droite horizontale pleine est située à la moyenne y et les droites horizontales en pointillés sont situées à y s y et y + s y. Le coefficient de corrélation r = 0.73 mesure le degré d association linéaire entre les deux variables. On voit sur le graphe que plus x est grand, plus y a tendance à être grand. Le coefficient de corrélation r est une mesure de la force de cette association. Étendue des ailes 236 238 240 242 244 246 248 154 156 158 160 162 164 Longueur de l oiseau Numéros 7, 8, 9. Voir les solutions vidéo-clips sur le site web du cours. 10

Numéro 10. Un verger compte 1512 pommiers. Le diagramme suivant représente les proportions de chacune des 5 espèces de pommiers de ce verger : Golden Delicious Red Delicious Ida Red Granny Smith McIntosh (a) Complétez le tableau suivant : Espéce Fréquence Nombre de pommes relative de pommiers Ida Red Red Delicious Golden Delicious Granny Smith McIntosh (b) Représentez ces données à l aide d un diagramme en bâtons. Solution. Espéce Fréquence Nombre de pommes relative de pommiers Ida Red 60/360 252 Red Delicious 40/360 168 Golden Delicious 20/360 84 Granny Smith 140/360 588 McIntosh 100/360 420 11

Voici le diagramme en bâton produit avec R : 0 100 200 300 400 500 Golden Deli Granny Ida Red McIntosh Red Deli Numéro 11. Lors d une journée de pêche sur le lac St-Pierre, un groupe de pêcheurs ont attrapé 9 achigans, 22 barbottes, 13 brochets, 18 dorés et 47 perchaudes. Représentez ces données à l aide d un diagramme en pointes de tarte. Solution. Brochet Barbotte Doré Achigan Perchaude Numéro 12. Voici les longueurs, en cm, des 22 barbottes dont il est question au numéro précédent : 32.2 29.5 29.3 31.9 36.9 30.8 40.6 31.9 26.7 37.9 34.4 30.3 32.9 24.4 32.2 28.3 29.2 31.0 30.6 27.3 30.0 27.6 12

(a) Calculez la moyenne. (b) Calculez l écart-type. (c) Calculez le coefficient de variation. (d) Dessinez un histogramme approprié. (e) Calculez le résumé à cinq nombres. (f) Dessinez le diagramme en boîte. Solution. (a) (b) et (c) x = 31.18 cm, s = 3.77 cm, s/x = 0.121 (d) Voici l histogramme : Fréquence 0 1 2 3 4 5 6 25 30 35 40 Longueur (e) Voici le résumé à cinq nombres : min Q1 Q2 Q3 max 24.400 29.225 30.700 32.200 40.600 (f) Voici le diagramme en boîte. Notez la présence d observations aberrantes. 13

Longueur en cm 25 30 35 40 Numéro 13. Voici les longueurs, en cm, et les poids, en gr, des 9 achigans dont il est question au numéro 11 : Longueur 31.5 34.8 31.1 37.5 30.4 32.6 36.0 27.6 36.8 Poids 542 680 653 694 614 596 606 541 743 (a) Tracez le diagramme de dispersion. (b) Calculez les moyennes x et y. (c) Calculez les écarts-types s x et s y. (d) Calculez le coefficient de corrélation r. (e) Sur le diagramme de dispersion, interprétez les résultats obtenus en (b), (c) et (d). Solution. (a) Voici le diagramme de dispersion. 14

Poids en gr 550 600 650 700 750 28 30 32 34 36 Longueur en cm (b) x = 33.14 cm et y = 629.9 gr. (c) s x = 3.33 cm et s y = 68.51 gr. (d) r = 0.745. (e) Comme au numéro 6 (e). Claude Bélisle 5 septembre 2010 15