Leçon N 4 : Statistiques à deux variables



Documents pareils
Chapitre 3. Les distributions à deux variables

Comment tracer une droite représentative d'une fonction et méthode de calcul de l'équation d'une droite.

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

a et b étant deux nombres relatifs donnés, une fonction affine est une fonction qui a un nombre x associe le nombre ax + b

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Statistiques à deux variables

Equations cartésiennes d une droite

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Correction du bac blanc CFE Mercatique

Correction du baccalauréat STMG Polynésie 17 juin 2014

Items étudiés dans le CHAPITRE N5. 7 et 9 p 129 D14 Déterminer par le calcul l'antécédent d'un nombre par une fonction linéaire

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

Annexe commune aux séries ES, L et S : boîtes et quantiles

Lecture graphique. Table des matières

Séquence 2. Repérage dans le plan Équations de droites. Sommaire

Activité 11 : Nuage de points ou diagramme de dispersion

Les devoirs en Première STMG

Seconde Généralités sur les fonctions Exercices. Notion de fonction.

Fonctions de plusieurs variables

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Nombre dérivé et tangente

Les fonction affines

L ALGORITHMIQUE. Algorithme

Module 16 : Les fonctions de recherche et de référence

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Complément d information concernant la fiche de concordance

Statistique Descriptive Élémentaire

Séries Statistiques Simples

Statistiques Descriptives à une dimension

Chapitre 3 : Le budget des ventes. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 3

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Feuille TD n 1 Exercices d algorithmique éléments de correction

LE PROCESSUS ( la machine) la fonction f. ( On lit : «fonction f qui à x associe f (x)» )

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Statistique : Résumé de cours et méthodes

STATISTIQUES A DEUX VARIABLES

Rappels sur les suites - Algorithme

1. Vocabulaire : Introduction au tableau élémentaire

Statistiques avec la graph 35+

Etude de fonctions: procédure et exemple

Notion de fonction. Série 1 : Tableaux de données. Série 2 : Graphiques. Série 3 : Formules. Série 4 : Synthèse

Logiciel XLSTAT version rue Damrémont PARIS

C f tracée ci- contre est la représentation graphique d une

Moments des variables aléatoires réelles

Cours pratique Excel. Dans chacune des feuilles, les donnés sont déjà entrées afin de gagner du temps.

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Chapitre 1 : Évolution COURS

PRISE EN MAIN D UN TABLEUR. Version OPEN OFFICE

Enoncé et corrigé du brevet des collèges dans les académies d Aix- Marseille, Montpellier, Nice Corse et Toulouse en Énoncé.

BACCALAURÉAT PROFESSIONNEL SUJET

Exercices Corrigés Premières notions sur les espaces vectoriels

MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .

Notion de fonction. Résolution graphique. Fonction affine.

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

données en connaissance et en actions?

3. Caractéristiques et fonctions d une v.a.

Calcul du niveau de transition

1 Importer et modifier des données avec R Commander

TSTT ACC OUTILS DE GESTION COMMERCIALE FICHE 1 : LES MARGES

1 Complément sur la projection du nuage des individus

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Relation entre deux variables : estimation de la corrélation linéaire

III- Raisonnement par récurrence

Module 24 : Analyse de scénarios

Séquence 4. Statistiques. Sommaire. Pré-requis Médiane, quartiles, diagramme en boîte Moyenne, écart-type Synthèse Exercices d approfondissement

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

Initiation à Excel. Frédéric Gava (MCF)

BACCALAUREAT GENERAL MATHÉMATIQUES

Table des matières. I Mise à niveau 11. Préface

Guide d'utilisation. OpenOffice Calc. AUTEUR INITIAL : VINCENT MEUNIER Publié sous licence Creative Commons

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

I. Ensemble de définition d'une fonction

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

L inégale répartition de l énergie solaire est à l origine des courants atmosphériques

Infolettre #18 : Les graphiques avec Excel 2010

La fonction exponentielle

Raisonnement par récurrence Suites numériques

Baccalauréat ES Amérique du Nord 4 juin 2008

PARTIE NUMERIQUE (18 points)

Statistiques 0,14 0,11

Statistiques à une variable

Logistique, Transports

Baccalauréat technique de la musique et de la danse Métropole septembre 2008

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

3 Approximation de solutions d équations

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

Evaluation de l impact des indicateurs du. Cost of Doing Business sur le taux de croissance de Maurice

Découverte du tableur CellSheet

Titre alcalimétrique et titre alcalimétrique complet

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

IBM SPSS Regression 21

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

IV- Equations, inéquations dans R, Systèmes d équations

TABLE DES MATIERES. C Exercices complémentaires 42

Date M.P Libellé Catégorie S.Catégorie Crédit Débit Solde S.B

Transcription:

Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d une population, mode, moyenne et médiane puis réaliser une classification, ensuite sur la série étudiée, calculer la variance et l écart type pour savoir si la série est dispersée ou peu dispersée, enfin trouver les quartiles et faire un diagramme en boîte avec positionnement de la médiane dans la boîte etc. En terminale, nous allons faire des statistiques sur deux variables en essayant de les relier entre elles par une relation simple. Soit donc deux séries statistiques (x i ) et (y i ) i variant de 1 à n (n entier quelconque, généralement, 5 ou 6 jusqu à 10 quelquefois). Nous représenterons ces données dans un repère du plan (P) par des points M i (x i ;y i ) afin de constituer ce que nous appelons un nuage de points. Définition : On appelle point moyen d un nuage, le point G( x ; y) x et ymoyennes calculées dans chaque série. Nous regardons ensuite si nous pouvons tracer une droite d équation y = ax+b passant le plus prés possible des points. Si cela est possible, nous dirons que nous avons réalisé un ajustement affine du nuage de points et donc trouver une relation simple de la forme y = ax + b entre les deux variables. Montrons un exemple ; Dans un avion, en pleine ascension nous notons la température extérieure en degrés avec l altitude correspondante en mètres, nous avons le tableau suivant : Altitude (x i ) 0 100 500 1000 3000 5000 Températures ( y i ) 24 22 20 13 6 25

Déterminons le point moyen G : x=1600 m ; y = 8.G(1600 ;8 ). Pour réaliser un ajustement affine, nous avons une première méthode qui donne «la droite de Mayer». Nous partageons le nuage de points en deux sous-nuages puis cherchons les points moyens de ces nuages G 1 et G 2, la droite cherchée est la droite (G 1 G 2 ). X 0 100 500 y 24 22 20 X 1000 3000 5000 y 13-6 -25 G 1 (200;22) G 2 (3000;-6 ) (G 1 G 2 ) a une équation de la forme y = ax + b. 6 22 a = = 0,01. Pour trouver b, nous utilisons un des points : 22 = 0,01(200)+b et donc 3000 200 22 = 2 + b c est-à-dire b = 24. (G 1 G 2 ) y = 0,01x + 24. Au programme, il est demandé d utiliser la méthode dite «des moindres carrés» qui s est imposée à la place de la méthode de Mayer. Les coefficients sont donnés par la calculette après avoir rentré les données concernant les deux séries statistiques. Cela donne ici : a 9,8 10-3 soit 0,0098 et b 23,65. Remarque ; la calculette parle d un coefficient r, coefficient de corrélation qui indique si l alignement est valable ou pas. Règle : si r 1, alors l alignement est de bonne qualité. Ici, r 0,999. La droite trouvée, tracée en rouge sur le graphique, a donc pour équation : (D) y 0,0098x + 23,65. Les deux droites sont proches l une de l autre. Elles passent par le point moyen G(1600 ; 8 ). Nous pouvons le vérifier facilement pour (G 1 G 2 ) : 8 = 1600( 0,01)+24 Si la calculette donne un coefficient de corrélation r dont la valeur absolue est éloigné de 1, cela veut dire qu un ajustement affine ne se justifie pas car soit, les points ne sont pas assez alignés soit, il y a une grande dispersion des données et un autre type d ajustement s impose. En résumé : Lorsque nous avons deux séries statistiques, nous pouvons représenter ces données dans un repère du plan (P), cela donne un nuage de points et souvent les points sont alignés dans une certaines direction. Il est possible alors à la machine de trouver les coefficients a et b de la droite d ajustement («Méthode des moindres carrés»). Cette droite (D) passe par le point moyen G(x ;y) du nuage. Utilité : Cette droite va permettre des prévisions à court terme par le calcul. Pour la température, nous pouvons la prédire pour 6000m par exemple : Y ( 0,01)6000 + 24 = 36 Remarque : le problème étudié ci-dessus a fait l objet de recherche en physique et effectivement, une loi a été trouvée disant que la température baisse de 1 tous les 100m soit si on appelle t la température et t s la température au sol, x étant en mètre : t = 0,01x + t s (Exemple : t s = 10, pour x = 500, t 1 = 5 et pour x = 600, t 2 = 4 )

TERMINALE STG FICHE LES STATISTIQUES Exercice 1 Nous voulons étudier l évolution de la population d une commune. Un relevé a été fait donnant le tableau suivant : Années 1980 1990 2000 2002 2010 x 0 10 20 22 30 Population y 2030 2500 3000 3200 3400 Calculer les coordonnées du point moyen G. Représenter ce nuage de points. A la calculette, déterminer les coefficients a et b de la droite d ajustement par la méthode des moindres carrés. Donner ensuite l équation de la droite d ajustement affine et tracer la sur le graphique. Vérifier que G appartient à cette droite. Quelle prévision pour 2020 cette droite permet-elle de faire? Exercice 2 Le PDG d une entreprise fait analyser la production d un produit sur 10 ans. Nous avons le tableau suivant : Années x 1 2 3 4 5 6 7 8 9 10 Production y 49 48 50 50 56 57 62 65 65 68 Représenter graphiquement ces données. Pourquoi un ajustement affine est - il possible? Placer G le point moyen. Tracer la droite (D1) passant par G et le dernier point (10 ; 68). ON considère qu elle réalise un ajustement linéaire valable du nuage. Donner l équation de (D1). Utiliser votre calculette pour déterminer a et b les coefficients de la droite (D2) d ajustement affine par la méthode des moindres carrés. Tracer (D2). Faire une prévision pour 15 ans en utilisant (D1) et (D2). Quelle est l erreur en % commise en prenant (D1) à la place de (D2).

Exercice3 (Avec Excel) Nous avons le tableau suivant : A B C 1 x i y i ax i +b 2 20 50? 3 30 68? 4 50 108? 5 70 150? 6 80 175? 7 100 220? 8 120 250? Entrer ces données dans une feuille de calcul Excel. En utilisant les commandes : =droitereg(b2 :B11 ;A2 :A11) et =ordonnee.origine(b2 :B11 ;A2 :A11) déterminer a te b les coefficients de la droite (D) d ajustement par la méthode des moindres carrés. Calculer alors ax i + b Faire un graphique dans la feuille pour illustrer ceci. (En sélectionnant la colonne x i et ax i + b, nous pouvons tracer (D)) Exercice4(Type Bac) Un couple de restaurateur étudie une formule Brunch-Culture. Ils ont recensé le nombre de personnes intéressées en fonction du prix fixé. Soit x i le prix en euros et y i le nombre de personnes correspondant à ce prix. x i y i 18 47 20 45 23 42 25 40 28 36 30 30 33 25 35 22 1-a Représenter graphiquement ces données. 1-b Peut-on émettre l hypothèse d une relation simple entre x et y. Si oui, quelle genre de formule proposez-vous? 2 Déterminer les coordonnées du point moyen G du nuage représentés précédemment. 3 On choisit de faire un ajustement affine par la droite (D) de coefficient directeur 1,5 passant par G. Donner l équation réduite de cette droite (D) puis tracer la. Lire sur le graphique à partir de quel prix, personne ne viendra utiliser la formule proposée. Vérifier par le calcul. 4 Quelle prévision donne (D) si on choisit x = 25. Quel est en % l erreur commise avec la réalité? 38 18 40 15

Correction Exercice 1 x i représente le nombre d années à partir de 1980 et y i donne le nombre d habitants de la commune. x = 16,4 et y = 2826. Le point moyen G aura pour coordonnées (16,4 ;2826). Représentons le nuage de points : y 4000 M 3500 (D) 3000 G 2500 2000 1500 1000 500-5 0 5 10 15 20 25 30 35 40 45 50 55 60 x Le point G est bien au centre du nuage. Les points sont relativement alignés et la calculette donne : a 47,6 soit a 48 et b 2045,2 soit b 2045. Le coefficient de corrélation r entre x et y est de 0,992 donc l ajustement affine est valable. La droite d ajustement (D) aura pour équation ; (D) y 48x + 2045 (Pour la calculette CASIO, nous entrons les données dans le module STAT puis on choisit REG et enfin F1). Vérifions que G appartient à la droite (D) : 48(16,4) + 2045 = 2832, il y a une différence de 6 habitants car nous avons pris une valeur approchée pour a et b. en fait, si nous prenons 47,603 pour a et 2045,296 pour b alors 47,603(16,4) + 2045,296 = 2825,985 donc en fait 2826. Nous pouvons alors effectuer une prévision pour 2020 c est-à-dire x = 40 (2020 1980), cela donne une idée du nombre d habitants pour l avenir. Y 48(40) + 2045 3965 personnes. Exercice 2 Nous représentons les données dans un repère du plan (P).

85 y 80 75 70 F 65 60 55 G 50 45 40 1 2 35 3 4 5 6 7 8 9 10 11 12 13 14 15 x Pour les axes, nous pouvons prendre 1 comme origine des abscisses et 40 pour origine des ordonnées, Nous plaçons les données et nous remarquons que les points sont assez alignés et donc un ajustement affine se justifie parfaitement. Calculons les coordonnées du point G : La moyenne des x i est 5,5 et celle des y i est 57, donc G(5,5 ; 57). Appelons F, le dernier point F(10 ; 68) et traçons la droite (GF) qui sera la droite (D1). Cherchons l équation cartésienne de (D1): elle est de la forme y=a 1 x+b 1. 68 57 11 a 1 = = 2,44. Pour b1, utilisons F, 68 =2,44(10) + b 1 et donc b 1 43,6. 10 5,5 4,5 La droite (D1) aura pour équation : y 2,44x + 43,6. Si nous entrons les données dans la calculette (puis calc ; F2 ; REG F3 et enfin x F1), nous avons : LinearReg (ajustement affine) ; a 2,436 ; b 43,6 et r 0,97. L équation de (D2) est donc : y 2,436x + 43,6. Notons que les deux équations se ressemblent et (D1) et (D2) se confondent pratiquement sur le graphique (Tracé rouge et tracé noir en pointillés). Faisons les prévisions pour x = 15 : Avec (D1), y 2,44(15) + 43,6 80,2 et avec (D2), y 2,436(15) + 43,6 80,14. Si nous prenons (D1) à la place de (D2) alors l erreur commise en % est : 80,2 80,14 0,07% (7,410^E-04 sur la calculette) 80,14 Remarque : conformément aux données du problème, si nous arrondissons à l unité alors la réponse devient 80 et les deux droites donnent la même prévision.

Exercice 3 A B C x y ax i + b a= 2,0631295 20 50 48,6 b= 7,33273381 30 68 69,2 50 108 110,5 (Calcul par Excel des coefficients a et b de (D)) 70 150 151,8 80 175 172,4 a est calculé avec :" =DROITEREG(B2:B8;A2:A8)" 100 220 213,6 entré dans la cellule suivant a= 120 250 254,9 b est calculé avec :"=ORDONNEE.ORIGINE(B2:B8;A2:A8)" entré dans la cellule suivant b= (série 1) (série 2) Dans la dernière colonne, nous avons calculé avec x, a et b, La droite d'ajustement a donc pour équation ; y 2,1 x + 7,3 (approximation au dixième) (tracé rouge sur le graphique) Nous avons ici un nuage ascendant et l ajustement par une droite est valable Exercice 4 1-a Pour faire le graphique, nous pouvons prendre comme origine (0 ; 0) mais aussi 18 pour l axe des abscisses et 10 pour l axe des ordonnées. Nous allons obtenir un nuage de points descendant dans ce cas car quand le prix de la formule augmente, le nombre de personnes intéressées diminue.

y 45 40 35 30 25 20 15 10 18 20 5 22 24 26 28 30 32 34 36 38 40 42 44 x 0 1-b Oui, un ajustement par une droite se justifie car les points sont presque alignés. Nous utiliserons une fonction affine de la forme y = ax + b. 2- Calculons les coordonnées de G : G(29 ; 32). 3- L équation de la droite choisie sera de la forme y = 1,5x + b. La droite passe par G, utilisons les coordonnées de G pour calculer b. 32 = 1,5(29) + b donc b = 75,5. L équation de la droite sera donc : y = 1,5x + 75,5. y 50 45 40 35 30 G 25 20 15 10 18 20 5 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 x 0

Le graphique nous montre, que pour avoir y = 0 (0 personne intéressée), il faut prendre x 50. Voyons par le calcul en utilisant l équation de la droite, cherchons donc x tel que y = 0 : 75 1,5x + 75,5 = 0 soit x = 50,33. 1,5 4-Si nous prenons x i = 25 personnes alors y i dans la série vaut 40, le calcul avec (D) donne : 38 40 y = 1,5(25)+75,5 = 38. L erreur en pourcentage sera = 0,05 soit 5%. 40