Statistiques à deux variables



Documents pareils
Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

Leçon N 4 : Statistiques à deux variables

Chapitre 3. Les distributions à deux variables

SÉRIES STATISTIQUES À DEUX VARIABLES

Items étudiés dans le CHAPITRE N5. 7 et 9 p 129 D14 Déterminer par le calcul l'antécédent d'un nombre par une fonction linéaire

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

EXERCICE 4 (7 points ) (Commun à tous les candidats)

Correction du bac blanc CFE Mercatique

a et b étant deux nombres relatifs donnés, une fonction affine est une fonction qui a un nombre x associe le nombre ax + b

Baccalauréat ES Amérique du Nord 4 juin 2008

Chapitre 3 : Le budget des ventes. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 3

C f tracée ci- contre est la représentation graphique d une

BACCALAURÉAT GÉNÉRAL SESSION 2012 OBLIGATOIRE MATHÉMATIQUES. Série S. Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE

Comment tracer une droite représentative d'une fonction et méthode de calcul de l'équation d'une droite.

Rappels sur les suites - Algorithme

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

LE PROCESSUS ( la machine) la fonction f. ( On lit : «fonction f qui à x associe f (x)» )

O, i, ) ln x. (ln x)2

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Equations cartésiennes d une droite

Fonction inverse Fonctions homographiques

Logistique, Transports

= constante et cette constante est a.

Exercice 3 (5 points) A(x) = 1-e -0039' e- 0,039x A '() -'-,..--,-,--,------:-- X = (l_e-0,039x)2

Relation entre deux variables : estimation de la corrélation linéaire

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

STATISTIQUES. UE Modélisation pour la biologie

Seconde Généralités sur les fonctions Exercices. Notion de fonction.

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Complément d information concernant la fiche de concordance

Commun à tous les candidats

Représentation géométrique d un nombre complexe

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Electricité : caractéristiques et point de fonctionnement d un circuit

Baccalauréat technique de la musique et de la danse Métropole septembre 2008

Séquence 2. Repérage dans le plan Équations de droites. Sommaire

Correction du baccalauréat STMG Polynésie 17 juin 2014

Statistique : Résumé de cours et méthodes

Lecture graphique. Table des matières

PARTIE NUMERIQUE (18 points)

Corrigé du baccalauréat S Asie 21 juin 2010

Bien lire l énoncé 2 fois avant de continuer - Méthodes et/ou Explications Réponses. Antécédents d un nombre par une fonction

TSTI 2D CH X : Exemples de lois à densité 1

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Nombre dérivé et tangente

La fonction exponentielle

Exprimer ce coefficient de proportionnalité sous forme de pourcentage : 3,5 %

SOMMAIRE OPÉRATIONS COURANTES OPÉRATIONS D INVENTAIRE

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

U102 Devoir sur les suites (TST2S)

Les suites numériques

Enoncé et corrigé du brevet des collèges dans les académies d Aix- Marseille, Montpellier, Nice Corse et Toulouse en Énoncé.

TP 7 : oscillateur de torsion

STATISTIQUES A DEUX VARIABLES

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ

I. Ensemble de définition d'une fonction

Correction du Baccalauréat S Amérique du Nord mai 2007

Les équations différentielles

BACCALAUREAT GENERAL MATHÉMATIQUES

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Union générale des étudiants de Tunisie Bureau de l institut Préparatoire Aux Etudes D'ingénieurs De Tunis. Modèle de compte-rendu de TP.

Cours d Analyse. Fonctions de plusieurs variables

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Correction du baccalauréat ES/L Métropole 20 juin 2014

Dérivation : Résumé de cours et méthodes

Feuille TD n 1 Exercices d algorithmique éléments de correction

Incertitudes expérimentales

Durée de L épreuve : 2 heures. Barème : Exercice n 4 : 1 ) 1 point 2 ) 2 points 3 ) 1 point

Raisonnement par récurrence Suites numériques

SUIVI CINETIQUE PAR SPECTROPHOTOMETRIE (CORRECTION)

Probabilités conditionnelles Loi binomiale

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Notion de fonction. Résolution graphique. Fonction affine.

Chapitre 1 Régime transitoire dans les systèmes physiques

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Coup de Projecteur sur les Réseaux de Neurones

Chapitre 2 Le problème de l unicité des solutions

Théorème du point fixe - Théorème de l inversion locale

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Ressources pour le lycée général et technologique

Perrothon Sandrine UV Visible. Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6

Logiciel XLSTAT version rue Damrémont PARIS

Exercices Corrigés Premières notions sur les espaces vectoriels

SEANCE 4 : MECANIQUE THEOREMES FONDAMENTAUX

LA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE

Les fonction affines

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

Fonctions de plusieurs variables

MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

Le théorème de Thalès et sa réciproque

Les devoirs en Première STMG

Séquence 4. Statistiques. Sommaire. Pré-requis Médiane, quartiles, diagramme en boîte Moyenne, écart-type Synthèse Exercices d approfondissement

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Transcription:

Statistiques à deux variables Table des matières I Position du problème. Vocabulaire 2 I.1 Nuage de points........................................... 2 I.2 Le problème de l ajustement..................................... I. Point moyen.............................................. II Ajustements 4 II.1 Ajustement à la règle......................................... 4 II.2 Méthode de Mayer.......................................... 4 II. Méthode des moindres carrés.................................... 4 II.4 Ajustement exponentiel....................................... 6 II.5 Comparaison............................................. 7 III Coefficient de corrélation linéaire 8-1-

Le problème qui se pose dans les séries statistiques à deux variables est principalement celui du lien qui existe ou non entre chacune des variables. Le texte en bleu concerne les calculatrices (TI et Casio) I Position du problème. Vocabulaire Par soucis de clarté, ce cours est élaboré à partir de l exemple suivant : Exemple Le tableau suivant donne l évolution du nombre d adhérents d un club de rugby de 2001 à 2006. Année 2001 2002 200 2004 2005 2006 Rangx i 1 2 4 5 6 Nombre d adhérentsy i 70 90 115 140 170 220 Le but est d étudier cette série statistique à deux variables (le rang et le nombre d adhérents) afin de prévoir l évolution du nombre d adhérents pour les années suivantes. I.1 Nuage de points La première étape consiste à réaliser un graphique qui traduise les deux séries statistiques ci-dessus. Définition 1 Soit X et Y deux variables statistiques numériques observées sur n individus. Dans un repère orthogonal (O; i ; j ), l ensemble des n points de coordonnées (x i,y i ) forme le nuage de points associé à cette série statistique. Dans notre exemple, si on place le rang en abscisses, et le nombre d adhérents en ordonnées, on peut représenter par un point chaque valeur. On obtient ainsi une succession de points, dont les coordonnées sont (1; 70), (2; 90),... (6; 220), forment un nuage de points. Question 1 Dans le plan muni d un repère orthogonal d unités graphiques : 2 cm pour une année sur l axe des abscisses et 1 cm pour 20 adhérents sur l axe des ordonnées, représenter le nuage de points associé à la série (x i ;y i ). T.I. Touche STAT Menu EDIT Entrer les valeursx i dansl 1 Entrer les valeursy i dansl 2 Règler les valeurs du repère avec la touche WINDOWS Appuyer sur la touche TRACE Casio Menu STAT Entrer les valeursx i danslist1 Entrer les valeursy i danslist2 Choisir GRPH Règler les paramètres avec SET Choisir GPH1-2-

1 ère BTSDOMOTIQUE Statistiques à deux variables 2008-2010 Nombre d adhérents 260 C f D 2 + 240 220 200 D 1 180 160 G 2 140 G 120 100 80 60 G 1 40 20 0 + 0 1 2 4 5 6 7 8 Rang I.2 Le problème de l ajustement Le nuage de points associé à une série statistique à deux variables donne donc immédiatement des informations de nature qualitatives. Pour en tirer des informations plus quantitatives, il nous faut poser le problème de l ajustement. Le tracé met en évidence la possibilité de "reconnaître" graphiquement la possibilité d une relation fonctionnelle entre les deux grandeurs observées (ici rang et nombre d adhérent). Le problème de l établissement d une relation fonctionnelle entre les deux séries est le problème de l ajustement. I. Point moyen Définition 2 Soit une série statistique à deux variables,x ety, dont les valeurs sont des couples (x i ;y i ). On appelle point moyen de la série le pointgde coordonnées x G = x 1 +x 2 + +x n. n y G = y 1 +y 2 + +y n. n --

Question 2 Déterminer les coordonnées des points moyens suivants : G 1 des années allant de 2001 à 200, G 2 des années allant de 2004 à 2006, G, point moyen du nuage de points tout entier. Calcul des coordonnées deg 1 : Calcul des coordonnées deg 2 : { 1+2+ xg1 = = 2 y G1 = 70+90+115 = 91, 7 { 4+5+6 xg2 = = 5 y G2 = 140+170+220 = 176, 7 donc, G 1 ( 2 ; 91, 7 ). donc, G 2 ( 5 ; 176, 7 ). Calcul des coordonnées de G : { 1+2++4+5+6 xg = 6 =, 5 y G = 70+90+115+140+170+220 = 14, 2 donc, G(, 5 ; 14, 2 ). II II.1 Ajustements Ajustement à la règle On se propose, à partir des résultats obtenus, de faire des prévisions pour les années à venir. Un poyen d y parvenir est de tracer au juger une droitedpassant le plus près possible des points du nuage et d en trouver l équation du typey=ax +b. II.2 Méthode de Mayer Cet ajustement consiste à déterminer la droite passant par deux points moyens du nuage de point. Question Déterminer l équation de la droited 1 qui passe par les points moyensg 1 etg 2 et la tracer sur le graphique précédent. La droited 1 n est pas parallèle à l axe des ordonnées, elle a donc pour équationy=ax +b avec : a = y G 2 y G1 x G2 x G2 = 176,7 91,7 5 2 = 28,. De plus, elle passe par le pointg 1 ( 2 ; 91, 7 ) d où : y G1 =ax G1 +b 91, 7 = 28, 2+b b = 5, 1. Conclusion : D 1 :y = 28, x + 5, 1. Pour tracerd 1, il suffit de placerg 1 etg 2 puis de tracer la droite qui les relie. II. Méthode des moindres carrés Il s agit d obtenir une droite équidistante des points situés de part et d autre d elle-même. Pour réaliser ceci, on cherche à minimiser la somme des distances des points à la droite au carré. On considère une série statistique à deux variables représentée par un nuage justifiant un ajustement affine. -4-

1 ère BTSDOMOTIQUE Statistiques à deux variables 2008-2010 Définition Dans le plan muni d un repère orthonormal, on considère un nuage denpoints de coordonnées (x i ;y i ). La droitedd équationy=ax +b est appelée droite de régression deyenxde la série statistique ssi la quantité suivante est minimale : n n (M i Q i ) 2 = [y i (ax i +b)] 2 i=1 i=1 y i M i D ax i +b Q i Remarque 1 Il serait tout aussi judicieux de s intéresser à la droited qui minimise la quantité Cette droite est appelée droite de régression dexeny. x i n [x i (ay i +b)] 2. i=1 Définition 4 On appelle covariance de la série statistique double de variablesxetyle nombre réel cov(x,y) =σ xy = 1 n (x i x)(y i ȳ). n i=1 Pour les calculs, on pourra aussi utiliser : Remarque 2 On a : cov(x,x) =σ x 2 =V (x) = [σ(x)] 2. σ xy = 1 n x i y i xȳ. n i=1 Propriété 1 La droite de régressionddey enxapour équationy =ax +b où a = σ xy [σ(x)] 2 b vérifie ȳ = a x + b. -5-

Remarque Les réelsaetbsont donnés par la calculatrice. T.I. Touche STAT Menu CALC Item LinReg LinRegL 1,L 2 Casio Menu STAT Item CALC Règler les paramètres avec set Item REG Choisir X Propriété 2 Le point moyengdu nuage appartient toujours à la droite de régression dey enx. Question 4 Déterminer une équation de la droite d ajustementd 2 deyenxobtenue par la méthode des moindres carrés et la tracer sur le graphique précédent. La calculatrice donned 2 :y =ax +b aveca = 29 etb = 2, 7. Conclusion : D 2 :y = 29x + 2, 7 Pour tracer la droited 2, il faut choisir deux points (au moins) sur cette droite. x 0 8 Par exemple :, les placer dans le repère puis tracer la droite. y 2, 7 264, 7 II.4 Ajustement exponentiel On remarque qu un ajustement affine ne semble pas très approprié pour ce nuage de points à partir de 2006, on se propose de déterminer un ajustement plus juste. Question 5 On posez= lny. Recopier et compléter le tableau suivant en arrondissant les valeurs dez i au millième. x i 1 2 4 5 6 z i 4, 248 Il suffit de calculer lny i pour chaque caleur dei: x i 1 2 4 5 6 z i 4, 248 4, 500 4, 745 4, 942 5, 16 5, 94 On peut déterminer les éléments de ce tableau grâce à la calculatrice : -6-

T.I. Touche STAT Menu EDIT Se placer dans L Entrer la formule "= lnl 2 " Casio Touche STAT Menu EDIT Se placer dans List Entrer la formule "= ln List2" Question 6 Déterminer une équation de la droite d ajustementd dez enxobtenue par la méthode des moindres carrés. La manipulation à la calculatrice est la même que précédemment, en oubliant pas de changer les paramètres. La calculatrice donned :z =ax +b aveca = 0, 224 etb = 4, 045. Conclusion : D :z = 0, 224x + 4, 045. Question 7 Dans ce cas, en déduire la relation qui liey àxpuis tracer la courbe représentative de la fonctiony=f(x). { z = 0, 224x + 4, 045 On a z = lny donc : lny = 0, 224x + 4, 045 On compose par la fonction exponentielle : e lny = e 0,224x+4,045 = (e 0,224 ) x e 4,045 = (1,251) x 57, 111 Conclusion : y = 57, 111 1, 251 x. Pour tracer la courbe, il suffit de placer des points, par exemple grâce au tableau de valeurs de la calculatrice. II.5 Comparaison Grâce aux trois derniers ajustements, on peut évaluer ce qui se passera plus tard, comparons les : Question 8 En supposant que les ajustements restent valables pour les années suivantes, donner une estimation du nombre d adhérents en 2007 suivant les trois méthodes. Dans tous les cas, il faut calculerylorsquexcorrespond à l année 2007, c est à dire au rang 7. Méthode de Mayer :y= 28, 7+5, 1 = 2, 2 soit environ 2 adhérents. Ajustement affine :y= 29 7+2, 7 = 25, 7 soit environ 26 adhérents. Ajustement exponentiel :y= 57, 112 1, 024 7 = 27, 9 soit environ 274 adhérents. Question 9 En 2007, il y a eu 280 adhérents. Lequel des trois ajustements semble le plus pertinent? Le troisième ajustement semble le plus pertinent puisqu il se rapporche le plus de la réalité. -7-

III Coefficient de corrélation linéaire Définition 5 Le coefficient de corrélation linéaire d une série statistique de variablesxetyest le nombrer défini par : r = σ xy σ(x) σ(y). Ce coefficient sert à mesurer la qualité d un ajustement affine. Interprétation graphique : Plus le coefficient de régression linéaire est proche de 1 en valeur absolue, meilleur est l ajustement linéaire. Lorquer=±1, la droite de régression passe par tous les points du nuage, qui sont donc alignés. Question 10 Déterminer le coefficient de corrélation linéaire dans le cas de l ajustement affine (entre x et y), puis exponentiel (entre x etz). Quel est l ajustemet le plus juste? Grâce à la calculatrice, on trouve successivementr 2 = 0, 987 puisr = 0, 999. Ce qui est conforme à ce que nous avions déduit précédemment, à savoir que l ajustement exponentiel est plus fiable pour ce cas. Propriété Le coefficient de corrélation linéairervérifie 1 r 1. -8-