Cours 5 : Série statistique à deux variables (série statistique double)



Documents pareils
Leçon N 4 : Statistiques à deux variables

Chapitre 3. Les distributions à deux variables

Correction du bac blanc CFE Mercatique

Comment tracer une droite représentative d'une fonction et méthode de calcul de l'équation d'une droite.

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

ISFA 2 année Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses.

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

Cours d Analyse. Fonctions de plusieurs variables

Structures algébriques

Statistiques à deux variables

SÉRIES STATISTIQUES À DEUX VARIABLES

Exercice 1 Trouver l équation du plan tangent pour chaque surface ci-dessous, au point (x 0,y 0,z 0 ) donné :

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Fonctions de deux variables. Mai 2011

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Correction du baccalauréat STMG Polynésie 17 juin 2014

Exercice 3 (5 points) A(x) = 1-e -0039' e- 0,039x A '() -'-,..--,-,--,------:-- X = (l_e-0,039x)2

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Baccalauréat ES Amérique du Nord 4 juin 2008

Cours 7 : Utilisation de modules sous python

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Chapitre 3 : Le budget des ventes. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 3

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ

Tutoriel Mathematica Les graphiques

Du bon usage de gnuplot

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Items étudiés dans le CHAPITRE N5. 7 et 9 p 129 D14 Déterminer par le calcul l'antécédent d'un nombre par une fonction linéaire

metal USB PEOPLE tel USB people Electronique 03 Objets et Cadeaux Publicitaires

Les équations différentielles

Une dérivation du paradigme de réécriture de multiensembles pour l'architecture de processeur graphique GPU

Calcul intégral élémentaire en plusieurs variables

Annexe commune aux séries ES, L et S : boîtes et quantiles

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

Statistiques Descriptives à une dimension

Bases de données Cours 5 : Base de données déductives

Analyse en Composantes Principales

Feuille TD n 1 Exercices d algorithmique éléments de correction

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

= constante et cette constante est a.

Dérivation : Résumé de cours et méthodes

Chap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1

TD 1 - Structures de Traits et Unification

Les devoirs en Première STMG

Chapitre 6. Fonction réelle d une variable réelle

Perrothon Sandrine UV Visible. Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

ENQUETE SUR LA SITUATION DES GRANDES VILLES ET AGGLOMERATIONS EN MATIERE D ASSURANCES DOMMAGES

Développements limités. Notion de développement limité

Exemples de problèmes et d applications. INF6953 Exemples de problèmes 1

L ALGORITHMIQUE. Algorithme

C f tracée ci- contre est la représentation graphique d une

Formation tableur niveau 1 (Excel 2013)

FONCTION DE DEMANDE : REVENU ET PRIX

Electricité : caractéristiques et point de fonctionnement d un circuit

Polynômes à plusieurs variables. Résultant

Table des matières. Le long terme Partie II. Introduction Liste des figures... Liste des tableaux...

Logistique, Transports

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

Chapitre 2 Le problème de l unicité des solutions

Quelques tests de primalité

Exercices sur le chapitre «Probabilités»

Séance 0 : Linux + Octave : le compromis idéal

Cryptographie RSA. Introduction Opérations Attaques. Cryptographie RSA NGUYEN Tuong Lan - LIU Yi 1

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

Introduction à l approche bootstrap

DOCM Solutions officielles = n 2 10.

Rappels sur les suites - Algorithme

SOMMAIRE OPÉRATIONS COURANTES OPÉRATIONS D INVENTAIRE

Relation entre deux variables : estimation de la corrélation linéaire

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Les algorithmes de base du graphisme

BACCALAURÉAT PROFESSIONNEL SUJET

SOMMAIRE. 1. Préambule Le calendrier Trajectoire d un objet lancé Régression linéaire...9

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

Lecture graphique. Table des matières

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

tâches nature durée en jours prédécesseurs C commande des matériaux 1 A D creusage des fondations 4 B E commande des portes et fenêtres 2 A

O, i, ) ln x. (ln x)2

Développements limités, équivalents et calculs de limites

TP 0 : INTRODUCTION À MATLAB

Logiciel XLSTAT version rue Damrémont PARIS

Séquence 2. Repérage dans le plan Équations de droites. Sommaire

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Exemples d utilisation de G2D à l oral de Centrale

Programmation linéaire

ASSURANCE PRÊT MARGE ATOUT ON VOUS ASSURE TOUT NOTRE SOUTIEN

Pourquoi l apprentissage?

Chapitre 4: Dérivée d'une fonction et règles de calcul

1 radian. De même, la longueur d un arc de cercle de rayon R et dont l angle au centre a pour mesure α radians est α R. R AB =R.

LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION

Statistique : Résumé de cours et méthodes

8.1 Généralités sur les fonctions de plusieurs variables réelles. f : R 2 R (x, y) 1 x 2 y 2

Note de cours. Introduction à Excel 2007

Une étude de différentes analyses réalisées par le BIT

MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

Transcription:

Cours 5 : Série statistique à deux variables (série statistique double) 1 Définition d une série statistique double 1 2 Quelques exemples 1 3 Représentation graphique 2 4 Covariance d une série statistique double 3 5 Ajustement affine 3 5.1 Principe 3 5.2 Méthodes 4 5.2.1 Méthode «au jugé» 4 5.2.2 Méthode de Mayer 4 5.2.3 Méthode des moindres carrés 4 5.2.3.1 Principe 4 5.2.3.2 Détermination des coefficients 5 6 Coefficient de corrélation linéaire 5 Les statistiques à une variable s intéressaient, pour une population donnée, à un caractère donné : les notes à un devoir surveillé d une classe, les salaires dans une entreprise, etc Lorsque l on s intéresse à l étude simultanée de deux caractères d une même population, on fait ce que l on appelle des statistiques à deux variables, en étudiant des séries statistiques doubles. 1 Définition d une série statistique double Définition 1 : On considère une population d'effectif n, si on étudie deux caractères X et Y de cette population, on dit que l'on étudie une série statistique double. Chaque individu de cette population est désigné par un nombre compris entre 1 et n. A chaque individu i ( 1 i n) correspond un couple (x i ; y i ), ou x i est la modalité du caractère X et y i est la modalité du caractère Y associé à l'individu i. L ensemble des couples (x i ; y i ) définit une série statistique à deux variables. 2 Quelques exemples Exemple 1 : Le tableau ci-dessous donne, pour chaque ville, le nombre moyen d heures d ensoleillement dans l année, ainsi que la température moyenne : Page 1 sur 5

Ville Ajaccio Lyon Marseille Brest Lille Paris Strasbourg Ensoleillement 2790 2072 2763 1729 1574 1833 1685 Température 14,7 11,4 14,2 10,8 9,7 11,2 9,7 Population : les sept villes étudiées Caractère n 1 : nombre moyen d heures d ensoleillement dans la ville Caractère n 2 : température moyenne dans la ville Exemple 2 : Le tableau ci-dessous permet de suivre l'évolution de l'espérance de vie à la naissance (en années) en France de 1990 à 1999 pour les femmes: Année 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 Espérance de vie 80,9 81,1 81,3 81,4 81,8 81,9 82,0 82,3 82,4 82,4 Population : les femmes en France Caractère n 1 : l année Caractère n 2 : l espérance de vie Définition 2 : Lorsque l un des deux caractères est une année, une date, on dit que la série statistique double est une série chronologique. 3 Représentation graphique Définition 3 : Si l on appelle x 1, x 2,, x n les n valeurs du premier caractère (on notera cette série (x i )), et si l on appelle y 1, y 2,, y n les n valeurs du second caractère (on notera cette série (y i )), alors on représente cette série statistique double par un nuage de points dans un repère du plan, constitué des points Mi de coordonnées (x i, y i ) Exemple 3 : Chaque mois, une entreprise consacre une somme à des opérations publicitaires. On met en regard le montant des ventes chaque mois. Une étude portant sur 8 mois a donné les résultats suivants exprimés en millions d euros. X=Frais de pub 0,24 0,3 0,25 0,32 0,35 0,2 0,18 0,3 Y=Ventes 38 42 39 40 45 35 34 41 Ventes 50 45 40 35 30 25 20 15 10 5 0 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 Frais de pub Remarque 1 : De la donnée de la série statistique double, on peut déduire les séries statistiques simples décrivant séparément les caractères X et Y : Page 2 sur 5

X=Frais de pub 0,18 0,2 0,24 0,25 0,3 0,32 0,35 Effectifs 1 1 1 1 2 1 1 Y=Ventes 34 35 38 39 40 41 42 45 Effectifs 1 1 1 1 1 1 1 1 Définition 4 : Soit la moyenne de la série (x i ), et la moyenne de la série (y i ). Le point G de coordonnées ( ; ) est appelé point moyen du nuage de points associé à cette série statistique double. 4 Covariance d une série statistique double Définition 5 : On appelle covariance d'une série statistique double (X ; Y) où les caractère X et Y sont quantitatifs le nombre noté cov(x, Y) ou XY défini par : Où et sont les moyennes des séries statistiques simples. Théorème de Huyghens-König : Propriété 1 : Soient α, β, α, β des constantes réelles, U et V les caractères statistiques définis par: U = α X + β et V = α X + β. C'est-à-dire tels que pour tout i tel que 1 i n : ui = αxi + β et vi = α' yi + β' Alors : cov (U, V) = αα' cov(x, Y) 5 Ajustement affine 5.1 Principe Soit (x i, y i ) une série statistique double, avec un nuage de points Mi (x i, y i ) associé. Lorsque les points du nuage paraissent presque alignés, on peut chercher une relation de la forme y = ax + b qui exprime de façon approchée les valeurs de la série (y i) en fonction des valeurs de la série (x i ), autrement dit, une fonction affine f telle que l égalité y = f(x) s ajuste au mieux avec les données. Graphiquement, cela signifie qu on cherche une droite qui passe au plus près de tous les points du nuage. Une telle relation permettrait notamment de faire des prévisions. Il existe de nombreuses manières d obtenir un ajustement affine satisfaisant. Page 3 sur 5

5.2 Méthodes 5.2.1 Méthode «au jugé» A vous de tracer une droite qui passe le plus près possible de tous les points du nuage, si possible en la faisant passer par le point moyen du nuage. C est peu précis, mais peut suffire dans certains cas. 5.2.2 Méthode de Mayer Etape 1 : On commence par «découper» la série statistique double en deux sous-séries bien distinctes, c est-à-dire que l on découpe le nuage de points Mi (x i, y i ) en deux sous-nuages distincts et de même effectif (ou presque : si le nombre de points est pair, pas de souci. S il est impair, on peut mettre le point surnuméraire dans n importe lequel des deux sous-nuages) Etape 2 : On calcule les coordonnées des deux points moyens G 1 et G 2 associés à ces deux sousnuages, et on place ces deux points sur le graphique. Etape 3 : On trace la droite (G 1 G 2 )?, appelée droite de Mayer du nuage de points Mi (x i, y i ), qui doit passer par le point moyen G du nuage de points Mi (x i, y i ).C est cette droite qui constitue un ajustement affine tout à fait acceptable pour la série double (x i, y i ) 5.2.3 Méthode des moindres carrés 5.2.3.1 Principe On considère un nuage de points Mi (x i, y i ) et soit (D) une droite d équation y = ax + b que l on cherche à déterminer. Définition 6 : On appelle somme des résidus associée à la droite (D), le nombre réel S défini par : Si Pi désigne le point d abscisses xi sur la droite (D), on a : Définition 7 : On appelle méthode des moindres carrés la méthode qui consiste à rechercher les coefficients a et b tels que la somme S soit minimale. Remarquons que S est une fonction des deux variables a et b. Page 4 sur 5

5.2.3.2 Détermination des coefficients Théorème 1 : Le nombre S est minimum pour Proposition 1 : La droite (D) d équation y = ax+b où a et b sont déterminés d après le théorème 1, est appelé droite de régression de Y en X et on dit qu on a obtenu cette équation par la méthode des moindres carrés. Proposition 2 : La droite (D ) d équation : x=a y+b avec : est appelée droite de droite de régression de X en Y et on dit qu on a obtenu cette équation par la méthode des moindres carrés. Remarque : Les deux droites de régression de Y en X et de X en Y passent toutes deux par le point moyen de coordonnées ( ; ) 6 Coefficient de corrélation linéaire Définition 8 : On appelle coefficient de corrélation linéaire du couple (X, Y), le nombre réel, noté r(x, Y) tel que : Remarques : -1 r(x,y) 1 aa = (r(x,y))² Lorsque la corrélation est forte (r 2 ¾) les droites de régression sont très proches et le nuage peut être approximé par une droite. Lorsque la corrélation est faible, le nuage de points ne peut pas être ajusté par une droite, mais il se peut qu une autre courbe permette un bon ajustement. Page 5 sur 5