Statistiques à deux variables

Documents pareils
SÉRIES STATISTIQUES À DEUX VARIABLES

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

Séquence 5. La fonction logarithme népérien. Sommaire

Chapitre 3 : Fonctions d une variable réelle (1)

Statistique descriptive bidimensionnelle

Comportement d'une suite

20. Algorithmique & Mathématiques

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

Dénombrement. Chapitre Enoncés des exercices

1 Mesure et intégrale

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

STATISTIQUE : TESTS D HYPOTHESES

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

55 - EXEMPLES D UTILISATION DU TABLEUR.

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

Chap. 5 : Les intérêts (Les calculs financiers)

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

EXERCICES : DÉNOMBREMENT

Limites des Suites numériques

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

c. Calcul pour une évolution d une proportion entre deux années non consécutives

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

Statistique Numérique et Analyse des Données

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

CHAPITRE 2 SÉRIES ENTIÈRES

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Les Nombres Parfaits.

Module 3 : Inversion de matrices

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Baccalauréat S Asie 19 juin 2014 Corrigé

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Cours de Statistiques inférentielles

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Solutions particulières d une équation différentielle...

14 Chapitre 14. Théorème du point fixe

STATISTIQUE AVANCÉE : MÉTHODES

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

4 Approximation des fonctions

Formation d un ester à partir d un acide et d un alcool

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Cours 5 : ESTIMATION PONCTUELLE

POLITIQUE ECONOMIQUE ET DEVELOPPEMENT

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

Processus et martingales en temps continu

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

MESURE DE L'INFORMATION

Principes et Méthodes Statistiques

2 ième partie : MATHÉMATIQUES FINANCIÈRES

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

Probabilités et statistique pour le CAPES

Suites et séries de fonctions

UNIVERSITÉ DE SFAX École Supérieure de Commerce

Université Pierre et Marie Curie. Biostatistique PACES - UE

Etude de la fonction ζ de Riemann

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

Terminale S. Terminale S 1 F. Laroche

Exercices de mathématiques

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

Mobile Business. Communiquez efficacement avec vos relations commerciales 09/2012

Régulation analogique industrielle ESTF- G.Thermique

Risque de longévité et détermination du besoin en capital : travaux en cours

Dominique Tapsoba, Vincent Fortin, François Anctil et Mario Haché

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

RESOLUTION DES FLOW SHOP STOCHASTIQUES PAR LES ORDRES STOCHASTIQUES. DERBALA Ali *)

Séries réelles ou complexes

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

RECHERCHE DE CLIENTS simplifiée

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

Dares Analyses. Plus d un tiers des CDI sont rompus avant un an

Semestre : 4 Module : Méthodes Quantitatives III Elément : Mathématiques Financières Enseignant : Mme BENOMAR

Un nouvel opérateur de fusion adaptatif. A new adaptive operator of fusion. 1. introduction

Chapitre 3 : Transistor bipolaire à jonction

One Office Voice Pack Vos appels fixes et mobiles en un seul pack

Initiation à l analyse factorielle des correspondances

Les solutions mi-hypothécaires, mi-bancaires de Manuvie. Guide du conseiller

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

Des résultats d irrationalité pour deux fonctions particulières

Chaînes de Markov. Arthur Charpentier

Introduction : Mesures et espaces de probabilités

L Objectif National des Dépenses d Assurance Maladie : d un outil global de régulation à une simple prévision des dépenses.

Gérer les applications

Les nouveaux relevés de compte

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

INTRODUCTION AUX MATRICES ALÉATOIRES. par. Djalil Chafaï

O, i, ) ln x. (ln x)2

Télé OPTIK. Plus spectaculaire que jamais.

DETERMINANTS. a b et a'

La coloration vitale au diacétate de fluorescéine permet un diagnostic plus précoce de la tuberculose à germes résistants à la rifampicine

ESIEA PARIS

Transcription:

Statistiques à deux variables. Approche des séries statistiques à deux variables.. Nuage de poits Sur ue classe de BTSA, le professeur a relevé les moyees de élèves e mathématiques et e agroomie. Les otes sot cosigées das le tableau doé ci-dessous. Élèves Moyee e Moyee e mathématiques : x i agroomie : y i Aselme Cédric David Kelvi 9 Lætitia Mohamed Pietro Richie Stéphaie, Tatiaa 9 Le professeur décide de faire ue représetatio graphique pour mieux visualiser les moyees e remplaçat chaque élève par le poit M i de coordoées(x i ; y i ), x i état la moyee e mathématiques et y i la moyee e agroomie. L esemble des poits aisi obteu est appelé uage de poits.. Faire la représetatio graphique du uage de poits.. Calculer la moyee x des otes de mathématiques et la moyee y des otes e agroomie.. Placer sur le graphique précédet le poit G de coordoées(x ; y)... Nuages de poits et lie etre les variables Les graphiques ci-cotre représetet des uages de poits de séries statistiques à deux variables. Pour chacue des séries à deux variables représetées par les uages de poits, o cherche à étudier s il existe u lie etre les deux variables, c est-à-dire si o peut exprimer y e foctio de x à l aide d ue foctio mathématique coue. Lorsqu il est possible de trouver ue telle foctio, o dit qu o effectue u ajustemet du uage.. Pour chacu des graphiques, costruire, lorsque cela est possible, ue courbe qui passe le plus près possible des poits.. Quels sot les graphiques où la courbe la plus adaptée semble être ue droite?

BTSA Cours FIGURE. Nuage FIGURE. Nuage - - - - -.... FIGURE. Nuage FIGURE. Nuage 9 FIGURE. Nuage FIGURE. Nuage Das le cas où la courbe qui approche le mieux les poits est ue droite, o dit qu o effectue u ajustemet affie du uage... Droites d ajustemet (où l o compare plusieurs droites qui approchet u uage) O cosidère la série statistique à deux variables x et y suivate : O ote M i le poit de coordoées(x i ; y i ). x i y i 9. Placer les poits M, M, M, M et M das le repère ci-dessous.

Cours BTSA. (a) Calculer les moyees x et y. 9 (b) Placer sur le graphique le poit G(x ; y). 9. O cosidère les droites, et d équatios respectives : y = x+, y =, x+, et y=, x+. (a) Tracer les trois droites sur la figure précédete. (b) Peut-o dire que ces trois droites approchet le uage? (c) Le poit G est-il u poit de chacue des trois droites? O cherche ue méthode permettat de savoir quelle droite approche le mieux le uage, c est-à-dire celle qui passe le plus près des poits. Cosidéros pour commecer la droite d équatio y= x+. O appelle P i le poit de la droite d abscisse x i, c est-à-dire de même abscisse que le poit M i ; par exemple P est le poit de d abscisse. O peut alors e déduire que P a pour coordoées( ; ) (e effet : + =).. Costruire les poits P i sur le graphique suivat. 9 M M M M M 9. O cherche à «mesurer» le fait que la droite passe plus ou mois près des poits M i. Pour cela o calcule le résidu P i M i = y Mi y Pi = y i x i+. Le calculer pour i=, puis pour i=,,..... O veut calculer esuite la somme S = P M +P M +P M +P M +P M. Cette somme s appelle somme des carrés des résidus.

BTSA Cours O cherche à redre cette somme la plus petite possible. Comparos avec les deux autres droites et et regardos laquelle des trois red la somme des carrés des résidus la plus petite.. O cosidère maiteat la droite d équatio y=, x+, et o appelle Q i les poits de d abscisses x i. Calculer la somme S = Q M + Q M + Q M + Q M + Q M. 9 M M M M M 9. O cosidère maiteat la droite d équatio y=, x+ et o appelle R i les poits de d abscisses x i. Calculer la somme S = R M + R M + R M + R M + R M. 9 M M M M M 9 Comparer les sommes S, S et S. Quelle est la plus petite? Quelle est, pour vous, la droite qui approche le mieux les poits du uage?. Série statistique à deux variables O cosidère ue populatio et o se propose d étudier cojoitemet deux caractères ou variables X et Y. Pour cela, o associe à chaque idividu de la populatio u couple(x i ; y i ) correspodat aux valeurs respectives des variables X et Y prises par l idividu.

Cours BTSA O étudiera uiquemet des variables X et Y quatitatives. O appelle série statistique double(x ; Y) l esemble des couples(x i ; y i ) associés à chaque idividu de la populatio. Exemple : O peut relever à des dates différetes sur u bébé so âge et so poids... Présetatio des doées Les résultats sot présetés gééralemet sous forme de tableaux. Exemple : U chef d etreprise a fait u relevé sur ciq aées de l évolutio du pourcetage d emplois à temps partiel das so etreprise : Aée Rag x i Pourcetages d emplois partiels y i,,,9,, Ue série est dite chroologique lorsque la variable X est foctio du temps. O remplace souvet la valeur de l aée par so rag... Nuage de poits Le pla est mui d u repère orthogoal O; ı, j. À chaque couple(x i ; y i ), o associe le poit M i (x i ; y i ). L esemble des poits M i (x i ; y i ) est appelé uage de poits associé à la série statistique double. Le poit moye d u uage est le poit G de coordoées(x ; y). Exemple : voir approche.. E gééral, o fait figurer le poit moye sur le graphique représetat le uage de poits.. Ajustemet affie O cherche s il existe u lie etre les deux variables, c est-à-dire s il est possible d écrire y e foctio de x. Effectuer u ajustemet d u uage de poits cosiste à trouver ue foctio dot la courbe représetative «approche» le uage, c est-à-dire dot la courbe passe au plus près des poits du uage. Quad le uage présete ue forme rectilige, la courbe cherchée est ue droite. Das ce cas la foctio est ue foctio affie du type x ax+b. Exemple : voir approche.. Ue droite d ajustemet affie est ue droite qui passe au plus près des poits du uage. O admettra que, pour que l ajustemet soit le meilleur possible, il faut que la droite d ajustemet affie passe par le poit moye G du uage. Diverses méthodes existet pour trouver ue droite d ajustemet affie.

BTSA Cours Ue des méthodes cosiste à effectuer graphiquemet et doc à tracer ue droite «au jugé», c est-à-dire «à la mai» ; les coefficiets a et b sot alors détermiés graphiquemet. MÉTHODE U chef d etreprise a fait u relevé sur ciq aées de l évolutio du pourcetage d emplois à temps partiel das so etreprise : Aée Rag x i Pourcetages d emplois partiels y i,,,9,, Le poit moye est le poit G de coordoées ( ; ). O remarque que le uage présete ue forme rectilige ce qui justifie u ajustemet affie. La droite a été dessiée «au jugé» : elle approche de près les poits du uage et elle passe par le poit moye G. O peut estimer que c est ue droite d ajustemet affie du uage de poits. Détermier graphiquemet so équatio. La droite que l o a tracée au jugé est pas uique. O aurait pu tracer de ombreuses droites approchat le uage et passat par le poit moye. O compred aisémet que cette méthode maque de précisio. O a doc cherché des méthodes plus calculatoires pour avoir ue plus grade précisio. G. Droite de régressio : méthode des moidres carrés O cherche ue droite qui approche au plus près le uage, c est-à-dire ue droite qui passe au plus près de chacu des poits du uage. La méthode qui suit est ue méthode qui se propose de «quatifier» l éloigemet des poits par rapport à la droite d ajustemet. Cosidéros ue série statistique double(x ; Y). O ote M i le poit de coordoées(x i ; y i ). Soit ue droite d équatio y= ax+ b. O ote P i le poit de d abscisse x i. P i est doc le poit de coordoées(x i ; ax i + b). y M ax+b P ax + b y P M O x x

Cours BTSA O compare les ordoées des poits M i et des poits P i correspodats. Pour cela, o calcule les résidus (ou écarts) e i = P i M i = y Mi y Pi = y i ax i + b. O cherche ue droite telle que les résidus soiet les plus petits possibles. O appelle somme des carrés des résidus, (ou somme des carrés des écarts), le réel S=P M + P M +...+P M = [y i (ax i + b)] = La droite cherchée est celle qui red cette somme miimale. O l appelle droite de régressio de y e x et la méthode s appelle méthode des moidres carrés. Cela reviet à dire qu o détermie les réels a et b pour que la somme des résidus soit miimale. La droite de régressio de y e x est la droite d équatio y= ax+b où les paramètres a et b ot été calculés de faço à ce que la somme S= [y i (ax i + b)] = e soit miimale. i Théorème Cette droite passe par le poit moye du uage. Les paramètres a et b sot doés par les formules suivates et par toute calculatrice ou tableur. e i. Covariace et coefficiet de corrélatio liéaire.. Covariace La covariace d ue série statistique double(x ; Y) est par défiitio le ombre oté cov(x ; Y) tel que : cov(x ; Y)= xi x y i y = x i y i x y.. Droites de régressio Théorème cov(x ; Y) La droite de régressio de y e x a pour équatio y y= m(x x) où m= σ(x) Si, au lieu de regarder les écarts verticaux etre la droite et les poits du uage, o avait miimisé la somme des carrés des écarts horizotaux, o aurait obteu ue autre droite de régressio. Théorème La droite de régressio de x e y a pour équatio x x= m y y cov(x ; Y) où m= σ(y).. Coefficiet de corrélatio liéaire Le coefficiet de corrélatio liéaire d ue variable statistique double est le ombre oté r défii par : cov(x ; Y) r= σ(x)σ(y)

BTSA 9 Cours Théorème U coefficiet de corrélatio est compris etre et. Lorsque r est voisi de, les droites de régressio et sot éloigées : les variables x et y sot peu corrélées. Lorsque r est voisi de, les droites de régressio et sot presque cofodues : les variables x et y sot très corrélées. MÉTHODE O cosidère la série statistique double(x ; Y) suivate où x i représete le ombre de poits de vete d ue marque et y i le chiffre d affaires correspodat e k. Aée 999 Nombre de poits de vete x i 9 9 Chiffre d affaires y i. À la calculatrice, trouver les coordoées du poit moye G.. À la calculatrice, trouver ue équatio de régressio de y e x par la méthode des moidres carrés.. Les deux variables sot-elles fortemet corrélées?.. Coefficiet de détermiatio cov(x ; Y) Le coefficiet de détermiatio est égal à r = = σ(x)σ(y) cov(x ; Y) V(X)V(Y). O démotre que la variace totale est égale à la somme de la variace expliquée et de la variace résiduelle grâce à la formule suivate : i= (y i y) i= ( y i y) = + c est à dire que y i est la valeur estimée par le modèle pour x i. i= (y i y i ) où y i = ax i + b variace expliquée par la droite des moidres carrés Tout cela permet de prouver que r =. variace totale Ceci sigifie que le coefficiet de détermiatio r mesure la part de la variabilité totale de la variable Y qui est expliquée par le facteur X. MÉTHODE Calculer le coefficiet de détermiatio de la méthode précédete et l iterpréter.