Statistiques à deux variables. Approche des séries statistiques à deux variables.. Nuage de poits Sur ue classe de BTSA, le professeur a relevé les moyees de élèves e mathématiques et e agroomie. Les otes sot cosigées das le tableau doé ci-dessous. Élèves Moyee e Moyee e mathématiques : x i agroomie : y i Aselme Cédric David Kelvi 9 Lætitia Mohamed Pietro Richie Stéphaie, Tatiaa 9 Le professeur décide de faire ue représetatio graphique pour mieux visualiser les moyees e remplaçat chaque élève par le poit M i de coordoées(x i ; y i ), x i état la moyee e mathématiques et y i la moyee e agroomie. L esemble des poits aisi obteu est appelé uage de poits.. Faire la représetatio graphique du uage de poits.. Calculer la moyee x des otes de mathématiques et la moyee y des otes e agroomie.. Placer sur le graphique précédet le poit G de coordoées(x ; y)... Nuages de poits et lie etre les variables Les graphiques ci-cotre représetet des uages de poits de séries statistiques à deux variables. Pour chacue des séries à deux variables représetées par les uages de poits, o cherche à étudier s il existe u lie etre les deux variables, c est-à-dire si o peut exprimer y e foctio de x à l aide d ue foctio mathématique coue. Lorsqu il est possible de trouver ue telle foctio, o dit qu o effectue u ajustemet du uage.. Pour chacu des graphiques, costruire, lorsque cela est possible, ue courbe qui passe le plus près possible des poits.. Quels sot les graphiques où la courbe la plus adaptée semble être ue droite?
BTSA Cours FIGURE. Nuage FIGURE. Nuage - - - - -.... FIGURE. Nuage FIGURE. Nuage 9 FIGURE. Nuage FIGURE. Nuage Das le cas où la courbe qui approche le mieux les poits est ue droite, o dit qu o effectue u ajustemet affie du uage... Droites d ajustemet (où l o compare plusieurs droites qui approchet u uage) O cosidère la série statistique à deux variables x et y suivate : O ote M i le poit de coordoées(x i ; y i ). x i y i 9. Placer les poits M, M, M, M et M das le repère ci-dessous.
Cours BTSA. (a) Calculer les moyees x et y. 9 (b) Placer sur le graphique le poit G(x ; y). 9. O cosidère les droites, et d équatios respectives : y = x+, y =, x+, et y=, x+. (a) Tracer les trois droites sur la figure précédete. (b) Peut-o dire que ces trois droites approchet le uage? (c) Le poit G est-il u poit de chacue des trois droites? O cherche ue méthode permettat de savoir quelle droite approche le mieux le uage, c est-à-dire celle qui passe le plus près des poits. Cosidéros pour commecer la droite d équatio y= x+. O appelle P i le poit de la droite d abscisse x i, c est-à-dire de même abscisse que le poit M i ; par exemple P est le poit de d abscisse. O peut alors e déduire que P a pour coordoées( ; ) (e effet : + =).. Costruire les poits P i sur le graphique suivat. 9 M M M M M 9. O cherche à «mesurer» le fait que la droite passe plus ou mois près des poits M i. Pour cela o calcule le résidu P i M i = y Mi y Pi = y i x i+. Le calculer pour i=, puis pour i=,,..... O veut calculer esuite la somme S = P M +P M +P M +P M +P M. Cette somme s appelle somme des carrés des résidus.
BTSA Cours O cherche à redre cette somme la plus petite possible. Comparos avec les deux autres droites et et regardos laquelle des trois red la somme des carrés des résidus la plus petite.. O cosidère maiteat la droite d équatio y=, x+, et o appelle Q i les poits de d abscisses x i. Calculer la somme S = Q M + Q M + Q M + Q M + Q M. 9 M M M M M 9. O cosidère maiteat la droite d équatio y=, x+ et o appelle R i les poits de d abscisses x i. Calculer la somme S = R M + R M + R M + R M + R M. 9 M M M M M 9 Comparer les sommes S, S et S. Quelle est la plus petite? Quelle est, pour vous, la droite qui approche le mieux les poits du uage?. Série statistique à deux variables O cosidère ue populatio et o se propose d étudier cojoitemet deux caractères ou variables X et Y. Pour cela, o associe à chaque idividu de la populatio u couple(x i ; y i ) correspodat aux valeurs respectives des variables X et Y prises par l idividu.
Cours BTSA O étudiera uiquemet des variables X et Y quatitatives. O appelle série statistique double(x ; Y) l esemble des couples(x i ; y i ) associés à chaque idividu de la populatio. Exemple : O peut relever à des dates différetes sur u bébé so âge et so poids... Présetatio des doées Les résultats sot présetés gééralemet sous forme de tableaux. Exemple : U chef d etreprise a fait u relevé sur ciq aées de l évolutio du pourcetage d emplois à temps partiel das so etreprise : Aée Rag x i Pourcetages d emplois partiels y i,,,9,, Ue série est dite chroologique lorsque la variable X est foctio du temps. O remplace souvet la valeur de l aée par so rag... Nuage de poits Le pla est mui d u repère orthogoal O; ı, j. À chaque couple(x i ; y i ), o associe le poit M i (x i ; y i ). L esemble des poits M i (x i ; y i ) est appelé uage de poits associé à la série statistique double. Le poit moye d u uage est le poit G de coordoées(x ; y). Exemple : voir approche.. E gééral, o fait figurer le poit moye sur le graphique représetat le uage de poits.. Ajustemet affie O cherche s il existe u lie etre les deux variables, c est-à-dire s il est possible d écrire y e foctio de x. Effectuer u ajustemet d u uage de poits cosiste à trouver ue foctio dot la courbe représetative «approche» le uage, c est-à-dire dot la courbe passe au plus près des poits du uage. Quad le uage présete ue forme rectilige, la courbe cherchée est ue droite. Das ce cas la foctio est ue foctio affie du type x ax+b. Exemple : voir approche.. Ue droite d ajustemet affie est ue droite qui passe au plus près des poits du uage. O admettra que, pour que l ajustemet soit le meilleur possible, il faut que la droite d ajustemet affie passe par le poit moye G du uage. Diverses méthodes existet pour trouver ue droite d ajustemet affie.
BTSA Cours Ue des méthodes cosiste à effectuer graphiquemet et doc à tracer ue droite «au jugé», c est-à-dire «à la mai» ; les coefficiets a et b sot alors détermiés graphiquemet. MÉTHODE U chef d etreprise a fait u relevé sur ciq aées de l évolutio du pourcetage d emplois à temps partiel das so etreprise : Aée Rag x i Pourcetages d emplois partiels y i,,,9,, Le poit moye est le poit G de coordoées ( ; ). O remarque que le uage présete ue forme rectilige ce qui justifie u ajustemet affie. La droite a été dessiée «au jugé» : elle approche de près les poits du uage et elle passe par le poit moye G. O peut estimer que c est ue droite d ajustemet affie du uage de poits. Détermier graphiquemet so équatio. La droite que l o a tracée au jugé est pas uique. O aurait pu tracer de ombreuses droites approchat le uage et passat par le poit moye. O compred aisémet que cette méthode maque de précisio. O a doc cherché des méthodes plus calculatoires pour avoir ue plus grade précisio. G. Droite de régressio : méthode des moidres carrés O cherche ue droite qui approche au plus près le uage, c est-à-dire ue droite qui passe au plus près de chacu des poits du uage. La méthode qui suit est ue méthode qui se propose de «quatifier» l éloigemet des poits par rapport à la droite d ajustemet. Cosidéros ue série statistique double(x ; Y). O ote M i le poit de coordoées(x i ; y i ). Soit ue droite d équatio y= ax+ b. O ote P i le poit de d abscisse x i. P i est doc le poit de coordoées(x i ; ax i + b). y M ax+b P ax + b y P M O x x
Cours BTSA O compare les ordoées des poits M i et des poits P i correspodats. Pour cela, o calcule les résidus (ou écarts) e i = P i M i = y Mi y Pi = y i ax i + b. O cherche ue droite telle que les résidus soiet les plus petits possibles. O appelle somme des carrés des résidus, (ou somme des carrés des écarts), le réel S=P M + P M +...+P M = [y i (ax i + b)] = La droite cherchée est celle qui red cette somme miimale. O l appelle droite de régressio de y e x et la méthode s appelle méthode des moidres carrés. Cela reviet à dire qu o détermie les réels a et b pour que la somme des résidus soit miimale. La droite de régressio de y e x est la droite d équatio y= ax+b où les paramètres a et b ot été calculés de faço à ce que la somme S= [y i (ax i + b)] = e soit miimale. i Théorème Cette droite passe par le poit moye du uage. Les paramètres a et b sot doés par les formules suivates et par toute calculatrice ou tableur. e i. Covariace et coefficiet de corrélatio liéaire.. Covariace La covariace d ue série statistique double(x ; Y) est par défiitio le ombre oté cov(x ; Y) tel que : cov(x ; Y)= xi x y i y = x i y i x y.. Droites de régressio Théorème cov(x ; Y) La droite de régressio de y e x a pour équatio y y= m(x x) où m= σ(x) Si, au lieu de regarder les écarts verticaux etre la droite et les poits du uage, o avait miimisé la somme des carrés des écarts horizotaux, o aurait obteu ue autre droite de régressio. Théorème La droite de régressio de x e y a pour équatio x x= m y y cov(x ; Y) où m= σ(y).. Coefficiet de corrélatio liéaire Le coefficiet de corrélatio liéaire d ue variable statistique double est le ombre oté r défii par : cov(x ; Y) r= σ(x)σ(y)
BTSA 9 Cours Théorème U coefficiet de corrélatio est compris etre et. Lorsque r est voisi de, les droites de régressio et sot éloigées : les variables x et y sot peu corrélées. Lorsque r est voisi de, les droites de régressio et sot presque cofodues : les variables x et y sot très corrélées. MÉTHODE O cosidère la série statistique double(x ; Y) suivate où x i représete le ombre de poits de vete d ue marque et y i le chiffre d affaires correspodat e k. Aée 999 Nombre de poits de vete x i 9 9 Chiffre d affaires y i. À la calculatrice, trouver les coordoées du poit moye G.. À la calculatrice, trouver ue équatio de régressio de y e x par la méthode des moidres carrés.. Les deux variables sot-elles fortemet corrélées?.. Coefficiet de détermiatio cov(x ; Y) Le coefficiet de détermiatio est égal à r = = σ(x)σ(y) cov(x ; Y) V(X)V(Y). O démotre que la variace totale est égale à la somme de la variace expliquée et de la variace résiduelle grâce à la formule suivate : i= (y i y) i= ( y i y) = + c est à dire que y i est la valeur estimée par le modèle pour x i. i= (y i y i ) où y i = ax i + b variace expliquée par la droite des moidres carrés Tout cela permet de prouver que r =. variace totale Ceci sigifie que le coefficiet de détermiatio r mesure la part de la variabilité totale de la variable Y qui est expliquée par le facteur X. MÉTHODE Calculer le coefficiet de détermiatio de la méthode précédete et l iterpréter.