1 ) POSITION DU PROBLÈME - VOCABULAIRE A ) DÉFINITION SÉRIES STATISTIQUES À DEUX VARIABLES O cosidère deux variables statistiques umériques x et y observées sur ue même populatio de idividus. O ote x 1 ; x 2 ; ; x les valeurs relevées pour la première variable et y 1 ; y 2 ; ; y les valeurs relevées pour la deuxième variable. Les couples x 1 ; y 1 ; x 2 ; y 2 ; ; x ; y formet ue série statistique à deux variables. Pour la suite du cours, o garde les otatios ci-dessus et o cosidère l'exemple ci-dessous : Exemple : Le tableau suivat doe l évolutio du ombre d adhérets d u club de basket de 2008 à 2013. Aée 2008 2009 2010 2011 2012 2013 Rag x i 1 2 3 4 5 6 Nombre d adhérets y i 70 90 115 140 170 220 Le but est d étudier cette série statistique à deux variables (le rag et le ombre d adhérets) afi de prévoir l évolutio du ombre d adhérets pour les aées suivates. B ) NUAGE DE POINTS La première étape cosiste à réaliser u graphique qui traduise les deux séries statistiques. Das le pla rapporté à u repère orthogoal, o appelle uage de poits associé à cette série statistique à deux variables, l'esemble des poits M 1 x 1 ; y 1 ; M 2 x 2 ; y 2 ;...; M x ; y. Das otre exemple, si o place le rag e abscisses, et le ombre d adhérets e ordoées, o peut représeter par u poit chaque valeur. O obtiet aisi ue successio de poits, dot les coordoées (1; 70), (2; 90),... (6; 220), formet u uage de poits. Exemple - questio 1 : Représeter le uage de poits associé à la série - Séries statistiques à deux variables - auteur : Pierre Lux - cours prof -page 1 / 5
Avec ue calculatrice : Remarque : Le uage de poits associé à ue série statistique à deux variables doe doc immédiatemet des iformatios de ature qualitative. Pour e tirer des iformatios plus quatitatives, il ous faut poser le problème de l ajustemet. Le tracé met e évidece la possibilité de "recoaître" graphiquemet la possibilité d ue relatio foctioelle etre les deux gradeurs observées (ici rag et ombre d adhérets). Le problème de l établissemet d ue relatio foctioelle etre les deux séries est le problème de l ajustemet. C ) POINT MOYEN O appelle poit moye de cette série le poit G de coordoées x ; y où x et y sot les moyees respectives des séries x 1 ; x 2 ; x et y 1 ; y 2 ; y. Exemple - questio 2 : Détermier les coordoées des poits moyes suivats : G 1 des aées allat de 2008 à 2010, G 2 des aées allat de 2011 à 2013, G, poit moye du uage de poits tout etier. O obtiet G 1 2 ; 91,7, G 2 5 ; 176,7 et G 3,5 ; 134,2 2 ) AJUSTEMENTS A ) À LA RÈGLE O se propose, à partir des résultats obteus, de faire des prévisios pour les aées à veir. U moye d y parveir est de tracer au juger ue droite d passat le plus près possible des poits du uage et d e trouver l équatio du type y = ax b. B ) MÉTHODE DE MAYER Cet ajustemet cosiste à détermier la droite passat par deux poits moyes du uage de poits. Exemple - questio 3 : Détermier l équatio de la droite d 1 qui passe par les poits moyes G 1 et G 2 et la tracer sur le graphique précédet. La droite d 1 est pas parallèle à l axe des ordoées, elle admet doc ue équatio de la forme y = ax b avec : a= 176,7 91,7 = 28,3 5 2 De plus, elle passe par le poit G 1 2 ; 91,7 d où : y G 1 =a x G1 b 91,7= 28,3 2 b b = 35,1 Coclusio : d 1 : y =28,3 x 35,1. Pour tracer d 1, il suffit de placer G 1 et G 2 puis de tracer la droite qui les relie. - Séries statistiques à deux variables - auteur : Pierre Lux - cours prof -page 2 / 5
C ) MÉTHODE DES MOINDRES CARRÉS Il s agit d obteir ue droite équidistate des poits situés de part et d autre d elle-même. Pour réaliser ceci, o cherche à miimiser la somme des distaces des poits à la droite au carré. O cosidère ue série statistique à deux variables représetée par u uage justifiat u ajustemet affie. Das le pla mui d u repère orthoormal, o cosidère u uage de poits de coordoées x i ; y i. La droite d d équatio y =ax b est appelée droite de régressio de y e x de la série statistique si et seulemet si la quatité suivate est miimale : d M i Q i 2 = y i a x i b 2 Remarque : Il serait tout aussi judicieux de s itéresser à la droite d qui miimise la quatité x i a y i b 2 Cette droite est appelée droite de régressio de x e y. O appelle covariace de la série statistique double de variables x et y le ombre réel : cov x ; y = xy = 1 x i x y i y i = 1 Pour les calculs, o pourra aussi utiliser : xy = 1 x i y i x y Remarque : O a cov x ; x = x 2 = V x = x 2 La droite de régressio d de y e x a pour équatio y = ax b où : Avec ue calculatrice : a= xy 2 et b vérifie y = a x b x Le poit moye G du uage appartiet toujours à la droite de régressio de y e x. Exemple - questio 4 : Détermier avec la calculatrice ue équatio de la droite d ajustemet d 2 de y e x obteue par la méthode des moidres carrés et la tracer sur le graphique précédet. La calculatrice doe d 2 : y = 29 x 32,7 Pour tracer la droite d 2, il faut choisir deux poits (au mois) sur cette droite. Par exemple : x 0 8 y 32,7 264,7 - Séries statistiques à deux variables - auteur : Pierre Lux - cours prof -page 3 / 5
D ) AJUSTEMENT EXPONENTIEL O remarque qu u ajustemet affie e semble pas très approprié pour ce uage de poits à partir de 2013, O se propose de détermier u ajustemet plus juste. Exemple - questio 5 : O pose z = l y. Compléter le tableau suivat e arrodissat les valeurs de z i au millième. x i 1 2 3 4 5 6 z i 4,248 4,500 4,745 4,942 5,136 5,394 Avec ue calculatrice : Exemple - questio 6 : Détermier ue équatio de la droite d ajustemet d 3 de z e x obteue par la méthode des moidres carrés. La maipulatio à la calculatrice est la même que précédemmet, e 'oubliat pas de chager les paramètres. La calculatrice doe d 3 : z = 0,224 x 4,045 Exemple - questio 7 : Das ce cas, e déduire la relatio qui lie y à x puis tracer la courbe représetative de la foctio y = f x. O a { z = 0,224 x 4,045 z = l y O a doc : l y =0,224 x 4,045 O obtiet : e l y =e 0,224 x 4,045 = e 0,224 x e 4,045 1,251 x 57,111 O e déduit que y = 57,111 1,251 x Pour tracer la courbe, il suffit de placer des poits, par exemple grâce au tableau de valeurs de la calculatrice. E ) COMPARAISON Grâce aux trois deriers ajustemets, o peut évaluer ce qui se passera plus tard, comparos les : Exemple - questio 8 : E supposat que les ajustemets restet valables pour les aées suivates, doer ue estimatio du ombre d adhérets e 2014 suivat les trois méthodes. Das tous les cas, il faut calculer y lorsque x correspod à l aée 2014, c est à dire au rag 7. Méthode de Mayer : y = 28,3 7 35,1= 233, 2 soit eviro 233 adhérets. Ajustemet affie : y = 29 7 32,7= 235,7 soit eviro 236 adhérets. Ajustemet expoetiel : y = 57,112 1,251 7 273,9 soit eviro 274 adhérets. - Séries statistiques à deux variables - auteur : Pierre Lux - cours prof -page 4 / 5
Exemple - questio 9 : E 2014, il y a eu 280 adhérets. Lequel des trois ajustemets semble le plus pertiet? Le troisième ajustemet semble le plus pertiet puisqu il se rapproche le plus de la réalité. Défiitios : O parle d'iterpolatio pour des valeurs à l'itérieur de la plage des valeurs observées et d'extrapolatio pour des valeurs à l'extérieur de cette plage. Bie etedu, les résultats obteu par iterpolatio et par extrapolatio sot à exploiter avec prudece. 3 ) COEFFICIENT DE CORRÉLATION LINÉAIRE Le coefficiet de corrélatio liéaire d ue série statistique de variables x et y est le ombre r défii par : xy r= x y Ce coefficiet sert à mesurer la qualité d u ajustemet affie. Iterprétatio graphique : Plus le coefficiet de corrélatio liéaire est proche de 1 e valeur absolue, meilleur est l ajustemet liéaire. Lorsque r =±1, la droite de régressio passe par tous les poits du uage, qui sot doc aligés. Exemple - questio 10 : Détermier le coefficiet de corrélatio liéaire das le cas de l ajustemet affie (etre x et y), puis expoetiel (etre x et z). Quel est l ajustemet le plus juste? Grâce à la calculatrice, o trouve : ajustemet affie : r 2 =0,987 ajustemet expoetiel : r 3 = 0,99 Ce qui est coforme à ce que ous avios déduit précédemmet, à savoir que l ajustemet expoetiel est plus fiable pour ce cas. Le coefficiet de corrélatio liéaire r vérifie 1 r 1. - Séries statistiques à deux variables - auteur : Pierre Lux - cours prof -page 5 / 5