Séries statistiques à deux variables : ajustement affine. Introduction : Ce thème est abordé en bac professionnel dans l unité «IV Activités statistiques». En évaluation, le candidat doit pouvoir : - représenter ou exploiter un nuage de points, - déterminer les coordonnées du point moyen G de la série. L emploi d un tableur permet de faciliter l approche des notions précédentes et de tracer rapidement la courbe de tendance. Pour l ajustement affine, toutes les indications utiles sont fournies. La représentation graphique est effectuée à partir du positionnement du point moyen G et d un autre point dont les coordonnées sont données. La problématique posée est résolue graphiquement. L exploitation algébrique est simplifiée ; l équation de la droite est souvent donnée. 1
Série statistiques à deux variables : ajustement affine. Objectif : Résoudre un problème lié au série statistique à deux variables en utilisant EXCEL. 1) Enigme Le tableau ci-dessous présente le chiffre d affaires d un magasin en fonction des frais de publicité qu il engage. Frais de publicité ( ) Chiffre d affaires ( ) 600 650 650 700 800 900 1000 1 100 1 100 1 150 22 000 22 200 22 800 24 000 24 400 24 600 25 000 25 900 26 800 26 200 Ce tableau est constitué de deux suites de nombres associés à deux caractères quantitatifs. Il définit une série statistique à deux variables où les valeurs sont données par les couples ( x i ;y i ). Problème : Comment déterminer graphiquement le chiffre d affaires de ce magasin si les frais de publicité s élèvent à 1 300. 2) Qu est-ce qu un nuage de points? Chaque couple de valeurs( x i ;y i ) correspond aux coordonnées d un point placé dans un repère orthogonal. L ensemble des points constitue un nuage de points. 2.1 Saisie des données sur EXCEL. - Ouvrir le logiciel EXCEL. - Reproduire le tableau donné ci-dessus : Les frais de publicité seront placés dans la première colonne. Les chiffres d affaires seront placés dans la deuxième colonne. Tableau des données : Frais de publicité Chiffre d'affaires 600 22 000 650 22 200 650 22 800 700 24 000 800 24 400 900 24 600 1000 25 000 1100 25 900 1100 26 800 1150 26 200 2
2.2 Tracé du nuage de points. - Sélectionner l ensemble du tableau en maintenant le bouton gauche de la souris enfoncé. - Cliquer sur l icône «Assistant graphique». - Sélectionner «Nuage de points» et le type de graphique : «Points placés dans un repère» ; appuyer sur «Suivant». - Sélectionner «Etiquettes de données» et «Afficher la valeur». - Sélectionner «Titres» : taper le titre choisi «Nuage de points». - Sélectionner «Axe des abscisses» : taper «Frais de publicité». - Sélectionner «Axe des ordonnées» : taper «Chiffre d affaires». - Sélectionner «Légende» : cliquer sur «Afficher la légende» ; cliquer sur «Suivant» ;puis «Afficher le graphique sur une nouvelle feuille» ; cliquer sur «Fin». Nuage de points 30 000 25 000 20 000 Chiffre d'affaires 15 000 10 000 5 000 0 0 200 400 600 800 1000 1200 1400 Frais de publicité 3) Point moyen de la série. On calcule les coordonnées du point moyen G : on calcule la moyenne des valeurs x i et y i de chaque partie. Méthode : - Ouvrir une nouvelle feuille de calcul. - Surligner la première colonne «Frais de publicité» ; sélectionner l icône. - Recommencer l opération pour la colonne «Chiffres d affaires». - Calculer les moyennes de chaque colonne : taper en B13 «= B12 / 5». - Recommencer les mêmes opérations pour la colonne «Chiffres d affaires». Solution : Coordonnées du point moyen G ( ; ). 3
4) Courbe de tendance. Le nuage de points semblent orienter selon une direction. On détermine la droite ayant cette direction, les points devant être répartis par rapport à elle. On détermine ainsi un ajustement affine de ce nuage de points. Méthode - Faire un clic droit sur un point de la courbe. Choisir «Ajouter une courbe de tendance».choisir la droite. Choisir dans le menu Options : «Afficher une équation».valider. Nuage de points 30 000 y = 7,4929x + 17909 25 000 20 000 15 000 10 000 5 000 0 0 200 400 600 800 1000 1200 1400 Frais de publicit é - Imprimer le graphique. Prolonger la droite dans tout le repère. - Placer le point moyen G dans le repère. - Indiquer si le point G appartient à la droite : oui non (entourer votre choix) 5)Exploitation de la courbe de tendance. La courbe de tendance tracée dans le repère correspond à l ajustement affine de cette série. Le point moyen G appartient à cette droite. Elle permet de déterminer graphiquement l évolution d une des deux variables en fonction de l autre variable. 3.1 Les frais de publicité s élevant à 1 300, déterminer le chiffre d affaires de ce magasin. ( Laisser les traits de construction apparents) Réponse au problème : Chiffre d affaires : 4
Compléments : 3.2 Le chiffre d affaires s élèvent à 27 000, déterminer les frais de publicité engagés par ce magasin. ( Laisser les traits de construction apparents) Frais de publicité : 5.3 Autre application :Utilisation de l équation de le droite proposée 5.3.1 Recopier dans le cadre l équation de la droite proposée par le logiciel : 5.3.2 Vérifier par le calcul que le point G appartient à la droite : 5.3.3 Calculer x i ou y i en utilisant l équation de la courbe de tendance proposée par le logiciel : x i = 1 300 y i = y i = 27 000 x i = A retenir : Une série statistique à deux variables ( x i ;y i ) est représenté par un nuage de points de forme allongée. Il peut être ajusté par une droite dite «droite d ajustement affine», tracée selon la direction du nuage. L exploitation graphique de cette droite permet de prévoir l estimation d une des deux variables par rapport à l autre. 5
Série à deux variables- Test. Le tableau suivant présente l évolution du nombre de nuitées réservées dans les gîtes ruraux d un département touristique, au cours des dernières années. Années 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2002 x i Rangs 1 2 3 4 5 6 7 8 9 10 12 Nombre de nuitées 25,4 26,8 31,1 28,0 33,2 32,0 32,2 37,2 39,3 45,7 45,8 y i En utilisant EXCEL : 1. Tracer le nuage de points de cette série. 2. Faire apparaître la courbe de tendance (droite)et son équation. 3. Déterminer les coordonnées du point moyen G. 4. Vérifier que G est sur la droite. 5. En supposant que la tendance traduite par cette droite est encore valable pour les trois années suivantes, déterminer graphiquement le nombre de nuitées prévisibles en 2002 6. Vérifier votre résultat par le calcul. Solution : Année 2002 : Elle correspond au rang 12.Donc x = 12. y = 1,8915 12 + 22,687 ; y = 45,847 valeur arrondie au dixième : y = 45,8. 6
Corrigé 1) Tableau EXCEL calcul des coordonnées du point moyen G. Frais de publicité Chiffres d'affaires 600 22000 650 22200 650 22800 700 24000 800 24400 900 24600 1000 25000 Coordonnées du point G 1100 25900 x = 685 y = 24930 1100 26800 1150 26200 8650 243900 865 24390 2) Vérification de l appartenance du point G à la droite d ajustement. (question 5.3.2) x = 865 y = 7,4929 865 + 17 909 24 390 3) Calculs de valeurs. (questions 5.3.3) x i = 1 300 y i = 7,4929 1 300+ 17 909 27 650 y i = 27 000 x i = ( 27 000 17 909) / 7,4929 1 213 7