COURS, ACTIVITES - ENONCES DES EXERCICES

Documents pareils
Statistique : Résumé de cours et méthodes

Statistiques Descriptives à une dimension

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Statistiques 0,14 0,11

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Représentation d une distribution

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Chapitre 3. Les distributions à deux variables

Séries Statistiques Simples

1. Vocabulaire : Introduction au tableau élémentaire

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Leçon N 4 : Statistiques à deux variables

Logiciel XLSTAT version rue Damrémont PARIS

Annexe commune aux séries ES, L et S : boîtes et quantiles

SERIE 1 Statistique descriptive - Graphiques

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

Baccalauréat ES Amérique du Nord 4 juin 2008

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

TSTI 2D CH X : Exemples de lois à densité 1

Les devoirs en Première STMG

Enoncé et corrigé du brevet des collèges dans les académies d Aix- Marseille, Montpellier, Nice Corse et Toulouse en Énoncé.

Statistiques avec la graph 35+

STATISTIQUES DESCRIPTIVES

Indications pour une progression au CM1 et au CM2

Complément d information concernant la fiche de concordance

Statistique descriptive. Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne. Notes de cours

Programmation linéaire

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

STATISTIQUES DESCRIPTIVES

Relation entre deux variables : estimation de la corrélation linéaire

BACCALAURÉAT PROFESSIONNEL SUJET

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

MATHÉMATIQUES. Mat-4104

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Le chiffre est le signe, le nombre est la valeur.

LES NOMBRES DECIMAUX. I. Les programmes

MegaStore Manager ... Simulation de gestion d un hypermarché. Manuel du Participant

DUT Techniques de commercialisation Mathématiques et statistiques appliquées

- Ressources pour les classes

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

PLAN DE CLASSIFICATION UNIFORME DES DOCUMENTS DU MSSS

Statistique Descriptive Élémentaire

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

Séquence 4. Statistiques. Sommaire. Pré-requis Médiane, quartiles, diagramme en boîte Moyenne, écart-type Synthèse Exercices d approfondissement

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

INFIRMIER(E) GRADUE(E) SPECIALISE(E) EN SANTE COMMUNAUTAIRE HAUTE ECOLE DE LA PROVINCE DE LIEGE PROFESSEUR : RENARD X.

FICHE 1 Fiche à destination des enseignants

Les pourcentages. Un pourcentage est défini par un rapport dont le dénominateur est 100. Ce rapport appelé taux de pourcentage est noté t.

Items étudiés dans le CHAPITRE N5. 7 et 9 p 129 D14 Déterminer par le calcul l'antécédent d'un nombre par une fonction linéaire

Quel système d équations traduit cette situation? x : la hauteur du rectangle. y : l aire du rectangle. C) y = 4x + 25.

Formation Août 2013 Michèle Garello, IEN économie gestion Caroline Natta, professeur

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Analyse et interprétation des données

Étude sur les taux de revalorisation des contrats individuels d assurance vie au titre de 2013 n 26 mai 2014

Logistique, Transports

BACCALAUREAT GENERAL MATHÉMATIQUES

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

CAPTEURS - CHAINES DE MESURES

Correction du bac blanc CFE Mercatique

Chapitre 1 : Évolution COURS

Probabilités conditionnelles Loi binomiale

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Statistiques à deux variables

Régression linéaire. Nicolas Turenne INRA

3. Caractéristiques et fonctions d une v.a.

Localisation des fonctions

TP 7 : oscillateur de torsion

L'ELASTICITE-PRIX I- QUAND LES PRIX VARIENT...

Résultats d Etude. L étude de marché. Résultats d Etude N 1889 : Conciergerie privée. Testez la fiabilité de votre projet.

Evaluation de la variabilité d'un système de mesure

LE PERP retraite et protection

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Quelles sont les principales formules utiles pour l étude de cas de vente?

EVALUATIONS MI-PARCOURS CM2

Traitement des données avec Microsoft EXCEL 2010

MATHÉMATIQUES. Les préalables pour l algèbre MAT-P020-1 DÉFINITION DU DOMAINE D EXAMEN

Chapitre 6. Fonction réelle d une variable réelle

Lire ; Compter ; Tester... avec R

Méthodes quantitatives en sciences humaines. 2 Pratique : 2 Étude personnelle : 2. BUREAU poste courriel ou site web

Pour monter un escalier, on peut, à chaque pas, choisir de monter une marche ou de monter deux marches. Combien y a-t-il de façons de monter un

BACCALAURÉAT PROFESSIONNEL EPREUVE DE TRAVAUX PRATIQUES DE SCIENCES PHYSIQUES SUJET A.1

BACCALAURÉAT PROFESSIONNEL ÉPREUVE DE MATHEMATIQUES. EXEMPLE DE SUJET n 2

CM2B Ste Marthe NOMBRES CROISES

12ème. *Source : Centre d Analyse Stratégique «Les secteurs de la nouvelle croissance : une projection à l horizon 2030», Rapport n 48, janvier 2012

LE PROCESSUS ( la machine) la fonction f. ( On lit : «fonction f qui à x associe f (x)» )

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

PROBLEME(12) Première partie : Peinture des murs et du plafond.

LE TABLEAU DE BORD DE SUIVI DE L ACTIVITE

Guidance de Statistique : Epreuve de préparation à l examen

Extraction d informations stratégiques par Analyse en Composantes Principales

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Créer un sondage sous Magento

1. Introduction Création d'une requête...2

Transcription:

Départements tertiaires MATHEMATIQUES Remise à niveau 3 : STATISTIQUES COURS, ACTIVITES - ENONCES DES EXERCICES Documents en ligne : sur http://jff-dut-tc.weebly.com IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 1 sur 19

SOMMAIRE 1 STATISTIQUES À UNE VARIABLE 3 1.1 VOCABULAIRE 3 1.2 PARAMÈTRES DE POSITION : MODE, MÉDIANE ET MOYENNE 4 1.2.1 LE MODE : MODALITÉ AYANT LE PLUS GRAND EFFECTIF 4 1.2.2 LA MÉDIANE : MODALITÉ TELLE QUE LA MOITIÉ DES VALEURS LUI SONT INFÉRIEURES OU ÉGALES. 4 1.2.3 LA MOYENNE : SOMME DE TOUTES LES VALEURS DIVISÉE PAR L EFFECTIF TOTAL 5 1.3 PARAMÈTRES DE DISPERSION 9 1.3.1 L ÉTENDUE 9 1.3.2 LES QUARTILES 9 1.3.3 L ÉCART TYPE σ 9 2 STATISTIQUES À DEUX VARIABLES 11 2.1 NUAGE DE POINTS 11 2.2 AJUSTEMENT AFFINE 11 2.2.1 MÉTHODE DE MAYER 11 2.2.2 DROITE D AJUSTEMENT PAR LA MÉTHODE DES MOINDRES CARRÉS 13 2.3 AJUSTEMENTS NON LINÉAIRES : CHANGEMENT DE VARIABLE 15 2.4 TABLEAUX DE CONTINGENCE : DÉPENDANCE DE VARIABLES CROISÉES 17 2.4.1 TABLEAUX DE CONTINGENCE 17 2.4.2 TABLEAUX DES PROFILS LIGNES OU COLONNES 17 2.4.3 MESURE DE L'INDÉPENDANCE 18 IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 2 sur 19

1 Statistiques à une variable 1.1 Vocabulaire Voici les résultats de trois enquêtes concernant un groupe de 30 étudiants d une section de l IUT : 1. Leur âge 2. Notes obtenues à une évaluation de mathématiques 3. Mention obtenue au BAC Âges x i 18 19 20 21 22 Effectifs n i 12 10 5 2 1 N = 30 Notes [0 ; 4[ [4 ; 8[ [8 ; 12[ [12 ; 16[ [16 ; 20[ Effectifs n i 3 6 10 8 3 N = 30 mention au BAC Pas de mention Assez bien Bien Très bien Effectifs n i 18 7 4 1 N = 30 Vocabulaire Variable X : c est le caractère étudié ; les valeurs possibles pour un caractère s appellent les modalités x i Variable qualitative : les modalités expriment des catégories et pas des quantités (les réponses données sont des mots) Variable quantitative discrète : les réponses données sont des nombres précis, modalités x i Variable quantitative continue : les réponses données sont inconnues et regroupées dans des intervalles, des classes, dont les amplitudes peuvent être égales ou différentes. Effectif n i : nombre d individus associé à chaque modalité x i Effectif total N = somme des effectifs n i Indiquer le type de variable pour chaque tableau : Tableau 1 : Tableau 2 : Tableau 3 : Quelques représentations graphiques utilisées : IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 3 sur 19

1.2 Paramètres de position : mode, médiane et moyenne 1.2.1 Le mode : modalité ayant le plus grand effectif Si les valeurs sont regroupées dans des classes (intervalles) on parle de classe modale : * c est la classe ayant le plus grand effectif lorsque les classes ont même amplitude. * c'est la classe ayant la plus grande Indiquer le mode pour les tableaux de l activité : exemple de classes d'amplitudes différentes : 1.2.2 La médiane : modalité telle que la moitié des valeurs lui sont inférieures ou égales. Si la variable est discrète : on range les valeurs par ordre croissant et on détermine la valeur qui partage le groupe en deux. Ex : salaires dans une petite entreprise de 11 personnes : 1250 ; 3500 ; 3050 ; 1860 ; 1310 ; 1430 ; 1525 ; 2360 ; 1980 ; 1250 ; 1630. Ex : lorsque l effectif total est pair, avec 10 salariés, on peut déterminer une valeur "centrale" : Ex : si les valeurs sont regroupées dans un tableau, on utilise les effectifs cumulés croissants : Âges x i Effectifs n i ECC 18 19 20 21 22 12 10 5 2 1 N = 30 IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 4 sur 19

Si la variable est continue : on trace le polygone des fréquences cumulées croissantes et on lit graphiquement la médiane qui correspond à 50 % des valeurs. Exemple avec le tableau de notes : Notes [0 ; 4[ [4 ; 8[ [8 ; 12[ [12 ; 16[ [16 ; 20[ Effectifs n i 3 6 10 8 3 N = 30 Fréquences f i FCC 1.2.3 La moyenne : somme de toutes les valeurs divisée par l effectif total Formule Calculer la moyenne dans les deux cas : Âges x i 18 19 20 21 22 Effectifs n i 12 10 5 2 1 N = 30 Notes [0 ; 4[ [4 ; 8[ [8 ; 12[ [12 ; 16[ [16 ; 20[ Effectifs n i 3 6 10 8 3 N = 30 IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 5 sur 19

moyenne et fréquences : comparaison des paramètres de position : utilisation de la calculatrice : IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 6 sur 19

EXERCICES * EX 3.1. 24 personnes ont été interrogées sur le nombre de packs de lait achetés ces trente derniers jours. Les résultats sont les suivants : 0-1-4-2-1-2-1-1 3-0-1-0-3-0-2-2 0-2-1-1-3-1-0-4 1) Organiser ces résultats dans un tableau où chaque modalité sera reprise une fois et associée à l effectif correspondant au nombre de réponses. 2) Quelle est la réponse modale? 3) Quel est le nombre médian de packs achetés, dans cet échantillon interrogé? 4) Quelle est le nombre moyen de packs par personne? * EX 3.2. A l issue d un concours de tir à l arc, Paul et Virginie comparent leurs résultats. La figure cidessous indique les impacts des quinze flèches de chacun. 1) Former un tableau reprenant en six colonnes (une pour chaque score possible) les nombres de tirs obtenus dans chaque zone (séparer les deux candidats). 2) Si le vainqueur est celui dont le total est le plus fort, qui a gagné? Est-ce que ça signifie que son score moyen par flèche est également le plus fort? 3) Si le vainqueur est celui dont le score modal est le plus fort, qui a gagné? * EX 3.3. Lectures graphiques Lors d un sondage, on a demandé leur âge aux personnes interrogées (au total : 200 personnes). Le graphique ci-dessous à droite est le diagramme des fréquences cumulées croissantes de cette série. 1) Quel pourcentage de personnes interrogées ont a. moins de 40 ans? b. Plus de 50 ans? c. Entre 30 et 50 ans? 2) Grâce aux données de ce diagramme de FCC, construisez à sa gauche l histogramme des effectifs correspondant. IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 7 sur 19

* EX 3.4. On donne les nombre d'élèves d'une classe de première, ordonnés selon la valeur de leur moyenne générale et de leur état civil, selon le tableau ci-dessous : ELEVES garçons filles Notes -17ans +17ans -17ans +17ans 10 2 1 0 2 11 3 4 3 3 12 3 5 4 6 13 2 3 2 3 14 4 2 3 1 1) a. Quelle est la moyenne des garçons? b. Quelle est la moyenne des filles? c. Quelle est la moyenne générale? 2) a. Parmi les élèves ayant eu moins de 12, quel est le pourcentage de filles? b. Parmi les filles, quel est le pourcentage d élèves qui ont eu moins de 12? * EX 3.5. QCM 1) Dans une classe de 30 élèves, la médiane de la série des notes est 10. Le professeur décide d ajouter 1 point aux trois notes les plus basses, lesquelles restent les plus basses. La médiane a. ne change pas b. augmente de 0,1 point c. augmente de 1 point c. augmente, mais on ne peut pas savoir de combien 2) Dans une classe de 30 élèves, la moyenne trimestrielle des notes est 9,4. Le professeur décide d ajouter 1 point aux trois notes les plus basses. La moyenne a. ne change pas b. augmente de 0,1 point c. augmente de 1 point c. augmente, mais on ne peut pas savoir de combien 3) Un même test a été donné dans deux classes. La première, composée de 20 élèves, a obtenu une moyenne de 12,30 ; la seconde, composée de 30 élèves, a obtenu une moyenne de 14,80. Quelle est la moyenne du groupe formé par les 50 élèves de ces deux classes? a. 12,55 b. 13,50 c. 13,55 d. 13,8 * EX 3.6. La moyenne d un groupe de 25 étudiants est 11,48. Celle des garçons est 10,7 et celle des filles est 12. Combien de garçons et de filles y a-t-il dans ce groupe? IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 8 sur 19

1.3 Paramètres de dispersion Ces paramètres montrent si les valeurs sont regroupées autour de la moyenne ou bien dispersées. Exemple : ces deux séries peuvent avoir la même moyenne mais les valeurs ne sont pas dispersées de la même manière : 1.3.1 L étendue c est la différence entre la valeur maximale et la valeur minimale de la variable 1.3.2 Les quartiles Le premier quartile Q 1 est la plus petite valeur telle qu au moins un quart (25 %) des valeurs lui sont inférieures ou égales ; on cherche donc la valeur correspondant à Le deuxième quartile Q 2 est la plus petite valeur telle qu au moins la moitié (50 %) des valeurs lui sont inférieures ou égales ; on cherche donc la valeur correspondant à N / 2 Remarque : Le troisième quartile Q 3 est la plus petite valeur telle qu au moins trois quarts (75 %) des valeurs lui sont inférieures ou égales ; on cherche donc la valeur correspondant à 1.3.3 L écart type σ L écart type sert à savoir comment la série est dispersée autour de la moyenne : plus l écart type est petit plus les valeurs sont regroupées autour de la moyenne. Pour calculer l écart type il faut d abord calculer la variance Puis, une fois la variance calculée, on trouve l écart type σ qui est la racine carrée de la variance. utilisation de la calculatrice : IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 9 sur 19

EXERCICES * EX 3.7. On mesure la taille, en cm, de 18 individus. Les résultats sont les suivants : 156, 160, 160, 164, 166, 167, 169, 170, 172, 172, 175, 176, 176, 178, 180, 180, 184, 190 1) Quelle est l étendue de la série? 2) Donner les trois quartiles, rappeler leur signification. 3) A l aide de la calculatrice, donner la taille moyenne de ce groupe et son écart type. Expliquer la signification de l écart type. 4) Si on saisit sur calculatrice uniquement les valeurs en cm au-delà de 100 (la série devient donc 56, 60, 60, 64, ), quel effet cela a-t-il sur la moyenne? sur l écart type? Était-on alors obligé de saisir ce «1» au début de chaque valeur pour obtenir les résultats de la question 3? * EX 3.8. On observe les résultats des participants à une épreuve. x i représente un score obtenu et la valeur n i est le nombre de concurrents ayant obtenu le score x i. x i 20 25 30 35 40 n i 1 3 12 5 2 23 1) Quelle est l étendue de la série? 2) Donner les trois quartiles, rappeler leur signification. 3) A l aide de la calculatrice, donner le score moyen et son écart type. * EX 3.9. Les deux tableaux ci-dessous montrent des valeurs en première ligne et des effectifs en deuxième ligne. Leur diagramme des effectifs sont donc respectivement ceux qui apparaissent audessous. 0 10 20 30 40 0 10 20 30 40 1 2 3 4 5 5 4 3 2 1 Donner la moyenne et l écart type de chaque série ; commenter la symétrie des résultats. * EX 3.10. Reprenons l exemple de l exercice 4.3. 1) A partir du diagramme des FCC : a. Donner l étendue de la série. b. Donner la médiane (que l on peut donc aussi appeler «âge médian»), ainsi que les deux autres quartiles. 2) A partir des effectifs retrouvés dans chaque classe d âge : a. Saisir les données statistiques sur la calculatrice. b. Obtenir alors l âge moyen des personnes interrogées et l écart type des âges. c. Interpréter concrètement l écart type. d. Grâce à une lecture graphique du diagramme des FCC, dire quel est le pourcentage des personnes interrogées dont l âge se situe à une distance maximale d un écart type autour de la moyenne. IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 10 sur 19

2 Statistiques à deux variables 2.1 Nuage de points Le tableau suivant présente l évolution du budget publicitaire et du chiffre d affaire d une société au cours des 6 dernières années : Budget publicitaire en milliers d euros x i 8 10 12 14 16 18 Chiffre d affaire en milliers d euros y i 40 55 55 70 75 95 1) Dans un repère, représenter le nuage de points (x i ; y i ). y 100 80 60 40 20 0 2 4 6 8 10 12 14 16 18 20 2) Déterminer les coordonnées du point moyen G du nuage de points. 2.2 Ajustement affine 2.2.1 Méthode de Mayer On reprend les données du tableau de l exemple précédent. 1) Soit G 1, le point moyen associé aux trois premiers points du nuage et G 2 le point moyen associé aux trois derniers points du nuage. a) Calculer les coordonnées de G 1 et G 2. IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 11 sur 19

b) On prend (G 1 G 2 ) comme droite d ajustement. Tracer cette droite. 2) À l aide du graphique : a) Estimer le chiffre d affaires à prévoir pour un budget publicitaire de 22 000. b) Estimer le budget publicitaire qu il faudrait prévoir pour obtenir un chiffre d affaires de 100 000. 3) À l aide de l équation de la droite (G 1 G 2 ) : a) déterminer l équation de la droite passant par les points G 1 et G 2 b) Calculer le chiffre d affaires pour un budget publicitaire de 22 000. c) Calculer le budget publicitaire qu il faudrait prévoir pour obtenir un chiffre d affaires de 100 000. IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 12 sur 19

2.2.2 Droite d ajustement par la méthode des moindres carrés Cette méthode porte le nom de «moindre carrés» car elle consiste à rechercher la position de la droite d ajustement telle que, la somme des carrés des longueurs donnant les distances respectives (en vert) entre la droite et les points, soit minimale. Pour cela, on utilise la calculatrice qui va donner l équation de la droite cherchée. Exemple : On considère la série statistique à deux variables donnée dans le tableau suivant : x i 5 10 15 20 25 30 35 40 y i 13 23 34 44 50 65 75 90 1) Dans un repère, représenter le nuage de points (x i ; y i ). y 100 80 60 40 20 0 5 10 15 20 25 30 35 40-20 2) a) À l aide de la calculatrice, déterminer une équation de la droite d ajustement par la méthode des moindres carrés. utilisation de la calculatrice : b) Représenter la droite d ajustement de y en fonction de x. 3) Estimer graphiquement la valeur de x pour y = 70. Retrouver ce résultat par calcul. IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 13 sur 19

EXERCICES * EX 3.11. On a noté le diamètre (Y, cm) et l âge (X, années) de divers arbres d une même essence. Les résultats numériques sont consignés dans le tableau ci-dessous et le nuage de points correspondant a été représenté. X 2 4 5 8 10 11 Y 11 15 22 27 38 37 1) a. Déterminer la droite permettant l ajustement linéaire de ces données, par la méthode de Mayer (coordonnées de G 1 et G 2, équation de la droite, représentation graphique). b. Estimer graphiquement puis par le calcul l âge auquel un arbre de cette essence atteint un diamètre de 50 cm. 2) a. Saisir les données du tableau sur calculatrice pour obtenir l équation de la droite de régression issue de la méthode des moindres carrés. b. Estimer par le calcul l âge auquel un arbre de cette essence atteint un diamètre de 50 cm. * EX 3.12. Un sondage a été réalisé sur le nombre X d heures par jour passées sur Internet et on a croisé les réponses avec l âge Y des répondants. Le tableau ci-dessous affiche les nombres de citations correspondant à chaque croisement. X : âge [10 ; 15[ [15 ; 25[ [25 ; 50[ [50 ; 90[ Y : nombre d heures quotidien [0 ; 1[ 8 5 12 23 [1 ; 3[ 15 28 18 8 [3 ; 6[ 6 16 2 0 1) Saisir les données (X, Y, effectifs) de cet exercice sur calculatrice (List 1, List 2, List 3). 2) Donner alors : a. l âge moyen des répondants b. le nombre moyen d heures passées par jour sur Internet, pour l ensemble des répondants c. le nombre moyen d heures passées par jour sur Internet, par tranche d âges 3) a. Grâce à votre calculatrice, donner l équation de la droite de régression de Y en fonction de X. b. Comment interpréter la négativité de son coefficient directeur? * EX 3.13. Une étude réalisée sur des magasins de revente d'électroménager a croisé deux variables : le chiffre d'affaires annuel réalisé et la dépense consacrée à la publicité. Les effectifs (nombre de magasins) ont été consignés dans le tableau de contingence ci-dessous : chiffre d'affaires Y (M ) [1,2 ; 1,6[ [1,6 ; 2,4[ [2,4 ; 2,8[ dépense [30 ; 50[ 28 18 11 publicitaire [50 ; 70[ 19 42 22 X (k ) [70 ; 90[ 8 25 27 1) Après avoir saisi les éléments de ce tableau dans votre calculatrice, donner les moyennes et écarttypes de X et de Y. 2) a. Donner l'équation de la droite de régression de Y en X, suivant la méthode des moindres carrés. b. À combien une entreprise peut-elle estimer son chiffre d'affaires si elle dépense 120 000 en publicité? IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 14 sur 19

2.3 Ajustements non linéaires : changement de variable Dans de nombreux cas, la corrélation linéaire entre deux variables n'est pas bonne, alors que l'on sait par ailleurs qu'elles sont corrélées. Une analyse plus poussée conduit à déterminer une relation, une formule "efficace" entre elles, mais pas de type "y = ax + b". La relation pourra être du type d'une fonction du second degré, ou invoquer un logarithme, exemples pris parmi une multitude de possibilités. La "meilleure" relation est censée rendre compte de la forme "non droite" d'un nuage de points, ce dernier étant par ailleurs suffisamment "effilé" pour traduire une corrélation forte entre X et Y. On procédera comme suit : 1. Un tableau de valeurs mesurées couples (x i, y i ) est donné, mais on se rend compte que la corrélation linéaire entre X et Y n'est pas bonne. 2. L'énoncé propose alors un changement de variable. Par exemple : " remplacer X par T = X² ". On calcule alors les différentes valeurs de cette nouvelle variable. 3. On effectue une étude de la corrélation linéaire entre T et Y (T a remplacé X) et si cette dernière est forte, on établit l'équation d'une droite de régression y = at + b. 4. On effectue à nouveau le changement de variable pour obtenir une relation fiable entre X et Y. Avec l'exemple T = X² : y = at + b deviendra y = ax² + b, équation d'une parabole censée "suivre au mieux" le nuage de points (x i, y i ). EXERCICES * EX 3.14. Dans une enseigne de grande surface, un produit alimentaire A est vendu depuis plusieurs années. Dans l'année 2008, son prix a fluctué et on a noté dans la même période l'évolution des quantités vendues de ce produit : prix de vente, en X 40 42 45 39 37 40 42 50 quantité vendue (unit.) Y 283 273 267 287 295 290 281 244 Partie 1 1) Donner, à l'aide de la calculatrice, les moyennes et écarts-types des variables X et Y. 2) a. Calculer Cov(X, Y) : la covariance de ces deux variables. b. Interpréter le signe de cette covariance. 3) a. Calculer leur coefficient de corrélation linéaire. b. Interpréter sa valeur. 4) a. Donner l'équation de la droite de régression de Y en X, suivant la méthode des moindres carrés. b. Décrire brièvement le principe de cette méthode. Partie 2 X et Y étant respectivement le prix de vente à l'unité et la quantité vendue, on s'intéressera ici à l'évolution du chiffre d'affaires réalisé, noté C, avec bien entendu C = X Y. prix de vente, en X 40 42 45 39 37 40 42 50 quantité vendue (unit.) Y 283 273 267 287 295 290 281 244 chiffre d'affaires, en T C 1) a. Compléter la ligne de valeurs de C, en utilisant les valeurs de X et Y données. b. Compléter la ligne de valeurs de T, variable remplaçant provisoirement X, avec T = (53 - X)². 2) a. Etudier la corrélation linéaire entre T et C. b. Donner l'équation de la droite de régression de C en T, suivant la méthode des moindres carrés. c. En déduire que l'on peut exprimer C en fonction de X comme suit : C = -3,92X² + 415X + 980. 3) Quelle est alors l'estimation que l'on peut faire du chiffre d'affaires dans les cas où le prix de vente est fixé à 52, 53, puis 54? IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 15 sur 19

* EX 3.15. Une société produit et commercialise des écrans TV haut de gamme et veut analyser ses coûts de production. Le coût global de production a fluctué en fonction de la quantité produite, comme donné dans le tableau suivant : quantité produite (écrans) X 42 45 39 37 40 42 48 45 coût de production (k ) Y 24 25 22 21 23 24 26 25 Les deux parties de cet exercice sont indépendantes et pourront être traitées dans l'ordre de votre choix. Partie 1 1) Donner, à l'aide de la calculatrice, les moyennes et écarts-types des variables X et Y. 2) a. Donner l'équation de la droite de régression de Y en X, suivant la méthode des moindres carrés. b. Décrire brièvement le principe de cette méthode. Partie 2 On reprend ici aussi les données de départ de l'exercice (énoncées avant la partie 1). On s'intéressera ici à l'évolution du coût de revient moyen d'un écran, noté T, avec bien entendu T = Y divisé par X. coût moyen (k /écran) T U 1) a. Compléter la ligne de valeurs de T, en utilisant les valeurs de X et Y données. b. Compléter la ligne de valeurs de U, variable remplaçant provisoirement T, avec U = 1/T. 2) a. Etudier la corrélation linéaire entre X et U. b. Donner l'équation de la droite de régression de U en X, suivant la méthode des moindres carrés. c. En déduire une expression de T en fonction de X. 3) a. Quelle est alors l'estimation que l'on peut faire du coût moyen de production d'un écran lorsque 60 unités seront produites? b. Combien d'unités (écrans) doit-on produire pour que ce coût moyen devienne inférieur à 500? * EX 3.16. Sur les arbres d'un échantillon d'une même essence, en période de croissance (leurs diamètres x sont compris entre 1 cm et 32 cm), une équipe chargée d'étude a relevé la longueur maximale y de leurs feuilles (en cm également). Les données relevées sont récapitulées dans le tableau de l'annexe 2. Notre équipe doit analyser ces résultats pour déterminer la corrélation existant entre les deux séries. 1) Corrélation linéaire entre x et y a. A l'aide de votre calculatrice, donner le coefficient de corrélation linéaire entre x et y. b. Interpréter le résultat précédent. c. Donner les coefficients a et b de la droite de régression de y sur x. 2) Changement de variable, corrélation puissance entre x et y a. Soit les variables p = ln(x) et q = ln(y). Le tableau ci-contre a été complété, vérifier les résultats sur calculatrice. b. Que dire du coefficient de corrélation linéaire entre p et q? c. Donner les coefficients a' et b' de la droite de régression de q sur p. d. Etablir alors la relation existant entre x et y, sous la forme y = k x n, en donnant aux nombres k et n une précision de quatre décimales. 3) Extrapolation des résultats Utiliser la corrélation trouvée en question 2)d. pour déterminer un arrondi à 0,1 cm près du diamètre d'un arbre dont les feuilles mesureraient 30 cm au maximum. IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 16 sur 19

2.4 Tableaux de contingence : dépendance de variables croisées 2.4.1 Tableaux de contingence Deux caractéristiques sont notées, sur 210 individus d'une population : leur catégorie d'emploi et leur région d'habitation. Les individus sont alors répartis dans le tableau de contingence suivant : tableau des effectifs observés Europe région Paris Province emploi hors France total N i. salarié d'une entreprise 34 10 24 68 recherche d'emploi 38 3 5 46 indépendant 23 31 2 56 dirigeant d'entreprise 9 0 31 40 total N.j 104 44 62 210 38 personnes sont en recherche d'emploi ET habitent à Paris effectif n 21 ou obs 21 44 personnes habitent en province effectif marginal N.2 210 personnes ont été interrogées effectif total N 46 personnes sont en recherche d'emploi effectif marginal N 2. 2.4.2 Tableaux des profils lignes ou colonnes Pour une meilleure lecture de l'importance de chaque effectif comparativement à son effectif marginal (somme d'une ligne ou d'une colonne), on peut calculer le pourcentage qu'il représente. tableau des profils lignes Europe région Paris Province emploi hors France total N i. salarié d'une entreprise 50 14,7 35,3 100 recherche d'emploi 82,6 6,5 10,9 100 indépendant 41,1 55,3 3,6 100 dirigeant d'entreprise 22,5 0 77,5 100 total N.j 49,5 21 29,5 100 21% des personnes interrogées habitent en province 77,5% des dirigeants d'entreprise habitent hors de France tableau des profils colonnes Europe région Paris Province emploi hors France total N i. salarié d'une entreprise 32,7 22,7 38,7 32,4 recherche d'emploi 36,5 6,8 8,1 21,9 indépendant 22,1 70,5 3,2 26,7 dirigeant d'entreprise 8,7 0 50 19 total N.j 100 100 100 100 50% des personnes habitant hors de France sont des dirigeants d'entreprise 21,9% des personnes interrogées sont en recherche d'emploi IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 17 sur 19

2.4.3 Mesure de l'indépendance Les deux variables sont indépendantes si le tableau des profils lignes (resp. profils colonnes) montre des lignes identiques (resp. colonnes identiques). Dans notre exemple, cela signifierait (en profil ligne) que la répartition des personnes, en pourcentage, selon le lieu d'habitation, serait la même quel que soit l'emploi. Tableau des effectifs théoriques Pour mesurer l'indépendance ou plutôt la dépendance entre deux variables, il existe des paramètres calculables basés sur la différence entre le tableau des effectifs observés et un tableau "virtuel" d'effectifs théoriquement attendus en cas d'indépendance. Ce dernier se doit d'être un tableau de proportion : pour calculer chaque effectif théorique th ij, on peut utiliser un produit en croix : Ni. N. j thij = N Europe région Paris Province emploi hors France total N i. salarié d'une entreprise 33,6761905 14,247619 20,0761905 68 recherche d'emploi 22,7809524 9,63809524 13,5809524 46 indépendant 27,7333333 11,7333333 16,5333333 56 dirigeant d'entreprise 19,8095238 8,38095238 11,8095238 40 total N.j 104 44 62 210 Deux variables sont indépendantes lorsque ce tableau est identique au tableau des effectifs observés. On remarque des divergences fortes dans certaines zones communes aux deux tableaux. En particulier : calcul du χ² (Khi-deux) 2 χ ( obsij thij ) = deux variables indépendantes correspondent donc à un χ² exactement nul. Dans notre exemple : χ² = 112,88 ij th ij 2 Cette valeur est formée par les différences observées entre tableau théorique et tableau d'observations, mais dépend aussi de la taille des tableaux (nombre de lignes p et nombre de colonnes q) et du nombre total N d'observations. Pour pouvoir être interprétée, c est-à-dire pour avoir du sens dans l'évaluation de la dépendance, elle doit donc être contextualisée puis comparée à d'autres valeurs de χ² pré calculées et lisibles dans une " table du χ² ", suivant la loi (de probabilité) du χ² à (p-1) (q-1) "degrés de liberté". Ce point sera traité en TC au second semestre. IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 18 sur 19

Coefficient de Cramer On peut traduire la valeur calculée du χ² en un coefficient plus facilement lisible : le coefficient de Cramer. dans notre exemple : 0,5184 2 χ N min p ; q { 1 1} Ce dernier a l'avantage de donner un résultat compris dans tous les cas entre 0 et 1, 0 correspondant à l'indépendance parfaite et 1 (ou des valeurs proches de 1) à une très grande disparité entre les lignes ou les colonnes du tableau d'observation : EXERCICES * EX 3.17. On observe dans le tableau ci-contre la fréquentation de deux magasins A et B. À l'issue d'un sondage, on note le nombre de personnes ayant effectué au moins un achat, par tranches d'âges (10 à 15 ans, etc.). 1) Établir le tableau d'effectifs théoriquement attendus en cas d'indépendance âge vs magasin. 2) Calculer le χ² entre ces deux tableaux. 3) Quelle tranche d'âge contribue le plus au résultat précédent? Interpréter. 4) Calculer le coefficient de Cramer puis donner une conclusion. * EX 3.18. La position d'une personne vis-à-vis du tabac dépend-elle de son sexe? Voici les résultats d'une enquête portant sur 51 hommes et 66 femmes : S : caractère "sexe" T : caractère "position vis-à-vis du tabac" Sh : hommes Tj : n'ont jamais fumé Sf : femmes Tf : sont fumeurs Ta : ont arrêté 1) Établir le tableau d'effectifs théoriquement attendus en cas d'indépendance sexe vs usage du tabac. 2) Calculer le χ² entre ces deux tableaux. 3) Calculer le coefficient de Cramer puis donner une conclusion. IUT de Saint-Etienne Tremplin Mathématiques RAN 3 Stats CoursEx Rev2017 page 19 sur 19