Statistique Les distributions à deux caractères 1) Définition Lorsqu on étudie simultanément deux caractères, on obtient deux valeurs pour chaque unité statistique d une population ou d un échantillon. Ces valeurs peuvent s exprimer sous la forme d un couple (X,Y). L ensemble des couples (X,Y) constitue une distribution à deux caractères, ou distribution à deux variables. Exemple : On considère la note en maths et en français de 12 élèves d une classe à la fin de la première étape de sec 4. Élève Maths % français % Élève Maths % français % Élève Maths % français % 1 32 48 5 65 63 9 65 66 2 50 61 6 92 95 10 72 60 3 70 74 7 75 80 11 55 83 4 88 76 8 38 52 12 77 80 2) Représentation d une distribution à deux caractères 2.1 Nuage de points Emmanuel Duran p1
2.2 Nuage de points avec calculatrice Insérer une page «Tableur & Listes» Nommer les colonnes Insérer une page «Données et Statistiques» Cliquer sur l axe des abscisses pour ajouter la variable «maths» Cliquer sur l axe des ordonnées pour ajouter la variable «français» Emmanuel Duran p2
2.3 Tableau à double entrée Valeur en y Valeur en x Note français en maths % [45,60[ [60,75[ [75,90[ [90,105[ % [30,45[ II [45,60[ I I [60,75[ IIII [75,90[ III [90,105[ I 3) La corrélation linéaire 3.1 Appréciation qualitative d une corrélation Parfaite Forte Moyenne Faible Nulle 3.2 Sens de la corrélation positive négative Emmanuel Duran p3
4) Le coefficient de corrélation linéaire Il se note r. Sa valeur est comprise entre [ 1,1] Intensité de la corrélation en fonction de la valeur de r Forte Parfaite Moyenne Faible Nulle Faible Moyenne Forte Parfaite 4.1 Comment trouver le coefficient de corrélation linéaire 4.1.1 Estimation avec la méthode du rectangle Après avoir tracé votre nuage de points, encadrer tous les points dans le plus petit rectangle possible et mesurer sa longueur et sa largeur. L utilisation d une règle et d une équerre est recommandée! Emmanuel Duran p4
r largeur = ± 1 longueur C est à toi de choisir le signe en fonction du sens de la corrélation 4.1.2 Estimation du coefficient de corrélation avec la calculatrice Se placer dans une case vide de la colonne C Cliquer sur Menu 4 (statistiques),1 (Calcul statistique), 3 (Ajustement linéaire mx+b) Sélectionner les variables On obtient le coefficient «r» de la corrélation Emmanuel Duran p5
5 La droite de régression linéaire 5.1 La méthode des points moyens ou la double moyenne ou la méthode de Mayer Pour estimer la droite de régression à l aide de la méthode de Mayer, il suffit de suivre les étapes suivantes : Placer les coordonnées en ordre croissant des abscisses. (Pour deux valeurs de X égales, ordonner les valeurs de Y en ordre croissant). Partager la distribution en deux groupes équipotents. (Si le nombre de données est impair, la donnée du centre est placée dans chacun des deux groupes). Pour chacun des deux groupes, trouver la moyenne des abscisses et la moyenne des ordonnées que l on notera P 1(x 1,y 1) et P 2(x 2,y 2). Trouver l équation de la droite de régression passant par ces deux points. Exemple #1 x 6 3 14 14 27 22 19 9 y 5 2 6 10 17 21 14 7 X 1 X 2 x 3 6 9 14 14 19 22 27 y 2 5 7 6 10 14 21 17 Y 1 Y 2 3+6+9+14 14+19+22+27 x 1= =8 x 2= =20,5 4 4 2+5+7+6 10+14+21+17 y 1= =5 y 2= =15,5 P 1(8,5) et P 2(20,5, 15,5) 4 4 Pour tracer la droite de Mayer dans le nuage de points, on place P 1 et P 2 dans le graphique et on trace la droite passant par ces deux points. Emmanuel Duran p6
L équation de la droite de régression, passant par P 1 et P 2 est de la forme y=ax+b a y y y 15,5 5 x x x 20,5 8 2 1 = = = = 2 1 y = 0,84x+ b 0,84 En remplaçant les coordonnées de P ou P on trouve: 1 2 15,5=0,84 20,5+b 15,5=17,22+b 15,5-17,22=b b=-1,72 L'équation de la droite de Mayer es t y= 0,84x-1, 72 Exemple #2 Si les données sont impaires! On double la donnée du centre après les avoir classées x 0 2 4 6 8 12 14 y 1 3 5 7 9 13 16 x 0 2 4 6 6 8 12 14 y 1 3 5 7 7 9 13 16 Par la suite le processus est le même que dans l exemple #1 5.2 Avec la calculatrice Les étapes sont les mêmes que dans la section 4.1.2 cependant l équation est donnée sous la forme y=mx+b À noter que dans la calculatrice il n est pas nécessaire d ordonner les valeurs ou de doubler une valeur si le nombre est impair. Emmanuel Duran p7
On peut aussi tracer la droite et obtenir son équation dans une page «Données & Statistiques» Après avoir tracé le nuage de points faire Menu 4 (Analyser) 6 (Régression) 1 (Afficher droite mx+b) Emmanuel Duran p8