STATISTIQUES I SERIE STATISTIQUE A UNE VARIABLE 1 Définition Les statistiques ont pour but la collecte, l'analyse et l'interprétation des observations relatives à des phénomènes collectifs. 2 Vocabulaire On a recueilli les données numériques suivantes : 1 2 0 0 1 4 5 2 4 2 2 1 0 1 2 1 5 4 2 2 2 1 2 0 0 1 2 3 3 2 3 3 1 0 1 2 2 4 4 5 3 1 0 2 1 0 2 3 4 5 Les 50 salariés interrogés constituent un ensemble de personnes appelé en statistique : population Un salarié de cette entreprise est un élément de la population ou unité statistique (on dit encore individu). Si parmi ces 50 salariés, on n'avait interrogé que 10 d'entre eux, on aurait pris une partie de la population, c'est à dire un sous-ensemble de cette population, on appelle ce sous-ensemble : échantillon Ces salariés ont été interrogés selon un critère bien défini : " nombre d'enfants à charge ". Ce critère s'appelle : caractère statistique.( Dans l'exemple : 0, 1, 2, 3, 4, 5 ) On peut étudier sur ce même exemple d'autres statistiques : * adresse des salariés * salaire mensuel * nombre de jours d'absences par an * distance du domicile à l'entreprise * catégorie socioprofessionnelle Certains de ces caractères ne sont pas mesurables ; on dit qu'ils sont "qualitatifs".exemples :adresse, catégorie... D'autres caractères sont mesurables ; dans ce cas, ils sont "quantitatifs". Exemples: salaire, nombre de jours d'absences... Parmi ces caractères quantitatifs, on distingue 2 types de caractères: * Caractère quantitatif à variable discontinue ou discrète. Exemple :nombre d'enfants à charge. * Caractère quantitatif à variable continue Exemple:Distance du domicile à l'entreprise [0, 10], [10, 20], [20,30] Comment range t-on ces données numériques? 3 Tableaux statistiques a) Série à variable discrète Nombre d enfants à charge ( x i ) Nombre de salariés ( n i ) 0 N = * Première colonne : énumération des différentes valeurs numériques associées au caractère noté Xi. * Deuxième colonne : à chaque valeur numérique distincte de la variable, on associe un nombre qui représente l'effectif de la valeur notée ni. * N : effectif total
b) Série à variable continue on a interrogé ensuite 50 salariés d'après la distance de leur domicile à l'entreprise. On a recueilli les données numériques suivantes : 10,5 7,2 3,8 5,4 13,5 7,6 2,5 24,5 11,5 11 4,8 6 1,2 24,9 10 20 9,9 15,1 5,8 7,9 15 3,8 23,7 14,2 13,5 8,5 21,2 9,6 17,6 7 16,5 3,7 11,5 5,5 10,8 12,5 7,7 17,5 14,5 13,6 2,4 0,8 21,4 17,5 8,3 9,8 18 5,9 7,8 10,8 Ces résultats sont arrondis à l'hectomètre prés. Distance en km ( x i ) Nombre de salariés ( n i ) Centre de classe [ 0 ; 5 [ [5 ; 10 [ [10 ; 15 [ [15 ; 20 [ [20 ; 25 [ Ces intervalles s'appellent des classes et la différence de leurs limites s'appelle l'amplitude. La valeur centrale d'une classe est égale à la demi-somme des limites de la classe. Exercice : Compléter le tableau précédent et indiquer l'amplitude des classes. II EFFECTIF CUMULE - FREQUENCE 1 Effectif cumulé croissant 2 Effectif cumulé décroissant 3 Fréquence Cette fréquence peut être exprimée en pourcentage et de même que pour les effectifs, nous pouvons calculer les fréquences cumulées croissantes et décroissantes (FCC et FCD). Exercice : Compléter le tableau ci-dessous. Remarque : la somme des fréquences doit faire 100% Distance en km ( x i ) Nombre de salariés ( ni ) ECC ECD fi % FCC [ 0 ; 5 [ 8 [5 ; 10 [ 16 [10 ; 15 [ 13 [15 ; 20 [ 7 [20 ; 25 [ 6 centre de classe n i. x i n i. (x i - x ) 2 x = V = σ =
III REPRESENTATION GRAPHIQUE 1 Variable discontinue Pour représenter ce type de caractère, on utilise le diagramme en bâtons. On trace des traits verticaux espacés régulièrement. Chaque trait ou bâton a une hauteur proportionnelle à l'effectif du caractère. Exercice : Tracer le diagramme en bâtons correspondant au nombre d'enfants à charge. 2 Variable continue Pour représenter ce caractère, on utilise l'histogramme. a) Les amplitudes sont les mêmes Exercice : tracer l'histogramme correspondant à la distance du domicile à l'entreprise. Remarque :Pour construire un polygone statistique, il suffit de prendre sur chaque base supérieure des rectangles le milieu de chacune d'elles et de relier ces points. b) les amplitudes sont différentes le tableau représente les auditeurs (en milliers) de RTL de plus de 15 ans et leurs heures d'écoute. Heure d écoute (x i ) Nombre d auditeurs ( n i ) centre de en milliers classe n i. x i n i. (x i x ) 2 [ 5 ; 6 [ 500 [ 6 ; 7 [ 2500 [ 7 ; 8 [ 2800 [ 8 ; 9 [ 3000 [ 9 ;12 [ 7200 [ 12;13 [ 3800 [ 13;15 [ 3000 [ 15;18 [ 3000 [ 18;20 [ 2200 [ 20;23 [ 1200 x = V = σ =
Exercice : construire l'histogramme correspondant. 3 Diagramme circulaire Pour ce diagramme, on utilise un cercle ou un demi-cercle que l'on divise en secteurs circulaires. Chaque secteur est engendré par un angle au centre proportionnel à l'effectif. Exercice : Dans le tableau ci-dessous calculer les angles correspondant ainsi que les fréquences. Comparer vos résultats avec le diagramme. Moyens de locomotion nb de salariés fréquence fi % angles au centre à pieds 2 roues voitures bus bus (26.0%) à pieds (18.0%) voitures (16.0%) 2 roues (40.0%) 4 Diagramme polaire Le diagramme polaire est utilisé pour représenter une distribution chronologique admettant un cycle périodique tel que la semaine, le mois, l'année...exemple : Heures d'ensoleillement à Montpellier. mois Ja F M A M Ju Jl Ao S O N D Heure 148 141 205 266 291 336 369 320 220 190 127 166 Exercice : Tracer le diagramme polaire correspondant. Echelle : 1 cm pour 100 heures.
IV PARAMETRES DE DISPERSION 1 Etendue d'une série 2 Mode-Classe modale 3 Médiane La valeur de la médiane d'une série statistique ordonnée est la valeur de la variable qui partage la série en 2 effectifs égaux. a) Détermination graphique Il faut déterminer graphiquement sur le diagramme des ECC, l'abscisse du point où l'ecc est égal à la moitié de l'effectif total Remarque : Si N est pair alors on prend N/2 Si N est impair alors on prend ( N+1)/2 Exercice : à partir du tableau du paragraphe II, tracer le diagramme des ECC sur le repère, puis déterminer la distance médiane. b) Détermination par le calcul On effectue une interpolation linéaire
3 Moyenne Remarque : Si la série est à variable continue, x i est le centre de la classe. Exemple : déterminer l heure moyenne d écoute et la distance moyenne dans les deux sondages précédents 4 Variance - Ecart - type a) Variance b) Ecart-type Remarque : Le calcul des probabilités montre que l'intervalle ] x - σ, x + σ [ contient 68% des valeurs. c) Exercices Calculer dans les deux sondages précédents la variance et l'écart type. V SERIE STATISTIQUE A DEUX VARIABLES 1 Nuage de points Exemple : on relève l évolution de la température en fonction du temps lors du refroidissement d une pièce. temps t (minute) 1 2 3 4 5 6 température θ( C) 100 90 81 69,2 60,1 48,5 Tracer la représentation graphique de la fonction θ = f(t)
2 Point moyen Déterminer le point moyen G de l étude précédente. 3 Application Déterminer l équation de la droite θ = a.t + θ 0 de coefficient directeur a = -10,3 passant par G. En déduire la température au bout de 10 minutes de refroidissement? 4 Ajustement affine : Méthode MAYER Déterminer l équation de la droite précédente.