Statistiques. Effectif d une valeur : c est le nombre de fois que la valeur d un caractère (la «modalité») revient dans la série.

Documents pareils
Statistique : Résumé de cours et méthodes

Statistiques Descriptives à une dimension

Séries Statistiques Simples

Représentation d une distribution

Annexe commune aux séries ES, L et S : boîtes et quantiles

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Statistiques 0,14 0,11

SERIE 1 Statistique descriptive - Graphiques

Séquence 4. Statistiques. Sommaire. Pré-requis Médiane, quartiles, diagramme en boîte Moyenne, écart-type Synthèse Exercices d approfondissement

1. Vocabulaire : Introduction au tableau élémentaire

STATISTIQUES DESCRIPTIVES

Statistiques avec la graph 35+

3. Caractéristiques et fonctions d une v.a.

- Ressources pour les classes

Statistique Descriptive Élémentaire

Logiciel XLSTAT version rue Damrémont PARIS

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

BACCALAURÉAT PROFESSIONNEL SUJET

Classe de première L

MATHÉMATIQUES. Mat-4104

INFIRMIER(E) GRADUE(E) SPECIALISE(E) EN SANTE COMMUNAUTAIRE HAUTE ECOLE DE LA PROVINCE DE LIEGE PROFESSEUR : RENARD X.

Les devoirs en Première STMG

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

STATISTIQUES DESCRIPTIVES

Statistique descriptive. Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne. Notes de cours

Cabinet d avocat Leduc-Novi. Indemnisation du préjudice corporel des. personnes victimes d un accident de la route

Lire ; Compter ; Tester... avec R

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Statistiques - Cours. 1. Gén éralités. 2. Statistique descriptive univari ée. 3. Statistique descriptive bivariée. 4. Régression orthogonale dans R².

Feuille d exercices 2 : Espaces probabilisés

Sommaire de la séquence 12

Fluctuation d une fréquence selon les échantillons - Probabilités

Statistiques à une variable

IBM SPSS Statistics Base 20

Analyse et interprétation des données

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

TSTI 2D CH X : Exemples de lois à densité 1

Catalogue des connaissances de base en mathématiques dispensées dans les gymnases, lycées et collèges romands.

La classification automatique de données quantitatives

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Relation entre deux variables : estimation de la corrélation linéaire

Probabilités. C. Charignon. I Cours 3

CAHIER DES CHARGES MAINTENANCE DU SYSTEME DES ALARMES INTRUSION ET TECHNIQUES DU LYCEE SCHUMAN

Probabilités conditionnelles Loi binomiale

Groupe symétrique. Chapitre II. 1 Définitions et généralités

Correction du baccalauréat ES/L Métropole 20 juin 2014

Bases de données. Chapitre 1. Introduction

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

PRÉSENTATION DE L OFFRE

Plan. 5 Actualisation. 7 Investissement. 2 Calcul du taux d intérêt 3 Taux équivalent 4 Placement à versements fixes.

Résumé du Cours de Statistique Descriptive. Yves Tillé

Bulletin d information statistique

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

CHAPITRE 2. Les variables

Evaluation de la variabilité d'un système de mesure

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Analyse des coûts. 1 ère année DUT GEA, 2005/2006 Analyse des coûts

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Baccalauréat ES Amérique du Nord 4 juin 2008

Les pourcentages. Un pourcentage est défini par un rapport dont le dénominateur est 100. Ce rapport appelé taux de pourcentage est noté t.

Quel système d équations traduit cette situation? x : la hauteur du rectangle. y : l aire du rectangle. C) y = 4x + 25.

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

P1 : Corrigés des exercices

IBM SPSS Direct Marketing 21

Cours d algorithmique pour la classe de 2nde

Exemples de problèmes et d applications. INF6953 Exemples de problèmes 1

Par combien de zéros se termine N!?

Statistiques descriptives

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Nom et adresse officiels de l'organisme acheteur : GROUPEMENT D'INTERET ECONOMIQUE HAROPA

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

REGLEMENT DE LA CONSULTATION ACCORD-CADRE

Swiss Auto. Roulez en toute sérénité

Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire :

Brock. Rapport supérieur

Hôtel de Ville Place du Général De Gaulle BP Verlinghem cédex Téléphone : Fax :

Collecter des informations statistiques

Travaux pratiques. Compression en codage de Huffman Organisation d un projet de programmation

Je découvre le diagramme de Venn

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

REGLEMENT DE LA CONSULTATION

MODELE D AVIS D APPEL PUBLIC A LA CONCURRENCE

Étude comparative sur les salaires et les échelles salariales des professeurs d université. Version finale. Présentée au

Quelles ressources pour vivre seul, en 2014, dans une commune du Doubs? Essai d évaluation

FOIRE AUX QUESTIONS. Le Conseil Général de l Oise précise qu à ce jour, aucune donnée chiffrée n est disponible pour répondre à cette question.

Loi binomiale Lois normales

Les exploitations de grandes cultures face à la variabilité de leurs revenus : quels outils de gestion des risques pour pérenniser les structures?

Les Français et le courrier publicitaire. Rapport

Etude salariale. Pour le domaine des ressources humaines 2013/2014

Probabilités. Une urne contient 3 billes vertes et 5 billes rouges toutes indiscernables au toucher.

PRXSENTATION D UN GESTIONNAIRE DE DONNEES NUMERIQUES HIERARCHISEES DESTINE AU DE- -POUILLEMENT D ENQUETES

Mesures et incertitudes

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Transcription:

I Vocabulaire de base Statistiques Série statistique : une série statistique est un ensemble d observations collectées. Population : C est l ensemble sur lequel porte une étude statistique. Si elle est trop grande, on peut alors décider de ne s intéresser qu à un échantillon de population. Individu : c est un élément de la population. Caractère : c est ce qu on observe chez l individu. Modalités : ce sont les différentes valeurs prises par le caractère. Série statistique quantitative ou qualitative : une série statistique est dite quantitative quand les modalités sont des nombres (nombre de frères et sœurs, dimensions d une pièce, âge ), et qualitative sinon (candidat pour lequel un individu à l intention de voter, couleurs des yeux ) Dans le cas d une série quantitative, celle-ci est dite discrète si les modalités sont limitées à un ensemble fini de valeurs (exemple : le nombre de frères et sœurs ne peut être qu un élément de l ensemble {0 ;1 ;2 ; ;100} par exemple) et continue si les modalités peuvent prendre n importe quelle valeur dans un intervalle (exemple : taille d un individu, température ) Effectif d une valeur : c est le nombre de fois que la valeur d un caractère (la «modalité») revient dans la série. Fréquence d une valeur : c est l effectif de la modalité divisé par l effectif total : elle est comprise entre 0 et 1. Classes de valeurs : s il y a trop de valeurs différentes, elles sont rangées par classe (intervalle), l effectif de la classe étant alors le nombre de modalités appartenant à cet intervalle. II Mesures de positions A) Mesures de tendance centrale Elles visent à résumer la série par une seule valeur qu on espère représentative de toutes les valeurs de la série. On en connaît trois : le mode, la moyenne, la médiane. 1) Le mode Définition : Le mode d une série statistique est la donnée la plus fréquente de la série (celle ayant le plus grand effectif). Exemple : déterminer le mode de la série de valeurs suivantes : 18, 12, 15, 10, 12, 15, 9, 8, 11, 13, 10, 12, 16, 6, 8. Remarques : - S il y a plusieurs données arrivant à égalité, il y a plusieurs modes. - Si les données sont rangées en classe, on parle de classe modale. - Le mode est défini aussi bien pour les séries quantitatives que qualitatives. - Le mode est un résumé sommaire d une série qui fournit un type d information assez limité. Il pourra intéresser un publicitaire.

2) La moyenne arithmétique : Définition : La moyenne arithmétique d une série statistique quantitative S ={x 1,x 2,...,x n } est le nombre, souvent noté : Remarque : cas d une série où chaque modalité a un effectif précis (on l appelle alors la moyenne pondérée) : Valeur Effectif Alors : où est l effectif total. On peut également calculer une moyenne à partir de la distribution des fréquences : x = a) Si les valeurs de la série sont discrètes Par exemple, voici les notes obtenues à un autre contrôle par les 25 élèves d une autre classe : Notes 2 4 6 7 8 9 10 11 12 14 17 Total Effectifs 1 2 1 2 2 3 4 6 2 1 1 25 La moyenne est alors dite pondérée par les effectifs. Pour calculer cette moyenne, on commence par effectuer les produits des notes par les effectifs associés, puis on additionne tous ces produits, et on divise la somme obtenue par le nombre total de notes. b) Si les valeurs de la série sont continues et regroupées par classes Par exemple, voici la répartition des salaires de 202 salariés d une entreprise : Salaires 1000 S<1200 1200 S<1500 1500 S<1700 1700 S<2000 2000 S<3000 Centre 1100 1350 1600 1850 2500 Effectifs 36 44 76 34 12 On considère alors qu une classe donnée sera représentée, dans le calcul, par son centre, et on utilise le centre de la classe pour calculer la moyenne pondérée par les effectifs. On obtient une valeur approchée du salaire moyen réel. p i 1 f i x i. Propriété de la moyenne - Linéarité de la moyenne : Si on ajoute (ou on soustrait) un même nombre k à toutes les valeurs d une série alors la moyenne de cette série se trouve augmentée (ou diminuée) de k. Si on multiplie (ou on divise) un même nombre k différent de zéro à toutes les valeurs d une série alors la moyenne de cette série se trouve multipliée (ou divisée) par k. Exemple : si on ajoute 1,5 point à chaque note d un contrôle alors on augmente la moyenne de 1,5 point également. - Moyenne par sous-groupes : Soit une série statistique d effectif total N et de moyenne m. On divise cette série en deux sous-groupes disjoints (sans individus en communs) d effectifs respectifs p 1 et p 2 (avec p 1 +p 2 = N) La moyenne m de deux moyennes m 1 et m 2 munies des effectifs respectifs p 1 et p 2 est donnée par la formule : m = p 1m 1 +p 2 m 2 p 1 +p 2 Exercice : Une classe est composée de 55% de filles. Les élèves de la classe sont répartis suivant leurs âges et leurs sexes comme l'indique le tableau suivant : 1) Calculer la moyenne d'âge m 1 des garçons et la moyenne d'âge m 2 des filles. 2) Calculer la moyenne d'âge m de la classe. 15 ans 16 ans 17 ans Garçons 10% 78% 12% Filles 20% 70% 10%

Remarques : - La moyenne a des avantages calculatoires : si l on connaît les moyennes et les effectifs de deux séries (ou deux sous séries), on peut obtenir la moyenne de la série constituée de l agrégation de ces deux séries. - La moyenne a le défaut d être très sensible aux valeurs extrêmes. 3) La médiane : Définition : La médiane M d une série statistique est la valeur qui partage la population étudiée en deux sousgroupes de même effectif, chacun tels que : tous les éléments du premier groupe ont des valeurs inférieures ou égales à M ; tous les éléments du deuxième groupe ont des valeurs supérieures ou égales à M. Méthode pour déterminer une médiane : Soit une série statistique quantitative comportant n données : S = { } telles que. Si N (effectif total de la population) est impair alors la valeur de M est la valeur de cette série qui est située «au milieu» à savoir la valeur dont le rang est N+1, le -ième élément de la série : m = 2 Si N (effectif total de la population) est pair alors une valeur de M est le centre de ce que l on appelle l intervalle médian qui est l intervalle formé par les deux nombres situés «au milieu» de la série, entre les rangs N 2 et N + 1. On 2 prend donc généralement. Remarque : La médiane a l avantage de ne pas être influencée par les valeurs extrêmes. Elle n a aucun avantage pratique dans les calculs, puisque pour connaître la médiane d une série constituée de l agrégation de deux séries, il faut nécessairement réordonner la nouvelle série pour trouver sa médiane, qui n aura pas de lien avec les deux médianes des deux séries initiales. B) Mesures de positions non centrales 1) Les quartiles Définition : Soit S une série statistique quantitative. On appelle premier quartile, noté Q 1, la plus petite valeur de la série telle que : au moins 25% des valeurs de la série ont une valeur inférieure ou égale à Q 1. On appelle deuxième quartile (valeur très proche de la médiane), noté Q 2, la plus petite valeur de la série telle que : au moins 50% des valeurs de la série ont une valeur inférieure ou égale à Q 2. On appelle troisième quartile, noté Q 3, la plus petite valeur de la série telle que : au moins 75% des valeurs de la série ont une valeur inférieure ou égale à Q 3. 2) Les déciles Définition : Soit S une série statistique quantitative. On appelle premier décile, noté D 1, la plus petite valeur de la série telle que : au moins 10% des valeurs de la série ont une valeur inférieure ou égale à D 1. On appelle neuvième décile, noté D 9, la plus petite valeur de la série telle que : au moins 90% des valeurs de la série ont une valeur inférieure ou égale à D 9.

III Mesures de dispersion 1) L étendue Définition : Les valeurs extrêmes d une série sont ses valeurs minimale et maximale et l étendue est la différence entre les valeurs extrêmes de la série. Soit une série statistique quantitative comportant n données : S = { } telles que. L étendue est alors : e = Exemple : déterminer les valeurs extrêmes et l étendue de la série : 2 ; 5 ; 0.5 ; 4 ; 3 ; 2 ; 1 2) L écart interquartile Définition : l intervalle interquartile est l intervalle [Q 1 ; Q 3 ] l écart interquartile est la différence Q 3 Q 1. Remarque : On peut également définir de même l écart interdécile la différence D 9 D 1 l intervalle interdécile l intervalle [D 1 ; D 9 ] Toutes ces mesures statistiques sont dans la même unité que les valeurs de la série. IV Représentations graphiques 1) Diagramme à bâtons, histogramme. Si les données sont regroupées en classes (intervalles), la série peut-être représentée par un histogramme où chaque rectangle a son aire proportionnelle à l effectif (ou à la fréquence) de la classe. Ainsi si on considère la série : Et la même regroupée en classe : On obtient les diagrammes en bâtons et histogramme suivants :

2) Diagramme en boite. On peut représenter graphiquement les valeurs extrêmes, les quartiles et la médiane par un diagramme en boite, appelé aussi boite à moustaches, conçues de la manière suivante : au centre une boite allant du premier au troisième quartile, séparée en deux par la médiane ; de chaque côté une moustache allant du minimum au premier quartile pour l une, et du troisième quartile au maximum pour l autre. Ces diagrammes permettent une interprétation visuelle et rapide de la dispersion des séries statistiques. Ils permettent également d apprécier des différences entre des séries (lorsqu elles ont des ordres de grandeurs comparables). Remarques : La hauteur des boites est arbitraire. La boite contient 50% des données centrales. On coupe parfois les moustaches de part et d autre à la hauteur du premier et neuvième décile ; on fait alors apparaître les minimum et maximum par un point. Exemple : lecture d un diagramme en boite. Le diagramme en boite ci-dessous est associé à la série des notes moyennes des élèves d un lycée au baccalauréat. Sur le diagramme, on lit : - M = 11, ce qui permet d affirmer qu au moins 50% des élèves ont une note supérieure ou égale à 11 et sont donc reçus sans passer les épreuves de rattrapage. - Q 3 = 13, ce qui permet d affirmer qu au moins 25% des élèves ont une note supérieure ou égale à 13, donc qu au moins 25% des élèves ont au moins la mention Assez Bien (ou l une des mentions Assez Bien, Bien, Très bien). - Q 1 = 9,5, ce qui permet d affirmer qu au moins 25% des élèves ont une note inférieure ou égale à 9,5 et ne sont donc pas reçus directement. Mais on ne peut pas savoir, avec ce diagramme, combien, parmi ces élèves, ont une note supérieure ou égale à 8 et pourront donc passer les épreuves de rattrapage. Exemple : Déterminer la médiane et les quartiles de cette série. Notes 2 4 6 7 8 9 10 11 12 14 17 Total Effectifs 1 2 1 2 2 3 4 6 2 1 1 25 ECC