On considère un ensemble E (la population) et on s'intéresse à une caractéristique (caractère statistique) que présente chaque élément de E.

Documents pareils
Statistiques 0,14 0,11

Statistique : Résumé de cours et méthodes

Statistiques Descriptives à une dimension

Représentation d une distribution

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Séries Statistiques Simples

Annexe commune aux séries ES, L et S : boîtes et quantiles

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Statistiques avec la graph 35+

Statistiques à une variable

STATISTIQUES DESCRIPTIVES

1. Vocabulaire : Introduction au tableau élémentaire

Logiciel XLSTAT version rue Damrémont PARIS

Evaluation de la variabilité d'un système de mesure

Statistiques - Cours. 1. Gén éralités. 2. Statistique descriptive univari ée. 3. Statistique descriptive bivariée. 4. Régression orthogonale dans R².

CAPTEURS - CHAINES DE MESURES

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Etude ECDL 2015 : Autoévaluation et connaissances réelles en informatique de la population suisse

Unité E Variation et analyse statistique

Comparaison des performances d'éclairages

BACCALAURÉAT PROFESSIONNEL SUJET

- Ressources pour les classes

CRÉER DES LEÇONS AVEC L'ÉDITEUR DU LOGICIEL 1000 MOTS POUR APPRENDRE À LIRE EN FRANÇAIS, ANGLAIS ET ALLEMAND

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

Séquence 4. Statistiques. Sommaire. Pré-requis Médiane, quartiles, diagramme en boîte Moyenne, écart-type Synthèse Exercices d approfondissement

Statistique Descriptive Élémentaire

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

Analyse et interprétation des données

I. Ensemble de définition d'une fonction

Étude sur les taux de revalorisation des contrats individuels d assurance vie au titre de 2013 n 26 mai 2014

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

L'insertion professionnelle des diplômés DNSEP 2003 trois ans après le diplôme

Bulletin d information statistique

Classe de première L

Chapitre 6. Fonction réelle d une variable réelle

MATHÉMATIQUES. Mat-4104

CHAPITRE VIII : Les circuits avec résistances ohmiques

Matérialiser les données d une BdD : créer une carte de densité de points par maillage

L assurance de la qualité à votre service

3. Caractéristiques et fonctions d une v.a.

Leçon N 4 : Statistiques à deux variables

Statistique descriptive. Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne. Notes de cours

Gestion de projet - contraintes, chevauchement, attente entre 2 tâches, jalons

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Evolution des risques sur les crédits à l habitat

Développements limités. Notion de développement limité

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

APPLICATION DU SCN A L'EVALUATION DES REVENUS NON DECLARES DES MENAGES

La rémunération des concepteurs. en théâtre au Québec. de 2004 à 2006

Par combien de zéros se termine N!?

Très légère hausse de la confiance des chefs d entreprise en février

Catalogue des connaissances de base en mathématiques dispensées dans les gymnases, lycées et collèges romands.

S'orienter et se repérer sur le terrain avec une carte

IBM SPSS Statistics Base 20

Dévéloppement de Sites Web

Combien coûtent vos soins dentaires?

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

BAREME sur 40 points. Informatique - session 2 - Master de psychologie 2006/2007

Copropriété: 31, rue des Abondances Boulogne-Billancourt

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

500 W sur 13cm avec les modules PowerWave

Synthèse. Jeux d argent. Internet et jeux vidéo. Comparaison avec les apprentis

LES AMORTISSEMENTS : CALCULS ENREGISTREMENTS

Généralités. Aperçu. Introduction. Précision. Instruction de montage. Lubrification. Conception. Produits. Guides à brides FNS. Guides standards GNS

Gestion et animation de sites web. Synthèse

Observation des modalités et performances d'accès à Internet

1. L'été le plus chaud que la France ait connu ces cinquante dernières années.

1 La société GIR. 2 La solution proposée

STATISTIQUES DESCRIPTIVES

Calculons avec Albert!

Bilan de l activité d accueil de jour et d hébergement temporaire en direction des personnes âgées dépendantes en 2010

Vous avez dit... LED??? DOCLED V2 Page 1 / 14

ASSOCIATION NATIONALE D'ASSISTANCE ADMINISTRATIVE ET FISCALE DES AVOCATS

Problème : Calcul d'échéanciers de prêt bancaire (15 pt)

Perrothon Sandrine UV Visible. Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

Brock. Rapport supérieur

TD 11. Les trois montages fondamentaux E.C, B.C, C.C ; comparaisons et propriétés. Association d étages. *** :exercice traité en classe.

L'instruction if permet d'exécuter des instructions différentes selon qu'une condition est vraie ou fausse. Sa forme de base est la suivante:

Fonctions homographiques

Sujet de rédaction. «Mon histoire»

Etude statistique des données fournies par la CCIJP

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

La confiance des chefs d entreprise continue de se renforcer en mai

LE PROBLEME DU PLUS COURT CHEMIN

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

LibreOffice Calc : introduction aux tableaux croisés dynamiques

Optimiser les performances du mouvement de monte de l Axe Z.

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

Étude comparative sur les salaires et les échelles salariales des professeurs d université. Version finale. Présentée au

Sub CalculAnnuite() Const TITRE As String = "Calcul d'annuité de remboursement d'un emprunt"

modélisation solide et dessin technique

Chapitre 1 : Évolution COURS

Stockage ou pas stockage?

Guide au remboursement anticipé du prêt hypothécaire

Introduction aux Statistiques et à l utilisation du logiciel R

Mémo d'utilisation de BD Dico1.6

LES NOMBRES DECIMAUX. I. Les programmes

Transcription:

Statistique A. Série statistique à un caractère On considère un ensemble E (la population) et on s'intéresse à une caractéristique (caractère statistique) que présente chaque élément de E. s - on s'intéresse aux notes du DS1 des élèves de la classe : la population est l'ensemble des élèves, la caractère statistique est la note - on s'intéresse à la durée de vie des ampoules produites par une usine : la population est l'ensemble des ampoules, le caractère statistique est la durée de vie On fait ensuite un relevé statistique relativement au caractère étudié, c'est à dire qu'on relève les différentes valeurs prises par le caractère; cela donne une liste de valeurs qui forme une série statistique. Le problème est de la présenter de façon parlante à l'aide de tableux, de graphiques ou de paramètres statistiques. Pour le DS1, on relève les notes : 7-13-11-5-12-10-8-6-13-19-9-3-5-3-13-10-10-15-16-1-3-9-8-14-7-11-10-8 1- Tableau des effectifs et histogramme Une première opération consiste à regrouper les notes égales et à indiquer leur nombre, cela conduit à faire un tableau des effectifs. Pour l'exemple du DS1 : Notes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Effectifs 1 0 3 0 2 1 2 3 2 4 2 1 3 1 1 1 0 0 1 On peut représenter ce tableau par un histogramme : 4 Histogramme des effectifs 3 Effectifs 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Notes On peut indiquer deux paramètres statistiques : - le mode, c'est la valeur du caractère étudié qui a le plus grand effectif; pour le DS1, le mode est 10; il s'agit d'un paramètre de position, il est destiné à montrer où se situent les valeurs les KB 1 sur 7

plus fréquemment observées. - l'étendue, c'est la différence entre la plus grande et la plus petite valeurs observées; pour le DS1 l'étendue est 19 1 = 18; il s'agit d'un paramètre de dispersion, il est destiné à montrer comment les valeurs se distribuent autour d'une position centrale. Ces deux paramètres sont très rudimentaires, le but de ce chapitre est d'en étudier d'autres : - la moyenne et la médiane comme paramètres de position - l'écart type et l'intervalle interquartile comme paramètres de dispersion. 2- Regroupement en classes Pour faciliter la lecture du tableau des effectifs et de l'histogramme on peut regrouper les valeurs du caractère étudié en classes. Pour le DS1, on peut par exemple considérer les classes [0;4[, [4;8[, [8;12[, [12,16[ et [16;20[. Cela donne un nouveau tableau des effectifs : Classes [0;4[ [4;8[ [8;12[ [12;16[ [16;20[ Effectifs 4 5 11 6 2 Et l'histogramme : La classe modale est la classe [8;12[. 3- Fréquences Effectifs 11 10 9 8 7 6 5 4 3 2 1 0 Regroupement en classes [0;4[ [4;8[ [8;12[ [12;16[ [16;20[ Classes Lorsqu'on a à comparer des séries statistiques d'effectifs différents, on peut s'intéresser aux fréquences plutôt qu'aux effectifs. La fréquence associée à une valeur du caractère étudiée est le quotient de son effectif par l'effectif total. Ainsi pour une valeur x i d'effectif n i, la fréquence est : f i = n i N = n i La fréquence peut être exprimé par un nombre entre 0 et 1 ou par un pourcentage. Pour le regroupement en classes du DS1, on a le tableau des fréquences : Classes [0;4[ [4;8[ [8;12[ [12;16[ [16;20[ Total Effectifs 4 5 11 6 2 28 Fréquences 0,14 0,18 0,39 0,21 0,07 1 Pourcentages 14% 18% 39% 21% 7% 100% On obtient alors un histogramme qui a la même forme qu'avec les effectifs, mais avec une n i KB 2 sur 7

graduation standard de 0% à 100% qui permet de réaliser facilement des comparaisons entre séries d'effectifs différents. 40% Histogramme des fréquences 35% Fréquences en % 30% 25% 20% 15% 10% 5% 0% [0;4[ [4;8[ [8;12[ [12;16[ [16;20[ Classes B. Médiane et quartiles Au lieu d'utiliser des classes formées par des intervalles de même longueur comme dans l'exemple précédent, nous pouvons considérer des classes de même effectif. En essayant de créer deux classes de même effectif, on obtient la notion de médiane; en essayant de créer quatre classes de même effectif, on arrive à la notion de quartiles. 1- Médiane La médiane sépare une série statistique en deux sous-séries de même effectif, l'une contient les valeurs les plus petites et l'autre les valeurs les plus grandes. Pour déterminer la médiane d'une série de n valeurs : - on range les valeurs du caractère étudié par ordre croissant - si n est impair on prend la valeur située au milieu; si n est pair, on prend la moyenne des deux valeurs situées au milieu. Pour les notes du DS1 : 7-13-11-5-12-10-8-6-13-19-9-3-5-3-13-10-10-15-16-1-3-9-8-14-7-11-10-8 on obtient après rangement dans l'ordre croissant : 1-3-3-3-5-5-6-7-7-8-8-8-9-9-10-10-10-10-11-11-12-13-13-13-14-15-16-19 Il y a 28 valeurs; les deux valeurs du milieu sont la 14ème et la 15 ème qui sont 9 et 10; la médiane est donc 9,5. Pour une moitié les notes sont inférieures à 9,5 et pour l'autre elles sont supérieures à 9,5. 2- Quartiles Les quartiles permettent de séparer une série statistique en quatre sous-séries de même effectif (à une unité près). Un quart des valeurs sont inférieures au premier quartile Q1. Un quart des valeurs sont supérieures au troisième quartile Q3. KB 3 sur 7

Le deuxième quartile Q2 est aussi la médiane. Pour le DS1, reprenons les valeurs classées dans l'ordre croissant. 1-3-3-3-5-5-6-7-7-8-8-8-9-9-10-10-10-10-11-11-12-13-13-13-14-15-16-19 L'effectif total est de 28. Comme 28/4 = 7, le 1er quartile est la 7ème valeur, donc Q1 = 6. Comme 3*28/4 = 21, le 3ème quartile est la 21ème valeur, donc Q3 = 13. On appelle intervalle interquartile l'intervalle ]Q1; Q3[. On appelle écart interquartile la différence Q3 Q1. La médiane comme paramètre de position et l'intervalle interquartile comme paramètre de dispersion fournissent une bonne description d'une série statistique. 3- Diagramme en boites Les notes du DS1 peuvent être résumées par : - le minimum Min = 1 - le 1er quartile Q1 = 6 - la médiane Me = 9,5 - le 3ème quartile Q3 = 13 - le maximum Max = 19 Ces 5 données permettent de construire un diagramme en boites : Echelle 0 4 8 12 16 20 DS1 Min Max Q1 Me Q3 4- Utilisation des effectifs ou des fréquences cumulées Lorsque l'effectif d'une série statistique est important ou lorsqu'on a effectué des regroupements en classe, les méthodes vues précédemment pour déterminer médiane et quartiles ne sont pas très efficaces ou même pas envisageables. On utilise alors un tableau des effectifs cumulés ou des fréquences cumulées, puis la représentation graphique en polygone des effectifs ou des fréquences cumulées. Reprenons les données du DS1 avec la répartition en classes : Classes [0;4[ [4;8[ [8;12[ [12;16[ [16;20[ Effectifs 4 5 11 6 2 Pour déterminer les effectifs cumulés, nous allons compter le nombre de valeurs inférieures à 0, 4, 8, 12, 16 et 20. Ceci nous donne le tableau : KB 4 sur 7

Notes 0 4 8 12 16 20 Effectifs cumulés 0 4 9 20 26 28 Avec les fréquences cumulées (en pourcentages), on obtient : Notes 0 4 8 12 16 20 Effectifs cumulés 0 4 9 20 26 28 Fréquences cumulées 0% 14% 32% 71% 93% 100% Le premier quartile correspond à une fréquence cumulée de 25% : il est entre 4 et 8. La médiane correspond à une fréquence cumulée de 50% : elle est entre 8 et 12. Le troisième quartile correspond à une fréquence cumulée de 75% : il est entre 12 et 16. Pour déterminer plus précisément ces trois nombres nous pouvons utiliser la représentation graphique en polygone des fréquences cumulées : 100% 90% Polygone des fréquences cumulées Fréquences cumulées 80% 70% 60% 50% 40% 30% 20% 10% 0% 0 2 4 6 8 10 12 14 16 18 20 Notes Il suffit alors de lire sur le graphique les notes correspondants aux fréquences cumulées 25%, 50% et 75%. 100% 90% Polygone des fréquences cumulées Fréquences cumulées 80% 70% 60% 50% 40% 30% 20% 10% 0% Q1 Me Q3 0 2 4 6 8 10 12 14 16 18 20 Notes On lit ici : Q1 6,5; Me 9,9 et Q3 12,5. Ces résultats sont voisins de ceux obtenus précédemment, mais moins précis; le regroupement en classes nous a fait perdre des informations. KB 5 sur 7

C. Moyenne et écart type La moyenne et l'écart type sont un paramètre de position et un paramètre de dispersion souvent utilisées pour des séries statistiques dites «normales», c'est à dire relativement symétriques avec la plupart des valeurs autour de la moyenne. 1- Moyenne La moyenne est le quotient de la somme des valeurs par le nombre de valeurs. Ainsi, pour des valeurs x i d'effectifs n i : - l'effectif total est n = n i n i x i n - la moyenne est m = = i x i (la moyenne est parfois notée n x ) n i Pour le DS1, la moyenne est : 1 1 3 3 2 5 1 6 2 7 3 8 2 9 4 10 2 11 1 12 3 13 1 14 1 15 1 16 1 19 1 3 2 1 2 3 2 4 2 1 3 1 1 1 1 = 259 28 Notes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Effectifs 1 0 3 0 2 1 2 3 2 4 2 1 3 1 1 1 0 0 1 = 9,25. Si on utilise des regroupements en classe, on choisit comme valeur x i correspondant à une classe son milieu. Toujours pour le DS1 : Classes [0;4[ [4;8[ [8;12[ [12;16[ [16;20[ Effectifs 4 5 11 6 2 on obtient comme moyenne : 4 2 5 6 11 10 6 14 2 18 = 268 4 5 11 6 2 28 9,57. Le regroupement en classes a provoqué une légère modification de la moyenne. 2- Variance et écart type La variance permet de mesurer la dispersion autour de la moyenne : c'est la moyenne des carrés des écarts à la moyenne. L'écart type est la racine carrée de la variance. Ainsi : - la variance est V= n i x i x 2 - l'écart type est = V. Pour le DS1, la variance est 17,9 et l'écart type est 4,23. n Les calculatrices scientifiques et les tableurs nous donnent en général directement ces nombres. KB 6 sur 7

3- Séries statistiques normales (ou gaussiennes) On dit qu'une série statistique est normale ou gaussienne lorsque l'histogramme des effectifs s'inscrit approximativement dans une courbe en cloche (courbe de Gauss). Il y a donc à la fois symétrie et regroupement autour de la moyenne qui correspond à l'axe de symétrie. Courbe de Gauss 0 2 4 6 8 10 12 14 16 18 On dispose des résultats suivants pour les séries statistiques «normale» : - approximativement 50% des données sont dans l'intervalle [ x 2 3, x 2 3 ] - approximativement 68% des données sont dans l'intervalle [ x, x ] - approximativement 95% des données sont dans l'intervalle [ x 2, x 2 ] - approximativement 99,7% des données sont dans l'intervalle [ x 3, x 3 ] Pour le DS1, nous avons trouvé la moyenne x =9,25 et l'écart type =4,23. - l'intervalle [ x 2 3, x 2 3 ] est ici [6,43; 12,07]; il contient 14 notes sur 28, soit 50% des notes. - l'intervalle [ x, x ] est ici [5,02; 13,48]; il contient 18 notes sur 28, soit 64,3% des notes - l'intervalle [ x 2, x 2 ] est ici [0,79; 17,71]; il contient 27 notes sur 28, soit 96,4% des notes - l'intervalle [ x 3, x 3 ] est ici -3,44; 21,94]; il contient toutes les notes, soit 100% des notes. La distribution des notes semble donc plutôt «normale». KB 7 sur 7