INTRODUCTION. Faire des statistiques, c est collecter, organiser puis traiter des données numériques

Documents pareils
Statistique : Résumé de cours et méthodes

Statistiques Descriptives à une dimension

Représentation d une distribution

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Annexe commune aux séries ES, L et S : boîtes et quantiles

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

Séries Statistiques Simples

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Introduction à la statistique descriptive

Calculs de probabilités avec la loi normale

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Logiciel XLSTAT version rue Damrémont PARIS

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

SERIE 1 Statistique descriptive - Graphiques

1. Vocabulaire : Introduction au tableau élémentaire

Statistique Descriptive Élémentaire

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Formation tableur niveau 1 (Excel 2013)

TP 7 : oscillateur de torsion

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

STATISTIQUES DESCRIPTIVES

Rappels sur les suites - Algorithme

STATISTIQUES DESCRIPTIVES

Collecter des informations statistiques

EPFL TP n 3 Essai oedomètrique. Moncef Radi Sehaqui Hamza - Nguyen Ha-Phong - Ilias Nafaï Weil Florian

Bien lire l énoncé 2 fois avant de continuer - Méthodes et/ou Explications Réponses. Antécédents d un nombre par une fonction

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Chapitre 2 Le problème de l unicité des solutions

2.4 Représentation graphique, tableau de Karnaugh

La simulation probabiliste avec Excel

TSTI 2D CH X : Exemples de lois à densité 1

TRAVAUX PRATIQUES SCIENTIFIQUES SUR SYSTÈME

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

Continuité et dérivabilité d une fonction

Chapitre 6. Fonction réelle d une variable réelle

Lecture graphique. Table des matières

Baccalauréat technique de la musique et de la danse Métropole septembre 2008

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Statistiques avec la graph 35+

Fonctions de plusieurs variables

Statistique descriptive. Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne. Notes de cours

Le patrimoine des ménages retraités : résultats actualisés. Secrétariat général du Conseil d orientation des retraites

Mini_guide_Isis_v6.doc le 10/02/2005 Page 1/15

Priorités de calcul :

Lire ; Compter ; Tester... avec R

Traitement bas-niveau

Didier Pietquin. Timbre et fréquence : fondamentale et harmoniques

Exprimer ce coefficient de proportionnalité sous forme de pourcentage : 3,5 %

Fonctions de deux variables. Mai 2011

Bulletin d information statistique

Chapitre 2 Les ondes progressives périodiques

Comment tracer une droite représentative d'une fonction et méthode de calcul de l'équation d'une droite.

Mini_guide_Isis.pdf le 23/09/2001 Page 1/14

TP Modulation Démodulation BPSK

Oscillations libres des systèmes à deux degrés de liberté

Localisation des fonctions

Aide-mémoire de statistique appliquée à la biologie

G.P. DNS02 Septembre Réfraction...1 I.Préliminaires...1 II.Première partie...1 III.Deuxième partie...3. Réfraction

Séquence 4. Statistiques. Sommaire. Pré-requis Médiane, quartiles, diagramme en boîte Moyenne, écart-type Synthèse Exercices d approfondissement

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Complément d information concernant la fiche de concordance

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

CH IV) Courant alternatif Oscilloscope.

Petit lexique de calcul à l usage des élèves de sixième et de cinquième par M. PARCABE, professeur au collège Alain FOURNIER de BORDEAUX, mars 2007

SEANCE 4 : MECANIQUE THEOREMES FONDAMENTAUX

Probabilités conditionnelles Loi binomiale

Baccalauréat L spécialité, Métropole et Réunion, 19 juin 2009 Corrigé.

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Traitement des données avec Microsoft EXCEL 2010

1 Démarrer L écran Isis La boite à outils Mode principal Mode gadget Mode graphique...

LISTE D EXERCICES 2 (à la maison)

ACOUSTIQUE 3 : ACOUSTIQUE MUSICALE ET PHYSIQUE DES SONS

- Ressources pour les classes

Extraction d informations stratégiques par Analyse en Composantes Principales

Expertise du logiciel «GanttProject»

AC AB. A B C x 1. x + 1. d où. Avec un calcul vu au lycée, on démontre que cette solution admet deux solutions dont une seule nous intéresse : x =

LES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES

Analyse tarifaire en ligne (TAO) de l'omc

Chapitre 3. Les distributions à deux variables

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

BACCALAURÉAT PROFESSIONNEL EPREUVE DE TRAVAUX PRATIQUES DE SCIENCES PHYSIQUES SUJET A.1

Etudier l influence de différents paramètres sur un phénomène physique Communiquer et argumenter en utilisant un vocabulaire scientifique adapté

BAREME sur 40 points. Informatique - session 2 - Master de psychologie 2006/2007

C f tracée ci- contre est la représentation graphique d une

Les Conditions aux limites

FICHE 1 Fiche à destination des enseignants

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

O, i, ) ln x. (ln x)2

Statistiques 0,14 0,11

Unité 2 Leçon 2 Les permutations et les combinaisons

PROBLEME(12) Première partie : Peinture des murs et du plafond.

TOUT CE QU IL FAUT SAVOIR POUR LE BREVET

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

Plan. 1. La planification d un d 2. Méthodes et techniques de planification 3. Conclusion. D. Leclet

UNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU

Transcription:

INTRODUCTION Faire des statistiques, c est collecter, organiser puis traiter des données numériques concernant une population (plus généralement un ensemble de «choses») Collecter : On réunit des nombres concernant cette population. Organiser : on présente ces nombres sous forme de tableau ou sous forme graphique. Traiter : on fait des calculs qui permettent souvent de mieux comprendre la structure et l évolution de cette population. Les données statistiques apportent des renseignements sur le nombre d INDIVIDUS d une POPULATION possédant telle propriété ou tel trait en commun (CARACTERE) - 1 -

EXEMPLES Le service communication d une entreprise est chargé de présenter les données relatives à ses 1500 salariés Tableau 1 Catégorie socioprofessionnelle Tableau 2 Nombre de salariés Cadres 256 Professions intermédiaires 352 Employés 232 Ouvriers 660 Age Nombre de salariés [18-20[ 110 [20-30[ 350 [30-40[ 440 [40-50[ 310 [50-65[ 290 Tableau 3 Nombre d enfants par famille Nombre de familles 0 265 1 315 2 430 3 120 4 10 Pour préparer la fête de Noël de l entreprise une enquête est organisée auprès d un échantillon de 150 personnes prises au hasard Tableau 4 Viendront à la fête Nombre de salariés oui 115 non 35-2 -

PLAN 1- Définitions 1-1 Individu ou unité statistique 1-2 Effectifs 1-3 Population 1-4 Echantillon 1-5 Caractère d une population 1-5-1 Qualitatif Modalité 1-5-2 Quantitatif Variable discontinue ou discrète Variable continue 1-6 Série statistique 2- Organisation des données 2-1 Tableaux 2-1-1 Regrouper les données selon un caractère qualitatif 2-1-2 Regrouper les données selon un caractère quantitatif variable discontinue variable continue : classes 2-2 Représentations graphiques 2-2-1 Diagramme circulaire 2-2-2 Diagramme semi circulaire 2-2-3 Diagramme à barres 2-2-4 Diagramme en bâtons 2-2-5 Histogramme 3- Traitement des données 3-1 Etendue 3-2 Amplitude de classe 3-3 Centre de classe 3-4 Fréquences 3-5 Effectifs cumulés 3-5-1 Croissants 3-5-2 Décroissants 3-6 Fréquences cumulées 3-6-1 Croissantes 3-6-2 Décroissantes 3-7 Mode 3-8 Moyenne 3-9 Médiane - 3 -

1- Définitions 1-1 Individu ou unité statistique Un individu ou unité statistique est tout élément de la population étudiée, Il peut s agir de personnes (hommes, femmes, salariés ), d objets (pièces fabriquées par une machine ), de durées ( jours, heures ) chaque salarié est une unité statistique 1-2 Effectifs L effectif est le nombre d unités statistiques L effectif total est de 1500 salariés L effectif de l échantillon est de 150 salariés 1-3 Population Au sens statistique, la population est l ensemble des unités statistiques que l on se propose d observer La population statistique est l ensemble des 1500 salariés. 1-4 Echantillon L échantillon est la partie de la population sur laquelle porte une enquête. Les 150 salariés sur lesquels porte l enquête constitue l échantillon 1-5 Caractère d une population C est le critère sur lequel repose toute étude statistique. Le caractère d une population est la propriété commune à tous les individus concernés par l étude statistique. 1-5-1 Qualitatif Un caractère est qualitatif quand il n est pas mesurable. Modalité : Les modalités désignent les différents états d un caractère qualitatif Cadres, agents de maîtrise, ouvriers.. sont les modalités du caractère «catégories sociaux professionnelles» - 4 -

1-5-2 Quantitatif Un caractère est quantitatif quand il est mesurable. Il lui correspond alors une variable statistique qui est la mesure du caractère. Variable discontinue ou discrète Une variable est discontinue (ou discrète) quand elle ne peut prendre que certaines valeurs entières, Le nombre d enfants de la famille est une variable discontinue : 0, 1, 2 enfants Variable continue Une variable est continue quand elle peut prendre toutes les valeurs qui se trouvent dans son intervalle de variation. L âge est une variable continue 1-6 Série statistique C est une suite d observations chiffrées, ordonnées, présentées le plus souvent sous forme de tableaux ou graphiques. - 5 -

2- Organisation des données 2-1 Tableaux 2-1-1 Regrouper les données selon un caractère qualitatif Tableau 1 Catégorie socioprofessionnelle Nombre de salariés Cadres 256 Professions intermédiaires 352 Employés 232 Ouvriers 660 2-1-2 Regrouper les données selon un caractère quantitatif variable discontinue Tableau 3 Nombre d enfants par famille Nombre de familles 0 265 1 315 2 430 3 120 4 10 variable continue : classes Parfois on ne peut pas garder toutes les valeurs du caractère. Pour simplifier on groupe ces valeurs en classes d amplitudes égales ou inégales Age Tableau 2 Nombre de salariés [18-20[ 110 [20-30[ 350 [30-40[ 440 [40-50[ 310 [50-65[ 290 Remarque les classes ne doivent pas se chevaucher et doivent avoir de limites bien nettes. En général chaque classe comprend la limite inférieure et exclut la limite supérieure. Pour la classe [18-20[ 18 est compris, 20 est exclu - 6 -

2-2 Représentations graphiques 2-2-1 Diagramme circulaire Le diagramme circulaire est utilisé pour représenter une population à caractère qualitatif Chaque modalité est représentée par un secteur circulaire dont l aire est proportionnelle à l effectif (ou à la fréquence), c'est-à-dire dont la mesure de l angle est proportionnelle à l effectif ou à la fréquence. La somme des angles est de 360 tableau 1 : catégories socioprofessionnelles Nombre de salariés par catégories socioprofessionnelles Cadres Professions intermédiaires Employés Ouvriers 2-2-2 Diagramme semi circulaire Le diagramme semi circulaire est utilisé en particulier pour présenter des résultats d élections. Sur un diagramme semi circulaire on peut respecter Droite Gauche. La somme des angles est de 180. On peut l utiliser également lorsque l on n a que deux caractères. tableau 4 : réponse à l enquête (oui non.) oui non - 7 -

2-2-3 Diagramme à barres Le diagramme à barres est lui aussi utilisé pour représenter une population à caractère qualitatif. Les rectangles ont même largeur et leur hauteur est proportionnelle à l effectif ou à la fréquence. Les barres peuvent être verticales Nombre de salariés par catégories socioprofessionnelles 700 600 500 400 300 200 100 0 Cadres Professions intermédiaires Employés Ouvriers ou horizontales Nombre de salariés par catégories socioprofessionnelles Ouvriers Employés Professions intermédiaires Cadres 0 100 200 300 400 500 600 700-8 -

2-2-4 Diagramme en bâtons Le diagramme en bâtons est utilisé pour représenter une population à caractère quantitatif de variable discontinue ou discrète. La hauteur de chaque bâton est proportionnelle à l effectif. tableau 3 : nombre d enfants par famille. 500 nombre de familles 400 300 200 100 0-1 0 1 2 3 4 5 nombre d'enfants 2-2-5 Histogramme L histogramme est utilisé pour représenter une population à caractère quantitatif de variable continue. Les effectifs des différentes classes sont représentés par des rectangles dont l aire est proportionnelle à l effectif. Il faut faire attention quand les classes sont d inégales amplitudes 15 20 25 30 35 40 45 50 55 60 65 Âge = 1,0 15 % salariés - 9 -

3- Traitement des données 3-1 Etendue On repère la plus petite et la plus grande valeur du caractère étudié. L étendue est la différence entre ces deux nombres. L étendue de la série est 65 18 = 47 3-2 Amplitude de classe L amplitude d une classe est la différence entre la valeur la plus grande et la valeur la plus petite de la classe ; On dit aussi étendue de la classe. L amplitude de la classe 18-20 et de 2 Les classes 20-30 ; 30-40 ; 40-50 ont une même amplitude de 10 La classe 50-65 a une amplitude de 15 3-3 Centre de classe Le centre de classe est le milieu de la classe 30 + 40 Le centre de la classe 30-40 est 35. ( ) 2 3-4 Fréquences La fréquence d une valeur du caractère s obtient en divisant l effectif correspondant par l effectif total, on peut l exprimer soit en nombre décimal (dans ce cas la somme des fréquences est égale à 1), soit en pourcentage ( la somme des fréquences est égale à 100%) tableau 4 : enquête Viendront à la fête Effectifs Fréquences oui 115 76,7% non 35 23,3% 150 100% 115 115 0,767 100 76, 7 150 150-10 -

3-5 Effectifs cumulés 3-5-1 Croissants Ils s obtiennent par cumul, c'est-à-dire des additions après avoir rangé les valeurs du caractère par ordre croissant. Age effectifs Age Effectifs cumulés croissants [18-20[ 110 18 0 [20-30[ 350 20 110 [30-40[ 440 30 460 [40-50[ 310 40 900 [50-65[ 290 50 1210 65 1500 460 (110 +360) est le nombre de salariés entre 18 et 20 ans, plus ceux entre 20 et 30 ans. 460 est le nombre de salariés de moins de 30 ans. 1210 (900 + 310) est le nombre de salariés de plus de 40 ans plus ceux entre 40 et 50 ans 1210 est le nombre de salariés de moins de 50 ans 3-5-2 Décroissants Ils s obtiennent soit par addition en commençant par la dernière ligne du tableau lorsque les valeurs du caractère sont rangées par ordre croissant. Age effectifs Age Effectifs cumulés décroissants [18-20[ 110 18 1500 [20-30[ 350 20 1390 [30-40[ 440 30 1040 [40-50[ 310 40 600 [50-65[ 290 50 290 65 0 1040 (290 + 210 +440) est le nombre de salariés entre 50 et 65 ans plus ceux entre 40 et 50 ans, plus ceux entre 30 et 40 ans. 1040 est le nombre de salariés de plus de 30 ans. On peut donner une représentation des effectifs cumulés croissants et décroissants, mais on utilisera de préférence la courbe des fréquences cumulées. - 11 -

3-6 Fréquences cumulées 3-6-1 Croissantes Elles s obtiennent par le cumul des fréquences ou en faisant le rapport des effectifs cumulés croissants à l effectif total. On peut tracer la courbe des fréquences cumulées croissantes qui permet de déterminer des pourcentages relatifs à une condition d un caractère (inférieur à ) Elle permet aussi de visualiser la médiane. 460 1500 Age Effectifs cumulés croissants Fréquences cumulées croissantes 18 0 0 % 20 110 7,3 % 30 460 30,7 % 40 900 60,0 % 50 1210 80,7 % 65 1500 100 % 0,307 30,7% Il y a 30,7 % des salariés qui ont moins de 30 ans. La courbe des fréquences cumulées croissantes permet par lecture graphique de déterminer le pourcentage de salariés âgés de moins de courbe des fréquences cumulées croissantes 120,0% 100,0% fréquences 80,0% 60,0% 40,0% 20,0% 0,0% 0 10 20 30 40 50 60 70 age - 12 -

3-6-2 Décroissantes Elles en faisant le rapport des effectifs cumulés décroissants à l effectif total. On peut tracer la courbe des fréquences cumulées décroissantes qui permet de déterminer des pourcentages relatifs à une condition d un caractère (supérieur à ) Elle permet également de visualiser la médiane. Age Effectifs cumulés décroissants Fréquences cumulées décroissantes 18 1500 100 % 20 1390 92,7 % 30 1040 69,3 % 40 600 40 % 50 290 19,3 % 65 0 0 % 1040 0,693 69,3% Il y a 69,3 % des salariés qui ont plus de 30 ans 1500 Remarque : Il y a 30,7 % de moins de 30 ans, c est donc qu il y a 69,3 % (100-30,7) de plus de 30 ans. La courbe des fréquences cumulées croissantes permet par lecture graphique de déterminer le pourcentage de salariés âgés de plus de courbe des fréquences cumulées décroissantes 120% 100% fréquences 80% 60% 40% 20% 0% 0 10 20 30 40 50 60 70 age - 13 -

3-7 Mode Le mode est la valeur du caractère qui a le plus grand effectif tableau 1 : catégories socioprofessionnelles Le mode est «les ouvriers» Les 30-40 ans sont les plus nombreux [30-40[ est la classe modale 3-8 Moyenne Lorsque l on a les données brutes, pour calculer une moyenne on divise la somme des valeurs (de la variable) par l effectif total. Quand les données sont regroupées en classes on ne peut donner qu une estimation de la moyenne en prenant comme variable le centre de chaque classe. tableau 3 : nombre d enfants par famille Nombre d enfants par famille Nombre de familles 0 265 1 315 2 430 3 120 4 10 Le nombre d enfants «moyen» par famille est d environ 1,4 : 0 265 + 1 315 + 2 430 + 3 120 + 4 10 1,38 265 + 315 + 430 + 120 + 10 Age Nombre de salariés [18-20[ 110 [20-30[ 350 [30-40[ 440 [40-50[ 310 [50-65[ 290 L âge moyen est d environ 38 ans : 19 110 + 25 350 + 35 440 + 45 310 + 57,5 290 37,9 1500-14 -

3-9 Médiane En rangeant les valeurs du caractère par ordre croissant (ou décroissant), la médiane est la valeur du caractère qui partage l effectif total en deux parties de même effectif. Quand les données sont regroupées en classe, on détermine la médiane sur la courbe des fréquences cumulées croissantes (ou décroissantes), la médiane correspond à la fréquence de 50%. Age Fréquences cumulées croissantes Fréquences cumulées décroissantes 18 0 % 100 % 20 7,3 % 92,7 % 30 30,7 % 69,3 % 40 60,0 % 40 % 50 80,7 % 19,3 % 65 100 % 0 % Sur le tableau on détermine que la médiane se situe entre 30 et 40 ans Sur le graphique des fréquences cumulées croissantes et décroissantes, les deux courbes se croisent pour la valeur de la médiane. courbe des fréquences cumulées 120,0% 100,0% fréquences 80,0% 60,0% 40,0% 20,0% 0,0% 0 10 20 30 40 50 60 70 age La médiane est d environ 36 ans - 15 -