Statistiques Descriptives ( En première S )

Documents pareils
Séries Statistiques Simples

Statistiques Descriptives à une dimension

Annexe commune aux séries ES, L et S : boîtes et quantiles

Statistique : Résumé de cours et méthodes

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Angles orientés et fonctions circulaires ( En première S )

Représentation d une distribution

Classe de première L

Statistiques avec la graph 35+

Statistique Descriptive Élémentaire

Logiciel XLSTAT version rue Damrémont PARIS

STATISTIQUES DESCRIPTIVES

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Statistiques 0,14 0,11

BACCALAURÉAT PROFESSIONNEL SUJET

3. Caractéristiques et fonctions d une v.a.

Séquence 4. Statistiques. Sommaire. Pré-requis Médiane, quartiles, diagramme en boîte Moyenne, écart-type Synthèse Exercices d approfondissement

1. Vocabulaire : Introduction au tableau élémentaire

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

LES REGLEMENTS AVEC SOCIEL.NET DERNIERE MISE A JOUR : le 14 juin 2010

: seul le dossier dossier sera cherché, tous les sousdomaines

Informatique Générale

1/24. I passer d un problème exprimé en français à la réalisation d un. I expressions arithmétiques. I structures de contrôle (tests, boucles)

Fluctuation d une fréquence selon les échantillons - Probabilités

Leçon N 4 : Statistiques à deux variables

DUT Techniques de commercialisation Mathématiques et statistiques appliquées

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

EXERCICES - ANALYSE GÉNÉRALE

Traitement des données avec Microsoft EXCEL 2010

Feuille TD n 1 Exercices d algorithmique éléments de correction

IBM SPSS Statistics Base 20

Lire ; Compter ; Tester... avec R

données en connaissance et en actions?

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Cours 1 : Introduction Ordinateurs - Langages de haut niveau - Application

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

IBM SPSS Direct Marketing 21

DOCM Solutions officielles = n 2 10.

Rappels sur les suites - Algorithme

Cours d algorithmique pour la classe de 2nde

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

MISE A NIVEAU INFORMATIQUE LANGAGE C - EXEMPLES DE PROGRAMMES. Université Paris Dauphine IUP Génie Mathématique et Informatique 2 ème année

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

Introduction aux Statistiques et à l utilisation du logiciel R

Glossaire des nombres

Statistiques - Cours. 1. Gén éralités. 2. Statistique descriptive univari ée. 3. Statistique descriptive bivariée. 4. Régression orthogonale dans R².

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

MATHÉMATIQUES. Mat-4104

INFIRMIER(E) GRADUE(E) SPECIALISE(E) EN SANTE COMMUNAUTAIRE HAUTE ECOLE DE LA PROVINCE DE LIEGE PROFESSEUR : RENARD X.

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Programmation C. Apprendre à développer des programmes simples dans le langage C

Projet de Traitement du Signal Segmentation d images SAR

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ

2010 Minitab, Inc. Tous droits réservés. Version Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1

Les devoirs en Première STMG

Chapitre 3. Les distributions à deux variables

Initiation à l algorithmique

Partage des capitaux propres de F1 à la consolidation de N. Éléments Total Part du groupe 60 % Capitaux propres de F1 hors résultat N

Manuel d utilisation DeveryLoc

Précision d un résultat et calculs d incertitudes

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Sommaire de la séquence 12

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Statistiques à une variable

Exercice du cours Gestion Financière à Court Terme : «Analyse d un reverse convertible»

White Paper - Livre Blanc

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

STATISTIQUES DESCRIPTIVES

Initiation à la programmation en Python

Partie 1. Fonctions plus complexes dans Excel. Fonctions Si(), Et(), Ou() et fonctions imbriquées. Opérateurs logiques. I.1.

Cours Numération Mathématique de base 1 MAT-B Alphabétisation

Chapitre 2 Le problème de l unicité des solutions

C f tracée ci- contre est la représentation graphique d une

Bases de programmation. Cours 5. Structurer les données

SmartCaisse, depuis Prise de Commande IPhone, IPad (2, 3 et mini), IPod et tablette Android SmartCaisse

COMPTA. Description des Commandes

EXERCICES DE REVISIONS MATHEMATIQUES CM2

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

Performance nette du Capital Investissement en France à fin Le 16 septembre 2008

Note de service À : De :

Exemples de problèmes et d applications. INF6953 Exemples de problèmes 1

Introduction à la programmation Travaux pratiques: séance d introduction INFO0201-1

Statistique descriptive. Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne. Notes de cours

LE PRODUIT SCALAIRE ( En première S )

OLYMPIADES ACADÉMIQUES DE MATHÉMATIQUES

Table des matières. I Mise à niveau 11. Préface

L assurance de la qualité à votre service

Etude statistique des données fournies par la CCIJP

FACTURATION. Menu. Fonctionnement. Allez dans le menu «Gestion» puis «Facturation» 1 Descriptif du dossier (onglet Facturation)

INFORMATIQUE : LOGICIELS TABLEUR ET GESTIONNAIRE DE BASES DE DONNEES

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

Le CAHIER NORMATIF pour les travaux de construction. 5. Électricité 5.4 Alarmes, communications et sécurité

Quelques tests de primalité

SERIE 1 Statistique descriptive - Graphiques

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Compter à Babylone. L écriture des nombres


Transcription:

Statistiques Descriptives ( En première S ) Dernière mise à jour : Jeudi 29 Octobre 2010 Vincent OBATON, Enseignant au lycée Stendhal de Grenoble (Année 2006-2007) Lycée Stendhal, Grenoble ( Document de : Vincent Obaton ) -1-

J aimais et j aime encore les mathématiques pour elles-mêmes comme n admettant pas l hypocrisie et le vague, mes deux bêtes d aversion. Stendhal Lycée Stendhal, Grenoble ( Document de : Vincent Obaton ) -2-

Table des matières 1 Notation 4 2 Quelques généralités et rappels 4 2.1 Tableau statistique standard.......................... 4 2.2 Effectif total d une série............................ 4 2.3 Fréquence d apparition d une valeur..................... 5 2.4 Tri à plat.................................... 5 3 Critère de position 5 3.1 Médiane..................................... 5 3.2 Quartiles.................................... 6 3.3 Déciles...................................... 6 3.4 Moyenne..................................... 7 3.5 Modes...................................... 8 4 Critère de dispersion 8 4.1 Etendue..................................... 8 4.2 Ecart Inter-Quartiles.............................. 8 4.3 Ecart Inter-Déciles............................... 8 4.4 Variance..................................... 9 4.5 Ecart-Type................................... 9 5 Représentation statistiques 10 5.1 Diagramme en boîte.............................. 10 5.2 Autres diagrammes............................... 10 5.3 Polygône des fréquences cumulées....................... 12 6 Plages de normalité des distributions normales Gaussiennes 12 Lycée Stendhal, Grenoble ( Document de : Vincent Obaton ) -3-

1 Notation La somme de n nombres numérotés de 1 à n peut s écrire : x 1 + x 2 + x 3 + x 4 + + x n 1 + x n mais cette écriture est longue et les pointillés ne sont pas satisfaisants. On écrira, pour faire moins long et éviter les pointillés, cette somme à l aide du symbole Sigma : Exemples : 1. 2. 3. nx i=0 n 1 X nx i=0 nx x i x i = x 0 + x 1 + x 2 + + x n 1 + x n i = 1 + 2 + 3 + 4 + + (n 2) + (n 1) i 2 = 0 2 + 1 2 + 2 2 + 3 2 + + (n 1) 2 + n 2 2 Quelques généralités et rappels 2.1 Tableau statistique standard On note (x i ; n i ) i N la série statistique ci-dessous : Rappels : L effectif n i est le nombre de fois où apparaît la valeur x i dans la série. valeurs x i x 1 x 2 x 3 x 4......... x k 2 x k 1 x k Effectifs n i n 1 n 2 n 3 n 4......... n k 2 n k 1 n k 2.2 Effectif total d une série L effectif total N de la série statistique est la somme de tous les effectifs ou le nombre de valeurs total dans cette série : N = n i = n 1 + n 2 + n 3 +... + n k 1 + n k Lycée Stendhal, Grenoble ( Document de : Vincent Obaton ) -4-

2.3 Fréquence d apparition d une valeur La fréquence d apparition d une valeur x i est la proportion de cette valeur par rapport à l effectif total. Effectif de la valeur Fréquence par rapport à 1 : f i = = n i Effectif total N Propriétés : 2.4 Tri à plat Fréquence par rapport à 100 : F i = 100n i N S f = S F = f i = f 1 + f 2 + f 3 +... + f k 1 + f k = 1 F i = F 1 + F 2 + F 3 +... + F k 1 + F k = 100 Le tri à plat d une série statistique est un tableau contenant les valeurs de la série, les effectifs, les effectifs cumulés croissants, les fréquences, les fréquences cumulées croissantes, les pourcentages et les pourcentages cumulés croissants. valeurs x i x 1 x 2 x 3......... x k 1 x k Effectifs n i n 1 n 2 n 3......... n k 1 n k Effectifs Cum Croi N i n 1 N 1 + n 2 N 2 + n 3......... N k 2 + n k 1 N Fréquences f i f 1 f 2 f 3......... f k 1 f k Fréquences Cum Croi F i f 1 F 1 + f 2 F 2 + f 3......... F k 2 + f k 1 1 Pourcentages p i p 1 p 2 p 3......... p k 1 p k Pourcentages Cum Croi P i p 1 P 1 + p 2 P 2 + p 3......... P k 2 + p k 1 100 3 Critère de position 3.1 Médiane La médiane d une série statistique est la valeur qui partage cette série en deux séries de même effectif. Lycée Stendhal, Grenoble ( Document de : Vincent Obaton ) -5-

Si M e est la médiane de la série statistique, alors : 50 % des valeurs de la série sont inférieures ou égales à M e 50 % des valeurs de la série sont supérieures ou égales à M e Méthode pour trouver la médiane : Il faut commencer par classer la série dans l orde croissant. Si N est impair alors la médiane est la N + 1 ième valeur de la série. 2 Si N est pair alors la médiane est la N 2 3.2 Quartiles + 1 ième valeur de la série. Les quartiles d une série statistique sont les valeurs qui partagent cette série en quatre séries de même effectif. Si Q 1 est le premier quartile et Q 3 le troisième de la série statistique, alors : 25 % des valeurs de la série sont dans [Min, Q 1 ] 50 % des valeurs de la série sont dans [Q 1, Q 3 ] 25 % des valeurs de la série sont dans [Q 3, Max] Méthode pour trouver les quartiles : Il faut commencer par classer la série dans l orde croissant. On utilisera une méthode approximative mais qui donnera des résultats significatifs pour des séries à grands effectifs. (Autement il suffit de couper en deux les deux séries [Min, M e ] et [M e, Max]) Calculer N 4 et on note a l entier supérieur à N 4. Calculer 3N 4 et on note b l entier supérieur à 3N 4. Q 1 est la a ième valeur de la série statistique. Q 3 est la b ième valeur de la série statistique. 3.3 Déciles Les déciles d une série statistique sont les valeurs qui partagent cette série en dix séries de même effectif. Lycée Stendhal, Grenoble ( Document de : Vincent Obaton ) -6-

Si D 1 est le premier décile et D 9 le neuvième de la série statistique, alors : 10 % des valeurs de la série sont dans [Min, D 1 ] 80 % des valeurs de la série sont dans [D 1, D 9 ] 10 % des valeurs de la série sont dans [D 9, Max] Méthode pour trouver les déciles : Il faut commencer par classer la série dans l orde croissant. On utilisera une méthode approximative mais qui donnera des résultats significatifs pour des séries à grands effectifs. Calculer N 10 et on note a l entier supérieur à N 10. Calculer 9N 9N et on note b l entier supérieur à 10 10. D 1 est la a ième valeur de la série statistique. D 9 est la b ième valeur de la série statistique. 3.4 Moyenne La moyenne arithmétique de la série statistique est le nombre : x = 1 N x i ni = x 1n 1 + x 2 n 2 + x 3 n 3 +... + x k 1 n k 1 + x k n k N ou x = Propriétés de la moyenne : x i f i = x 1 f 1 + x 2 f 2 + x 3 f 3 +... + x k f k 1. Si x est la moyenne d un groupe d effectif N 1 et y la moyenne d un groupe d effectif N 2 alors la moyenne z de la série constituée de l ensemble des deux groupes est : z = N 1x + N 2 y N 1 + N 2 2. Si x est la moyenne d une série (x i, n i ) alors la moyenne de la série (ax i + b, n i ) est : y = ax + b Lycée Stendhal, Grenoble ( Document de : Vincent Obaton ) -7-

3. Moyenne élaguée : Quand une valeur aberrante, correspondant à une erreur de mesure ou à une situation exceptionnelle, est présente dans une série, elle influence considérablement la valeur moyenne. Une moyenne calculée après avoir enlevé certaines valeurs est appelée Moyenne elaguée. 3.5 Modes Les modes d une série sont les valeurs ayant le plus grand effectif. 4 Critère de dispersion 4.1 Etendue L étendue d une série statistique est la différence entre la plus grande valeur et la plus petite, de la série. Et = Max Min 4.2 Ecart Inter-Quartiles 4.3 Ecart Inter-Déciles L écart inter-quartiles est la différence entre Q 3 et Q 1 E Q = Q 3 Q 1 L intervalle inter-quartiles est l intervalle entre Q 1 et Q 3 I Q = [Q 1, Q 3 ] L écart inter-déciles est la différence entre D 9 et D 1 E D = D 9 D 1 L intervalle inter-déciles est l intervalle entre D 1 et D 9 I D = [D 1, D 9 ] Lycée Stendhal, Grenoble ( Document de : Vincent Obaton ) -8-

4.4 Variance Certaines séries statistiques peuvent avoir les mêmes critères de position comme la médiane et la moyenne. Pour les différencier on va utiliser un nouvel outil qui va mesurer la dispersion de la série autour de la moyenne. On souhaite trouver une mesure de l écart entre les valeurs de la série et sa moyenne. Si cet écart est grand alors la série est très hétérogène et les valeurs sont éloignées de la moyenne sinon si cet écart est petit la série est homogène et les valeurs rapprochées autour de la moyenne. On pourrait calculer la moyenne des écarts à la moyenne mais celle-ci donne toujours 0 à cause des écarts qui sont opposés. Démonstration : (x x) = 1 N (x x i )n i = 1 N (xni x i n i ) = 1 N xni 1 N = x 1 ni x = x N N N x = x x = 0 Pour éviter ce problème, on va faire la moyenne des carrées des écarts à la moyenne. On note ce résultat, la variance de la série. La variance d une série statistique est la moyenne des carrées des écarts à la moyenne de chacune des valeurs. valeurs x i x 1 x 2 x 3... x k 1 x k Effectifs n i n 1 n 2 n 3... n k 1 n k (x x i ) 2 (x x 1 ) 2 (x x 2 ) 2 (x x 3 ) 2... (x x k 1 ) 2 (x x k ) 2 La variance de la série est donc la moyenne de la dernière ligne du tableau ci-dessus : 4.5 Ecart-Type V (x) = 1 N V (x) = ou (x x i ) 2 n i (x x i ) 2 f i L écart-type σ est la racine carrée de la variance pour revenir aux même unités que les valeurs de la série statistique. Propriété : σ = È V (x) x i n i Lycée Stendhal, Grenoble ( Document de : Vincent Obaton ) -9-

Si on a deux séries S 1 et S 2 d écart-type respectifs σ 1 et σ 2 Si σ 1 < σ 2 alors la série S 1 est plus homgène que la série S 2 ou la série S 2 est plus hétérogène que la série S 1. 5 Représentation statistiques 5.1 Diagramme en boîte Les diagrammes en boîte, ou boîtes à moustaches, sont des diagrammes permettant de comparer rapidement des séries statistiques. 5.2 Autres diagrammes Diagramme en barres (Histogrammes) : Lycée Stendhal, Grenoble ( Document de : Vincent Obaton ) -10-

Diagramme en bâtons : Diagramme en camembert : Lycée Stendhal, Grenoble ( Document de : Vincent Obaton ) -11-

5.3 Polygône des fréquences cumulées Le polygône des fréquences cumulées (en pourcentages) permet de lire rapidement la médiane et les quartiles d une séries statistique : 6 Plages de normalité des distributions normales Gaussiennes Lorsque l on fait des statistiques sur une grande quantitié de valeurs, il arrivent souvent que l on obtienne des diagramme ayant sensiblement la même forme dite EN CLOCHE ou COURBE DE GAUSS, comme ci-dessous : Lorsque la série statistique donne une représentation graphique de la forme d une courbe de Gauss, les données sont qualifiées de données Gaussiennes. Lycée Stendhal, Grenoble ( Document de : Vincent Obaton ) -12-

Proriétés (Plages de normalité) : On note x la moyenne de la série et σ l écart-type de la série. 1. Environ 68 % des données se trouvent dans l intervalle [x σ, x + σ] On nomme cet intervalle la plage de normalité pour le niveau de confiance 0.68 2. Environ 95 % des données se trouvent dans l intervalle [x 2σ, x + 2σ] On nomme cet intervalle la plage de normalité pour le niveau de confiance 0.95 3. Environ 99 % des données se trouvent dans l intervalle [x 3σ, x + 3σ] On nomme cet intervalle la plage de normalité pour le niveau de confiance 0.99 Lycée Stendhal, Grenoble ( Document de : Vincent Obaton ) -13-