Chapitre II : Analyse univariée

Documents pareils
Statistiques Descriptives à une dimension

Séries Statistiques Simples

Statistique : Résumé de cours et méthodes

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

1. Vocabulaire : Introduction au tableau élémentaire

Résolution d équations non linéaires

Annexe commune aux séries ES, L et S : boîtes et quantiles

3. Caractéristiques et fonctions d une v.a.

Table des matières. I Mise à niveau 11. Préface

Chapitre 3. Les distributions à deux variables

Moments des variables aléatoires réelles

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Représentation d une distribution

CAPTEURS - CHAINES DE MESURES

TD1 Signaux, énergie et puissance, signaux aléatoires

Comparaison de fonctions Développements limités. Chapitre 10

Programmation Linéaire - Cours 1

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Statistiques 0,14 0,11

Statistiques - Cours. 1. Gén éralités. 2. Statistique descriptive univari ée. 3. Statistique descriptive bivariée. 4. Régression orthogonale dans R².

Programmation linéaire

Statistique Descriptive Élémentaire

Oscillations libres des systèmes à deux degrés de liberté

Statistique descriptive. Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne. Notes de cours

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Fonctions homographiques

Logiciel XLSTAT version rue Damrémont PARIS

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

Chp. 4. Minimisation d une fonction d une variable

Observatoire Economique et Statistique d Afrique Subsaharienne

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

Chap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1

Projet de Traitement du Signal Segmentation d images SAR

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Optimisation Discrète

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Quelques tests de primalité

M2 IAD UE MODE Notes de cours (3)

3 Approximation de solutions d équations

La classification automatique de données quantitatives

Document d orientation sur les allégations issues d essais de non-infériorité

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

Licence MASS (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

DOCM Solutions officielles = n 2 10.

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Résumé du Cours de Statistique Descriptive. Yves Tillé

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

SERIE 1 Statistique descriptive - Graphiques

Classe de première L

Catalogue des connaissances de base en mathématiques dispensées dans les gymnases, lycées et collèges romands.

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Théorie des sondages : cours 5

Exercices supplémentaires sur l introduction générale à la notion de probabilité

FORMULAIRE DE STATISTIQUES

STATISTIQUES DESCRIPTIVES

PROBABILITES ET STATISTIQUE I&II

Fonctions de plusieurs variables

PRXSENTATION D UN GESTIONNAIRE DE DONNEES NUMERIQUES HIERARCHISEES DESTINE AU DE- -POUILLEMENT D ENQUETES

LISTE D EXERCICES 2 (à la maison)

Polynômes à plusieurs variables. Résultant

Leçon N 4 : Statistiques à deux variables

Programmes des classes préparatoires aux Grandes Ecoles

Lecture graphique. Table des matières

Window Dressing des comptes consolidés : les écarts de consolidation positifs

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

MATHÉMATIQUES. Mat-4104

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Probabilités sur un univers fini

Limites finies en un point

LA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE

Sites web éducatifs et ressources en mathématiques

COURS EULER: PROGRAMME DE LA PREMIÈRE ANNÉE

Cours Fonctions de deux variables

CHAPITRE IV Oscillations libres des systèmes à plusieurs degrés de liberté

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Probabilités III Introduction à l évaluation d options

STATISTIQUES DESCRIPTIVES

Modèles et Méthodes de Réservation

Probabilités sur un univers fini

aux différences est appelé équation aux différences d ordre n en forme normale.

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Texte Agrégation limitée par diffusion interne

Relation entre deux variables : estimation de la corrélation linéaire

FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1

CHAPITRE V SYSTEMES DIFFERENTIELS LINEAIRES A COEFFICIENTS CONSTANTS DU PREMIER ORDRE. EQUATIONS DIFFERENTIELLES.

Section «Maturité fédérale» EXAMENS D'ADMISSION Session de février 2014 RÉCAPITULATIFS DES MATIÈRES EXAMINÉES. Formation visée

CH.6 Propriétés des langages non contextuels

Parc des Bois de Grasse - 1 rue Louison Bobet GRASSE

TABLE DES MATIERES. C Exercices complémentaires 42

Baccalauréat technique de la musique et de la danse Métropole septembre 2008

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Complément d information concernant la fiche de concordance

Mortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine

Raisonnement probabiliste

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Transcription:

1 / 31 Chapitre II : Analyse

2 / 31 introduction Les premières correctement élaborées ont été celles des recensements démographiques. Ainsi le vocabulaire statistique est essentiellement celui de la démographie. Les ensembles étudiés sont appelés population. Les éléments de la population sont appelés individus ou unités. La population est étudiée selon un ou plusieurs caractères.

introduction (suite) : Pour recueillir des informations sur une population statistique, l on dispose de deux méthodes : la méthode exhaustive ou recensement où chaque individu de la population est étudié selon le ou les caractères étudiés. la méthode des sondages ou échantillonnage qui conduit à n examiner qu une fraction de la population, un échantillon. L échantillonnage représente l ensemble des opérations qui ont pour objet de prélever un certain nombre d individus dans une population donnée. Pour que les résultats observés lors d une étude soient généralisables à la population statistique, l échantillon doit être représentatif de cette dernière, c est à dire qu il doit refléter fidèlement sa composition et sa complexité. 3 / 31

Définition 1 On appelle effectif de la modalité x i, le nombre n i des individus ω tel que X(ω) = x i (Cas discret) 2 On appelle effectif de la classe [x i 1, x i [, le nombre n i des individus ω tel que X(ω) [x i 1, x i [ (Cas continu) Remarque p On a n i = N. l effectif total. i=1 Définition (Série statistique) Une série statistique est l ensemble des couples (x i ; n i ) ou ([x i ; x i+1 [; n i ). 4 / 31

5 / 31 base (suite) : Définition On appelle fréquence de la modalité x i ou de la classe [x i 1, x i [, le nombre f i tel que f i = n i N Définition i 1 On appelle effectif cumulé en x i, le nombre n j. 2 On appelle fréquences cumulées en x i, le nombre F i tel i que F i = f j. j=1 j=1

6 / 31 base (suite) : Remarque On peut noter que p f j = 1 j=1 p n j = N, taille de l échantillon j=1 en effet p f j = j=1 p j=1 n i N = 1 N p n i = 1 N N = 1 j=1

7 / 31 base (suite) : En général une série statistique à caractère discret se présente sous la forme : Valeurs x 1 x 2 x p Effectifs n 1 n 2 n p Fréquences f 1 f 2 f p TABLE : caractère discret et pour un caractère continue, on a la représentation suivante : classes [x 0 ; x 1 [ [x 1 ; x 2 [ [x p 1 ; x p ] effectifs n 1 n 2 n p fréquences f 1 = n 1 N f 1 = n 2 N f p = n p N TABLE : caractère continu

base (suite) : Exemple (caractère discret) Soit un échantillon de 64 familles. Le caractère étant le nombre d enfants par famille (tableau 2.1) x i 0 1 2 3 4 5 n i 16 18 14 11 3 2 f i = n i /n E.C.C E.C.D Avec : x i : Nombre d enfants, n i : Nombres de familles, f i = n i /n : Fréquence E.C.C : Effectifs cumulés croissants E.C.D : Effectifs cumulés décroissants 8 / 31

base (suite) : Exemple (caractère discret) Soit un échantillon de 64 familles. Le caractère étant le nombre d enfants par famille (tableau 2.1) x i 0 1 2 3 4 5 n i 16 18 14 11 3 2 f i = n i /n 0.25 0.281 0.218 0.172 0.047 0.031 E.C.C 16 34 48 59 62 64 E.C.D 64 48 30 16 5 2 Avec : x i : Nombre d enfants, n i : Nombres de familles, f i = n i /n : Fréquence E.C.C : Effectifs cumulés croissants E.C.D : Effectifs cumulés décroissants 9 / 31

base (suite) : Exemple (caractère continu) Soit un echantillon de 80 personnes d une collectivité portant sur la taille. On adopte un intervalle de classe de 0,05 m. (tableau 3.1) classe Effectif E.C.C E.C.D [1.55 ;1.60[ 3 [1.60 ;1.65[ 12 [1.65 ;1.70[ 18 [1.70 ;1.75[ 25 [1.75 ;1.80[ 15 [1.80 ;1.85[ 5 [1.85 ;190[ 2 10 / 31

base (suite) : Exemple (caractère continu) Soit un echantillon de 80 personnes d une collectivité portant sur la taille. On adopte un intervalle de classe de 0,05 m. (tableau 3.1) classe Effectif E.C.C E.C.D [1.55 ;1.60[ 3 3 80 [1.60 ;1.65[ 12 15 77 [1.65 ;1.70[ 18 33 65 [1.70 ;1.75[ 25 58 47 [1.75 ;1.80[ 15 73 22 [1.80 ;1.85[ 5 78 7 [1.85 ;190[ 2 80 2 11 / 31

12 / 31 : Paramètres de position a/ Dominante ou mode Définition Lorsque la variable est discrète, une dominante ou mode est une valeur du caractère qui correspond à un effectif maximum. La série est unimodale, bimodale lorsque le nombre de modes est 1, 2. Lorsque la variable est continue, une classe modale correspondra à un effectif maximum.

13 / 31 Exemples 1 Considérons la série statistique de l exemple 2 : le mode est 1 enfant puisqu il est associé à l effectif maximum 18. 2 Considérons la série statistique de l exemple 4 : la classe modale est [1.70 1.75[ puisqu il est qui corespond à l effectif maximum 25.

14 / 31 (suite) : b/ Moyenne arithmétique Définition Lorsque la variable est discrète la moyenne arithmétique X de la série statistique est la moyenne pondérée X = p i=1 n ix i p i=1 n i = n 1x 1 + n 2 x 2 + + n p x p N Lorsque la variable est continue la moyenne est : X = p i=1 n ic i p i=1 n i où les c i = x i + x i+1 2 sont les centres des classes.

15 / 31 (suite) : Théorème X + b = X + b ax = ax

16 / 31 Exemples 1)Le nombre moyen d enfants par famille de la série statistique de l exemple 2 est : X = = 2)Pour la série statistique de l exemple 4, la taille moyenne d une personne est X = =

17 / 31 Exemples 1)Le nombre moyen d enfants par famille de la série statistique de l exemple 2 est : X = 1 (16 0 + 1 18 + 2 14 + 3 11 + 4 3 + 5 2) 64 = 90 64 2)Pour la série statistique de l exemple 4, la taille moyenne d une personne est X = 3 1.575 + 12 1.625 + 18 1.675 + 25 1.725 80 15 1.775 + 5 1.825 + 2 1.875 + 80 = 137 80

18 / 31 (suite) : c/ Médiane Définition La médiane, Me, est la valeur du caractère pour laquelle la fréquence cumulée est égale à 0,5 ou 50%. Elle correspond donc au centre de la série statistique classée par ordre croissant, ou à la valeur pour laquelle 50% des valeurs observées sont supérieures et 50% sont inférieures.

Remarques : Dans le cas où les valeurs prises par le caractère étudié ne sont pas regroupées en classe, si n est impair, alors n = 2m + 1 et la médiane est la valeur du milieu Me = x m+1. si n est pair, alors n = 2m et une médiane est une valeur quelconque entre x m et x m+1. Dans ce cas Me = x m + x m+1. 2 Dans le cas où les valeurs prises par le caractère étudié sont groupées en classe, on cherche la classe contenant le n e individu de l échantillon. En supposant que tous les 2 individus de cette classe sont uniformément répartis à l intérieur,la position exacte du ne individu est déterminée 2 de la façon suivante (par interpolation linéaire) : 19 / 31

(suite) : M e x m N 2 N m = x m+1 x m N m+1 N m donc N M e = x m + (x m+1 x m ) 2 N m N m+1 N m avec m N telle que N m N 2 < N m+1 et N m effectif cumulé de la classe [x m, x m+1 [ Remarque Dans le cas d une série groupée en classes, la médiane est représentée aussi par la valeur de la variable correspondant à l intersection du polygône des effectifs cumulés avec l horizontale représentant l effectif moitié 20 / 31

21 / 31 Exemples : 1) Les données suivantes représentent le capital social en 10 3 de 17 sociétés marocaines créées entre le 20 et 24-10-1995 (les valeurs du caractère étudié sont classé par ordre croissant) : médian 90 {}}{ 10; 10; 20; 20; 30; 50; 50; 50; ; 100; 100; 100 ; 100 ; 200 ; 200 ; 200 ; 300 }{{}. Le nombre de valeurs observées est 17 (impaire). Dans ce cas, le capital médian est le neuvième ( c.à.d 90 ) car il divise le nombre de sociétés en 2 ensembles égaux : 8 sociétés sont créées avec un capital inférieur à 90 000 DH et 8 autres sont créées avec un capital supérieur à 90 000 DH. Donc Me=90 000

Exemples :[suite] 2) Les capacités de production de 10 sucreries au Maroc en 1993 (en 10 3 tonnes) sont les suivants : médian {}}{ {}}{ 30; 35; 35; 45; 50 ; 51; 78; 80; 90 ; 500. Le nombre de valeurs observées est 10 (paire) ; la médiane est, en effet, située ente la cinquième capacité (50) et la sixième (51). Dans ce cas-la, on peut estimer la production médiane 50 + 51 par : = 50.5 2 3) Médiane associée à la série statistique de l exemple2 : on a N = 64, les valeurs centrales sont la 32ème valeure et la 33ème valeure qui sont égales à 1. Donc la médiane est égale à 1. 4)Médiane associée à la série statistique de l exemple4 : on a N = 80 chercher la médiane revient à trouver la taille de la 40ème personne. On procède par interpolation linéaire en utilisant le polygône des effectifs cumulés. 22 / 31

23 / 31 Exemples : [suite]

Exemples : [suite] Me 1.70 1.75 1.70 On a = 40 33 58 33. 7 (1.75 1.70) = Me = 1.70 + = 1.71. 25 24 / 31

25 / 31 (suite) : Caractéristiques de disperssion Les paramètres de position sont insuffisants pour caractériser complètement une série. Par exemple, deux séries différentes ayant la même moyenne, ne se repartissent pas nécessairement de la même manière autour de cette moyenne. Elles sont plus ou moins étalées, ce qui sera décrit par les caractéristiques de dispersion. Un paramètre de dispersion se rapporte a la différence de deux valeurs du caractère alors qu un paramètre de position représente une valeur du caractère

26 / 31 (suite) : a/ Ecart moyen arithmétique Définition Écart moyen arithmétique est la moyenne arithmétique des écarts par rapport à la moyenne arithmétique X des valeurs du caractère E(X) = 1 p n i x i X N i=1 Lorsque la variable est continue l écart moyen arithmétique est : E(X) = 1 p n i c i X N i=1 où les c i = x i + x i+1 2 sont les centres des classes.

27 / 31 (suite) : b/ Variance Définition La variance d une série de valeurs du caractère est la moyenne arithmétique des carres des écarts de ces valeurs par rapport à leur moyenne arithmétique. V (X) = 1 N p n i (x i X) 2 i=1 Lorsque la variable est continue l écart moyen arithmétique est : V (X) = 1 p n i (c i X) 2 N où les c i = x i + x i+1 2 i=1 sont les centres des classes.

28 / 31 (suite) : Théorème V (X) = 1 N p i=1 V (X + b) = V (X) n i x 2 i X 2 V (ax + b) = a 2 V (X) c/ Ecart-type Définition L écart-type (ou écart quadratique moyen) est la racine carrée de la variance σ = V

29 / 31 (suite) : Définition L étendue d une série est la difference entre la plus grande et la plus petite valeur du caractère. d/ D autres définitions Soit (x i, n i ) i [1,p] ou (x i, f i ) i [1,p] une série statistique discrète. Soit N son effectif total et supposons que pour tout indice i, x i est strictement positif. On appelle moyenne harmonique de la série est le nombre h définie par 1 h = 1 N p i=1 n i x i = p f i x i i=1 ( moyenne de ( )) 1 x i

(suite) : moyenne géométrique de la série est le nombre g définie par : ( p ) 1/N p g = = x f i i. x n i i i=1 i=1 Moment d une série statistique : on appelle moment d ordre q par rapport à x 0 la moyenne arithmétique des puissances q ièmes des déviations des valeurs du caractère par rapport à x 0 notée :m q = 1 p n i (x i x 0 ) q. N - Si x 0 = 0 et q = 1, le moment n est rien d autre que la moyenne. - Si x 0 = x et q = 2, le moment n est rien d autre que la variance. i=1 30 / 31