Cours de statistique descriptive



Documents pareils
1. Vocabulaire : Introduction au tableau élémentaire

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Statistiques Descriptives à une dimension

Le Moyen-Orient depuis `1990: carte `1

Statistique : Résumé de cours et méthodes

Statistiques descriptives sous Excel. Lætitia Perrier Bruslé Cours de statistique descriptive sous Excel

Séries Statistiques Simples

Statistique Descriptive Élémentaire

LES DIFFERENTS TYPES DE MESURE

Perspectives économiques régionales du Moyen-Orient et de l Afrique du Nord

Représentation d une distribution

Élément 424b Introduction à la statistique descriptive

Traitement des données avec Microsoft EXCEL 2010

SERIE 1 Statistique descriptive - Graphiques

CHAPITRE 2. Les variables

Introduction à la statistique descriptive

Logiciel XLSTAT version rue Damrémont PARIS

SIG ET ANALYSE EXPLORATOIRE

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Statistique descriptive. Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne. Notes de cours

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Base de données sur l'économie mondiale Alix de Saint Vaulry *

FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Moyen-Orient et Afrique du Nord : définir la voie à suivre

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

BOURSES SCOLAIRES. au bénéfice des enfants français résidant avec leur famille à l étranger AGENCE POUR L ENSEIGNEMENT FRANÇAIS À L ÉTRANGER

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Relation entre deux variables : estimation de la corrélation linéaire

Sommaire INVESTIR AU MAROC

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Annexe commune aux séries ES, L et S : boîtes et quantiles

Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire :

A. Liste des pays tiers dont les ressortissants doivent être munis d un visa pour traverser la frontière nationale. 1.

Chapitre 3 : INFERENCE

AFFAIBLISSEMENT DÛ AUX NUAGES ET AU BROUILLARD

Les relations commerciales entre les pays méditerranéens

Le Moyen-Orient et le pétrole. pp32-39

Statistiques 0,14 0,11

Extrait d'acte de naissance de moins de trois mois traduit en français.

Qu est-ce qu une probabilité?

Où sont les Hommes sur la Terre

T de Student Khi-deux Corrélation

Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»

Chapitre 1. La démarche statistique appliquée au management. Minicas. Questions :

Passeport en cours de validité avec copie des pages relatives à l'identité, validité et visa d'entrée en France.

Loi binomiale Lois normales

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Statistiques avec la graph 35+

BASE DE DONNEES - MONDE

MATHÉMATIQUES. Mat-4104

MODÈLE CROP DE CALIBRATION DES PANELS WEB

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Collecter des informations statistiques

Sommaire. Rentabilité du retour d une franchise de baseball de la Ligue majeure de baseball à Montréal (les «Expos»)

Aide-mémoire de statistique appliquée à la biologie

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

BULLETIN OFFICIEL DES DOUANES ET DES IMPOTS. Texte n DGI 2011/25 NOTE COMMUNE N 16/2011

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Sommaire INVESTIR AU MAROC

Le projet DRIAS : premières études et documents

Validation probabiliste d un Système de Prévision d Ensemble

Principe d un test statistique

Disparités entre les cantons dans tous les domaines examinés

Statistiques descriptives

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

FOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS

Classe de première L

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Question 2 Le Proche et le Moyen-Orient, un foyer de conflits depuis la fin de la Première Guerre mondiale

Fiche récapitulative 2013/14 Sommaire des réformes Doing Business au Moyen-Orient et en Afrique du Nord 1

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

THESAURUS ENTREPRISES PUBLIQUES

Pays arabes du Moyen-Orient

SAEGIS SUR SERION DES BASES DE DONNÉES DIVERSIFIÉES. UNE COUVERTURE MONDIALE. THOMSON COMPUMARK. Registre international.

REGARDS SUR L ÉDUCATION 2013 : POINTS SAILLANTS POUR LE CANADA

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

LA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE

La mobilité des étudiants du Moyen-Orient

IBM SPSS Direct Marketing 21

Pays pétroliers et gaziers du Maghreb et du Moyen-Orient

Les bases de données Les systèmes d informations

EXCEL et base de données

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

ACCORD RELATIF AU TRANSIT DES SERVICES AÉRIENS INTERNATIONAUX SIGNÉ À CHICAGO LE 7 DÉCEMBRE 1944

Notes méthodologiques

Biostatistiques : Petits effectifs

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Introduction au datamining

Statistiques - Cours. 1. Gén éralités. 2. Statistique descriptive univari ée. 3. Statistique descriptive bivariée. 4. Régression orthogonale dans R².

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION

INTRODUCTION A LA MACROECONOMIE Séance de travaux dirigés n 4 Construction des comptes de secteur

- Ressources pour les classes

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Projet de Traitement du Signal Segmentation d images SAR

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

Transcription:

Cours de statistique descriptive Séance 1 : Les caractères et la mise en forme des données Lætitia Perrier Bruslé Cours de statistique descriptive

Les statistiques et la géographie La géographie est une science sociale Les statistiques sont un instrument de mesure des phénomènes géographiques Approche numérique d un problème Raisonnement basé sur un échantillon

Organisation de la statistique La statistique descriptive et la statistique inférentielle La statistique descriptive Population Résumé Ecart-type Moyenne Elle permet de résumer quantitativement l'information recueillie sur un ensemble d'éléments au moyen d'une investigation exhaustive. C'est la statistique descriptive, qui fait l'objet de ce cours.

Organisation de la statistique La statistique descriptive et la statistique inférentielle La statistique inférentielle Echantillon Inférence Population Sondage? Elle permet de généraliser à de grands ensembles d'éléments les conclusions tirées des résultats obtenus avec des ensembles beaucoup plus restreints appelés échantillons. C'est la statistique inférentielle ou probabiliste, qui n'est pas abordée dans cette UE

La statistique univariée, bivariée, multivariée Univariée A chaque élément d un ensemble correspond un seul caractère Statistique bivariée ou multivariée A chaque élément d un ensemble correspond plusieurs caractères L objet de cette statistique sera de repérer les distributions homogènes et celles qui ne le sont pas

Plan des séances TD 1 : Le Tableau élémentaire TD 2 : La valeur centrale (moyenne, médiane, mode) TD 3 : Réflexion sur la valeur centrale : calcul et utilisation des paramètres de dispersion (moyenne pondérée, moyenne sur des classes). TD 4 : Représentation graphique : (Diagramme en barre ; histogramme et courbe de fréquence cumulée) TD 5 : Tableau de contingence avec standardisation

II Le tableau élémentaire Lætitia Perrier Bruslé Cours de statistique descriptive

Le tableau élémentaire : définition C'est un tableau à simple entrée où les lignes correspondent aux éléments de l'ensemble étudié et les colonnes aux caractères (ou variables) décrivant ces éléments. La première colonne est en principe réservée à la liste nominale des éléments.

Les États du Proche-Orient Nom Ar Saoudite Bahreïn N 1 2 superficie en milliers de km² 2 150 0.700 place pour la superficie 1 14 population en millions 21.4 0.7 densité PIB en hab/km2 Elément 1 10 Elément 2 1 035 $ 7 230 9 370 monnaie riyal dinar bahr fécondité en nbre enf/fem 5.7 2.8 façade littorale Mer Rouge Golfe Persique consommation d énergie kgep/h 4 204 9 000 Em Ara Unis 3 84 9 3 35.6 - dirham 3.5 Golfe Persique 9 977 Egypte Iran Irak Israël Jordanie 4 5 6 7 8 1 001 Caractère 1 1 633 438 21 89 3 Caractère 2 2 5 10 8 65.2 Caractère 3 64.7 23.7 6.4 5 65 40 54.3 309 57 1 530 1 750-16 710 1 750 livre égy rial iranien dinar irak shekel dinar jor 3.5 2.6 5.3 3 3.6 Mer Méditer Golfe Persique Golfe Persique Mer Méditer Mer Méditer 709 1 651 1 263 3 029 1 028 Koweït 9 18 11 2 115 18 030 dinar kow 4.2 Golfe Persique 8 984 Liban 10 10 13 4.4 429 4 010 livre lib 2.5 Mer Méditer 1 280 Oman 11 212 6 2.4 11.5 - ryal oman 6.1 Mer d Oman 3 607 Qatar 12 11 12 0.6 54.3 - rial qat 3.9 Golfe Persique 28 262 Syrie 13 185 7 16.6 90 1 000 livre syr 4.1 Mer Méditer 1 143 Yémen 14 528 4 18 34 460 rial 7.2 Golfe d Aden 184

Ensemble C'est la collection (le plus souvent finie en géographie) d'unités, ou d'éléments, sur laquelle porte l'observation. Pour que cet ensemble soit correctement défini, il faut lui donner une définition précise de façon à ce que deux personnes différentes aboutissent toujours à la même liste d'éléments. L'ensemble des éléments observés sera appelé E Le titre du tableau élémentaire défini l ensemble observé sans ambiguité

Les États du Proche-Orient Nom N superficie en milliers de km² place pour la superficie population en millions densité hab/km2 PIB en $ monnaie fécondité en nbre enf/fem façade littorale consommatio n d énergie kgep/h Ar Saoudite 1 2 150 1 21.4 10 7 230 riyal 5.7 Mer Rouge 4 204 Bahreïn 2 0.700 14 0.7 1 035 9 370 dinar bahr 2.8 Golfe Persique 9 000 Em Ara Unis 3 84 9 3 35.6 - dirham 3.5 Golfe Persique 9 977 Egypte 4 1 001 3 65.2 65 1 530 livre égy 3.5 Mer Méditer 709 Iran 5 1 633 2 64.7 40 1 750 rial iranien 2.6 Golfe Persique 1 651 Irak 6 438 5 23.7 54.3 - dinar irak 5.3 Golfe Persique 1 263 Israël 7 21 10 6.4 309 16 710 shekel 3 Mer Méditer 3 029 Jordanie 8 89 8 5 57 1 750 dinar jor 3.6 Mer Méditer 1 028 Koweït 9 18 11 2 115 18 030 dinar kow 4.2 Golfe Persique 8 984 Liban 10 10 13 4.4 429 4 010 livre lib 2.5 Mer Méditer 1 280 Oman 11 212 6 2.4 11.5 - ryal oman 6.1 Mer d Oman 3 607 Qatar 12 11 12 0.6 54.3 - rial qat 3.9 Golfe Persique 28 262 Syrie 13 185 7 16.6 90 1 000 livre syr 4.1 Mer Méditer 1 143 Yémen 14 528 4 18 34 460 rial 7.2 Golfe d Aden 184 Quel est l ensemble observé? En donner une définition précise.

Éléments Les éléments sont les objets constitutifs de l'ensemble. Ce sont des objets déterminés dont l'appartenance à tel ou tel ensemble E est sans ambiguïté. Les éléments peuvent être désignés par leur position dans le tableau de données : 1 pour le premier, i pour un élément quelconque, N pour le dernier élément. Nb : éléments = individus Exemple : stock de matériels, réponses à une question, population française.

Combien d éléments composent cet ensemble? Exemple d éléments? Repérer le code, identificateur? Le nom?

III Les caractères dans le tableau élémentaire Lætitia Perrier Bruslé Cours de statistique descriptive

Caractère (ou variable) Les éléments d'un ensemble sont décrits par un caractère. Le caractère est une propriété que tous les individus d un ensemble possède même si ça modalité est différente (ex : le sexe d une population : tout le monde à un sexe, mais la modalité est différente : F ou M, ex : l âge etc). Cela revient à établir une correspondance entre chaque élément i de l'ensemble E et l'ensemble X des modalités ou des valeurs du caractère. La fonction f E --> X i --> xi est une application au sens mathématique: chaque élément de E a une modalité (caractère qualitatif) ou une valeur (caractère quantitatif) et une seule dans X.

Caractère Exemple E = Les Etats et territoires Americains avec E = { Honduras, Belize, Brésil,...} X = Statut politique en 1989 avec X = { "dépendant"; "indépendant"} Pour chaque élément de E on peut établir une application dans l'ensemble du caractère Statut Politique

Différents types de caractère 1) Les caractères qualitatif : MODALITES Caractère qualitatif : deux types : nominal et ordinal Les nominaux ne sont pas mesurables, ce sont des noms ou ce qui revient au même des sigles ou des codes. Les différentes modalités ne sont pas ordonnables. Attention, même si les modalités sont des codes numériques, les opérations sur les modalités n'ont aucun sens. Exemple Ex 1 : type de relief avec trois modalités (plaine, montagne, plateau) Ex 2 : taille de la ville avec quatre modalités (petite, moyenne, grande, très grande) Les caractères ordinaux, ils s expriment sur une échelle ordinale: chaque modalité est explicitement significative du rang pris par chaque individu pour le caractère considéré. Si E possède N éléments, les modalités seront 1er, 2eme, 3eme etc?. Comme on possède juste l'ordre des individus, on ne sait rien de l'intervalle des valeurs. Exemple: Rang des départements pour la population en 1999.

Différents types de caractère 2) Les caractères quantitatif : MESURES Les caractères quantitatifs expriment des quantités issus d une mesure (ex : superficie) ou d un dénombrement (ex : nombre d enfant par ménage). Il est possible de les ordonner et de de faire des calculs dessus Deux types de caractères quantitatifs Les caractères quantitatifs repérable ou mesurable Les caractères quantitatifs de stock ou de taux

Caractère quantitatif repérable ou mesurable Quantitatif repérable sur une échelle d'intervalle. Ces caractères permettent de repérer la position de chaque élément par rapport à une origine arbitraire. La valeur 0 est donc conventionnelle et ne signifie pas l'absence du phénomène. Exemple: Latitude, longitude, température, altitude,... Quantitatif mesurable sur une échelle numérique. Le 0 signifie bien l'absence du phénomène Exemple: population, taux de fécondité, précipitations

Caractères quantitatifs de stock ou de taux Les caractères quantitatifs de stock expriment des quantités concrètes : la somme des valeurs prises par l'ensemble E des éléments a un sens. Exemple: Population totale d'un département. Les caractères quantitatifs de taux expriment le rapport entre deux valeurs, on les appelle parfois caractères de rapport. Leur total n'a pas de signification. Exemple: Densité de population d'un département Exemple : proportion des actifs chômeurs à une date donnée.

Caractère quantitatif discret ou continu Les caractères quantitatifs discrets sont des caractères dont les différentes situations où peuvent se trouver les éléments sont des nombres isolés dont la liste peut être établie a priori. Exemple: Nombre de villes de plus de 100 000 h dans chaque département, Nombre d enfants par foyer Les caractères quantitatifs continus sont des caractères les différentes situations où peuvent se trouver les éléments ne sont pas dénombrables et qui sont définies sur un intervalle (continu) de valeur donnée. Exemples: Superficie des départements, Altitude moyenne des départements, salaire moyen des employés en 1999

En résumé Un caractère quantitatif doit être caractérisé par un point Exhaustif (autant de modalités que d élément) ou discret (moins de modalités que d éléments) Un caractère qualitatif doit être caractérisé par trois points Repérable ou mesurable De Stock ou de Taux Discret ou continu Intérêt de la définition des caractères : Il est très important de savoir définir le type d'un caractère car les outils statistiques ou les représentations graphiques ne sont pas les mêmes selon le type de caractère à étudier.

Exercice : à partir du tableau des États du moyen Orient définir la nature de chaque caractère Superficie Rang Population Densité Pib/hab Monnaie Fécondité Façade Cons NRJ Qual/quant Ord ou non Mesurable ou non Taux ou stock Discrète ou continu

Exercice : à partir du tableau des États du moyen Orient définir la nature de chaque caractère Superficie Rang Population Densité Pib/hab Monnaie Fécondité Façade Cons NR J Qual/quant Quant. Qual. Quant. Quant. Quant. Qual. Quant. Qual. Quant. Ord ou non Ord. Non ord. Non ord. Mesurable ou non Mesurable Mesurable Mesurabl e Mesurabl e Mesurabl e Mesurabl e Taux stock ou Stock Stock Taux Taux Taux Taux Discrète ou continu Continue Discrète. Continue Continue Continue Continue

IV Spécificité du tableau élémentaire Lætitia Perrier Bruslé Cours de statistique descriptive

Le tableau élémentaire Le tableau élémentaire possède deux caractéristiques c est un tableau brut, de collecte de l'information à chaque élément (unité spatiale) correspond une modalité de la variable En fait c est une application mathématique : à chaque élément de l ensemble E correspond une modalité du caractère j E = ensemble observé Des unités géographiques X = ensemble des modalités De la variable

Le tableau de dénombrement Le tableau de dénombrement au contraire : est un tableau élaboré de construction de l'information : construit à partir du tableau élémentaire. à chaque modalité de la variable correspond un certain nombre d'unités statistiques appelées effectif* de la modalité En général, il y a autant de tableaux de dénombrement qu'il y a de variables les unités statistiques deviennent anonymes regroupées dans leur modalité Caractère ou variable (regroupé en classe) 100 000-200 000 (nom des modalités) Effectif des classes Nombre d éléments

Exercice : à partir du document 2 reconstruire un tableau élémentaire