STA240 : Statistique descriptive

Documents pareils
Statistique : Résumé de cours et méthodes

Séries Statistiques Simples

Représentation d une distribution

Statistiques Descriptives à une dimension

Annexe commune aux séries ES, L et S : boîtes et quantiles

Chapitre 3. Les distributions à deux variables

Logiciel XLSTAT version rue Damrémont PARIS

Leçon N 4 : Statistiques à deux variables

UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Statistiques 0,14 0,11

1. Vocabulaire : Introduction au tableau élémentaire

Latitude N Longitude E Altitude 376 m RÉSUMÉ MENSUEL DU TEMPS DE JANVIER 2014

Statistiques avec la graph 35+

Statistique Descriptive Élémentaire

Statistiques à une variable

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Lire ; Compter ; Tester... avec R

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

3. Caractéristiques et fonctions d une v.a.

6 ème. Rallye mathématique de la Sarthe 2013/ ère épreuve de qualification : Problèmes Jeudi 21 novembre 2013

Statistiques - Cours. 1. Gén éralités. 2. Statistique descriptive univari ée. 3. Statistique descriptive bivariée. 4. Régression orthogonale dans R².

Brock. Rapport supérieur

STATISTIQUES DESCRIPTIVES

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Bulletin d information statistique

Fonctions linéaires et affines. 1 Fonctions linéaires. 1.1 Vocabulaire. 1.2 Représentation graphique. 3eme

Introduction à l approche bootstrap

L exclusion mutuelle distribuée

STATISTIQUES DESCRIPTIVES

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Analyse en Composantes Principales

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

TSTI 2D CH X : Exemples de lois à densité 1

Traitement des données avec Microsoft EXCEL 2010

Réaliser la fiche de lecture du document distribué en suivant les différentes étapes de la méthodologie (consulter le support du TD!

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Formules et Approches Utilisées dans le Calcul du Coût Réel

Limites finies en un point

FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1

Les devoirs en Première STMG

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Statistiques descriptives

L inégale répartition de l énergie solaire est à l origine des courants atmosphériques

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Compter à Babylone. L écriture des nombres

Classe de première L

Séquence 4. Statistiques. Sommaire. Pré-requis Médiane, quartiles, diagramme en boîte Moyenne, écart-type Synthèse Exercices d approfondissement

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Evolution des risques sur les crédits à l habitat

TRAVAUX PRATIQUES SCIENTIFIQUES SUR SYSTÈME

Cours Fonctions de deux variables

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

La rémunération des concepteurs. en théâtre au Québec. de 2004 à 2006

CONVENTION DE L OFFRE e.lcl A LA CARTE

Chapitre 6 : Consolidation par paliers et consolidation directe

La médiatrice d un segment

Le parcours professionnel des chômeurs de longue durée en Suisse

IGN Usages et besoins d informations géographiques sur le littoral

Introduction à la statistique descriptive

iil est désormais courant de trouver sur Internet un document

23. Interprétation clinique des mesures de l effet traitement

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Feuille d exercices 2 : Espaces probabilisés

C f tracée ci- contre est la représentation graphique d une

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire :

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

IBM SPSS Direct Marketing 21

Mesure du volume d'un gaz, à pression atmosphérique, en fonction de la température. Détermination expérimentale du zéro absolu.

Résumé du Cours de Statistique Descriptive. Yves Tillé

Le chi carré. Le sommaire. Approche quantitative

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Note de service À : De :

Nom : Groupe : Date : 1. Quels sont les deux types de dessins les plus utilisés en technologie?

Analyse de la variance Comparaison de plusieurs moyennes

Étude sur les taux de revalorisation des contrats individuels d assurance vie au titre de 2013 n 26 mai 2014

VI. Tests non paramétriques sur un échantillon

Projet de Traitement du Signal Segmentation d images SAR

VI- Exemples de fiches pédagogiques en 3 ème année primaires

Petit lexique de calcul à l usage des élèves de sixième et de cinquième par M. PARCABE, professeur au collège Alain FOURNIER de BORDEAUX, mars 2007

Marché de l occasion et exigences de rénovation énergétique. Rencontre de l Observatoire 21 mai 2015

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Statistique Descriptive Multidimensionnelle. (pour les nuls)

SERIE 1 Statistique descriptive - Graphiques

1 Importer et modifier des données avec R Commander

Rapport de Russell sur la gestion active

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

BTS Groupement A. Mathématiques Session Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

Loi binomiale Lois normales

Problème 1 : applications du plan affine

IBM SPSS Statistics Base 20

Plus petit, plus grand, ranger et comparer

Probabilités conditionnelles Loi binomiale

Relation entre deux variables : estimation de la corrélation linéaire

Le plombier chauffagiste a aussi besoin de cette représentation pour savoir ce qu il y a à l intérieur de la maison au niveau des hauteurs.

BACCALAURÉAT PROFESSIONNEL SUJET

Transcription:

STA0 : Statistique descriptive Rappel de cours : Soit (x 1,..., x n ) un échantillon, c est-à-dire les valeurs numériques prises par un même caractère sur un ensemble de n individus. Les modalités sont les valeurs prises. La moyenne empirique est x = 1 n x i. n ( i=1 ) 1 n La variance empirique est s x = (x i ) x. n i=1 L écart-type empirique est la racine carrée de la variance empirique. Un échantillon centré et réduit a pour moyenne 0 et pour variance 1. Pour centrer et réduire un échantillon, on retranche la moyenne à toutes les modalités, puis on les divise par l écart-type. La fréquence empirique d un intervalle est le rapport du nombre de valeurs prises dans cet intervalle, au nombre total d individus. La médiane est la plus petite modalité telle qu au moins 0% des valeurs prises soient inférieures. Le premier quartile est la plus petite modalité telle qu au moins % des valeurs prises soient inférieures. Le dernier quartile est la plus petite modalité telle qu au moins 7% des valeurs prises soient inférieures. On considère qu un caractère est continu quand toutes les valeurs prises sont distinctes ou presque. Quand pour la plupart des modalités plusieurs individus ont la même valeur, le caractère est discret. On étudie une population suivant caractères X et Y. On note (x 1,..., x p ) (respectivement (y 1,..., y q )) les modalités prises par le caractère X (resp. Y ). La repartition des individus étudiés suivant ces caractères est présentée dans le tableau de contingence : y 1 y j y q x 1 x i n ij n i. x p n.j n n ij est l effectif conjoint de l échantillon étudié associé à la i-ième modalité du caract ere X et à la j-ième modalité du caractère Y. f ij = n ij /n est la fréquence conjointe. f i. = n i. /n (resp. f.j = n.j /n sont les fréquences marginales. f i/j = n ij /n.j est la fréquence conditionnelle de la modalité x i sachant que le caractère Y a pour valeur y j. 1

Si les caractères X et Y sont indépendants, f ij = f i. f.j. Exercice 1. On donne les effectifs par âge, de mères non fumeuses à l accouchement. âge 1 3 6 7 8 9 30 31 3 33 3 3 effectif 7 8 9 10 1 3 0 1 1. Quelle est la population étudiée? Suivant quel caractère? La population étudiée est une population de femmes non fumeuses ayant au moins un enfant. On s intéresse à leur âge.. Quelles sont les modalités? Les modalités sont les entiers de 1 à 3. 3. S agit-il d un caractère discret ou continu? Compte tenu de la précision des données, plusieurs individus prennent la même modalité (sont considérés comme ayant le même âge). Il s agit donc d un caractère discret.. Calculer les fréquences empiriques des modalités. Pour obtenir les fréquences empiriques, on divise les effectifs par le nombre total d individus, soit ici. âge 1 3 6 7 7 8 9 10 1 3 fréquence val. arrondie 0.09 0.108 0.1 0.13 0.16 0.01 0.07 8 9 30 31 3 33 3 3 0.068 0.0 0.068 0.07 0.0 0.07 0 0.01. Représenter les fréquences empiriques sur un diagramme en bâtons. Le diagramme en bâtons consiste à tracer un segment vertical au-dessus de chaque modalité, de longueur proportionnelle à l effectif ou à la fréquence empirique. 6. Calculer la moyenne, la variance et l écart-type empiriques de l échantillon et interprétez vos résultats. Pour calculer la moyenne empirique on effectue l opération : x = 1 ( ) 7 1 + 8 + + 0 3 + 1 3 =.66. L âge moyen dans cet échantillon est de ans et 8 mois environ. L âge cumulé de toutes les mères étudiées serait le même si toutes avaient ans et 8 mois. Pour calculer la variance empirique on effectue l opération : s x = 1 ) (7 1 + 8 + + 0 3 + 1 3 (.66) = 1.683. 0 1

L écart-type est la racine carrée de la variance : s x = 1.683 = 3.61, soit environ 3 ans et 7 mois. La dispersion moyenne de l âge des mères autour de l âge moyen ans et 8 mois est de 3 ans et 7 mois. 7. Calculer les valeurs de la fonction de répartition empirique. Les valeurs de la fonction de répartition empirique sont les fréquences cumulées. âge 1 3 6 7 7 1 3 6 9 1 fréq. cum. val. arrondie 0.09 0.03 0.3 0.9 0.6 0.66 0.689 8 9 30 31 3 33 3 3 6 60 6 67 0.77 0.811 0.878 0.90 0.99 0.986 0.986 1 8. Quelle est la fréquence empirique de l intervalle [ ; ]? C est la somme des fréquences empiriques des modalités, 3,,, ou bien la différence de valeurs de la fonction de répartition empirique F () F (1), soit 39/ 0.7. Plus de la moitié des femmes de l échantillon sont âgées de à ans. 9. Représenter graphiquement la fonction de répartition empirique. Déterminer graphiquement la médiane et les quartiles de l échantillon. La médiane est ans ; le premier quartile est 3 ans, le dernier quartile est 8 ans. 10. Comparer d une part la moyenne avec la médiane, d autre part l écart-type avec les distances entre la médiane et les quartiles. La moyenne est supérieure à la médiane, ce qui est normal pour une distribution qui est étirée vers la droite. Pour la même raison, l écart entre le dernier quartile et la médiane est supérieur à l écart entre la médiane et le premier quartile. Les deux sont inférieurs à l écart-type : c est le cas pour la plupart des distributions, qu elles soient symétriques ou non. Exercice. On donne les effectifs par âge, de mères fumeuses à l accouchement. âge 1 3 6 7 8 9 30 31 3 33 3 3 effectif 3 3 1 3 3 1 1 1 1. Quelles sont les modalités?. S agit-il d un caractère discret ou continu? 3. Calculer les fréquences empiriques des modalités.. Représenter les fréquences empiriques sur un diagramme en bâtons. 3 71 73 73

. Calculer la moyenne, la variance et l écart-type empiriques de l échantillon. 6. Calculer les valeurs de la fonction de répartition empirique. 7. Quelle est la fréquence empirique de l intervalle [ ; ]? 8. Représenter graphiquement la fonction de répartition empirique. Déterminer la médiane et les quartiles de l échantillon. 9. Comparer d une part la moyenne avec la médiane, d autre part l écart-type avec les distances entre la médiane et les quartiles. Exercice 3. On s intérese ici au lien éventuel entre l âge d un enfant et sa dominance manuelle. Le sujet devait mettre des cartes sur une table en les prenant une à une. L observateur notait alors la main active ainsi qu un éventuel changement de main. Le tableau suivant présente la répartition des enfants étudiés suivant leur âge et leur dominace manuelle. Main droite Main gauche Ambidextre 6 ans 3 10 1 8 ans 38 1 10 10 ans 3 10 7 Merci d interpéter chacun de vos résultat, c est à dire de faire une phrase intégrant chaque résultat numérique. 1. Quelle est la population étudiée? Quels sont les caractères étudiés ainsi que leur type?. Quel est le nombre d enfants âgés de 10 ans et ambidextres? 3. Quel est le pourcentage d enfants âgés de 10 ans et ambidextres?. Quel est la pourcentage d enfants droitiers?. Quel est le pourcentage d enfants gauchers? 6. Quel est le pourcentage d enfants gauchers parmi les enfants de 6 ans? 7. Quelle est la distribution conditionnelle de l âge des enfants pour les enfants ambidextres? 8. Construisez le tableau de distribution conditionnelle des dominances en fonction des âges? 9. Construisez le tableau de distribution conditionnelle des dominances en fonction des âges sous l hypothèse d indépendance? 10. Y a t il indépendance entre l âge des enfants et la dominance manuelle? Exercice. Le tableau de données ci dessous donne la distribution de la surface glaciaire selon l altitude et le lieu du glacier au sein du bassin de l Arve à Chamonix, en 1999. Chaque individu correspond à 1m de glace.

Mer de Glace G. d Argentière G. du Tour La Reudant Nantrilous Total [100 ; 1800[ 76 390 0 0 0 116 [1800 ;100[ 1 00 0 0 0 6 [100 ; 00[ 860 60 3 0 0 9 [00 ; 700[ 8 3100 97 100 0 8600 [700 ;3000[ 1096 7708 916 78 68 3916 [3000 ;3300[ 13968 016 331 0 0 96 [3300 ;3600[ 806 100 3 0 0 9996 Total 696 1886 806 878 718 80 1. De quels types sont les deux variables étudiées?. Construisez le tableau de la distribution conjointe des deux variables (en pourcentage) en faisant apparaître les deux distributions marginales. 3. Calculer moyenne, médiane, variance et écart-type de la distribution marginale de l altitude. Interpréter les deux caractéristiques centrales.. Quelle est la distribution conditionnelle de l altitude pour le glacier du Reudant? Interpréter f [700,3000[/Le Reudant.. Quelle est la distribution conditionnelle des glaciers pour l altidude [700, 3000[? Interpréter f Le Reudant/[700,3000[. 6. Retrouver le tableau de la distribution conjointe à partir des deux tableaux précédents de deux manières différentes. Expliquer votre méthode sur un exemple. 7. Superposer sur un même dessin (histogramme) les distributions conditionnelles de l altitude pour la Mer de Glace et le Glacier d Argentières.