Cours 5. Les mesures de dispersion

Documents pareils
Statistiques Descriptives à une dimension

Séries Statistiques Simples

Annexe commune aux séries ES, L et S : boîtes et quantiles

Statistique : Résumé de cours et méthodes

Représentation d une distribution

Logiciel XLSTAT version rue Damrémont PARIS

3. Caractéristiques et fonctions d une v.a.

Le patrimoine des ménages retraités : résultats actualisés. Secrétariat général du Conseil d orientation des retraites

Séquence 4. Statistiques. Sommaire. Pré-requis Médiane, quartiles, diagramme en boîte Moyenne, écart-type Synthèse Exercices d approfondissement

STATISTIQUES DESCRIPTIVES

1. Vocabulaire : Introduction au tableau élémentaire

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

IBM SPSS Statistics Base 20

Statistique Descriptive Élémentaire

Statistiques descriptives

Statistiques à une variable

Étude comparative sur les salaires et les échelles salariales des professeurs d université. Version finale. Présentée au

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Résumé du Cours de Statistique Descriptive. Yves Tillé

Statistiques - Cours. 1. Gén éralités. 2. Statistique descriptive univari ée. 3. Statistique descriptive bivariée. 4. Régression orthogonale dans R².

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Présentation des termes et ratios financiers utilisés

Statistiques avec la graph 35+

Le suivi de la qualité. Méthode MSP : généralités

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Tableau de bord des communautés de l Estrie DEUXIÈME ÉDITION INDICATEURS DÉMOGRAPHIQUES ET SOCIOÉCONOMIQUES

Analyse et interprétation des données

Catalogue des connaissances de base en mathématiques dispensées dans les gymnases, lycées et collèges romands.

Chapitre 3. Les distributions à deux variables

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

2010 Minitab, Inc. Tous droits réservés. Version Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

L endettement privé des ménages début 2010

Elec II Le courant alternatif et la tension alternative

Introduction à l approche bootstrap

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Quelles ressources pour vivre seul, en 2014, dans une commune du Doubs? Essai d évaluation

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

23. Interprétation clinique des mesures de l effet traitement

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

: seul le dossier dossier sera cherché, tous les sousdomaines

Classe de première L

FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

L assurance de la qualité à votre service


Bulletin d information statistique

Lire ; Compter ; Tester... avec R

glossaire Appellation commerciale Voir nom de marque.

EXERCICE 2 : SUIVI CINETIQUE D UNE TRANSFORMATION PAR SPECTROPHOTOMETRIE (6 points)

INFIRMIER(E) GRADUE(E) SPECIALISE(E) EN SANTE COMMUNAUTAIRE HAUTE ECOLE DE LA PROVINCE DE LIEGE PROFESSEUR : RENARD X.

Evaluation de la variabilité d'un système de mesure

Evolution des risques sur les crédits à l habitat

Validation probabiliste d un Système de Prévision d Ensemble

SERIE 1 Statistique descriptive - Graphiques

Portrait statistique de la population avec incapacité. Région de Québec 2003

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

COTE LAVAL. Cette méthode de calcul de la cote Laval est utilisée pour fin d admission depuis la session d automne 2010.

Principe d un test statistique

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

OUTILS STATISTIQUES ET NUMÉRIQUES

Note de service À : De :

Glossaire de termes relatifs à l assurance de la qualité et aux bonnes pratiques de laboratoire

TSTI 2D CH X : Exemples de lois à densité 1

Aide-mémoire de statistique appliquée à la biologie

Théorie des sondages : cours 5

Introduction aux Statistiques et à l utilisation du logiciel R

IBM SPSS Direct Marketing 21

Gouvernance des mesures de sécurité avec DCM-Manager. Présentation du 22 mai 2014

Titre 4 - Analyse de l impact de la résiliation annuelle sur les marges des contrats emprunteurs

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

CH IV) Courant alternatif Oscilloscope.

Cartographie des Hotspots Démographiques et du Changement Climatique: Pérou

afférent au projet de décret relatif aux obligations indexées sur le niveau général des prix

NORME IAS 32/39 INSTRUMENTS FINANCIERS

Tableau récapitulatif de l analyse fréquentielle

Votre Réseau est-il prêt?

Les actifs financiers les plus couramment

Joueur B Pierre Feuille Ciseaux Pierre (0,0) (-1,1) (1,-1) Feuille (1,-1) (0,0) (-1,1) Ciseaux (-1,1) (1,-1) (0.0)

La nouvelle planification de l échantillonnage

MATHÉMATIQUES. Mat-4104

Joël Tremblay, Ph.D Nadine Blanchette-Martin, M. Serv. Soc. Pascal Garceau, étudiant en sociologie

TD 11. Les trois montages fondamentaux E.C, B.C, C.C ; comparaisons et propriétés. Association d étages. *** :exercice traité en classe.

Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire :

Introduction à la statistique descriptive

Études. Coût de la chirurgie d une hernie discale

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

DEUXIÈME ÉTUDE D'IMPACT QUANTITATIVE SUR LE RISQUE DE MARCHÉ SOMMAIRE DES RÉSULTATS

Statistiques 0,14 0,11

Étude des résultats des investisseurs particuliers sur le trading de CFD et de Forex en France

Régime de retraite de la Corporation de l École Polytechnique ASSEMBLÉE ANNUELLE 14 JUIN 2010

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

Le risque Idiosyncrasique

Transcription:

Cours 5 Les mesures de dispersion

Retour sur cours 4 Les mesures de dispersion Étendue Variance et écart-type Coefficient de variation Mesures de dispersion La fonction «compute» ou «calculer» 2

Tableaux et graphiques Mesures de tendance centrale Mesures de position Mesures de dispersion Utilité Les tableaux présentent l information relative aux données individuelles. Les graphiques donnent un profil général de la distribution. Permettent de résumer en un seul nombre, la valeur la plus représentative d une série statistique. Renseignent sur la position d une donnée par rapport aux autres données d une distribution ordonnée. Mesurent le niveau de variation ou de dispersion des variables. Types Tableau de fréquences Diagrammes à rectangles, circulaire, à bâtons Histogramme Polygone de fréquence Moyenne Mode et classe modale Médiane Quartiles Quintiles Déciles Centiles Étendue Variance et Écart-type Coefficient de variation Outils et mesures permettant de faire l analyse descriptive détaillée des données et des distributions. 3

Les mesures de tendance centrale ne peuvent pas décrire pleinement une distribution de scores. Les mesures de dispersion sont des indices qui caractérisent l'étalement des valeurs d'une distribution d'une variable autour d'une valeur centrale. Les indices de dispersion permettent de savoir si les scores individuels se rapprochent ou s éloignent beaucoup des mesures de tendance centrale. 4 indices principalement utilisés : Étendue, variance, écart-type et coefficient de variation

Renseignent sur : L étalement des données Étendue La variabilité des données Variance et écart-type L homogénéité des données Coefficient de variation Ne s appliquent qu aux variables quantitatives 5

Étendue (E) Renseigne sur l étalement des données Différence entre la valeur observée la plus élevée et la valeur observée la moins élevée d une distribution de variables. Par exemple, sur un nombre de crimes commis E = Vmax Vmin Étendue = Max Min Étendue = 18 2 Étendue = 16 2 18 Nombre de crimes commis durant le dernier mois

Avantages Simplicité du calcul Désavantages Basée seulement sur les valeurs extrêmes Information sommaire 7

Renseignent sur la variabilité des données Variance Mesure la distance de chaque observation par rapport à la moyenne. σ 2 = S (xi - m) 2 N Où S = somme de... xi = observations m = moyenne N = nombre de cas 8

L écart-type Mesure la distance de chaque observation par rapport à la moyenne. Il s interprète mieux que la variance, car il donne les unités utilisées dans l'échelle originale et non dans leur forme au carré. C est tout simplement la racine carré de la variance! S ( - u) xi 2 N On utilise l écart-type corrigé en présence d un échantillon (n-1). 9

Règle empirique pour une distribution normale Environ 68% des observations se situent à ± 1σ de la moyenne. Environ 95% des observations se situent à ± 2 σ de la moyenne. Environ 99,7 % des observations se situent à ± 3 σ de la moyenne. 10

$ par transaction pour 1 gr. d héroïne Moyenne : 305/8= 40$ Médiane=40$ et mode = 40$ Étendue: 60$-20$ = 40$ 40$ 20$ 60$ 50$ 40$ 35$ 35$ 40$ Variance et écart-type 1. Moyenne = 40$ 2. Déviations : (40-40= 0); (20-40=-20); (60-40=20); (50-40=10); (40-40= 0); (35-40= -5); (40-40= 0) 3. Carré des déviations: 0; 400; 400; 100; 0; 25; 0; 25; 0 4. Somme des carrés des déviations= 950 5. Moyenne des carrés des déviations (variance): 950/8=118,75$ 6. Racine carrée de la variance (écart-type) =10,90$ 11

Interprétation de l écart-type 68% des transactions d héroïne se situent entre ± 10,90$ de la moyenne (40$) donc entre 29,10$ et 50,90$ 95% des transactions d héroïne se situent entre ± 21,80$ de la moyenne (40$) donc entre 18,20$ et 61,80$ 99,7% des transactions d héroïne se situent entre ± 32,70$ de la moyenne (40$) donc entre 7,30$ et 72,70$ 12

Avantages Mesures particulièrement représentatives de la réalité lorsque la distribution est normale Tiennent compte de toutes les valeurs de la distribution donc représentent bien sa dispersion Utiles pour comparer la dispersion d une variable d une même population à des temps différents ou de populations semblables. Désavantages Mesures affectées par les valeurs extrêmes Difficultés d interprétation liées au fait que la valeur de l écart-type varie selon les valeur de la variable. 13

L écart-type est toujours à 0 parce que les déviations sont au carré. L écart-type = 0 quand toutes les valeurs observées sont égales. Un grand écart-type ne signifie pas nécessairement une grande dispersion. 14

Renseigne sur l homogénéité des données Permet d évaluer l importance relative de la dispersion donc de comparer des distributions entre elles. Le CV divise l écart-type par la moyenne. CV= σ/µ ou CV= s/x 15

Transaction d héroïne ($/gr) Moyenne = 40$ Écart-type =10,90$ CV= 0,27 ou 27% Transaction de cocaïne ($/gr) Moyenne =121$ Écart-type = 64,21$ CV= 0,53 ou 53% Interprétation Plus le CV est grand, plus la dispersion des données est grande. Plus le CV est faible (près de 0), plus les données sont homogènes donc plus la moyenne est représentative. 16

Avantages C est une mesure neutre, donc on peut comparer l homogénéité de plusieurs distributions entre elles, même si leurs données ne sont pas exprimées avec les mêmes unités de mesure. Prend en considération toutes les données. Désavantage Ne s applique qu aux variables quantitatives. 17

La symétrie des distributions Normale La symétrie Mode = médiane = moyenne Symétrie des distributions Moyenne Médiane et Mode Asymétrique négative Médiane Moyenne Mode Asymétrique positive L asymétrie Négative: mode > médiane > moyenne Concentration de fortes valeurs Mode Médiane Moyenne Positive: mode < médiane < moyenne Concentration de faibles valeurs

Normale Mésokurtique: courbe normale (cloche) Kurtose des distributions Moyenne Médiane et Mode Leptokurtique Moyenne Médiane et Mode Platikurtique Moyenne Médiane et Mode Leptokurtique: courbe élancée haute concentration de cas qui prennent les valeurs égales ou proches de la moyenne peu de variation : distribution relativement homogène Platikurtique: courbe plate les cas s éloignent de la moyenne forte variation : distribution relativement hétérogène

Asymétrie (skewness) Coefficient d asymétrie utilisé pour vérifier si la distribution est normale On utilise le rapport entre le coefficient sur son erreur type (standard error) On rejet la normalité si le ratio est inférieur à -2 ou supérieur à +2 Distribution normale = skew=0 Applatissement (kurtosis) Coefficient d applatissement utilisé pour vérifier si la distribution est normale On utilise le rapport entre le coefficient sur son erreur type (standard error) On rejet la normalité si le ratio est inférieur à -2 ou supérieur à +2 Distribution normale = kurtosis =0

Pour obtenir les mesures de tendance centrale et de dispersion Analyse Statistiques descriptives - Effectifs Option Statistiques

Banque de données homicides Banque de données DUC Vols qualifiés 22

Banque de données homicides Banque de données DUC Vols qualifiés 23

Ratio: Exprime le poids relatif des effectifs d une catégorie sur le nombre total de données. On compte 1 trafiquant sur 8 détenus Taux : Rapport entre deux quantités (Nb d observation/nb total) Par exemple sur un nombre d habitants :1000, 10 000, 100 000 Taux d homicide à Mtl en 1996 71 homicides Population 1996 = 3 365 200 individus Taux : (71/ 3 365 200 )* 100 000 habitants = 2,11 homicides par 100 000 habitants en 1996 (Mtl) Comparativement à 2,07 homicides par 100 000 habitants (PQ) n=153 24