Cours # 2 Variables qualitatives et quantitatives discrètes

Documents pareils
Séries Statistiques Simples

Statistiques Descriptives à une dimension

Statistique : Résumé de cours et méthodes

Représentation d une distribution

1. Vocabulaire : Introduction au tableau élémentaire

Logiciel XLSTAT version rue Damrémont PARIS

Statistiques avec la graph 35+

Annexe commune aux séries ES, L et S : boîtes et quantiles

FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1

Statistique Descriptive Élémentaire

PLAN STATISTIQUE AUTOMOBILE DU QUÉBEC Définitions

3. Caractéristiques et fonctions d une v.a.

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

«Étude sur l appropriation et les usages au sein d un ENT en IUFM»

Chapitre 3. Les distributions à deux variables

CAPTEURS - CHAINES DE MESURES

YANN ROUDAUT - Professeur de l Ecole Française de Poker - roudaut@ecolefrancaisedepoker.fr

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

SERIE 1 Statistique descriptive - Graphiques

MATHÉMATIQUES. Mat-4104

Introduction au Data-Mining

Evaluation de la variabilité d'un système de mesure

Traitement des données avec Microsoft EXCEL 2010

Projet de Traitement du Signal Segmentation d images SAR

Observatoire Economique et Statistique d Afrique Subsaharienne

Introduction au Data-Mining

IBM SPSS Direct Marketing 21

SPHINX Logiciel de dépouillement d enquêtes

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Resolution limit in community detection

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12

Le chi carré. Le sommaire. Approche quantitative

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

La fumée de tabac secondaire (FTS) en Mauricie et au Centre-du- Québec, indicateurs du plan commun tirés de l ESCC de

Quelles ressources pour vivre seul, en 2014, dans une commune du Doubs? Essai d évaluation

TEST D ALIMENTATION CONTINUE

DTS MOBATime's Distributed Time System

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Catalogue des connaissances de base en mathématiques dispensées dans les gymnases, lycées et collèges romands.

Statistiques 0,14 0,11

Optimiser les performances du mouvement de monte de l Axe Z.

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Introduction aux Statistiques et à l utilisation du logiciel R

Relation entre deux variables : estimation de la corrélation linéaire

PROGRAMME AEC COMPTABILITÉ FINANCIÈRE INFORMATISÉE

Accédez au test ici

Lundi Mardi Mercredi Jeudi Vendredi Samedi Dimanche. Camp des Cactus Stanstead 16:30 18:30 FOOTBALL CADET D2

TSTI 2D CH X : Exemples de lois à densité 1

LES DIFFERENTS TYPES DE MESURE

Rappel sur les bases de données

Exercice du cours Gestion Financière à Court Terme : «Analyse d un reverse convertible»

Statistiques à une variable

Introduction à l approche bootstrap

Service Relevé de Courrier

IBM SPSS Statistics Base 20

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

Présentation et installation PCE-LOG V4 1-5

CA Oblig Immo (Janv. 2014)

Mise en oeuvre TSM 6.1

Élément 424b Introduction à la statistique descriptive

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

STATISTIQUES DESCRIPTIVES

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

Arbres binaires de décision

Propriétés des options sur actions

Le taux d'actualisation en assurance

CHAPITRE 2. Les variables

Introduction à la statistique descriptive

L obtention d un diplôme au Canada : profil, situation sur le marché du travail et endettement des diplômés de la promotion de 2005

Volet préparatoire aux cours de CSI - MODULE 1

Lois de probabilité. Anita Burgun

Statistique descriptive. Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne. Notes de cours

La nouvelle planification de l échantillonnage

SOMMAIRE. AVRIL 2013 TECHNOLOGIE ÉTUDE POINTS DE VUE BDC Recherche et intelligence de marché de BDC TABLE DES MATIÈRES

Séquence 4. Statistiques. Sommaire. Pré-requis Médiane, quartiles, diagramme en boîte Moyenne, écart-type Synthèse Exercices d approfondissement

Unité E Variation et analyse statistique

Étude des résultats des investisseurs particuliers sur le trading de CFD et de Forex en France

Table des matières. I Mise à niveau 11. Préface

Barèmes des commissions et frais généraux

La construction du nombre en petite section

Questionnaire GTA - Analyse des re ponses

Programmation linéaire

Introduction Le phénomène que représentent les Services de Gestion des Documents Managed Document Services (MDS) Une définition du concept

Du benchmarking logistique au choix d une nouvelle stratégie d organisation

Étude nationale sur les besoins des clients

Assises Européennes du Bâtiment Basse Consommations. Frédéric ric FRUSTA. Président Directeur Général. ENERGIVIE 25 Juin 2010

Étude sur les taux de revalorisation des contrats individuels d assurance vie au titre de 2013 n 26 mai 2014

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

COMPTE EPARGNE-TEMPS. En application du décret n du 29 avril 2002 portant création du CET dans la fonction publique de l Etat 1/11

Statistiques descriptives

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES

Chap17 - CORRECTİON DES EXERCİCES

Compatibilité Électromagnétique

Analyse et interprétation des données

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

Probabilités III Introduction à l évaluation d options

BULLETIN OFFICIEL DES IMPÔTS

Transcription:

Cours # 2 Variables qualitatives et quantitatives discrètes Département de mathématiques Cégep de Saint-Jean-sur-Richelieu 11 août 2010

Table des matières 1 Variables qualitatives 2

Contexte Variables qualitatives Durant un sondage, on a demandé à 21 personnes leur sexe et leur degré de satisfaction face au gouvernement provincial 1 étant pas satisfait, 2 : peu satisfait, 3 : assez satisfait et 4 très satisfait. Voici les résultats :

No Sexe degré No Sexe degré No Sexe degré 1 M 3 8 F 1 15 F 2 2 M 1 9 M 4 16 F 3 3 F 2 10 M 2 17 F 3 4 M 3 11 F 4 18 F 1 5 F 3 12 F 4 19 M 2 6 F 2 13 F 3 20 F 4 7 M 4 14 F 2 21 F 1 La lecture de ce tableau n est pas très facile.

Tableau de fréquences et fréquences relatives pour la variable "Sexe" TABLE: Tableau de fréquences et de fréquences relatives du sexe des 21 répondants. Sexe Fréquences Fréquences relatives (%) M 7 33.3 F 14 66.7 Total 21 100

Tableau de fréquences et fréquences relatives pour la variable "Degré de satisfaction" TABLE: Tableau de fréquences et de fréquences relatives du degré de satisfaction des 21 répondants. Degré de satisfaction Fréquences Fréquences relatives (%) pas satisfait 4 19.0 peu satisfait 6 28.6 assez satisfait 6 28.6 très satisfait 5 23.8 Total 21 100

Représentations graphiques : diagramme à secteurs Répartition du sexe en pourcentage Répartition du degré de satisfaction en pourcentage (33.3%) (28.6%) F peu pas (19.0%) M assez très (28.6%) (66.7%) (23.8%)

Diagramme à bandes Répartition du degré de satisfaction en pourcentage Répartition du sexe en pourcentage Fréquence relative (%) 70 60 50 40 30 20 10 0 M F Sexe Les bandes ne sont pas collées!! Fréquence relative (%) 30 25 20 15 10 5 0 Pas Peu Assez Très Degré de satisfaction

Mesures de tendance centrale Les mesures de tendance centrale servent à caractériser une série statistique à l aide d une valeur ou d une modalité typique. Il existe trois mesures possibles : 1 Mode : modalité(s) ou valeur(s) de la variable qui correspond (correspondent) à la plus grande fréquence. On le note Mo. 2 Médiane : valeur de la variable telle que le nombre de donnés qui lui sont inférieurs ou égales est égal au nombre de données qui lui sont supérieurs ou égales. On la note Md. 3 Moyenne : valeur obtenue par la sommes de toutes les données et en divisant cette somme par le nombre de données. On la note x s il s agit d un échantillon ou µ s il s agit d une population.

Mesures de tendance centrale pour une variable qualitative Avec une variable qualitative nominale, on peut seulement utiliser le mode. Pourquoi? La médiane demande un ordre, ce qui n est pas le cas pour ce type de variable. La moyenne est une somme de valeurs prises par la variable. Ici, la variable possède des modalités et non des valeurs.

Exemple Variables qualitatives Dans l exemple, pour la variable "Sexe", sont mode est Mo = F. La variable "Degré de satisfaction" possède comme mode Mo = peu et Mo = assez. C est une variable bimodale.

Précision Variables qualitatives Même s il existe un ordre dans une variable qualitative ordinale, la médiane n est pas toujours bien définie. C est pourquoi on n en tiendra pas compte ici.

Présentation dans un tableau de fréquences. D une manière similaire à la présentation des variables qualitatives : TABLE: Répartition de 50 répondants selon le nombre de paquets de cigarettes fumés par semaine. Nombre de paquets de cigarettes fumés par Fréquence Fréquence relative (% ) semaine 0 19 38 1 2 4 2 4 8 3 5 10 4 6 12 5 8 16 6 3 6 7 2 4 8 1 2 Total 50 100

Présentation graphique : diagramme en bâtons Fréquence 18 16 14 12 10 8 6 4 2 0 1 2 3 4 5 6 7 8 Nombre de cigarettes fumés par

Mesures de tendance centrale : mode Ici, Mo = 0. Pour trouver la médiane, il faut ajouter une colonne au tableau.

Tableau de fréquence cumulée TABLE: Répartition de 50 répondants selon le nombre de paquets de cigarettes fumés par semaine. Nombre de paquets de cigarettes fumés par semaine Fréquence Fréquence relative (% ) Fréquence cumulée 0 19 38 19 1 2 4 21 2 4 8 25 3 5 10 30 4 6 12 36 5 8 16 44 6 3 6 47 7 2 4 49 8 1 2 50 Total 50 100

Mesures de tendance centrale : médiane Tout d abord, il faut trouver le rang de la donnée médiane. Celui-ci est donné par rang de Md = N + 1 2 Dans notre exemple, N = 50 d où le rang est 25.5 QUOI, un rang fractionnaire?? On prend la moyenne des valeurs du rang 25 et 26. Md = rang 25 + rang 26 2 = 2 + 3 2 = 2.5 paquets de cigarettes

Calcul de médiane avec N impair Exemple Soit les données 1, 2, 3, 4, 5 Alors, rang de Md = N + 1 2 = 3 D où, Md est la valeur à la position 3 qui est 3.

Mesures de tendance centrale : moyenne Deux notations pour la moyenne selon si les données représentent une population ou un échantillon. µ = 1 N N i=1 x i x = 1 n n i=1 x i Lorsque les données sont regroupées dans un tableau de fréquence avec K valeurs possibles, alors µ = 1 N K i=1 v i f i x = 1 n K i=1 v i f i, où v i est une valeur de la variable et f i la fréquence de celle-ci.

Exemple Variables qualitatives Dans l exemple sur les paquets de cigarettes, on a un échantillon x = 1 n K i=1 v i f i = 1 (0 19 + 1 2 + 2 4 +... + 8 1) 50 = 2.58

Mode, Médiane ou Moyenne? Exemple!!!

Mesures de dispersion L étendus : différence entre la plus grande valeur et la plus petite. On la note E. Variance : moyenne des carrés des écarts à la moyenne. Notée σ 2 ou s 2 selon s il s agit d une population ou d un échantillon. L écart type racine carrée positive de la variance. Coefficient de variation : rapport entre l écart type et la moyenne. Noté C.V. et exprimé en pourcentage.

Exemple Variables qualitatives TABLE: Répartition de 50 répondants selon le nombre de paquets de cigarettes fumés par semaine. Nombre de paquets de cigarettes fumés par Fréquence Fréquence relative (% ) semaine 0 19 38 1 2 4 2 4 8 3 5 10 4 6 12 5 8 16 6 3 6 7 2 4 8 1 2 Total 50 100

Mesures de dispersion : l étendue E = x max x min = 8 0 = 8

Mesures de dispersion : variance La formule de la variance dépend s il s agit d une population ou d un échantillon. Rappelons que la variance est la moyenne des carrés des écarts à la moyenne. σ 2 = 1 N N i=1 (x i µ) 2 s 2 = 1 n 1 n i=1 (x i x) 2 Lorsque les données sont dans un tableau de fréquence avec K valeurs possibles σ 2 = 1 N K i=1 f i (v i µ) 2 s 2 = 1 n 1 K i=1 f i (v i x) 2

Mesures de dispersion : variance Dans l exemple, σ 2 5.92paquets de cigarettes 2 et s 2 6.04paquets de cigarettes 2. On le fait avec la "pitonneuse".

Mesures de dispersion : l écart type L écart type que l on note σ ou s selon s il s agit d une population ou d un échantillon. σ = σ 2 s = s 2 Dans l exemple, σ 2.43 paquets de cigarettes et s 2.46 paquets de cigarettes.

Mesures de dispersion : coefficient de variation Le coefficient de variation est donné par CV = σ 100% CV = 100% µ s x

À quoi servent-les mesures de dispersion? Les mesures de dispersion servent à quantifier l étalement des données. Les mesures de tendance centrale nous informent sur le centre de la distribution tandis que les mesures de dispersions nous indiquent la manière dont elles sont distribuées.

Remarque 1 L étendue ne révèle pas grand chose sur la distribution. Elle est parfois aberrante. 2 La variance et l écart type sont plus parlant. Plus leur valeur est grande, plus la distribution est étendue et vice-versa. 3 Attention à l échelle de grandeur de la variable. Si σ = 1kg, ça n a pas la même signification si la variable est le poids d un éléphant ou d une souris. 4 Le CV ne possède pas d unité. Il est adimensionnel. Ce qui n entraîne pas les problèmes d échelle de grandeur. 5 Si CV < 15%, on dit que les données sont homogènes, i.e. qu elles se rassemblent autour de la moyenne. Si CV > 15%, les données sont hétérogènes.