Statistiques descriptives (partie 2 de 2)

Documents pareils
Logiciel XLSTAT version rue Damrémont PARIS

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Statistiques 0,14 0,11

Statistiques Descriptives à une dimension

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

XML, PMML, SOAP. Rapport. EPITA SCIA Promo janvier Julien Lemoine Alexandre Thibault Nicolas Wiest-Million

Comparaison de fonctions Développements limités. Chapitre 10

SCI6052 Information documentaire numérique École de bibliothéconomie et des sciences de l information

Traitement des données avec Microsoft EXCEL 2010

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Représentation d une distribution

STATISTIQUES DESCRIPTIVES

RIHANE Abdelhamid Maitre de conférences Université de Constantine (ALGERIE)

M F. F O Unité: [m. N] La norme du moment de force peut se calculer en introduit le bras de levier d

Répartition des coûts du compte de pass-on par catégorie de consommateurs

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Mesure du volume d'un gaz, à pression atmosphérique, en fonction de la température. Détermination expérimentale du zéro absolu.

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Annonces internes SONATRACH RECHERCHE POUR SON ACTIVITE COMMERCIALISATION :

SOLUTION ONLINE DE GESTION

Tableau récapitulatif de l analyse fréquentielle

Statistique : Résumé de cours et méthodes

BAROMETRE DE CONJONCTURE DE L HEBERGEMENT D ENTREPRISES

La nouvelle planification de l échantillonnage

Chapitre 3 : INFERENCE

Étude sur les taux de revalorisation des contrats individuels d assurance vie au titre de 2013 n 26 mai 2014

3. Caractéristiques et fonctions d une v.a.

Solution logicielle pour le pilotage et l ERM. Journées d études IARD 26 mars mars 2010

Caisses Sociales de Monaco - Déclarations de Salaires DIDACTICIEL. Version 3.2

Inégalités de salaires et de revenus, la stabilité dans l hétérogénéité

Auto-Entreprise : Activités : Eric SOTY - Siret n Formation Bureautique, continue d'adultes. Tél : Fax :

TP N 57. Déploiement et renouvellement d une constellation de satellites

Table des matières Mise en contexte...3 Historique Lettre d entente no Diagnostic du plan Imbeault, le plan qui est

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Analyse et interprétation des données

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Manuel d utilisation

Les pôles commerciaux et leurs magasins

Utilisation des fonctions financières d Excel

Séries Statistiques Simples

8. Gestionnaire de budgets

données en connaissance et en actions?

Union générale des étudiants de Tunisie Bureau de l institut Préparatoire Aux Etudes D'ingénieurs De Tunis. Modèle de compte-rendu de TP.

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Cours pratique Excel. Dans chacune des feuilles, les donnés sont déjà entrées afin de gagner du temps.

Chapitre 2 : Caractéristiques du mouvement d un solide

EXERCICE 2 : SUIVI CINETIQUE D UNE TRANSFORMATION PAR SPECTROPHOTOMETRIE (6 points)

RAPPORTS DU CONSEIL D ADMINISTRATION SUR L EXERCICE 2013

INDUSTRIALISATION ET RATIONALISATION

Etude salariale. Pour le domaine des ressources humaines 2013/2014

Statistique descriptive. Interrogation 2 : à rendre le Jeudi 18 novembre

TP1 - Prise en main de l environnement Unix.

Créer son questionnaire en ligne avec Google Documents

BOUYGUES TELECOM ENTREPRISES - CLOUD

Fonctions homographiques

Note de service À : De :

Latitude N Longitude E Altitude 376 m RÉSUMÉ MENSUEL DU TEMPS DE JANVIER 2014

BACCALAURÉAT PROFESSIONNEL EPREUVE DE TRAVAUX PRATIQUES DE SCIENCES PHYSIQUES SUJET A.1

DÉVERSEMENT ÉLASTIQUE D UNE POUTRE À SECTION BI-SYMÉTRIQUE SOUMISE À DES MOMENTS D EXTRÉMITÉ ET UNE CHARGE RÉPARTIE OU CONCENTRÉE

La gestion des contraintes pour modéliser les stratégies humaines d'ordonnancement et concevoir des interfaces homme-machine ergonomiques

Prédiction de couverture de champ radioélectrique pour les réseaux radiomobiles : L apport du Système d Information Géographique ArcInfo 8

Calculs de probabilités avec la loi normale

UNIVERSITE DE TOULON UFR FACULTE DE DROIT REGLEMENT D EXAMEN ANNEE 2012/2017 LICENCE DROIT MENTION DROIT GENERAL

La rémunération des concepteurs. en théâtre au Québec. de 2004 à 2006


PLAN DE COURS CEGEP DU VIEUX-MONTRÉAL

Fonctions de deux variables. Mai 2011

Département de Maine et Loire OASIS. Observatoire d Analyse du Système d Information Stratégique

MASTER. Marchés Financiers. Domaine : Droit, Economie, Gestion. Mention : Comptabilité-Finance. Organisation : Ecole Universitaire de Management

à moyen Risque moyen Risq à élevé Risque élevé Risq e Risque faible à moyen Risq Risque moyen à élevé Risq

Étude comparative sur les salaires et les échelles salariales des professeurs d université. Version finale. Présentée au

ASSUSOFT: CONTRÔLE BORDEREAU DES PRIMES ASSUSOFT S.A. TÉL: 03/

2 S I M 1 P H O N E G U I D E U T I L I S A T E U R. Guide d utilisation E-commerce / Prestashop

BULLETIN QUESTIONS-RÉPONSES PROGRAMME D ÉQUITÉ SALARIALE

Chapitre 02. La lumière des étoiles. Exercices :

PLATEFORME SAAS D'ENVOI DE SMS. Guide du débutant UTILISER LA PLATEFORME SMSMODE TUTORIEL

WINSCOP GESTION DES COOPERATIVES D ACTIVITES ET D EMPLOI

Document d orientation sur les allégations issues d essais de non-infériorité

Exercice 6 Associer chaque expression de gauche à sa forme réduite (à droite) :

Régionalisation des régimes de perturbations et implications pour l aménagement dans un contexte de changement climatique

TRAVAUX PRATIQUES SCIENTIFIQUES SUR SYSTÈME

PRÉSENTATION DE L OFFRE

GUIDE D UTILISATION DU CENTRE DE DONNÉES DE L ISU

Présentation des projets de recherche BLOWOUT et METANE. Journée technique du Cedre. Brest 14 novembre 2013

FEN FICHE EMPLOIS NUISANCES

L éducation au Québec : L état de la situation

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

GUIDE DE DÉMARRAGE SOMMAIRE INTRODUCTION 1. SUIVI DE CAISSE PRÉSENTATION DU CALENDRIER PRINCIPES DE SAISIE N GESTIONSAISIE D'UNE JOURNÉE DE CAISSE

Interdiction des taux d intérêt fixes au Cambodge

Sigma Consulting est un cabinet conseil spécialisé en management des organisations. Le Management en mode projet..2

Le patrimoine des ménages retraités : résultats actualisés. Secrétariat général du Conseil d orientation des retraites

Bulletin d information statistique

OASIS Date de publication

Fonctions de plusieurs variables

Formation. Module WEB 4.1. Support de cours

1 Points du champ d'audit «Documentation des risques selon l'art. 196 et l'art. 97 OS»

ANNEXE J POTEAUX TESTÉS SELON UN CHARGEMENT STATIQUE ET TESTÉS SELON UN CHARGEMENT CYCLIQUE ET STATIQUE

QUICK GUIDE #1. Guide du pilotage par la performance pour les distributeurs automobiles

1. Vocabulaire : Introduction au tableau élémentaire

Evaluation de la variabilité d'un système de mesure

Transcription:

École de bibliothéconomie et des sciences de l information SCI6060 Méth. de recherche sc. de l'information Statistiques descriptives (partie 2 de 2) Faculté des arts et des sciences 17 mars 2017 Christine Dufour, 2017 1/ 21

SCI6060 2/ 21 Cours 10 Objectifs visés et activités associées Mise en application OG4 Appliquer les méthode de base en sciences de l'information pour analyser des données OS b) Appliquer les méthodes statistiques de base pour analyser des données quantitatives Activités TP3 Devoir 4

SCI6060 3/ 21 Caractérisation d'une distribution [1/2] Distribution Comment les données sont réparties Moyen pour la visualiser? Histogramme!

SCI6060 4/ 21 Caractérisation d'une distribution [2/2] Point de comparaison pour décrire une distribution Distribution normale

SCI6060 5/ 21 Caractérisation d'une distribution Distribution normale COURBE NORMALE Moyenne/Médiane/Mode = 0 Écart-type = 1 68% de l'échantillon entre + ou - 1 écart-type -1 écart-type +1 écart-type -4-3 -2-1 0 Moyenne 1 2 3 4 Médiane Mode

SCI6060 6/ 21 Caractérisation d'une distribution Symétrie Dans Excel =coefficient.asymetrie(plage) Courbe symétrique mode = médiane = moyenne Courbe asymétrique (étalée) à droite, (asymétrie positive) mode < médiane < moyenne Courbe asymétrique (étalée) à gauche, (asymétrie négative) mode > médiane > moyenne

SCI6060 7/ 21 Caractérisation d'une distribution Aplatissement Dans Excel =kurtosis(plage) Courbe régulière Kurtosis nul Aplatissement faible Kurtosis positif Aplatissement élevé Kurtosis négatif

SCI6060 8/ 21 Illustration des mesures de tendance centrale et de dispersion

SCI6060 9/ 21 Tendance centrale et dispersion : deux dimensions pour caractériser des données

Médiane = 25 Équité Mode = 20 Popularité SCI6060 10 / 21 Soit 16 personnes ayant dans leur portefeuille 10$, 20$, $, 40$ ou 50$ : 3 personnes ont 10$, 5 en ont 20$, 10 20 40 50 Différents indicateurs de centralité Moyenne = 26,4 Équilibre

SCI6060 11 / 21 Seule une distribution symétrique aura la même valeur pour sa médiane, son mode et sa moyenne. La distribution symétrique est parfaitement équilibrée! Médiane = Mode = Moyenne 10 20 40 50 Différents indicateurs de centralité

Tendances centrales : Impact des valeurs aux extrémités Médiane = Équité (10) Mode = le plus fréquent (5) 1 1 5 5 5 10 10 25 32 40 0 20 40 60 Moyenne = point d'équilibre (18,67) 40 50 1 Mode = le plus fréquent (5) Médiane = Équité (10) 1 5 5 5 10 10 40 40 50 0 20 Moyenne = point d'équilibre 40 60 (23,08) 50 60

SCI6060 15 / 21 Impact de l'asymétrie sur la moyenne et la médiane

SCI6060 16 / 21 Choix des mesures de tendance centrale

Mesures de dispersion 0 Moyenne = Médiane = Étendue = 60 Mode = aucun Écart-type = 19,5 Moyenne Écart-type 5 10 15 20 25 35 40 45 50 0 20 40 60 Moyenne 55 60 Moyenne = Médiane = Étendue = 60 Mode = Écart-type = 12,2 Écart-type 0 0 20 40 60 60

Cas 1 Moyenne - 1 écart-type Moyenne Moyenne + 1 écart-type Illustration du lien entre la dispersion des données et l écart-type Exemples de distribution des notes pour 2 examens différents dans un cours Cas 2 Moyenne - 1 écart-type Moyenne Moyenne + 1 écart-type Cas 1 (examen fictif) : Moyenne = 82 Nbre étudiants = 79 Presque tous les étudiants entre 80 et 85 Écart-type = 3,26991 Coefficient de variation = 3,99% Cas 2 (final) : Moyenne = 82 Nbre étudiants = 79 Notes sont plus étendues entre 77 et 86 Écart-type = 4,7231 Coefficient de variation = 5,76%

SCI6060 19 / 21 Interprétation de l'écart-type [1/2] Soit les deux indicateurs suivants : A) Somme mensuelle dépensée pour les transports en commun ($) B) Longueur de la repousse des cheveux par mois (cm) 10 personnes vous fournissent leurs données pour ces deux indicateurs et vous calculez leur moyenne ainsi que leur écart-type Transports ($) Cheveux (cm) Moyenne 100 1,13 Écart-type 6,67 0,49 Selon vous, pour lequel de ces indicateurs vos répondants diffèrentils le plus (i.e. que les données sont les plus dispersées)?

SCI6060 20 / 21 Interprétation de l'écart-type [2/2] 0,5 1,0 1,5 2,0 Repousse des cheveux (cm) Rép. Transports ($) Cheveux (cm) 1 90 0,7 2 90 0,8 3 100 0,9 90 100 110 Transport en commun ($) L écart-type ne s interprète pas uniquement sur la grandeur de son chiffre, mais doit s interpréter par rapport à la moyenne et en fonction de son unité de mesure. Ici, il s avère que c est pour la repousse des cheveux que l écarttype est le plus grand! 4 100 1,1 5 100 2,0 6 100 0,9 7 100 1,3 8 100 0,7 9 110 2,0 10 110 0,9 Moyenne 100 1,13 Écart-type 6,67 0,49

SCI6060 21 / 21 Coefficient de variation (COV) Aide à interpréter l écart-type en le ramenant en % COV = écart-type / moyenne Rép. Transports ($) Cheveux (cm) 1 90 0,7 2 90 0,8 3 100 0,9 4 100 1,1 5 100 2,0 6 100 0,9 7 100 1,3 8 100 0,7 9 110 2,0 10 110 0,9 Moyenne 100 1,13 Écart-type 6,67 0,49 COV 6,67% 43,56% Plus le COV est grand, plus l écart-type représente une grande proportion de la moyenne, plus les données sont dispersées autour de la moyenne. Ici, le COV nous permet de facilement voir que c est l indicateur sur la repousse des cheveux qui a la plus grande dispersion des données. Si COV < 15%, les données sont considérées comme homogènes par rapport à l indicateur. Si COV > 15%, les données sont hétérogènes par rapport à l indicateur.