Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie



Documents pareils
Annexe commune aux séries ES, L et S : boîtes et quantiles

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Observatoire Economique et Statistique d Afrique Subsaharienne

Séries Statistiques Simples

SERIE 1 Statistique descriptive - Graphiques

Introduction à la méthodologie de la recherche

Statistique : Résumé de cours et méthodes

1. Vocabulaire : Introduction au tableau élémentaire

Relation entre deux variables : estimation de la corrélation linéaire

Traitement des données avec Microsoft EXCEL 2010

LA CONDUITE D UNE MISSION D AUDIT INTERNE

BUREAU DU CONSEIL PRIVÉ. Vérification de la gouvernance ministérielle. Rapport final

Gé nié Logiciél Livré Blanc

Logiciel XLSTAT version rue Damrémont PARIS

Statistiques Descriptives à une dimension

Construire un tableau de bord par Marc Maisonneuve

LA GESTION DE PROJET INFORMATIQUE

LA GESTION DE PROJET INFORMATIQUE

LE PROBLÈME DE RECHERCHE ET LA PROBLÉMATIQUE

Manuel de recherche en sciences sociales

Nom de l application

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Chapitre 2. Eléments pour comprendre un énoncé

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

La nouvelle planification de l échantillonnage

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Université de Lorraine Licence AES LIVRET DE STAGE LICENCE

Documents mis à disposition par : Attention

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

L élaboration de la fiche de poste

d évaluation Objectifs Processus d élaboration

MATHÉMATIQUES. Mat-4104

Structure typique d un protocole de recherche. Préparé par Johanne Desrosiers dans le cadre d une formation au réseau FORMSAV

Lecture critique et pratique de la médecine

SOCLE COMMUN: LA CULTURE SCIENTIFIQUE ET TECHNOLOGIQUE. alain salvadori IA IPR Sciences de la vie et de la Terre ALAIN SALVADORI IA-IPR SVT

Ressources nécessaires (avec budget)

Les exploitations de grandes cultures face à la variabilité de leurs revenus : quels outils de gestion des risques pour pérenniser les structures?

DiFiQ. Diplôme Finance Quantitative. Une formation en partenariat. Ensae Dauphine Bärchen

Chapitre 2 LE CAS PRATIQUE

Correction du baccalauréat ES/L Métropole 20 juin 2014

Document d orientation sur les allégations issues d essais de non-infériorité

Formation PME Etude de marché

Introduction au datamining

Introduction à l évaluation des besoins en compétences essentielles

EXAMEN CRITIQUE D UN DOSSIER TECHNIQUE

ANNEXE 2 : Liste des questions entre le directeur et l étudiant

E-COMMERCE VERS UNE DÉFINITION INTERNATIONALE ET DES INDICATEURS STATISTIQUES COMPARABLES AU NIVEAU INTERNATIONAL

Consignes pour les travaux d actualité Premier quadrimestre

Cycle de formation certifiante Sphinx

Rédiger et administrer un questionnaire

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Limites finies en un point

LES DIFFERENTS TYPES DE MESURE

Qu est-ce que le ehealthcheck?

CADRE D AGRÉMENT APPROCHE STANDARD DU RISQUE OPÉRATIONNEL

Guide de rédaction d un protocole de recherche clinique à. l intention des chercheurs évoluant en recherche fondamentale

Recherche documentaire et autoformation. Lecture critique d un article médical. Recommandations pour la pratique. Les maladies orphelines

ITIL V3. Transition des services : Principes et politiques

Les documents primaires / Les documents secondaires

Guide No.2 de la Recommandation Rec (2009).. du Comité des Ministres aux États membres sur la démocratie électronique

Collecter des informations statistiques

PROMOUVOIR «LE DIALOGUE INTERNE EN TANT QUE FACTEUR D AMÉLIORATION»

CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE. Information importante : Ces conseils ne sont pas exhaustifs!

Représentation d une distribution

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Sujet de thèse CIFRE RESULIS / LGI2P

Assurance maladie publique et «Opting out» - Réflexions théoriques

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Notre modèle d engagement

LA GESTION DE LA RELATION CLIENT

Politique de gestion des risques

INFORMATIQUE : LOGICIELS TABLEUR ET GESTIONNAIRE DE BASES DE DONNEES

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Méthode universitaire du commentaire de texte

«Donnons envie aux entreprises de faire de la Formation continue à l Université!» (Stand D07) La formation continue à l Université Fiche expérience

Proposition de sujet de thèse CIFRE EUROCOPTER / LGI2P

Les Méthodes Agiles. description et rapport à la Qualité. Benjamin Joguet Rémi Perrot Guillaume Tourgis

C est un outil important pour : - mener une politique de communication cohérente, - et fixer des priorités.

Statistique Descriptive Élémentaire

Ministère de l intérieur

Petit guide pour choisir une solution CRM

3 - Sélection des fournisseurs Marche courante Conditionnement Transport Livraison... 5

Principe et règles d audit

Regards croisés sur l auto-entrepreunariat

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES

Ressources APIE. La comptabilisation des frais de R&D. de l immatériel. Pour agir. En bref. Agence du patrimoine immatériel de l État

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

FOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS

TUTORIEL Qualit Eval. Introduction :

Agence Leitmotiv - Tous droits réservés. Etude de plan marketing RH

Annexe au document intitulé Communication relative à certaines questions de politique concernant le Bureau de Procureur : renvois et communications

Etude relative aux rapports des présidents sur les procédures de contrôle interne et de gestion des risques pour l exercice 2011

Modernisation et gestion de portefeuilles d applications bancaires

Développement itératif, évolutif et agile

Le suivi de la qualité. Méthode MSP : généralités

Misereor a-t-elle besoin «d études de base»? Document d information à l intention des partenaires

STAGE D INITIATION RAPPORT DE. Elaboré par. Prénom NOM. Encadré par : Mr Prénom NOM (Société) Société d accueil :. (Sigle de la société d accueil)

Transcription:

Partie I : Séries statistiques descriptives univariées (SSDU) A Introduction Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie et tous sont organisés selon le même principe. Ils commencent par une présentation qui permet au lecteur de situer l étape traitée dans le plan de l étude statistique et d en comprendre les finalités. Les notions essentielles sont ensuite développées et elles sont illustrées par des exemples dans la section suivante. Une partie «Approfondissements» donne quelques compléments théoriques et un QCM, en fin de chapitre, permet de vérifier les acquis. En fin de première partie, un cas d étude complet «LoisirCréa» illustre chaque étape de l analyse d une série statistique descriptive univariée. 1. Qu est-ce qu une série statistique descriptive univariée? Lorsque l on réalise une étude statistique, on parle de population, de caractère, de série statistique. Population. On appelle population, population statistique ou univers, un ensemble d éléments disposant de certaines caractéristiques plus ou moins communes et constituant l objet de l étude statistique. Il peut s agir de mesures, d observations qualitatives, d individus réels ou de tout autre ensemble d éléments possibles. Comme en théorie des ensembles, une population peut se définir en extension (de manière explicite) ou en compréhension (de manière implicite). Exemple 1. Définition en extension : l ensemble des ouvrages {ouvrage-1, ouvrage-2, ouvrage-i, ouvrage-n} de la bibliothèque. Exemple 2. Définition en compréhension : l ensemble des habitants de la ville de Nice. Les définitions précédentes sont encore insuffisantes. Voici une version plus complète : Exemple 1bis. L ensemble des ouvrages {ouvrage-1, ouvrage-2, ouvrage-i, ouvrage-n} dûment répertoriés de la bibliothèque de l organisme Untel, à la date du 12 avril 2013.

2 Partie I : Séries statistiques descriptives univariées (SSDU) Exemple 2bis. L ensemble des habitants inscrits sur les listes électorales de la ville de Nice à la date du 27 janvier 2013. À noter que, dans ce cas, il est possible de donner une définition en extension en fournissant une copie des listes électorales. Taille de la population statistique. On appelle taille ou effectif le nombre total d éléments de la population. On note usuellement l effectif total par N. Individu statistique. On appelle individu, individu statistique ou unité statistique, chacun des éléments constituant la population statistique. Ces éléments sont indicés par i avec i entier variant de 1 à N, et souvent notés par I. Alors, I i est la i-ième unité statistique observée. Exemple. L ouvrage «ouvrage-3», l électeur «727». Caractère. On appelle caractère le phénomène observé c est-à-dire étudié sur la population statistique. On désigne généralement les caractères par les lettres X, Y ou Z, éventuellement X 1, X 2, etc. Pour chaque individu, une valeur de caractère sera observée et éventuellement mesurée. Si l on étudie un caractère X sur une population de N individus notés I i avec i variant de 1 à N, alors le résultat de l observation de l individu I i sera noté x i. On classe les caractères selon leur type, dont les deux principaux sont le type quantitatif et le type qualitatif selon qu ils sont mesurables ou non (voir Étape 2. Formalisation). Série statistique ou distribution statistique. Soit P une population de taille N et X un caractère observé sur cette population. On appelle série statistique descriptive ou distribution statistique sur P un ensemble de couples (individu ; observation) = (I i ; x i ) avec i variant de 1 à N inclus dans l ensemble des entiers naturels. Cette série est dite descriptive d une part pour exprimer le fait que la statistique descriptive est quelque peu différente de la statistique mathématique et, d autre part, parce qu elle porte sur des observations qui ont été effectivement réalisées dans le passé et qui sont supposées avoir été menées exhaustivement sur la population observée, c est-à-dire qu une observation existe pour chaque individu statistique. La série statistique des observations est dite univariée, si l on étudie un seul caractère, bivariée, s il y a deux caractères, et multivariée, s il y en a plus de deux. SSDU s entend pour série statistique descriptive univariée. C est donc un ensemble d observations rendant compte de l étude d un certain caractère sur une population d individus statistiques. Une SSDU donne lieu à une formulation explicite précise, qui résulte des entretiens préliminaires essentiels avec l entreprise pour définir et délimiter la problématique du cas d étude, et qui servira de point de départ obligé pour mener l étude.

A Introduction 3 2. Plan statistique d analyse d une SSDU La méthodologie proposée dans ce livre présente l avantage fondamental d utiliser un plan d étude statistique qui détaille pas à pas les huit étapes à franchir, les paramètres à calculer, comment les interpréter et évaluer leur représentativité. Chaque résultat sera replacé dans la problématique de l entreprise. Le suivi rigoureux des étapes associé à la traçabilité des données est un gage de réussite pour mener à bien l étude, de manière efficace et pertinente. Les étapes du plan statistique sont détaillées ci-après. Étape 1. Définition du problème Objectif. Savoir dégager à partir d un problème les questions précises à traiter et les formuler en termes statistiques. Technique. Définition informelle du problème et définition statistique. Étape 2. Formalisation Objectif. Savoir décrire formellement la série statistique à traiter. Technique. Définition des éléments nécessaires à l étude : population, individu, caractère/variable, type de caractère, valeur/modalité, unité de mesure, taille. Étape 3. Collecte Objectif. Connaître les différentes sources de collecte de données et informer sur les dates et protocoles relatifs à cette collecte. Technique. Détermination du type de la source : interne, externe (INSEE, ANPE, sondage, etc.), de la date des données (pérennité de l étude) et de la date de récupération de ces données (validité/intégrité). Étape 4. Dépouillement et tris Objectif. Savoir dépouiller et trier les données, positionner des étiquettes pour la traçabilité des données. Technique. Génération des tableaux de données. Étape 5. Regroupements Objectif. Savoir regrouper l information (séries condensées, séries classées) et calculer les fréquences. Technique. Sélection et détermination des classes, des tableaux de distribution, et calcul des différents types de fréquence. Étape 6. Représentation graphique Objectif. Savoir représenter graphiquement les données regroupées en fonction du type de caractère et des fréquences à présenter. Technique. Élaboration de secteurs circulaires, tuyaux d orgue, diagrammes en bâtons, histogrammes ou autres représentations graphiques pertinentes.

4 Partie I : Séries statistiques descriptives univariées (SSDU) Étape 7. Résumé de l information par les caractéristiques de position, de dispersion et de concentration Objectif. Savoir résumer l information : connaître, choisir et calculer les différentes caractéristiques et interpréter les résultats. Technique. Détermination des caractéristiques de position : moyennes, médiane, mode, valeur minimale, valeur maximale, quantiles ; des caractéristiques de dispersion : étendue, intervalle interquantilles, variance, écart type ; des caractéristiques de concentration : courbe de concentration et calcul de l indice de Gini. Interprétation des résultats par rapport au caractère et à la population. Analyse de leur pertinence : représentativité de la moyenne, approche probabiliste, etc. Étape 8. Conclusion Objectif. Savoir conclure pertinemment sur les questions dégagées dans l étape 1 de définition du problème, avec éventuellement des solutions proposées et une prise de décision. Technique. Rédaction de la conclusion statistique (réponse à la définition statistique) et de la conclusion informelle (réponse à la définition informelle cette conclusion s adresse davantage à un non-statisticien) et proposition d ouverture sur une prise de décision, sur des améliorations de l existant, sur des projets d études.

B Les étapes de traitement d une SSDU Étape 1. Définition du problème Pour mener une étude statistique, il est essentiel de la définir exactement. Par exemple, lors d une étude sur le marché du travail, il est impératif de caractériser précisément la population étudiée. Lorsque l on parle de «population active», on considère à la fois les personnes ayant un emploi et celles qui en cherchent un («les chômeurs»). Les chômeurs ne regroupent pas tous les gens en âge de travailler et sans emploi mais ceux qui sont effectivement en recherche d emploi. Et à l intérieur même de la population ayant un emploi (dite «population occupée»), certains ne sont occupés qu à temps partiel alors qu ils recherchent un emploi à temps plein : on parle alors de «sous-emploi». Lorsqu une étude est menée sur la structure de l emploi en France, les résultats diffèrent selon que l on considère la population active, les chômeurs, la population occupée ou la population sous-employée. Dans un autre domaine, en 2009, la Fédération française de canoë-kayak a délivré 35 598 licences pour le canoë-kayak et 303 190 autres types de licence à des adhérents ne pratiquant pas le canoë-kayak. Alors combien y a-t-il de Français qui «rament» vraiment? 1. Présentation L étape 1 consiste à poser le problème avec précision et à définir les deux paramètres principaux : la population étudiée et ce que l on étudie dessus. Généralement, les approches statistiques possibles en réponse à une question posée sont multiples. Il n est pas de pire situation que celle qui consiste à faire une étude rigoureuse mais qui, finalement, ne répond pas aux attentes du donneur d ordre, faute d avoir pris le temps de définir clairement son besoin. Lorsqu on cherche à définir une problématique afin d y apporter des réponses, il est essentiel de prendre le temps et le recul nécessaires pour énoncer clairement les questions. Il est préférable de mener cette étape avec la personne qui commande l étude sans pour autant utiliser un quelconque langage statistique. L étape 1 comprend deux sous-étapes : la définition informelle et la définition statistique. 1.1. Définition informelle Cette définition consiste à exprimer, en langage courant et aussi précisément que possible, la problématique du donneur d ordre. Plusieurs entretiens avec ce dernier sont

6 Partie I : Séries statistiques descriptives univariées (SSDU) souvent nécessaires pour aboutir à un texte clair. L objet de l étude (la population) devra être nettement identifié, ainsi que ses différents éléments (les individus) et leur nombre (la taille de la population). De même, les enseignements attendus devront être précisés. Il est également important que les limites de l étude soient fixées explicitement : étude sur la population entière ou sur un échantillon, étude préliminaire ou non, délais, précisions des observations, etc. Par exemple, nous étudions la satisfaction clients sur la livraison des produits achetés via notre site d e-commerce. L étude porte sur la population entière des clients livrés au cours des six derniers mois. Les clients devront indiquer leur degré de satisfaction sur une échelle de 1 (pas du tout satisfait) à 5 (très satisfait), ce qui apporte la précision nécessaire à l étude. 1.2. Définition statistique Elle consiste à traduire, en langage statistique, la définition informelle. Elle se présente généralement sous la forme d une simple phrase structurée toujours de la même façon : «Étude de la distribution de (population) par rapport à (caractère) à l aide d une SSDU.» 2. Exemples Pour éclairer cette étape de la «définition», nous allons nous appuyer sur un exemple. L énoncé du problème est le suivant : Une pizzeria demande une étude sur 256 pizzas livrées au travers de 212 ventes du 1 er août au 15 septembre. Comme souvent dans la réalité, cet énoncé n est pas très précis. Plusieurs études différentes sont imaginables : Première possibilité Définition informelle : étude des différents types de pizzas. Définition statistique : étude de la distribution des pizzas livrées (population) par rapport au type de pizza (caractère) par une série statistique descriptive univariée (type de série). Deuxième possibilité Définition informelle : étude du nombre de pizzas par vente. Définition statistique : étude de la distribution des ventes de pizzas (population) par rapport au nombre de pizzas (caractère) par une série statistique descriptive univariée (type de série). Troisième possibilité Définition informelle : étude du chiffre d affaires par vente. Définition statistique : étude de la distribution des ventes de pizzas (population) par rapport au chiffre d affaires (caractère) à l aide d une SSDU (type de série).

B Les étapes de traitement d une SSDU Étape 1. Définition du problème 7 3. Approfondissements De nombreux points seraient à aborder concernant la manière de gérer les relations entre les différentes parties prenantes : donneurs d ordre, exécutants, responsables de l étude, ingénieurs, analystes, statisticiens, chargés des relations avec les commanditaires. Ils relèvent essentiellement des relations humaines et de disciplines comme la psychologie, les relations intra- et intergroupes, les techniques de gestion et de management des entretiens et des interviews et sortent largement du cadre de cet ouvrage. Il semble souhaitable, cependant, d insister sur quelques aspects importants : La clarification des objectifs, termes et limites de l étude, objet de la phase «Définition informelle», peut demander du temps et de nombreux allers-retours pour converger vers une formulation adéquate. Il est parfois utile de construire un glossaire précisant le sens des mots et des termes techniques employés par les donneurs d ordre, aussi bien que par les responsables de l étude. Ce glossaire servira de référence commune officielle et pourra même être annexé au rapport d analyse. Le phénomène de mondialisation fait que les parties prenantes impliquées dans l étude peuvent venir d horizons, voire de cultures, très différents. La phase de définition clarification des termes utilisés, traduction éventuelle afin de minimiser les risques de biais d interprétation et de faciliter la mise en œuvre du plan méthodologique type devient alors d autant plus nécessaire. Les protocoles de contrôle du bon déroulement de l étude réunions intermédiaires, points de rendez-vous, réunion de réception de l étude définitive pouvant être variables d une culture à une autre, il faudra également les préciser dans le cadre d un document écrit. 4. QCM 1. Que signifie le sigle SSDU que l on utilise dans la définition statistique? a. Suite Standard Descriptive Uniforme b. Série Standardisée, Décrite et Uniformisée c. Suite Statistique Descriptive Univariée d. Série Statistique Descriptive Univariée 2. Quel est le plan SSDU correct et le plus complet (étapes et ordre des étapes)? a. Définition, formalisation, collecte, dépouillement et tris, regroupement, graphique, résumé b. Définition, formalisation, dépouillement et tris, collecte, résumé, regroupement, graphique c. Définition, formalisation, collecte, dépouillement et tris, résumé, regroupement, graphique, conclusion

8 Partie I : Séries statistiques descriptives univariées (SSDU) d. Définition, formalisation, sélection, dépouillement et tris, regroupement, graphique, résumé, conclusion e. Définition, formalisation, collecte, dépouillement et tris, regroupement, graphique, résumé, conclusion 3. Dans une SSDU, on étudie la distribution : a. Du type de caractère b. De la population c. Du caractère d. D une entité statistique 4. Dans une SSDU, la distribution se fait par rapport à : a. Plusieurs caractères b. La population c. Un individu d. Un caractère 5. Quelle est la bonne définition statistique d une étude portant sur l analyse des chiffres d affaires correspondant à un ensemble de commandes? a. Étude de l ensemble des chiffres d affaires par rapport aux commandes b. Étude de la répartition des chiffres d affaires par rapport aux commandes par une SSDU c. Étude de la distribution d un ensemble de commandes par rapport à leur chiffre d affaires à l aide d une SSDU d. Étude de l ensemble des commandes par rapport aux chiffres d affaires par une SSDU 6. Quelle est la bonne définition statistique d une étude portant sur l analyse du nombre de commandes en ligne dont fait l objet chacun des produits du catalogue d un site d e-commerce? a. Étude de l ensemble des produits par rapport au nombre de commandes en ligne b. Étude de la distribution des produits par rapport au nombre de commandes en ligne à l aide d une SSDU c. Étude de l ensemble des nombres de commandes en ligne par rapport aux produits d. Étude de l ensemble des nombres de commandes en ligne par rapport aux produits par une SSDU