Des données numériques pour la pré-enquête de sondage : Statistiques et micro-donn données Formation présentée par Maryna Beaulieu, Pascal Martinolli Bibliothécaires pascal.martinolli@umontreal.ca 514 343-6111 #0994
Objectif : Dans la phase de pré-enquête, trouver les données numériques de base sur la population pour pouvoir élaborer une stratégie d'échantillonnage
Partie 1 Quelques définitions
Données numériques Indicateurs Statistiques (données agrégées) Micro-données (données d enquête)
1. Micro-données (données d enquête) données brutes issues d enquêtes de sondage (échantillon) de recensements de données administratives n ayant reçu aucun traitement statistique ou agrégation sauf pour assurer la confidentialité des données et pour pondérer chaque enregistrement d enquête
1. Exemple de données d enquête
1. Exemple de données d enquête
1. Micro-données (données d enquête) nécessite un logiciel de statistique (Stata, SPSS, SAS) Fichier des données brutes + Code File Enquêtes transversales (état à un instant t) Enquêtes longitudinales (suivi d individus sur le temps)
1. Micro-données (données d enquête) Fichier maître détaillé (au CIQSS) Fichier public anonymisé FMGD «fichier de microdonnées à grande diffusion» PUMF «Public Use Microdata File» échantillon (même pour le recensement)
1. Micro-données (données d enquête) Trois univers : 1 enregistrement = 1 personne (Individuals File) 1 enregistrement = 1 famille (Families File) Attaché aux caractéristiques des personnes 2 sous-univers : Famille de recensement / Famille économique 1 enregistrement = 1 ménage (Household File) Attaché aux caractéristiques du logement Source : Dictionnaire du recensement de 2006 http://www12.statcan.gc.ca/francais/census06/reference/dictionary/index.cfm
2. Données statistiques issues de micro-données agrégées et traitement statistique présentées de façon à pouvoir être interprétées (ex. : tableaux, histogrammes)
2. Exemples de données statistiques
3. Exemples d indicateurs Produit intérieur brut (décembre 2008) : - 1, 0 % Taux de chômage (janvier 2009) : 7, 2 % Population active (janvier 2009) : 18 292 100
Partie 2 Ressources statistiques : Des informations sur la population et ses caractéristiques
Site web des données numériques http://www.bib.umontreal.ca/ss/num
Statistiques Statistique Canada Institut de la statistique du Québec CREPUQ SourceOCDE
Statistique Canada Site public
Statistique Canada CANSIM (E-Stat) Numéro de tableau 000-0000 obtenu sur le site public (sic) Répertoire des tableaux Moteur de recherche
Statistique Canada Pour aller plus loin Collecte, traitement et distribution des données Méthodes, mesures et définitions http://www.statcan.gc.ca/edu/power-pouvoir/toc-tdm/5214718-fra.htm Comment citer les produits de Statistique Canada http://www.statcan.gc.ca/bsolc/olc-cel/olc-cel?catno=12-591-x =fra Recensement: «données intégrales (100%)» ex ou «données-échantillon (20%)» ex http://www12.statcan.ca/francais/census06/reference/dictionary/popint.cfm http://www12.statcan.ca/census-recensement/2006/ref/notes/difference-fra.cfm
Institut de la statistique du Québec http://www.stat.gouv.qc.ca/ 1. Publications en ligne sur le site web 2. BDSO : Banque de données des statistiques officielles sur le Québec http://services.banq.qc.ca/sdx/pgq BANQ : publications gouvernementales en ligne du Québec
Données statistiques de la CREPUQ http://ivt.crepuq.qc.ca/ Ressources statistiques sur le Québec et le Canada Données agrégées des recensements du Canada Tableaux thématiques Manipulation des fichiers Beyond 20/20
Canada Provinces et territoires RMR / AR DR DR division de recensement SDR subdivision de recensement SR secteur de recensement RMR Région métropolitaine de recensement AR Agglomération de recensement RTA Région de tri d acheminement (code postal) AD aire de diffusion (avant 2001: SD secteur de dénombrement) RTA SDR SR AD
SourceOCDE Statistiques internationales multidisciplinaires Par sujet et type de série Guide d'utilisation de SourceOCDE
Partie 3 Ressources de micro-données Enquêtes préexistantes et questionnaires, des modèles pour la pré-enquête
IDD Sherlock + IDLS = Equinox ICPSR CORA
IDD DLI Initiative de démocratisation des données Data Liberation Initiative http://www.statcan.gc.ca/dli-ild/dli-idd-coll-fra.htm Puis demander accès à maryna.beaulieu@umontreal.ca
Sherlock et IDLS http://sherlock.crepuq.qc.ca http://janus.ssc.uwo.ca/idls Bientôt remplacés par Equinox (avril 2009)
ICPSR http://www.icpsr.umich.edu/
CORA Queen s http://www.queensu.ca/cora