Gestion et analyse de données d enquêtes épidémiologiques. Accès aux données (saisie)



Documents pareils
Formation Word/Excel. Présentateur: Christian Desrochers Baccalauréat en informatique Clé Informatique, 15 février 2007

EXCEL et base de données

Évaluation des compétences. Identification du contenu des évaluations. Septembre 2014

Mon aide mémoire traitement de texte (Microsoft Word)

Les ateliers du Resclin. Préparation des données issues d Epi-Info en utilisant le tableur Excel

TIC INFORMATIQUE Ce que je dois retenir

RACCOURCIS CLAVIERS. DEFINITION : Une «combinaison de touches» est un appui simultané sur plusieurs touches.

EXCEL TUTORIEL 2012/2013

MAÎTRISE DE L ENVIRONNEMENT WINDOWS VISTA

Guide d usage pour Word 2007

Excel 2007 Niveau 3 Page 1

La Clé informatique. Formation Excel XP Aide-mémoire

PRISE EN MAIN D UN TABLEUR. Version OPEN OFFICE

VOCABULAIRE LIÉ AUX ORDINATEURS ET À INTERNET

Avant-propos FICHES PRATIQUES EXERCICES DE PRISE EN MAIN CAS PRATIQUES

Sage 100 CRM - Guide de la Fusion Avancée Version 8. Mise à jour : 2015 version 8

Utilisation du logiciel ModellingSpace

SYSTRAN 7 Guide de démarrage

Système de Gestion Informatisée des. Exploitations Agricoles Irriguées avec Contrôle de l Eau

CATALOGUE DES FORMATIONS

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

Créer un tableau avec LibreOffice / Calc

Table des matières A. Introduction... 4 B. Principes généraux... 5 C. Exemple de formule (à réaliser) :... 7 D. Exercice pour réaliser une facture

SAP BusinessObjects Web Intelligence (WebI) BI 4

CREG : versailles.fr/spip.php?article803

Date M.P Libellé Catégorie S.Catégorie Crédit Débit Solde S.B

Séminaire d information MIGRATION WINDOWS 7 ET OFFICE 2010

Tout savoir sur le clavier

Qu est-ce qu un outil de travail collaboratif Google Drive?

PRÉSENTÉ PAR : NOVEMBRE 2007

GUIDE MEMBRE ESPACE COLLABORATIF. Février 2012

Progression secrétariat

Utiliser un tableau de données

PAGE 1. L écran du logiciel d Open Office Draw. Barre de menu: Les commandes du logiciel

CONSTRUIRE UNE QUESTION ET ELABORER UN QUESTIONNAIRE?

PROGRAMME PROVISOIRE. Degré 9 (1CO)

Installation et lancement d ETHNOS Configuration requise... 5 Installation... 5 Lancement Les modules d ETHNOS... 7

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ

CA CA T T AL AL O O GUE GUE CATALO FORMATIONS t n s c o p. f r / / / / / / c o n t a c t n s c o p. f r / / / / / # t r o c n u m

Formation. Module WEB 4.1. Support de cours

Page Paragraphe Modification Mise en page du document Le bouton "Format de page" est maintenant "Page"

Vous allez le voir au cours de ce premier chapitre, 1. Découvrir l ipad

Plan de formation des Personnels en CUI-CAE Année

I DIFACT. COGESTIB SA I DIFACT (Facturation Diverse) Page 1 / 22

Guide de formation avec cas pratiques. Programmation. Philippe Moreau Patrick Morié. Daniel-Jean David

Initiation à la bureautique

Programme de Formation Office 2010 Word, Excel, Powerpoint et Outlook 2010 pour Windows

Algorithmique et programmation : les bases (VBA) Corrigé

INITIATION A EXCEL Année

KIELA CONSULTING. Microsoft Office Open Office Windows - Internet. Formation sur mesure

Logiciel Le Sphinx Plus 2 version 5. Le Sphinx Développement Chavanod

Numbers en EPS UN TUTORIEL POUR LA! NOUVELLE VERSION DE NUMBERS EST! DISPONIBLE SUR TICEPS.FREE.FR. ticeps.free.fr

Excel 2010 Intermediaire

Database Manager Guide de l utilisateur DMAN-FR-01/01/12

INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX

COURS DE MS EXCEL 2010

Le Sphinx Millenium Modes opératoires Préparer, administrer, Dépouiller les enquêtes

POUR ALLER UN PEU PLUS LOIN SUR UN TABLEUR. Version EXCEL

L évolution des modes de communication, comment adapter les enquêtes en population générale? L expérience de l enquête KABP VIH/sida 2010

Google Documents permet d élaborer un questionnaire, de le diffuser sur le net pour ensuite le dépouiller.

SOMMAIRE. Présentation assistée sur ordinateur. Collège F.Rabelais 1/10

A.-M. Cubat PMB - Import de lecteurs - Généralités Page 1 Source :

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

Débuter avec Excel. Excel

Localisation des fonctions

ESPACE COLLABORATIF SHAREPOINT

Choisir le mode d envoi souhaité. Option 1 : Envoyer un SMS à un nombre réduit de numéros (0 10 )

Base de données relationnelle et requêtes SQL

FORMATION EXCEL NIVEAU 2

Le cas «BOURSE» annexe

GUIDE D UTILISATION DE LA BASE DE DONNEES SUR LES PROJETS EXISTANTS ET PREVUS

1. Introduction Création d'une macro autonome Exécuter la macro pas à pas Modifier une macro... 5

Mai Médiathèque «Les Trésors de Tolente»

GUIDE D UTILISATION. e-banking

DIJON Séminaire des correspondants informatiques régionaux BILAN FINAL

Le cas «BOURSE» annexe

Manuel d utilisation du site web de l ONRN

REMISE A NIVEAU DES SAVOIRS DE BASE INFORMATIQUE

F0RMAT I0N BUREAUTIQUE

Mes premiers diaporamas avec Open Office Impress?

qwertyuiopasdfghjklzxcvbnmqwerty uiopasdfghjklzxcvbnmqwertyuiopas dfghjklzxcvbnmqwertyuiopasdfghjklz mqwertyuiopasdfghjklzxcvbnmqwert

Créer une base de données

Les Différents types de Requêtes dans Access

NOTICE D UTILISATION

TP Contraintes - Triggers

Une ergonomie intuitive

Note de cours. Introduction à Excel 2007

Utilisation de l'outil «Open Office TEXTE»

Créer le schéma relationnel d une base de données ACCESS

CATALOGUE Parcours de Formations E-Learning BILAN FORMATION STAGE. e-learning

Numbers sur ipad. Atelier Formation Numbers sur ipad. [Notes extraitres de l'aide en ligne]

Créer vos données sources avec OpenOffice, adieu Excel

Gestion des bases de données

GENERALITES Sélection du fichier... 7 TRANSFERT DES ECRITURES... 8

COURS BARDON - EXCEL 2010

MANUEL DE L UTILISATEUR

Ecran principal à l ouverture du logiciel

Excel avancé. Frédéric Gava (MCF)

Transcription:

Projet Obe Maghreb Ecole thématique gestion et analyse de données 20 au 29 avril 2010 Gestion et analyse de données d enquêtes épidémiologiques Accès aux données (saisie) Institut de recherche pour le développement Agnès Gartner, Pierre Traissac UMR 204 «Prévention des malnutritions et pathologies associées» IRD, Montpellier, France 1 Pourquoi EpiData 1- Saisie des données (Masques de saisie, contrôles, validation) 1- EpiData 2- Gestion des données (Recodages, calculs de nouvelles variables, fusion de fichiers, sauvegardes) 2- EpiData Analysis (+ Anthro) 3- Analyse des données (statistiques descriptive, inférentielle, tableaux, graphiques) 3- EpiData Analysis 4- Présentation des données (tableaux, graphiques, document écrit, présentation orale) 4- MS Office (Word, Excel, Power Point) (ou OPEN Office) 2

Des données à l information Monde réel Base de sondage Plan de sondage Absences, refus Questionnaires Enquêteurs Transcription valeurs Codage Saisie des données Gestion de données Analyse Présentation résultats Ce qu on perçoit 3 Variable mesurée Erreur de mesure Erreur de lecture Erreur de transcription Erreur de lecture Unité statistique (personne) Réaliser la mesure Lire valeur sur instrument Transcrire valeur sur papier Lire valeur sur papier Sources d erreurs Mesure (terrain) Report (terrain) Erreur choix du code Erreur de transcription Choisir le code Transcrire code sur papier Codage éventuel (terrain ou bureau) Erreur de lecture Erreur de frappe Lire le code ou la valeur sur papier Taper la valeur au clavier Saisie (bureau) Donnée informatique 4

Variable recueillie par interrogation Erreur de mesure Erreur de perception Erreur de transcription Erreur de lecture Unité statistique (personne) Poser la question Entendre la réponse Transcrire valeur sur papier Lire valeur sur papier Sources d erreurs Mesure (terrain) Report (terrain) Erreur choix du code Erreur de transcription Choisir le code Transcrire code sur papier Codage éventuel (terrain ou bureau) Erreur de lecture Erreur de frappe Lire le code ou la valeur sur papier Taper la valeur au clavier Saisie (bureau) Donnée informatique 5 Saisie des données Acquisition des données - saisie = lecture du questionnaire & frappe au clavier Disposer données sur support informatique - fidèles à celles recueillies sur terrain - cohérentes - documentées (dictionnaire de variables)!!! Recherche et correction d erreurs 6

Détection et correction d erreurs Erreurs liées à la mesure - réalisation mesure, lecture et transcription - formation enquêteurs -supervision - vérification des questionnaires «le plus près possible» du terrain Erreurs liées au codage - lecture, choix du code, transcription - formation codeurs, guide de codage Erreurs de saisie - Erreur de lecture, erreur d entrée (frappe clavier, choix dans un menu) - Ergonomie du questionnaire papier, du masque de saisie - Formation opérateurs de saisie Détection et correction d erreurs 7 x questionnaires x lignes

Saisie des données Intégrité d entité (! identifiants principaux) Intégrité de référence (! identifiants secondaires) Intégrité de domaine (valeurs de chaque variable) Cohérence (2 variables ou plus) Autres erreurs (erreurs du 5 ème type ) 9 identifiants Intégrité d entité (! identifiants principaux) Intégrité de référence (! identifiants secondaires) saisis ou programmés ménages femmes 10

domaine Intégrité de domaine (valeurs de chaque variable) 1107011 à 8324061 et UNIQUE 13/01/1996 à 28/12/1997 135 à 185 taille=129? 11 Cohérence des questions Recherche sur papier ou en informatique

Détection et correction d erreurs Détection & correction d erreurs pendant la saisie : contrôles d entrée Détection & correction d erreurs après la saisie : validation (double saisie) apurement 13 Saisie des données Documenter la saisie - incidents, problèmes pendant la saisie - dictionnaire de variables - version des fichiers - corrections (par programmation et non mode interactif)!!! Sauvegarde des fichiers!!! 14

Logiciel de saisie «data entry» Fonctionnalités spécifiques - création «masques de saisie» - contrôles d entrée - validation (double saisie) - documentation (programmes, codages, ) Saisie directe interfaces genre tableur (Excel, autres) ou «feuilles de données» logiciel statistique : NON, NON et NON!!! (sauf très petit ensemble de données) 15 x questionnaires x lignes n variables n colonnes

17 18

19 20

Masque de saisie Fichier de type.qes Fichier de type.rec Tableau de données 21 Principes et règles de base Dessiner l outil à travers lequel les données seront saisies Créer la liste des variables (colonnes du tableau de données) Pour chaque variable - Choisir un nom - Définir le type - Définir le format Soigner la présentation - Présentation fidèle à celle du questionnaire papier facilite le travail de saisie - Commentaires pour clarifier le questionnaire 22

Règles à retenir Noms des variables - Pas plus de 8 caractères - Chiffres autorisés mais pas en 1er caractère - Pas de caractères spéciaux (* ; _, %. & : etc.) - Éviter caractères accentués Plusieurs façons de les créer - Le premier mot de la question - Les 8 premiers caractères - Les caractères entre { } (y compris si plusieurs sur la même ligne) : conseillé 23 Types et format des variables Alphanumérique (caractère) - Standard : (autant de traits que de caractères possibles) - Majuscules : <A > (toutes entrées transformées en majuscules) Numérique - Entiers simples : ### (autant de # que de chiffres voulus) - Avec décimales : ##.### Date - Européennes : <dd/mm/yyyy> - Anglosaxonnes : <mm/dd/yyyy> Autres - Dichotomiques : <Y> (n accepte que Y ou N, ou 1 ou 0 ) - Numéros séquentiels : <idnum> - Date du jour : <today-dmy> - Cryptées : <S > 24

Types et format des variables 25 Pièges à éviter Mélanger plusieurs u.s. dans un même fichier exemple : - le ménage et la personne - la personne et ses n hospitalisations Identifiants non uniques, voire manquants! Oublier les identifiant(s) de niveau supérieur!! nécessaires à la mise en relation hiérarchique des fichiers (très classique : «quel est le ménage de cette personne??») 26

Masque de saisie Fichier de type.qes Nombreux risques d erreur Fichier de type.rec Tableau de données 27 Détection et correction d erreurs Détection & correction d erreurs pendant la saisie : contrôles d entrée Détection & correction d erreurs après la saisie : validation (double saisie) apurement 28

Contrôle de la saisie But : limiter au maximum les erreurs de saisie, tout en facilitant et simplifiant le travail de saisie Création d un fichier de contrôle (extension.chk) dans lequel sont spécifiées toutes les opérations àfaire : De la plus simple - Définir les valeurs autorisées pour chaque variable - Rendre la saisie obligatoire dans un champ donné - Remplir automatiquement certains champs - S assurer de l unicité des valeurs des identifiants - Déplacement conditionnel du curseur (sauts) A la plus compliquée! - Attribuer et faire apparaître des «labels» - Utilisation de boîtes de dialogue - Faire des calculs cumulatifs - Vérifications sur plusieurs fichiers liés etc. 29 Principes généraux Contrôle de la saisie - Le fichier de contrôle (.CHK) doit porter le même nom que le fichier des données (.REC) - L écriture du fichier de contrôle peut se faire : - de façon assistée (boîte de dialogue, pour contrôles simples) - en éditant le fichier (contrôles plus complexes, syntaxe) - Principes (conseils ) - Adapter la complexité des contrôles au type de questionnaire, au niveau des opérateurs de saisie et à son propre niveau! - Commencer par les contrôles simples en utilisant l assistant, puis éditer le fichier pour les opérations plus complexes - Tester les opérations complexes au fur et à mesure 30

L assistant Contrôle de la saisie Nom de variable + description Valeurs autorisées: continues (Range) ou non (Legal) Sauts conditionnels Champ à entrée obligatoire Champ à valeur répétée (d un enregistrement à l autre) Attribution de labels: prédéfinis ou création Pour modifier ou compléter les contrôles (par ex KEY UNIQUE) 31 Contrôle de la saisie Structure - La structure du fichier de contrôle comporte une succession de «blocs de commandes», tous terminés par le mot clef END - Les blocs de commande peuvent commencer par: -Un NOM DE VARIABLE: les opérations concernent la variable, ou en tout cas seront effectuées lors de la saisie lorsque le curseur se trouvera dans le champ correspondant - BEFORE (ou AFTER) FILE (ou RECORD, ou ENTRY): les opérations seront effectuées au début (ou à la fin) de la saisie d un fichier (ou d un enregistrement, ou d un champ) - LABEL (ou LABELBLOCK): pour préciser les listes de codes - Il n est pas possible d écrire des instructions entre deux blocs de commande; mais un bloc peut être inclus dans un autre bloc 32

Modèle de données Idmen: clé primaire (unicité) ménage tableau u.s. x var. ménage MENAGES.REC MENAGES.QES Lien ménage femme par idmen Idfem : clé primaire (unicité) Idmen: clé secondaire code le lien femme Tableau u.s. x var. femmes FEMMES.REC FEMMES.QES 35 Modèle de données Identifiant ménage - grappe, - numéro de ménage dans la grappe exemple idmen = 215 Identifiant femme - grappe, - numéro de ménage dans la grappe, - numéro de femme dans le ménage exemple idfem = 21503 Prévoir les champs dans le masque 36

2 x 100 + 15 200 + 15 215 215 x 100 + 03 21500 + 03 21503

Détection et correction d erreurs Détection & correction d erreurs pendant la saisie : contrôles d entrée Détection & correction d erreurs après la saisie : validation (double saisie) apurement 39 Validation Double saisie Comparaison des 2 fichiers.rec Quand différence, vérifier dans le questionnaire Correction re-validation.etc 40

Validation (double saisie) Fichiers initiaux (de saisie) Menage_A1.rec comparaison Menage_A2.rec Cr_men_1.pgm Cr_men_2.pgm Programme de correction d erreurs Menage_B.rec Fichier «validé»

Apurement Fichier validé (après double saisie) Menage_B.rec Procédures de détection d erreurs Corr_menA.pgm Fichier validé et apuré prêt pour gestion/analyse Programme de correction d erreurs Menage_C.rec Contrôle et correction d erreurs Détection erreurs durant la saisie (contrôle d entrées) Fichiers «bruts» de saisie Recherche et correction d erreurs (validation, apurement) Fichiers «apurés» prêts pour gestion/analyse 44