PRXSENTATION D UN GESTIONNAIRE DE DONNEES NUMERIQUES HIERARCHISEES DESTINE AU DE- -POUILLEMENT D ENQUETES



Documents pareils
MATHÉMATIQUES ET SCIENCES HUMAINES

Systèmes d information et bases de données (niveau 1)

Localisation des fonctions

Techniques de stockage. Techniques de stockage, P. Rigaux p.1/43

Introduction à Business Objects. J. Akoka I. Wattiau

Logiciel Le Sphinx Plus 2 version 5. Le Sphinx Développement Chavanod

Traitement des données avec Microsoft EXCEL 2010

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

Rédiger et administrer un questionnaire

EVOLUTIONS suite à mise à jour

12 Tableaux croisés dynamiques

Leçon 1 : Les principaux composants d un ordinateur

SUPPORT DE COURS LOGICIEL SAGE SAARI COMPTABILITE 100

Excel Avancé. Plan. Outils de résolution. Interactivité dans les feuilles. Outils de simulation. La valeur cible Le solveur

Extraction d informations stratégiques par Analyse en Composantes Principales

Le scoring est-il la nouvelle révolution du microcrédit?

L analyse de la gestion de la clientèle

Avant-propos FICHES PRATIQUES EXERCICES DE PRISE EN MAIN CAS PRATIQUES

Le Sphinx Millenium Modes opératoires Préparer, administrer, Dépouiller les enquêtes

Structure fonctionnelle d un SGBD

1. Présentation générale du volet «Recherche» du projet PASS

TP : Gestion d une image au format PGM

INFORMATIQUE : LOGICIELS TABLEUR ET GESTIONNAIRE DE BASES DE DONNEES

aalto Collaborative Pour le gestionnaire,

Gestion d un VIDÉOPROJECTEUR. ou d un ÉCRAN SECONDAIRE

Endettement des jeunes adultes

INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX

Risques liés aux systèmes informatiques et de télécommunications

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

CREG : versailles.fr/spip.php?article803

CHAPITRE I : PRESENTATION DES INSTRUMENTS DE LA SAISIE

Création, analyse de questionnaires et d'entretiens pour Windows 2008, 7, 8 et MacOs 10

BASES DE DONNÉES. CNAM Centre associé de Clermont-Ferrand Cycle A Année J. Darmont I. INTRODUCTION II. LES SYSTÈMES HIÉRARCHIQUES

Convergence Grand public professionnelle

Baladeur Santé VITAL'ACT

2 / ENONCER ET DECRIRE LES FONCTIONS DE SERVICE A REALISER

Identification des incontournables à la démarche Lean

COMPTABILITE SAGE LIGNE 30

Chapitre 1 : Introduction aux bases de données

EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO

Note méthodologique. Les principales différences avec les TES sont mentionnées dans l encadré 1.

Etape 1 : Identification avec un compte personnel sur la plateforme (cf. notice «Création et gestion de votre compte utilisateur»)

Révision salariale - Manager

«Dire et écrire» pour réaliser une composition en travail collaboratif en géographie. Agnès Dullin, lycée J. Racine 20 rue du Rocher, Paris

ActoPalm 1.0 b. Logiciel d'aide au relevé d'observation in situ sur Organiseurs PalmOS Compatibles. Alain Kerguelen, mai 2002

Modes Opératoires WinTrans Mai 13 ~ 1 ~

Se former pour réussir!

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE

Tutoriel. Votre site web en 30 minutes

VI. Tests non paramétriques sur un échantillon

Guide PME Version

INSTALLATION MODULE WEB

Bases de données Cours 1 : Généralités sur les bases de données

Les bases de données Page 1 / 8

Kiapel V1.2 DOCUMENTATION TECHNIQUE APERCU DES PRINCIPALES FONCTIONNALITES

Observatoire Economique et Statistique d Afrique Subsaharienne

Paramètres d accessibilité des systèmes d exploitation Windows et Mac

Un site Web performant p 3. Les moteurs de la réussite p 4

Moyens de paiement. Manuel pédagogique Version 14

SUGARCRM MODULE RAPPORTS

EXCEL Les tableaux croisés dynamiques

Utilisation avancée de SugarCRM Version Professional 6.5

Ouvrir...59 Ouverture du dossier comptable...59 Ouverture du fichier expert...60

Access 2007 FF Access FR FR Base

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Cours Base de données relationnelles. M. Boughanem, IUP STRI

BREVET D ENSEIGNEMENT SUPERIEUR DE CONSEILLER EN ADMINISTRATION ET GESTION DU PERSONNEL

Ecole Technique «Transformation de données documentaires» Poitiers, mars Atelier 1: Sphinx. import, conversion, export de données

Satisfaction des stagiaires de BRUXELLES FORMATION Résultats 2010

MyReport, LE REPORTING SOUS EXCEL

Capacité étendue d utilisation en réseau

INTRODUCTION AUX BASES de DONNEES

Comment suivre l évolution d une transformation chimique? + S 2 O 8 = I SO 4

1. Installation de COMPTINE

ADMINISTRATION (BI COMMERCE ET GESTION)

Communiqué de lancement

QU EST-CE QUE LE SAAS?

PRESENTATION. Parcours de formation à distance A destination des personnels en contrats aidés

QU EST-CE QUE LE SAAS?

Dans l idéal, ceci devrait être fait en amont pour chaque image envoyée sur l espace de stockage de votre site internet.

Inégalités de salaires et de revenus, la stabilité dans l hétérogénéité

Aide : publication de décisions VS

Plus de 85% des utilisateurs BOB Software ont déjà fait le pas vers Sage BOB 50.

Etape 1 : Identification avec un compte personnel sur la plateforme (cf. notice «Création et gestion de votre compte utilisateur»)

Les Différents types de Requêtes dans Access

SPHINX Logiciel de dépouillement d enquêtes

Le format des questionnaires en ligne Par Daniel Bô (QualiQuanti) mai 2006

Manuel utilisateur Portail SAP

PromoPost Manuel d utilisation

LOGICIEL MARCHES PUBLICS

Guide de prise en main de Beyond 20/20 page 1/20

culture chiffres PRODUCTION, DIFFUSION ET MARCHÉS Les entreprises du commerce du marché de l art François Rouet *

RACCOURCIS CLAVIERS. DEFINITION : Une «combinaison de touches» est un appui simultané sur plusieurs touches.

Installation et lancement d ETHNOS Configuration requise... 5 Installation... 5 Lancement Les modules d ETHNOS... 7

CONCEPTION D UN MONITORING DES QUARTIERS COUVRANT L ENSEMBLE DU TERRITOIRE DE LA RÉGION DE BRUXELLES-CAPITALE

CAHIER DES CHARGES de la formation : «Excel pour les bibliomètres»

EXCEL et base de données

Université de Lorraine Licence AES LIVRET DE STAGE LICENCE

PROGRAMMATION D UN ENREGISTREUR NUMÉRIQUE PERSONNEL (ENP) À PARTIR D ILLICO WEB. Guide d utilisation v 1.0

Transcription:

97 PRXSENTATION D UN GESTIONNAIRE DE DONNEES NUMERIQUES HIERARCHISEES DESTINE AU DE- -POUILLEMENT D ENQUETES Jacques Vaugelade & Marie Piron (Demographie et Statistique) (UR 702) Centre ORSTOM de Ouagadougou B.P. 182 Ouagadougou (Burkina Faso) RESUME - Le depouillement d enquetes est la suite d operations qui conduit du questionnaire au tableau de frequence (appele aussi tableau statistique, croise ou de contingence). Cette suite d operations comprend des modules obligatoires : description des variables, description des controles, saisie et correction, calcul des nouvelles variables et tabulation. Le questionnaire presente ici offre la particularite de traiter des questionnaires hierarchises et de permettre une saisie interactive. Il peut étre complete et interface avec des logiciels statistiques qui realisent des opérations du type regression, analyse de données multidimensionnelles, etc.. Dans ce cas la structure hierarchique doit etre abandoxmee au profit d une structure rectangulaire qui entrame la repartition des informations des niveaux superieurs pour chaque unité des niveaux inferieurs. 1. OBJECTIFS RECHERCHES. Concevoir un gestionnaire le moins limite possible dans le nombre d enregistrements, des variables, des individus et dans les possibilites de composer la tabulation.. Saisi les informations, aussi complexes soient-elles, dans l organisation du questionnaire qui se presente parfois sous la forme de differents niveaux d enquete. Il s agit d enregistrer les donnees sans redondance des unites superieures et pour un nombre quelconque de niveaux (principe d une structure hierarchisêe).. Etre attentif aux details qui facilitent ou permettent d executer des operations giciels de meme profü. qui font parfois defaut sur les autres lo-

98. Enfin, concevoir un logiciel pour micro-ordinateur afin de pouvoir saisir et traiter immediatement l information localement, suivant les exigences precitees, aspect non negligeable pour les etudes.portant sur les pays en développement. 2. PRESENTATION DU GESTIONNAIRE Ce gestionnaire, conçu par J.Vaugelade, est ecrit en Basic pour micro-ordinateur compatible IBM. Il permet actuellement de traiter uniquement des donnees numeriques entieres (valeurs comprises entre -32 768 et +32 767). Il se presente sous la forme de menus deroulants et comporte les modules essentiels a son fonctionnement, a savoir : 2.1. Description des unités, des variables et des contaes Cette phase préliminaire consiste a decrire la structuration de l enquête (un questionnaire peut étre compose d un ensemble de sous-questionnaires definissant chacun des unites secondaires, tertiaires, etc.. L unité principale est l unité statistique d enquete dont peuvent dependre plusieurs unites de niveau 2, 3, etc.). Il s agit de definir les types d unite et leur niveau dans la hierarchie, de constituer les informations necessaires pour decrire les variables qui leur sont affectees (libelle, nom abrege, valeurs possibles) et d établir des controles croises entre les variables, bases sur des tests logiques. 2.2. Saisie, mise à jour, contrble des données La saisie est effectuée de maniére interactive avec controle et correction immediate. Elle se particularise par une structure hierarchique qui offre par la même deux avantages : une saisie simple compte tenu de la complexite du questionnaire pouvant faire intervenir differents niveaux d enquete et l occupation du minimum de place dans les fichiers d enregistrement. Lors de la Premiere saisie, il suffit d appeler l unite desiree en respectant l ordre de la hierarchie, les variables concernees s affichent alors. Avec le programme de mise a jour, il est possible de se deplater dans le fichier afin d effectuer des corrections sur les variables, de supprimer ou d ajouter des variables ou des unites. Ceci permet, par consequent, d enregistrer plusieurs passages d enquete en ajoutant soit des variables, soit des unites statistiques d enquêtes. Cette saisie est simultanément accompagnee d un pretraitement permettant de controler la qualite de l information en decelant les erreurs de codification ou de saisie. Un premier

99 controle nous assure que chaque reponse est possible car elle appartient a une categorie de codes precises (Cf. description des variables), le deuxieme contrôle, dit croise, permet de verifler la pertinence de la valeur de la variable (Cf. description des contrôles). 2.3. Crtiation des variables A partir des variables existantes, il est souvent necessaire de creer par synthese d autres variables plus adaptees aux objectifs de l etude. Par cette fonction, il est possible de synthetiser les informations d un niveau inferieur ou d utiliser les informations des niveaux superieurs (on peut de plus faire intervenir dans le calcul les unites precedentes appartenant au méme type d un& de la variable concernee). Il est egalement prevu de creer une variable pour une sous-population constituee a l aide de filtres. 2.4. Tabulation Ce module permet de composer des tableaux de contingence (ou de frequence) a partir d une ou de plusieurs variables. Il permet de recoder ou de reclasser une variable, de lui affecter un intitule, d en selectionner ses modalites, de ventiler un nombre quelconque de variables avec le choix de faire intervenir le total ou le rebut, de ponderer la population et enfin de travailler sur un type de population precis, selectionne par des filtres. Cependant, les types d unites de meme niveau sont independants entre eux. Par conséquent, les informations d une unite peuvent étre correlees soit entre elles, soit avec les informations des unites superieures dont elles sont dependantes. Mais rappelons que nous sommes toujours a meme de synthetiser l information de deux types d unites de meme niveau au type d unite superieure commune. D autres modules existent comme lister ou trier des données suivant des variables predefmies, recuperer des fichiers endommages et accéder a des fichiers sequentiels. En effet, concernant ce dernier point, il est a preciser que la structure hierarchique des fi- chiers impose un enregistrement a acc& diiect. La sortie sequentielle en caracteres peut s effectuer sous la forme de tableau rectangulaire ou hierarchique. Ce module a toute son importance puisqu il permet de passer sur des logiciels statis- tiques specifiques. A cet effet, un passage vers STATITCF est actuellement en cours de realisation.

100 3. EVALUATION 3.1. Propositions d amélioration. Etendre au traitement de donnees non entieres et non numeriques.. Elargir les contrdes croises, lors de la saisie, a des contr6les portant sur plusieurs variables, calques en plus des tests logiques, sur le principe de creation des variables.. Perfectionner l ergonomie et notamment au niveau de l homogeneitc! dans les differents programmes.. Optimiser la vitesse d execution des differents modules et du stockage des donnees. Realiser une version compilee. : Améliorer la presentation des tableaux croises.. Et pourquoi pas, etudier les possibilites d une manipulation directe sur le tableau des donnees par le deplacement du curseur. 3.2. Points forts L originalite de ce gestionnaire est de pouvoir traiter des fichiers hierarchises a un nombre quelconque de niveaux. Lorsque les fichiers sont liiites a deux niveaux, il est toujours possible de les ramener a un niveau unique en prevoyant le nombre maximal d occurrences du deuxieme niveau. Cela n est plus possible au dela de deux niveaux. Nous attirons donc l attention sur le principe d une saisie hierarchique qui consiste a degager du questionnaire de base plusieurs sous-questionnaires correspondant chacun a un type d information recueillie et pouvant, par consequent, etre consideres comme des sous-unit& statistiques. Si nous envisageons un fichier avec quatre types d unites (Menage, Individu, Etape, Champ) avec la structure suivante : Chaque unite est caracterisee par un certain nombre de variables et depend imperativement d une unit& superieure qui l identifie. Les unit& secondaires sont enregistrbes autant de fois

101 qu il est necessaire pour le questionnaire, en respectant l ordre de la hierarchie. Cette demarche permet, par consequent, de focaliser progressivement les informations caracteristiques du menage vers l unite étape. Cette methode de saisie presente l avantage de traiter une categorie d enquete qui sera plus riche que les enquetes restreintes a un seul type d unite qui synthetisent et donc perdent l information des sous-unites. Ce gestionnaire offre un dimensionnement des fichiers en fonction des besoins de l utilisateur, la seule limite relative reste la mémoire disponible de l ordinateur, a savoir 64 Koctets pour le programme et les donnees. Une grande souplesse d utilisation est apportee par de nombreux outils de manipulation qui facilitent le traitement des donnees dont on augmente les possibilités (etude sur une souspopulation sans revenir au tableau des donnees, existence de rebut, maniement des variables et de leurs modalites, etc.). 4. APPLICATION M.Piron a utilise et teste ce gestionnaire de donnees numeriques pour une enquete socio-urbaine a passages repetes, comprenant neuf types d unites reparties sur trois niveaux : (ler t niveau) I Parcelle. 4 I, Ménage (2ème niveau) Bâtiment I I I I Epouse résid. Epouse n.rés. (3ème niv.) f Elle n a eté contrainte a aucun dimensionnement, bien que le nombre de variables soit relativement important, plus de 300 variables et environ 13 000 unit& confondues, après le deuxieme passage de l enquete. Elle a pu supprimer, modifier les variables, realiser un premier traitement de donnees avant de passer sur des logiciels specifiques tels que l analyse multidiiensionnelle, pour une etude plus approfondie des phenomenes urbains a Ouagadougou.

102 ANNEXE Structure des fichiers hi&archisés : principe d enregistrement. Pour permettre la correction des unites et la mise a jour, le fichier doit être a actes direct, il faut alors choisir une longueur d enregistrement. Plusieurs possibilites s offrent, choisir l unite ayant le plus de variables pour fmer la longueur de l enregistrement conduit a une perte de place importante pour un microordinateur ; creer un fichier par type d unité presente deux inconvénients, le premier est une limitation du nombre d unites par le nombre de fichiers pouvant etre ouverts simultanément, le deuxieme est une perte de temps en écriture et en lecture, car le temps de positionnement pour acceder a un enregistrement (secteur) est de l ordre de cent fois le temps de lecture d un secteur. La structure retenue est donc une structure sequentielle, chaque enregistrement a une longueur fxe (par exemple 126 variables entieres sur deux octets) et les unites sont mises les unes a la suite des autres.. Pour permettre la mise a jour, il faut pouvoir se deplacer dans le fichier dans n importe quel sens, vers l avant ou vers l arriere. On est donc conduit a introduire des pointeurs que l on va illustrer par un exemple. Soit un fichier avec quatre type d unites, menage, individu, etape, champ, avec la structure suivante : Individu Champ Pour chaque unite on a un pointeur sur l unite precedente et sur l unite suivante, et pour chaque unite non terminale autant de pointeurs qu il y a d unites directement dependantes.

103 <b-l Etape Précédente Suivante < Au cas ob un pointeur est sans objet, sa valeur est zero. Chaque pointeur donne le deplacement relatif, sauf si l unit4 correspondante est dans le fichier des ajouts, auquel cas c est le numero de l enregistrement (précede d un signe negatif) qui est le pointeur.