Le rôle d'un logiciel de base de données pour les projets de recherche



Documents pareils
Utiliser Access ou Excel pour gérer vos données

1. Introduction Création d'une requête...2

SUPPORT DE COURS ACCESS 2010

1. Création d'un état Création d'un état Instantané Colonnes Création d'un état Instantané Tableau... 4

1. Introduction Création d'une macro autonome Exécuter la macro pas à pas Modifier une macro... 5

MS PROJECT Prise en main. Date: Mars Anère MSI. 12, rue Chabanais PARIS E mail : jcrussier@anere.com Site :

MEDIAplus elearning. version 6.6

LibreOffice Calc : introduction aux tableaux croisés dynamiques

CATALOGUE DES FORMATIONS

KIELA CONSULTING. Microsoft Office Open Office Windows - Internet. Formation sur mesure

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

HP Data Protector Express Software - Tutoriel 3. Réalisation de votre première sauvegarde et restauration de disque

Créer le schéma relationnel d une base de données ACCESS

Créer une base de données

OSIRIS/ Valorisation des données PORTAIL BO MANUEL UTILISATEUR

TABLEAU CROISE DYNAMIQUE

Calc 2 Avancé. OpenOffice.org. Guide de formation avec exercices et cas pratiques. Philippe Moreau

PARAGON SYSTEM BACKUP 2010

NETWORK & SOFTWARE ENGINEERING MANUEL D UTILISATEUR. Logiciel TIJARA. NETWORK AND SOFTWARE ENGINEERING Manuel d'utilisateur "TIJARA" 1

Préparer la synchronisation d'annuaires

Classer et partager ses photographies numériques

Virtualisation de Windows dans Ubuntu Linux

Cours 1 : introduction

Symantec Enterprise Vault

Mode d'emploi du back office KNE. Contact technique établissement

Comment utiliser FileMaker Pro avec Microsoft Office

Administration du site (Back Office)

GUIDE MEMBRE ESPACE COLLABORATIF. Février 2012

Suivi de la formation

CRÉER UNE BASE DE DONNÉES AVEC OPEN OFFICE BASE

Installation et Réinstallation de Windows XP

Sauvegarde des bases SQL Express

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

Interface PC Vivago Ultra. Pro. Guide d'utilisation

1. Cliquez sur dans le coin supérieur gauche de l'écran 2. Sélectionnez la Langue de l'interface désirée 3. Cliquez sur

MODE OPERATOIRE OPENOFFICE BASE

Le modèle de données

F0RMAT I0N BUREAUTIQUE

Les Utilisateurs dans SharePoint

Auguria_PCM Product & Combination Manager

LE TABLEUR OPENOFFICE CALC : CONTRÔLES DE FORMULAIRES ACCÈS AUX BASES DE DONNÉES

Prise en main du BusinessObjects XI R2 Service Pack 2/ Productivity Pack

IMPORTATION, CRÉATION, MANIPULATION, EXPORTATION DE DONNÉES STATISTIQUES

Gestion de parc informatique - Prise en main

Importation des données dans Open Office Base

FileMaker Pro 12. Guide de l utilisateur

Cyberclasse L'interface web pas à pas

Nouveautés dans Excel 2013

LA SAUVEGARDE DES DONNEES SUR LES ORDINATEURS PERSONNELS

Infrastructure - Capacity planning. Document FAQ. Infrastructure - Capacity planning. Page: 1 / 7 Dernière mise à jour: 16/04/14 16:09

EXCEL PERFECTIONNEMENT CALCULS AVANCES

Plan de cours. Chiffriers et bases de données en gestion commerciale

Petit guide à l'usage des profs pour la rédaction de pages pour le site Drupal du département

Comment et pourquoi créer des clés d'activation?

Procédure Création : 04/05/2009 ARCHIVAGE DE LA MESSAGERIE

Access. Apprenez exactement ce dont vous avez besoin Progressez à votre rythme Téléchargez les exercices. Joyce Cox et Joan Lambert

Foire aux Questions Note: Les réponses aux questions correspondent à la version Mise en route

Tutoriaux : Faites vos premiers pas avec Microsoft Visio 2010

Acronis Backup & Recovery 10 Advanced Server Virtual Edition. Guide de démarrage rapide

Serveur Acronis Backup & Recovery 10 pour Linux. Update 5. Guide d'installation

NOS FORMATIONS EN BUREAUTIQUE

FileMaker Server 14. Guide de démarrage

Licences Windows Server 2012 R2 dans le cadre de la virtualisation

Netissime. [Sous-titre du document] Charles

OnDemand Version 1.7. Manuel d installation et d utilisation. AST Technology. Sophienstrasse Herford Allemagne

Analyse tarifaire en ligne (TAO) de l'omc

les Formulaires / Sous-Formulaires Présentation Créer un formulaire à partir d une table...3

STATISTICA Version 12 : Instructions d'installation

Table des Matières. 2 Acronis, Inc

Base élèves : des étiquettes avec OpenOffice 2.0

Guide de l'utilisateur : Surveillance MédiaSource Analytique

IBM SPSS Direct Marketing

Création d'un site dynamique en PHP avec Dreamweaver et MySQL

Tune Sweeper Manuel de l'utilisateur

Pascal Weber - Expert en organisation

1 Gestionnaire de Données WORD A4 F - USB / / 6020 Alco-Connect

Sage 100 CRM Guide de l Import Plus avec Talend Version 8. Mise à jour : 2015 version 8

IBM SPSS Statistics Version 22. Instructions d'installation sous Windows (licence nominative)

Access 2007 FF Access FR FR Base

Leica Application Suite

Manuel de l'utilisateur d'intego VirusBarrier Express et VirusBarrier Plus

Manuel de l utilisateur du système en ligne pour les demandes de subvention ainsi que pour les rapports sur leur utilisation

Table des Matières. Pages 3-4. A propos d emblue. Page 5. L environnement emblue. Création d une campagne d marketing. Pages 6-15.

Guide de démarrage Janvier 2012

Gestion de projets. avec. Microsoft Office PROJECT 2003

SCOLASYNC : Logiciel de gestion de flotte de «supports USB», synchronisation de fichiers.

8. Gestionnaire de budgets

Guide d'utilisation. OpenOffice Calc. AUTEUR INITIAL : VINCENT MEUNIER Publié sous licence Creative Commons

Cours Access 1) INTRODUCTION AU SGBD...4 2) LES TABLES...4

Jexcel. V1.1.4 Manuel d'utilisation. modifié le 16 nov. 2004

SW43W. Mode d'emploi. Logiciel FlukeView Power Quality Analyzer à partir de Version 3.20

Edutab. gestion centralisée de tablettes Android

SAP Lumira Version du document : Guide de l'utilisateur de SAP Lumira

Décompresser, créer une archive au format «ZIP»

TD3 - Facturation avec archivage automatisé

Fonctions pour la Belgique

Introduction à Microsoft InfoPath 2010

Pluridisciplinarité. Classe de BTS DATR

Transcription:

Le rôle d'un logiciel de base de données pour les projets de recherche Novembre 2000 Mise à jour d'octobre 2010 Traduit en français par Hamado TAPSOBA The University of Reading Statistical Services Centre Biometrics Advisory and Support Service to DFID

Table des matières 1. Introduction 3 2. Gestion des données dans Excel 4 2.1 Données d enquête dans Excel 4 2.2 Validation et formulaires de saisie de données 5 2.3 Lier des données de feuilles différentes 7 2.4 Données au niveau Activité 7 2.5 Les tables croisés dynamiques 8 2.6 Revue de Excel 9 3. Composantes d'un logiciel de base de données 10 3.1 Conception de la base de données 10 3.2 Saisie dans les tables 15 3.3 Vérification et validation 18 3.4 Utilisation des données 20 3.5 Les objets dans Access 22 3.6 Exportation à partir d'access 22 3.7 Revue de Access 23 4. Le flux de données 24 5. Savoir plus sur un logiciel de base de données 25 5.1 Faire appel à un consultant externe 25 5.2 Travailler en partenariat avec un consultant externe 26 5.3 Construire la base de données en interne 27 5.4 Recommandations 27 Remerciements 27 2010 Statistical Services Centre, The University of Reading, UK

1. Introduction Dans notre guide intitulé "Guide sur la gestion de données pour les projets de développement", nous avons souligné l'importance d'avoir une bonne stratégie de gestion des données des projets de recherche. Nous avons dit que là où il ya des tableurs sont utilisés, ils doivent être utilisés avec la même discipline qui est imposée automatiquement lorsqu un logiciel de base de données est utilisé. Le guide intitulé «Utilisation disciplinée des tableurs pour la saisie des données», explique ce qu'on entend par utilisation d'un tableur avec «discipline» et le guide intitulé "Excel pour les statistiques" est conçu pour aider les chercheurs à se prononcer sur le rôle d'un tableur pour leurs analyses. Ce guide est destiné à aider les chercheurs et les gestionnaires de la recherche à décider s ils ont besoin de faire usage d'un logiciel de base de données pour gérer leurs données. Nous utilisons Microsoft Access à titre d'exemple, mais les concepts sont d'ordre général et s'appliquent également à tout logiciel de base de données relationnelle. Il existe de nombreux manuels sur Access, mais ils se concentrent principalement sur COMMENT utiliser le logiciel. Ce guide se concentre sur SI le logiciel est nécessaire et si oui, quelles sont les compétences que les différents membres de l'équipe du projet ont besoin. Nous supposons une certaine familiarité avec le tableur et commençons, à la section 2, avec un exemple de données d enquête qui ont été saisies dans Excel. Nous passons en revue brièvement les concepts, à partir du guide de saisie de données, sur l'utilisation de Excel avec discipline pour améliorer le processus de saisie des données. Cette section vise en partie à introduire les concepts d'un système de base de données par rapport à une feuille de calcul. C'est aussi parce que la plupart des projets auront une certaine utilisation de feuilles de calcul. La principale question est habituellement quelque chose comme «Étant donné que nous sommes raisonnablement confiants avec Excel, pourquoi avons-nous aussi besoin d'apprendre un logiciel de base de données (Access)?" Dans la section 3, nous passons en revue les composantes d'un ensemble de bases de données et voyons comment les données que nous avons utilisées à la section 2 pourraient être saisies et gérées dans Access. Nous montrons la conception de la base de données et examinons des exemples de formulaires et rapports pour la saisie et l'extraction des données. Dans la section 4, nous considérons le «flux» de données pendant un projet de recherche allant de la saisie à l'étape d archivage des données à la fin du projet. Nous considérons le rôle d'un logiciel de base de données dans tout ce SSC 2000 & 2010 Role of a Database Package for Research Projects 3

processus. Nous terminons la section 5 par un bref examen des compétences nécessaires pour le personnel du projet pour pouvoir utiliser un logiciel de base de données modernes d'une manière efficace. 2. Gestion des données dans Excel Dans cette section, nous passons en revue certains aspects de la gestion des données dans Excel. Beaucoup de ces sujets sont traités plus en détail dans notre guide sur l'utilisation d'excel avec discipline. 2.1 Données d enquête dans Excel Les données de la Figure 1 sont d'une étude de journal d'activités effectuée au Malawi. Les individus au sein des ménages tiennent un registre des activités menées à quatre moments différents de la journée. Les ménages sont regroupés en clusters ou mbumbas. Un cluster est un ensemble de ménages pour une mère, ses filles adultes, leurs maris et enfants. Il ya donc trois niveaux de données, à savoir le Mbumba, le ménages et la personne. Dans un classeur Excel, il est pratique pour stocker chaque niveau de données dans une feuille séparée. Un nom approprié est donné à chaque feuille. Ceci est illustré dans la Figure 1. Figure 1 - Extrait de Excel montrant plusieurs feuilles de calcul dans un seul fichier Dans cette enquête, le niveau Mbumba comprend le nom du Mbumba, son emplacement, etc. Au niveau ménage, le nom de famille est stocké. Le niveau personne comprend le nom, l'âge et le sexe de l'individu. L'identificateur unique de la personne est une combinaison du numéro du Mbumba, du ménage au sein du Mbumba et de la personne au sein de Mbumba. Ainsi la personne 2518 est la 18e personne du Mbumba n 2 et est dans le ménage n 5 du Mbumba n 2. Dans la Figure 4 SSC 2000& 2010 Rôle d un logiciel de base de données pour les projets de recherche

1 on peut voir les détails de la feuille du niveau personne. Nous voyons que les numéros du Mbumba et du ménage sont également stockés à ce niveau et ils agissent comme une référence dans les feuilles des niveaux ménage et Mbumba. La plupart des données qui a été enregistrée étaient des activités. Elles ont été enregistrées à 4 fois dans la journée. Elles ont été stockées sur une quatrième feuille comme le montre la Figure 2, quoiqu une une meilleure façon est présentée plus loin. Cela a introduit un 4ème niveau de données, à savoir un niveau heure de la journée. Figure 2 - Extrait de la feuille de calcul des activités dans le fichier Excel Des codes ont été affectés aux activités. Une table de codage est stockée dans une cinquième feuille dans le même fichier. Un maximum de 10 activités à tout moment de la journée est pris en charge. 2.2 Validation et formulaires de saisie de données Comme mentionné dans notre guide sur Excel, il est possible de définir des contrôles de validation sur les cellules dans une feuille de calcul Excel. Comme il ya 47 activités numérotées de 1 à 47, nous pouvons définir des contrôles de validation sur les colonnes D à M comme le montre la Figure 3. Dans les versions antérieures de Excel, une autre fonctionnalité utile était la possibilité d'utiliser un formulaire pour la saisie des données. Choisir Formulaire dans le menu Données pour produire le formulaire présenté dans la Figure 4. SSC 2000& 2010 Rôle d un logiciel de base de données pour les projets de recherche 5

Figure 3 Règles de validation dans Excel Figure 4 formulaire de saisie de données dans Excel. Lorsque les données sont saisies via un formulaire elles sont vérifiées selon les règles de validation seulement à la fin de chaque enregistrement et non après la saisie de chaque valeur. 6 SSC 2000& 2010 Rôle d un logiciel de base de données pour les projets de recherche

2.3 Lier des données de feuilles différentes Nous avons dit que chaque personne se voit attribuer un identifiant unique. Cet identifiant est utilisé dans la feuille Activités et agit comme un lien vers les données du niveau Personne. En utilisant ce lien, nous sommes en mesure d'afficher les données du niveau Personne à côté des données dans la feuille Activités. Par exemple, la Figure 5 montre la feuille Activités avec des colonnes supplémentaires pour l'age et le Sexe. Nous avons utilisé la fonction RECHERCHEV pour afficher les données stockées dans la feuille du niveau personne. Le point clé ici est que ces données ne sont stockées qu une fois - dans la feuille du niveau personne - mais en utilisant RECHERCHEV nous sommes capables de les afficher dans d'autres feuilles. Stocker une valeur de données une seule fois permet de minimiser les erreurs. Ceci a été obtenu en divisant les données en niveaux et le stockage de chaque élément de données au niveau approprié. Figure 5 - Utilisation de RECHERCHEV pour combiner des données de feuilles séparées 2.4 Données au niveau Activité Dans cette enquête, les répondants ont été invités à dresser la liste des activités qu'ils ont menées à des moments précis de la journée comme le montre la Figure 5. Ceci est un exemple d'une question à réponses multiples qui est commune dans les enquêtes. Un répondant pourrait liste une ou plusieurs activités et le nombre d'activités est différent pour chaque personne. Une façon de saisir et de stocker les données d'activités est présentée dans les figures 2 et 5, mais elle n'est pas entièrement SSC 2000& 2010 Rôle d un logiciel de base de données pour les projets de recherche 7

satisfaisante, car elle se traduit par un bloc non rectangulaire de données. Cela se voit dans la Figure 5 - peu de personnes ont jusqu'à 10 activités et par conséquent il ya beaucoup de valeurs manquantes. Une autre manière d'entrer ces données consiste à envisager un niveau Activité plutôt qu'un niveau heure de la journée. L'équivalent de la Figure 5 est illustré à la Figure 6, où chaque ligne de données se réfère maintenant à une activité plutôt qu à une heure de la journée. Cette disposition utilise plusieurs lignes de données, mais a l'avantage d'une structure rectangulaire simple sans limite arbitraire sur le nombre d'activités. Nous verrons, à section 3, que cette structure est le choix naturel à utiliser si les données doivent être stockées dans un logiciel de base de données. Figure 6 - Une seule activité par ligne 2.5 Les tables croisés dynamiques Une fois que les données sont saisies elles doivent être analysées. Les analyses simples consistent généralement en des tables et graphiques: les deux sont des caractéristiques standard des tableurs. Dans la Figure 7, nous illustrons avec une table récapitulative qui utilise une puissante fonctionnalité de Excel qu est le Table croisé dynamique. Il s'agit en fait des tables croisés avec l'avantage d'être interactive - vous pouvez facilement échanger des lignes et des colonnes par exemple. La Figure 7 montre une table croisée dynamique créé à l'aide des données d'activités, où un sous-ensemble des activités a été choisi et est présenté comme têtes de ligne. Les individus ont été regroupés en garçons, filles, hommes et femmes en fonction de leur âge et sexe, et ces 8 SSC 2000& 2010 Rôle d un logiciel de base de données pour les projets de recherche

regroupements apparaissent comme des têtes de colonne dans la table. Les cellules de la table indiquent le nombre d'enregistrements dans chaque catégorie. Ces tables peuvent donner des pourcentages et d'autres valeurs de synthèse. Si les données originales sont modifiées, cette table croisée dynamique peut être actualisé pour refléter ces changements. Figure 7 - Table croisé dynamique dans Excel 2.6 Revue de Excel Nous pouvons maintenant passer en revue quelques-uns des points forts et les faiblesses de Excel pour la saisie et la gestion des données scientifiques. Lorsqu'il est utilisé avec la discipline il est approprié pour les données qui ont une structure simple. Nous définissons une «structure simple» comme n ayant pas beaucoup de niveaux. Dans le guide pour la saisie des données dans Excel, nous avons examiné des données avec un ou deux niveaux et Excel semble suffisant. Ici nous avons eu 4 niveaux et ce niveau de complexité a déjà rendu Excel plus difficile à utiliser. Notez également que la question à réponses multiples dont nous avons discutée plus tôt sur les activités menées à une heure donnée de la journée, a été facilement manipulée par la saisie des données d'activités dans une feuille séparée. Lorsque les enquêtes ont plus d'une question à réponses multiples la saisie des données nécessite encore plus de tables. Un deuxième problème similaire avec Excel a été montré dans la Figure 4 où nous avons utilisé un simple formulaire de saisie de données. Lorsque nous avons beaucoup de données, il est judicieux de rendre le processus de saisie aussi simples que possible, c'est à dire faire le formulaire à l'écran qui ressemble à la fiche du questionnaire, et cela ne peut pas se faire efficacement dans Excel seul. Si Access est disponible sur votre ordinateur, il est possible d'utiliser les formulaires de Access dans Excel. Cela se fait via le Microsoft AccessLinks Add-In pour Excel. Lorsque vous utilisez cette fonction, Excel crée une base de données Access avec votre feuille de calcul actuelle comme une table liée - les modifications apportées aux données dans Access seront SSC 2000& 2010 Rôle d un logiciel de base de données pour les projets de recherche 9

répercutées dans le fichier Excel. Avec cette fonctionnalité, vous avez plus de flexibilité sur la conception du formulaire et pouvez exploiter toutes les fonctionnalités de conception de formulaire de Access. Il convient de noter, toutefois, que les règles de validation mis en place dans Excel ne sont pas transposées dans Access - vous aurez besoin de définir des contrôles sur le formulaire de Access lui-même. Une troisième limite possible, lorsque nous avons des structures complexes de données, c'est que nous avons souvent de nombreuses façons différentes de vouloir résumer les données. Dans Excel, il est généralement approprié de considérer dans chaque cas comme l'équivalent d'une simple «rapport» et chacun ira sur une nouvelle feuille. Une fois que nous avons beaucoup des feuilles (de rapport), nous devons être sûrs que nous documentons bien notre classeur, afin que nous puissions examiner ce que nous avons fait à une prochaine occasion. Excel et les autres tableurs ont des atouts majeurs. Il s'agit notamment du fait que ce que vous faites est toujours visible. Ils sont aussi puissants et très flexible. A l opposée de cela, il y a le fait qu'il est difficile de travailler avec la «discipline» si les ensembles de données sont importants et/ou complexes dans leur structure. Alors, une approche structurée est nécessaire pour la saisie et la gestion pour exploiter pleinement les données. Un logiciel de base de données fournit cette structure. 3. Composantes d'un logiciel de base de données Dans cette section, nous passons en revue brièvement les composantes d'un logiciel de base de données. Nous nous appuyons sur les idées de la section 2, mais utilisons un jargon standard de base de données. Cela afin que les lecteurs soient en mesure de comprendre les consultants et lire la littérature qui loue les vertus des bases de données. Nous examinons la conception de la base de données, la saisie des données, et l utilisation des données. A titre d'exemple, nous utilisons les données de l'étude d activités que nous avons présentée dans la section 2. 3.1 Conception de la base de données Dans un logiciel de base de données les données sont stockées dans des «tables». L'exemple de la section 2 avait quatre tables, pour les niveaux Mbumba, ménage, personne et activité. Dans un logiciel de base de données les tables doivent être créées avant que les données ne puissent être saisies. Au minimum, vous devez spécifier le nombre de champs ou de colonnes de données requis, donner un nom à chaque champ et de définir le type de données, par exemple texte ou numérique. Cela va en grande partie vers l application de la «discipline» que nous avons encouragée dans l'utilisation 10 SSC 2000& 2010 Rôle d un logiciel de base de données pour les projets de recherche

de Excel dans notre guide sur Excel et la section 2 du présent guide. La Figure 8 montre l'écran de création de table. C'est là que les noms de champs et les types de données sont définis. Figure 8 - Création de table dans Access Figure 9 Vue "Feuille de données" des données du niveau Personne L'écran de création de table dans la Figure 8 montre la conception du table au niveau Personne. Nous devons spécifier les noms des champs et de définir leurs types de données. Une fois que la table est créée, nous pouvons saisir les données via la feuille de données ou la vue feuille de calcul. Ceci est illustré à la Figure 9. La feuille de données ressemble à la feuille de calcul Excel. La feuille de données est adaptée aux données que vous voulez saisir, chaque colonne se réfère à un champ dans la table et SSC 2000& 2010 Rôle d un logiciel de base de données pour les projets de recherche 11

n'accepte que les données du type spécifié lors de la conception de la table. Il n'y a pas de limite au nombre de lignes que vous pouvez saisir autre que la limite physique de la taille de votre disque. Une différence vous pouvez remarquer entre la feuille de données dans Access et la feuille de calcul dans Excel est qu'il n'y a pas de numérotation automatique des lignes dans Access. Toutefois, les informations en bas de la fenêtre vous indique à quelle entrée ou ligne vous êtes et combien d entrées il ya au total. Comme avec l'utilisation d'un tableur, il est important que vous utilisiez un logiciel de base de données "avec discipline". La discipline minimale - définir le nombre de champs et leur type de données - est obligatoire, mais vous devriez normalement faire plus que le minimum. A titre d'exemple, nous expliquons pourquoi il est important que toutes les tables aient ce qu'on appelle une clé primaire. Toutes les données, qu'elles soient stockées dans une base de données, un tableur, ou ailleurs, doivent avoir un identifiant unique pour chaque entrée. Ce peut être un champ unique ou une combinaison de champs. Dans Excel et autres tableurs il n'existe aucun moyen pour garantir l'unicité de cet identifiant et des doublons peuvent donc se produire. Dans Access et d autres logiciels de base de données, cependant, vous pouvez et devez définir une clé primaire pour chaque table. Il s'agit soit d'un seul champ ou combinaison de champs, qui agit comme un identificateur unique. La clé primaire est toujours unique - Access ne permet pas de doublons dans la clé primaire. Au niveau Personne l'identifiant unique est l'id. Se référant à nouveau à la Figure 8, nous voyons que ce champ a un symbole de clé à son côté indiquant que c'est le champ de clé primaire de cette table. Dans de nombreux cas, le choix du champ de clé primaire est évident. Considérons maintenant une situation où le champ de clé primaire n'est pas si évident. Les données au niveau Activité incluent PersonID, Date, TOD, Activity. Un extrait de ces données est présenté dans la Figure 10. Il est clair qu'aucun de ces champs n est unique en soi. Ainsi, nous devons examiner les combinaisons de champs et quand nous faisons cela, nous constatons que la seule combinaison qui doit être unique est la combinaison de ces quatre champs. Il est possible de définir cette combinaison comme notre clé primaire, cependant, les clés primaires multi-champ, comprenant plus de 2 champs, deviennent difficiles à manipuler et peuvent facilement conduire à des erreurs lors de l'établissement des relations. 12 SSC 2000& 2010 Rôle d un logiciel de base de données pour les projets de recherche

Figure 10 Vue Feuille de données" des données au niveau Activité Une alternative est d'utiliser un champ NuméroAuto comme clé primaire. Cela assignera un numéro unique à chaque entrée. Cependant, nous voulons toujours faire en sorte que la combinaison des quatre champs d'origine soit unique. Nous pouvons faire cela en créant ce que Access appelle un «index». Un index peut être créé pour tout champ et toute combinaison de champs et accélère le processus de tri et de sélection. Une fois qu un index a été créé, il peut être rendu unique, en d'autres termes vous ne seriez pas en mesure de saisir de doublons dans ce champ ou combinaison de champs. La Figure 11 montre l'écran de création de table pour les données du niveau Activité et comprend le champ de numérotation automatique que nous avons ajouté comme la clé primaire. Nous pouvons également voir la fenêtre Index, qui montre qu'il existe un index appelé "identifiant" qui est une combinaison des quatre champs d'origine. La propriété Unique a été fixée à "Oui" pour cet index. Un important supplémentaire qui vient avec les logiciels de base de données relationnelles tel que Access, est la capacité à créer des relations ou des liens entre les tables de données. Ceci est implicite dans notre discussion précédente sur Excel lorsque nous avons parlé de liaison de données à partir de feuilles différentes en utilisant RECHERCHEV. Ces liens peuvent être intégrés à la conception dans Access. SSC 2000& 2010 Rôle d un logiciel de base de données pour les projets de recherche 13

Figure 11 - Création de table avec la fenêtre Index La Figure 12 montre la même structure de données que nous avons développée dans Excel, mais dans Access. Les 4 niveaux sont traduits en 4 tables avec des relations entre eux. Les relations sont tous du type " un-à-plusieurs" en ce sens qu une entrée dans un table est liée à potentiellement plusieurs entrées dans un autre table. Par exemple, chaque ménage a plusieurs personnes. Figure 12: Structure de base de données dans Access Access inclut un ensemble de règles connu sous le nom de l'intégrité Référentielle. Lorsqu elle est appliquée elle permet de valider les relations en ne permettant pas de saisir un entrée d'une table sur le côté «plusieurs» d'une relation où il n'ya pas d'entrée correspondant dans la table sur le côté «un». Par exemple, avec l'intégrité référentielle vous ne seriez pas en mesure de saisir les détails d'un individu avant qu'il y ait un ménage pour cette personne. Une fois que vous vous rendez compte de la valeur de plusieurs tables, vous trouverez que vous pouvez en utiliser plus. Considérons par exemple les «activités» dans notre 14 SSC 2000& 2010 Rôle d un logiciel de base de données pour les projets de recherche

exemple de base de données. Les activités sont codées de 1 à 47 et le code est stocké dans la base de données. Il serait relativement facile d'ajouter une table à 2 colonnes contenant ces codes et leurs descriptions associées. La Figure 13 montre quelques-unes des données de la Table «Activités» et la Figure 14 montre comment cette table et les tables correspondantes pour le «heure de la journée» et «lien familial» peuvent être ajoutées à la structure de la base de données. Figure 13 - Extrait de la table des activités Figure 14 - Structure complète de la base de données Contrairement à une feuille de calcul, où sept tables avec des données seraient source de confusion, il s'agit d'une structure assez simple pour une base de données. Une base de données a généralement entre 5 et 50 tables. SSC 2000& 2010 Rôle d un logiciel de base de données pour les projets de recherche 15

3.2 Saisie dans les tables L aspect suivant que nous devons prendre en compte est la façon de saisir les données dans les tables. Nous avons déjà mentionné que les données peuvent être saisies directement dans la table par la feuille de données. Nous avons vu un exemple de feuille de données à la Figure 9. Quand il ya juste une petite quantité de données, ce sera facile et c'est tout ce qui est nécessaire. La Figure 15 montre les cinq entrées de la table Mbumba sous forme d une «feuille de calcul». Figure 15 - Données du niveau Mbumba Figure 16 - Simple formulaire de saisie des données du niveau Personne Pour des volumes plus grands de données, il est plus fréquent de mettre en place des formulaires spécifiques de saisie de données. Un peu plus pratique est nécessaire que dans Excel, mais les formulaires simples sont très faciles à concevoir. Le formulaire de la Figure 16 est pour la saisie des données sur les individus. Ce formulaire a été généré automatiquement à partir de la table correspondante à l'aide l'un des Assistants AutoForm dans Access, et la structure est semblable à la Figure 4 qui a été donnée dans Excel. 16 SSC 2000& 2010 Rôle d un logiciel de base de données pour les projets de recherche

La Figure 17 montre le même formulaire, après quelques simples modifications de conception. Ainsi, il est facile de commencer avec un formulaire généré automatiquement et modifier la disposition pour correspondre à votre questionnaire. La facilité de produire des formulaires de ce type dans Access est l'une des raisons de sa popularité. Figure 17 - Variation sur le formulaire de saisie de données du niveau Personne Toutefois, un formulaire d'enquête comprend souvent des données de plus d'une table. Dans notre cas, la fiche personne comprenais de l espace pour enregistrer les données du niveau Activité. Idéalement, nous aurions donc voulu saisir des données à partir d'un questionnaire unique en 2 ou même 3 tables en même temps. Cette nouvelle étape nécessite une certaine expertise, mais est aussi relativement facile dans un logiciel de base de données tel que Access. Ceci est important car il permet une saisie des données beaucoup plus facile et donc plus fiables. La Figure 18 montre un formulaire qui a été utilisé dans cette étude. La partie supérieure du formulaire est pour la saisie des données sur les individus. Ceci est similaire au formulaire dans les figures 16 et 17. La moitié inférieure du formulaire est pour la saisie des données d'activité. C'est en fait un sous-formulaire et les données saisies sont stockées dans la table d'activité. En raison des liens entre le formulaire principal et le sous-formulaire, vous voyez seulement les données d'activité de l'individu affiché dans le formulaire principal. Généralement, il ya une relation un-à-plusieurs entre les données dans le formulaire principal et les données dans le sous-formulaire. Dans la Figure 18, nous pouvons voir que cette personne en particulier a plusieurs activités pour le matin du 1er Juin 1998. Ainsi, la question à réponses multiples sur les différentes activités dans chaque période de temps se traduit par une entrée distincte pour chaque réponse. SSC 2000& 2010 Rôle d un logiciel de base de données pour les projets de recherche 17

Figure 18 - formulaire du niveau Personnes avec sous-formulaire du niveau Activité Dans notre guide Excel nous avons souligné l'importance de la distinction entre la personne qui a conçu le «système» pour la saisie des données et le personnel qui fait effectivement la saisie. C'est désormais une distinction beaucoup plus claire avec un logiciel de base de données. S'il s agit d une enquête ou d une base de données complexe, la tâche de conception d un système efficace de saisie des données demande de hautes qualifications. 3.3 Vérification et validation Dans la discussion qui suit, nous considérons la validation comme vérification des données au moment de la saisie, et interprétons la vérification comme la vérification des données une fois saisies. Le processus d audit que nous décrivons dans notre guide Excel peut être considéré comme la vérification dans cette définition. Dans la saisie de données d'enquête, il est important que les données soient vérifiées. Cela peut être fait en fournissant des contrôles quand les données sont saisies ou par un système comme la double saisie. Un système de double saisie est celui dans lequel deux opérateurs saisissent les mêmes données dans des fichiers séparés qui sont ensuite comparés. Les différences sont vérifiées par rapport à la version papier originale des données. 18 SSC 2000& 2010 Rôle d un logiciel de base de données pour les projets de recherche

La saisie double des données est une fonctionnalité automatique dans certains logiciels conçus pour la saisie des données d enquête. Dans certains cas, ce logiciel combine plusieurs des concepts de base de données décrite jusque-là avec des moyens faciles d'une double saisie. Un exemple de ces logiciels est Epi-Info. C est gratuit et peut être téléchargé à partir du Web. Epi-Info vous propose une méthode rigoureuse de vérification des données. Après que les entrées aient été saisies et enregistrées dans un fichier, il ya une option pour résaisir et vérifier les entrées dans le fichier de données existant. Les données sont saisies exactement comme pour les nouvelles entrées. Quand une entrée correspond aux données dans le fichier le curseur se déplace sur exactement comme pour les nouvelles entrées. Quand une entrée ne correspond pas un message apparaît et il est donné une chance à l'opérateur de ré-saisir la valeur ou de comparer l'entrée originale à la nouvelle et faire un choix. Les données de Epi-Info peuvent être importées dans Access. Il est donc possible d'utiliser quelque chose comme Epi-Info pour la phase de saisie de données principale, puis transférer les données dans Access pour le stockage et la gestion. Dans Access, vous pouvez définir des règles de validation des champs individuels. La Figure 11 montre une règle de validation de Compris entre 1 et 47 pour le champ Activité. Il est également possible de fixer des règles de validation sur la table. Cela pourrait être utilisé par exemple lorsque la valeur dans un champ ne peut pas dépasser la valeur dans un autre champ. Par exemple supposons que nous ayons stocké le nombre de personnes dans le ménage et le nombre d'enfants. Évidemment, il ne peut avoir plus d'enfants qu il ya de gens et nous pouvons donc fixer une règle de validation des [gens]> [enfants] pour la table. Les logiciels de base de données tels que Access ont été principalement conçus pour les utilisateurs du monde des affaires où le processus de saisie de données et d utilisation des données est un cycle continu. Le cas de la double saisie est moins évident dans ces conditions et ne sont pas fournis par Access ou d autres logiciels similaires de base de données. Dans les enquêtes et les travaux scientifiques, cependant, il ya une phase reconnue de saisie des données et dans ces cas la vérification est nécessaire. Pour toute application donnée, il est relativement facile de construire un système simple système de double saisie dans Access. SSC 2000& 2010 Rôle d un logiciel de base de données pour les projets de recherche 19

3.4 Utilisation des données Dans Excel, nous avons montré dans la Figure 7 comment une table croisée dynamique a été utilisé pour résumer et présenter les données. Dans Access, nous utilisons des requêtes et des rapports pour faire la même chose. Une requête simple fournit un moyen d'afficher ou de résumer un sous-ensemble de données d'une table donnée dans la base de données. Un exemple est montré dans la Figure 19, qui est semblable à une table croisée dynamique produite par Excel. Figure 19 Requête d analyse croisée, équivalent d un table croisé dynamique Toutefois, l'idée d'une base de données est que les tables sont liées. Par conséquent, il ne sera pas surprenant de constater que les requêtes peuvent porter sur des données provenant de plusieurs tables. La Figure 20 montre les résultats d'une requête qui inclut les données, tant au niveau personne qu au niveau Activité. La requête compte le nombre d'activités pour chaque individu. Figure 20 - Requête de comptage des activités pour les personnes sélectionnées Les résultats d'une requête peuvent être utilisés dans un rapport, utilisés comme base pour d'autres questions, visualisés avec un formulaire, exportés vers un autre logiciel ou stockées dans une nouvelle table. 20 SSC 2000& 2010 Rôle d un logiciel de base de données pour les projets de recherche