Créez votre propre Archive Darwin Core



Documents pareils
Retour d expérience d outils autour d EML. Marie-Claude Quidoz (CEFE) Atelier FRB : 02/04/2014

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015)

Tutoriel QSOS. Version /02/2013

Séance 1 Introduction aux bases de données

LES NOUVEAUTES DE COST AND PROFITABILITY MANAGEMENT 8.1

Base de Connaissances SiteAudit. Utiliser les Rapports Planifiés. Sommaire des Fonctionnalités. Les Nouveautés

Magento. Magento. Réussir son site e-commerce. Réussir son site e-commerce BLANCHARD. Préface de Sébastien L e p e r s

Méthode de préparation du fichier texte d import depuis Excel, via Access jusqu à Drupal.

SQL MAP. Etude d un logiciel SQL Injection

contact@nqicorp.com - Web :

Sophos Endpoint Security and Control Guide de configuration pour réseaux étendus. Enterprise Console, version 3.1 EM Library, version 1.

1. Aménagements technologiques 2. Installation de Microsoft SQL Server 2012

Mercredi 15 Janvier 2014

FileMaker 13. Guide ODBC et JDBC

Learning Object Metadata

WorkflowGen 6.0 Guide de mise à jour

MANUEL D'INSTALLATION SUR WINDOWS 2003/2008 SERVER

IBM* DB2 Universal Database* Tutoriel Business Intelligence : Introduction à Data Warehouse Center

1. Aménagements technologiques 2. Installation de Microsoft SQL Server Microsoft SQL Server 2008 Service Pack 3

Configuration de GFI MailArchiver

Information utiles. webpage : Google+ : digiusto/

Termes de référence pour le recrutement d un Assistant pour la gestion des bases de données

Procédure d'installation de SQL Server Express 2008

GPI Gestion pédagogique intégrée

MailStore Server 7 Caractéristiques techniques

Introduction aux concepts d ez Publish

avast! EP: Installer avast! Small Office Administration

Manuel d Administration

Comment Créer une Base de Données Ab Initio

Déployer une application Web avec WebMatrix et Ma Plateforme Web

Suite Messerli Gest (gestion de chantier) Prestations (imputations des heures) Procédure d'installation du programme ou d'une mise à jour

Les nouveautés d AppliDis Fusion 4 Service Pack 1

TERRA CLOUD. Online Backup

Auguria_PCM Product & Combination Manager

Guide d'installation d'esprit Version 2014 R2

Oracle Developer Suite 10g. Guide de l installation. Vista & Seven

THEME PROJET D ELABORATION D UNE BASE DE DONNEES SOUS LE SERVEUR MYSQL

et Groupe Eyrolles, 2006, ISBN :

Service d information pour remise de paiement de factures Scotia

Guide de l utilisateur du Centre de gestion des licences en volume LICENCES EN VOLUME MICROSOFT

COMMENT INSTALLER LE SERVEUR QIPAIE

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Sauvegarde d'une base de données SQL Server Express 2005

Pré-requis pour les serveurs Windows 2003, Windows 2008 R2 et Windows 2012

CAHIER DES CHARGES D IMPLANTATION

TMS THE MUSEUM SYSTEM

Outils de développement collaboratif

contact@nqicorp.com - Web :

Installation et Administration de SolidWorks Electrical CadWare Systems

FileMaker Server 14. Guide de démarrage

Installation de Concrete 5

Avantages. Protection des réseaux corporatifs de gestion centralisée

mailpro mode d'emploi

Guide de déploiement

Logiciel Libre Cours 9 Modèles Économiques

Introduction à Microsoft InfoPath 2010

PROSOP : un système de gestion de bases de données prosopographiques

Sage 100 CRM Guide de l Import Plus avec Talend Version 8. Mise à jour : 2015 version 8

Manuel du logiciel PrestaTest.

GEST_INSTANCES APPLICATION DE GESTION DES INSTANCES ET REUNIONS EN EPLE ETABLISSEMENT PUBLIC LOCAL D ENSEIGNEMENT

FileMaker Server 14. Aide FileMaker Server

Sauvegarde et Restauration d un environnement SAS

VRM Monitor. Aide en ligne

Initiation au logiciel de gestion bibliographique Zotero

InstallShield 2014 FICHE TECHNIQUE. Création de programmes d installation pour Microsoft Windows

Reporting Services - Administration

PostgreSQL, le cœur d un système critique

Atelier marin. - Vers un suivi optimal des lagons et récifs -

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Procédure d installation :

Manuel du composant CKForms Version 1.3.2

RELEASE NOTES. Les nouveautés Desktop Manager 2.8

Installer ADONIS:CE. ADONIS:Community Edition 2.0 Français. Prérequis et procédure pas à pas. BOC Information Systems 5 rue du Helder, Paris

INTERCONNEXION ENT / BCDI / E - SIDOC

ADMINISTRATION DE ADOBE LIVECYCLE MOSAIC 9.5

SAUVEGARDER SES DONNEES PERSONNELLES

Installation EPLAN platform 2.4

Retek Data Warehouse 11.0 Guide d'installation du Middle Tier

Formation Administrateur de Données Localisées (Prodige V3.2) Recherche et consultation des métadonnées

Imaginez un Intranet

Sybase PowerAMC 16. Guide des nouvelles fonctionnalités générales. DOCUMENTATION

TUTORIEL D INSTALLATION D ORACLE ET DE SQL DEVELOPPER TUTORIEL D INSTALLATION D ORACLE...1 ET DE SQL DEVELOPPER...1

Configuration système requise

Solutions SAP Crystal

Thème : Gestion commerciale

SQL SERVER PRECONISATIONS A L INSTALLATION.2 VERIFICATION INSTALLATION...2 CONNEXION RESEAU.4 EMPLACEMENTS DOSSIERS & SAUVEGARDES...

Pentaho. présentation

7.0 Guide de la solution Portable sans fil

COPENHAGUE, AVANT ET APRÈS ENJEUX ET PERSPECTIVES POUR LES ENTREPRISES. Novembre 2009

Vade mecum installation et configuration d une machine virtuelle V5.1.0

SQL Server Installation Center et SQL Server Management Studio

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES

ANTICIPEZ ET PRENEZ LES BONNES DÉCISIONS POUR VOTRE ENTREPRISE

Logiciel Libre Cours 3 Fondements: Génie Logiciel

IBM System i. DB2 Web Query for System i : le successeur de Query/400? Oui, mais bien plus!!!

Infrastructure Management

Utiliser SQL Server 2008 R2 Reporting Services comme source de donne es pour Microsoft Excel

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Transcription:

Créez votre propre Archive Darwin Core Guide pas à pas Version 1.0 Avril 2011

Citation suggérée : GBIF (2010). Créez votre propre Archive Darwin Core Archive, Guide pratique, (version originale rédigée par Remsen D.P., Döring, M, Robertson, T. ; traduite de l anglais par E. Chenin), Copenhague : Global Biodiversity Information Facility,8 pp,. Disponible à l adresse : http://links.gbif.org/dwca_manual_create_fr_v1 URI maintenue : http://links.gbif.org/dwca_manual_create_fr_v1 ISBN (version anglaise) : 87-92020-30-5 Langue : Français (FR) Copyright Global Biodiversity Information Facility, 2011 Licence: Ce document est enregistré sous une licence Creative Commons Attribution 3.0 Unported License Contrôle du document : Version Description Date of release Author(s) 1.0 Release Draft in English April 2011 DPR 1.0 fr Première version en Français Août 2011 E. Chenin Ce document fait aussi partie du manuel de publication de données du GBIF, version 1.0, ISBN 87-92020-31-3 (version anglaise), disponible à l adresse : http://links.gbif.org/data_publishing_manual Couverture, crédits graphiques : David Remsen

A propos du GBIF Le Système Mondial d Information sur la Biodiversité (en anglais, «Global Biodiversity Information Facility» : GBIF) est une initiative mondiale de type «méga-science» mise en place pour relever l un des grands défis du 21 ème siècle : exploiter la connaissance sur la biodiversité de la planète. Le GBIF envisage un monde dans lequel l information sur la biodiversité est partout disponible gratuitement pour la science, la société et un avenir durable. La mission du GBIF est d être la ressource mondiale prééminente en information sur la biodiversité, et de susciter des solutions intelligentes pour le bien être de l homme et de l environnement. Pour accomplir sa mission, le GBIF encourage une grande diversité de fournisseurs de données dans le monde à découvrir et publier des données à travers son réseau. April 2011 ii

Table des matières INTRODUCTION... 2 ETAPE 1. PRODUIRE UN FICHIER DE META DONNEES... 2 ETAPE 2. CREER UN METAFICHIER DESCRIPTEUR XML (META.XML)... 3 ETAPE 3. CREEZ VOS FICHIERS DE DONNEES... 4 ETAPE 4. CREEZ L ARCHIVE... 5 ETAPE 5. VALIDEZ L ARCHIVE... 5 ETAPE 6. PUBLIEZ L ARCHIVE... 5 April 2011 1

Introduction Des Archives Darwin Core peuvent être créées sans installer aucun logiciel dédié. Ce document est destiné à des gestionnaires de données qui connaissent le jeu de données à publier et qui ont une bonne pratique de leur système de gestion de données. Il suppose que vos données sont déjà, ou peuvent facilement être mises, sous la forme d un fichier texte CSV avec séparateurs, ou bien qu elles sont dans un système de gestion de base de données (MySQL, PostgresQL, Microsoft SQL Server, Oracle, ou Sybase). Il suppose que vous avez accès à un serveur Web et que vous ne souhaitez pas héberger une instance de l IPT. Ce document ne fournit pas une description complète du format des Archives Darwin Core : celle-ci est disponible ailleurs 1. Vous trouverez ci-dessous un ensemble d instructions pour créer et valider vous-même une Archive DwC. Trois composants sont requis : 1. Un fichier de métadonnées qui décrit la source des données (eml.xml). 2. Un métafichier (meta.xml) qui décrit le contenu et la relation entre le(s) fichier(s) de données au format texte, et 3. Le(s) fichier(s) texte au format CSV ou avec délimiteur, contenant les données elles-mêmes, Ce guide détaille comment générer chacun de ces trois composants, puis les étapes suivantes pour en faire une archive. Etape 1. Produire un fichier de métadonnées Il faut documenter la provenance et la couverture des jeux de données pour publier les données dans le réseau GBIF. L ensemble des instructions pour faire cela sont disponibles dans la Description étendue des métadonnées du GBIF : Guide pratique 2. Si vous n avez pas déjà un document sur vos métadonnées, trois options vous sont offertes pour en créer un. Le GBIF accepte une description de métadonnées fondée sur le langage EML (Ecological Metadat Language). 1 Darwin Core Archive - http://links.gbif.org/gbif_dwc-a_how_to_guide_en_v1 2 GBIF Metadata How-to - http://links.gbif.org/gbif_metadata_profile_guide_en_v1 April 2011 2

1. Identifiez un Centre d hébergement de données du GBIF et utilisez leur version d IPT (Integrated Publishing Toolkit : Outil de publication intégré) pour générer votre description. Vous trouverez une liste complète de ces Centres à l adresse : http://links.gbif.org/data_hosting_centers 2. Téléchargez un formulaire de tableur de métadonnées du GBIF et utilisez le service de traitement 3 pour générer un document EML.xml valide. 3. Téléchargez un document EML d exemple 4, et remplacez les métadonnées par votre propre information. Etape 2. Créer un Métafichier Descripteur XML (meta.xml) Il y a deux manières différentes de générer le fichier : utiliser l Assistant d Archive Darwin Core, ou le créer manuellement. Il est recommandé de consacrer l Etape 2 à créer le métafichier descripteur XML car celui-ci peut ensuite servir de guide pour générer les fichiers de données à l Etape 3 Figure 1 L Assistant d Archive Darwin Core produit un métafichier. 1. Utilisez l application en ligne Assistant d Archive Darwin Core 5 (Recommandé). Le GBIF fournit un outil en ligne pour vous aider à créer un métafichier XML. Il vous suffit de sélectionner les champs de données que vous souhaitez publier, de fournir quelques détails sur les fichiers et de sauvegarder le fichier XML produit. Ceci n est à faire qu une seule fois, à moins que vous ne modifiiez ultérieurement le jeu de champs publiés. Vous trouverez ci-dessous un jeu d instructions simplifié sur la manière d utiliser l Assistant d Archive Darwin Core pour créer votre métafichier : 3 Spreadsheet Processor http://tools.gbif.org/spreadsheet-processor 4 Sample EML XML - http://tools.gbif.org/eml-gbif-sample.xml 5 Darwin Core Archive Assistant http://tools.gbif.org/dwca-assistant/ April 2011 3

1. Sélectionnez la catégorie d information à laquelle appartiennent vos données : Occurrence : c est la catégorie des preuves de l occurrence d une espèce dans la nature, dans une collection, ou dans un jeu de données (spécimen, observation, etc.). Taxon: c est la catégorie des noms taxonomiques, des usages des noms de taxons, ou des concepts taxonomiques. 2. (Dans l onglet Occurrence ou dans l onglet Taxon) Ordonnez les termes selon l ordre des colonnes dans votre fichier texte source, en notant les deux termes obligatoires (occurrenceid et basisofrecord pour Occurrence ou bien taxonid pour Taxon) qui doivent être présents dans votre fichier source. 3. (Dans l onglet Occurrence ou dans l onglet Taxon) Saisissez les paramètres de configuration de votre fichier source : Type de fichier (CSV, Tab, Custom), délimiteur de champs, etc. 4. (Dans l onglet meta.xml) Saisissez l URL de votre fichier eml.xml, si possible. 5. (Dans l onglet meta.xml) Validez le métafichier. 6. (Dans l onglet meta.xml) Sauvegardez le métafichier. Un guide complet de l Assistant d Archive Darwin Core est disponible 6. 2. Elaborez vous-même le métafichier, à l aide d un éditeur XML et en partant d un exemple de métafichier pour vous guider. Une description complète du format de métafichier peut être trouvée sur le site Web de Biodiversity Information Standards 7 ou dans le Guide du GBIF des Métafichiers d Archive Darwin Core (GBIF Darwin Core Archive Metafile Guide 8 ). Assurez-vous que le fichier se valide bien. Etape 3. Créez vos fichiers de données A moins que vos données ne soient déjà stockées dans un fichier texte CSV/Tab, vous devez préparer un ou des fichier(s) texte à partir de la source. Si vos données sont stockées dans une base de données, générez un fichier de sortie au format texte avec délimiteurs à partir de votre base de données. La plupart des systèmes de gestion de bases de données possèdent les fonctions nécessaires. Comme le métafichier met en correspondance les colonnes du fichier texte avec les termes du schéma Darwin Core, il n est pas nécessaire d utiliser les termes de Darwin Core comme titres des colonnes dans votre fichier texte, bien que cela puisse aider à 6 Darwin Core Archive Assistant User Guide http://links.gbif.org/gbif_dwc-a_asst_en_v1.1 7 http://rs.tdwg.org/dwc/terms/guides/text/index.htm 8 Metafile Guide- http://links.gbif.org/gbif_dwc-a_metafile_en_v1 April 2011 4

éviter les erreurs. Une recommandation générale si vous souhaitez que vos sorties de données portent une extension, est de produire un fichier central de données unique, et un fichier unique pour chaque extension. Utilisez le métafichier que vous avez créé comme guide pour générer les fichiers de données au format texte. Assurez-vous que ce qui suit correspond aux valeurs spécifiées dans le métafichier. Noms de fichiers pour les métadonnées, pour le fichier central et pour les fichiers à extension Paramètres de configuration pour chaque fichier de sortie produit Ordre des champs pour le fichier central et pour les fichiers à extension Etape 4. Créez l Archive Assurez-vous que le fichier des métadonnées, les fichiers de données, et le métafichier XML sont dans le même répertoire. Compressez le répertoire à l aide de l un des formats de compression pris en charge. Le résultat est une Archive Darwin Core. Figure 2 Archive Darwin Core Etape 5. Validez l Archive Utilisez le valideur d Archive Darwin Core du GBIF (GBIF Darwin Core Archive Validator 9 ) pour vérifier que l archive se valide bien. Le valideur fournira un retour d information si l archive ne se valide pas correctement. Si l archive se valide correctement, elle est prête à être publiée. Etape 6. Publiez l Archive La publication de l archive requiert de rendre l archive accessible publiquement via une adresse (URL) fiable qui peut être partagée avec d autres. Ceci nécessite d accéder à un serveur Web. Si vous ne disposez d un accès à votre propre service Web, vous pouvez envisager de contacter un Centre d hébergement de données du GBIF, qui hébergera l archive pour vous. 9 http://tools.gbif.org/dwca-validator/ April 2011 5