gbif@gbif.fr Twi$er : @gbiffrance Comment publier des données d occurrence et enregistrer des jeux de données au GBIF



Documents pareils
Créez votre propre Archive Darwin Core

Pierre Bonnet, INRA UMR AMAP Raffi Enficiaud, INRIA Équipe IMEDIA

GBIF Système mondial d'information sur la biodiversité

HERBIER NUMERIQUE COLLABORATIF DE MAURICE. enseignants des établissements à programme français de Maurice

Retour d expérience d outils autour d EML. Marie-Claude Quidoz (CEFE) Atelier FRB : 02/04/2014

Rédaction Anne- Sophie Archambeau (GBIF France) Participants. Thomas Changeux. Michel Guiraud

Learning Object Metadata

Mise en œuvre de l architecture SINP. Forum ATEN des TIC 4 juin Y. Lebeau MEDDE/DGALN/DEB/PEM4

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015)

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

JDev Atelier Datalift

Mise en place d une politique institutionnelle d archives ouvertes

Recherche bibliographique

Présentation du SINP. DGALN/DEB/PEM4 mai 2014

Bibliothèque numérique de l enssib

sommaire L organisation et la gestion des archives d entreprise...7

Présentation générale du projet data.bnf.fr

ISTEX, vers des services innovants d accès à la connaissance

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007

GKR. Geological Knowledge Representation Base de connaissances métallogéniques

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) JRES Novembre 2007

2. Questionnaire pour une base de données

Rédiger : le numérique dans la préparation de la thèse

GESTION D UNE BASE BIBLIOGRAPHIQUE

Infrastructure de Données Spatiales

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype

Ministère de la Culture et de la Communication

La gestion des données en écologie des communautés végétales : l exemple de Phytobase

Open Data. François Bancilhon twitter.com/fbancilhon Printemps de la recherche EDF R&D 28/9/12

Nœud Suisse du Projet International GBIF (Global Biodiversity Information Facility)

Formats de fichiers adaptés à l'archivage électronique à moyen et long terme

Domaine D1 : Travailler dans un environnement numérique évolutif

Mettre en place un Géoportail avec ArcGIS Server Armel OUEDRAOGO Pierre TEYSSENDIER

E-réputation Méthodes et outils pour les individus et les entreprises

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

Chapitre VIII. Les bases de données. Orientées Objet. Motivation

2 Serveurs OLAP et introduction au Data Mining

L offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence

Groupe Eyrolles, 2005,

Exploration des technologies web pour créer une interaction entre Mahara et les plateformes professionnelles et sociales

arcopole Studio Annexe 4 Intégration LDAP et processus d authentification Site du programme arcopole :

«Poursuivre au-delà de BEEST : une approche fonctionnelle basée sur les traits de vie des espèces en relation avec l habitat».

Rapport d évaluation à mi-parcours de thèse

Drupal et les SSO Nicolas Bocquet < nbocquet@linalis.com >

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Développer votre plan et votre stratégie Intranet

+ = OpenStack Presentation. Raphaël Ferreira - enovance. Credits : Thanks to the OpenStack Guys 1

Chapitre 3 : outil «Documents»

Formation SharePoint Server 2013

Cours Plugin Eclipse. Université Paris VI / Parcours STL / Master I Pierre-Arnaud Marcelot - Iktek - pamarcelot@iktek.com

La solution idéale de personnalisation interactive sur internet

Maarch V1.4

DIRAC : cadre et composants pour créer des systèmes de calcul distribués

Un serveur d'archivage

Recherche et veille documentaire scientifique

Introduction à Microsoft InfoPath 2010

Archivage à long terme des données de la recherche scientifique

X2BIRT : Mettez de l interactivité dans vos archives

ZOTERO Un outil gratuit de gestion de bibliographies

Fiche n 1 : Téléverser une ressource dans la plateforme

Veille Internet avec les flux RSS, recherche et veille sur les réseaux sociaux

LOGICIELS DE RÉFÉRENCES BIBLIOGRAPHIQUES CHOISIR LE BON OUTIL

Microsoft Office system Février 2006

Les profils d'intégration du domaine ITI

PROJET Site Drupal Informationsgeographiques.onema.fr

Projet en nouvelles technologies de l information et de la communication

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Problématiques de recherche. Figure Research Agenda for service-oriented computing

Outil de saisie et de gestion de données d observation naturaliste

Journée des bibliothécaires

RFC 7011 : Specification of the IP Flow Information export (IPFIX) Protocol for the Exchange of Flow Information

Décompresser, créer une archive au format «ZIP»

HAL, archives ouvertes. Christine Berthaud, CNRS/CCSD - Directrice

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Lettre d information de l Association ANTAREA. Numéro 4 - Automne 2014

Commerce Server 2009 R2

Glossaire. base de données géographiques Voir géodatabase (GDB).

Evidian Secure Access Manager Standard Edition

La documentation, l archivage et la dissémination des micros-données au Sénégal NIANG Mamadou OBJECTIFS

SYNC FRAMEWORK AVEC SQLITE POUR APPLICATIONS WINDOWS STORE (WINRT) ET WINDOWS PHONE 8

Sauvegarde et Restauration d un environnement SAS

SCI6052 Information documentaire numérique École de bibliothéconomie et des sciences de l information

DEMARREZ RAPIDEMENT VOTRE EVALUATION

TELA BOTANICA Le réseau des botanistes francophones. Daniel MATHIEU, président Montpellier, FRANCE

TMS THE MUSEUM SYSTEM

Utilisation du gestionnaire de références Zotero pour FIREFOX 4.0 avec plugiciel de Word

Présentation Seilia Solutions logiciels pour l immobilier. Juillet 2009

Le Web de Données Dan VODISLAV Université de Cergy-Pontoise Master Informatique M2 Plan

Compte-rendu re union Campus AAR 3 mars 2015

Messagerie & Groupeware. augmentez l expertise de votre capital humain

BIRT (Business Intelligence and Reporting Tools)

Problématiques de stockage d un Data Center

Guide d'utilisation. Zotero

ManageEngine EventLog Analyzer. Les bonnes critiques et recommandations

PRESTATIONS 2015 DEVELOPPEZ-VOUS! Anne LEROND Conseil

IPFIX (Internet Protocol Information export)

L import massif introduit plusieurs nouvelles fonctionnalités, selon que l on importe un thésaurus, un ensemble de valeurs contrôlées ou un corpus.

Université de Lausanne

Nos webmasters, web designers et ingénieurs de développement vous accompagnent dans vos projets afin de vous apporter entière satisfaction.

Guide d implémentation. Paiement par identifiant Fichier des cartes arrivant à expiration

Transcription:

Formation qualité, utilisation et publication des données Paris, 24-25 mars 2014 Comment publier des données d occurrence et enregistrer des jeux de données au GBIF gbif@gbif.fr Twi$er : @gbiffrance

Ensemble des données connectées via le GBIF France (au mois de mars 2014) Cette page ne montre que les données géo-référencées (plus de 8 569 222 enregistrements sur un total de 16 495 001 enregistrements).

Terminologie Fournisseur de données (Data Publisher, Provider) Jeu de données, Ressource (Data Resource, data set) Type de ressource (Metadonnées, Occurrences, Taxons) Enregistrements (Data record) Champs, concept, colonne (Data record element, term, field, column, property, a?ribute, concept (e.g., BasisOfRecord, sciendficname) Valeurs (Data value) Standards, Vocabulaires

Fournisseurs de données Institutions or individus ayant une seule ressource Institutions, groupes, ou individus ayant plusieurs ressources Institutions avec plusieurs départements, chacun ayant plusieurs ressources.

Qui sont les fournisseurs de données français? AssociaDons et conservatoires Universités Muséums Herbiers universitaires de Clermont-Ferrand InsDtuts de recherche Agrégateurs Et bientôt plus encore

Types de ressources Métadonnées décrivant les jeux de données d Occurrences et de Taxons. Données primaires (Specimens & Observations, Données écologiques) La donnée source est l Occurrence de l organisme Catalogues taxonomiques et Checklists. La donnée source est le Taxon

Standards d échange Métadonnées Données primaires Données taxonomiques Ecological Metadata Language (EML) Description riche des jeux de données GBIF Profile Darwin Core 180 concepts Ratifié en 2009 (TDWG) Fichiers texte Extensible Ou ABCD (TDWG) >1200 concepts Utilisé par Biocase et Tapir

Enregistrements Ressource de type Taxon Ressource de type Occurrence

Champs Taxon resource type Occurrence resource type

Valeurs Taxon resource type Occurrence resource type

Darwin Core Archive Contenu de l'archive Une archive correspond à un jeu de données Fichiers formatés par le standard Darwin Core Données d occurrences ou taxonomiques Métadonnées sous format EML

Darwin Core Archive: Anatomie Les archives ont toujours un fichier de métadonnées EML

Ecological Metadata Language (EML) Décrit les jeux de données même ceux qui ne sont pas publiés Titre et Description Citation and Attribution Contacts et Auteurs Couverture Géographique Méthode d'échantillonage Bibliographie Et plus...

Darwin Core Archive: Anatomie Les archives ont toujours un fichier de données principal (Core Data File)

Fichier excel modèle : page occurrences Fourni aux geshonnaires de données par le GBIF France Champs = termes DwC (mapping automahque par la suite)

Fichier excel modèle : page métadonnées Facilite le remplissage des métadonnées sur l IPT

Termes Darwin Core Darwin Core = standard de données interopérabilité Termes obligatoires (* dans le fichier modèle) : - institutioncode (ex : MNHN) : nom ou acronyme de l institution ayant la garde de l occurrence - catalognumber (ex : PPG-CF-00001) : identifiant (si possible unique) de chaque occurrence dans le jeu de données ou la collection - collectioncode (ex : Entomologie) : nom ou acronyme du jeu de données ou de la collection dont l occurrence provient - scientificname (ex: Canis lupus) : nom scientifique complet avec paternité et date (si connus) - basisofrecord (ex : observation, specimen, fossil ) : nature spécifique de l enregistrement

Termes importants : taxonomie, géographie (surtout latitude et longitude), conditions de prélèvement ou d observation, contexte géologique, date, habitat, médias associés Possibilité d ajouter des extensions (vocabulaire plus spécifique) : - Taxonomie détaillée - Ajout de noms vernaculaires - Images - Pour plus d informations (définition et traduction des termes Darwin Core) : http://terms.tdwg.org/wiki/darwin_core

Darwin Core Archive Le dossier est zippé Fichiers de données Fichier de correspondance des colonnes (meta.xml) Fichier de métadonnées (eml.xml) Ceci est une archive DarwinCore

Darwin Core Archive : avantages Format simple (Fichiers texte) Stockage efficace (compressé) Récolte efficace (un seul fichier) Simple d accès (pas besoin de logiciel spécifique) Extensible Format le plus souvent utilisé pour la publication des données sur le réseau GBIF

Processus de publicadon des données

PrésentaDon de l IPT (Integrated Publishing Toolkit)

Pour installer l IPT Version 2.0.5 Serveur Tomcat Disponible sur Google Code

Métadonnées obligatoires

Métadonnées géographiques

Mapping : correspondance des champs

Mapping : suite

GesDon de la ressource Rendre visible à tous Ajouter un gestionnaire

Publier le jeu de données

PublicaDon de la ressource

Enregistrement de la ressource (moissonnage par GBIF internadonal)

Références IPT v2 User Manual http://code.google.com/p/gbif-providertoolkit/wiki/ IPT2ManualNotes Occurrence Data Publishing Tutorial http://code.google.com/p/gbif-providertoolkit/wiki/ TutorialOccurrenceResource

Contacts Equipe GBIF France : gbif@gbif.fr Questions sur les outils GBIF : melecoq@gbif.fr pamerlon@gbif.fr Site web: http://www.gbif.fr Twitter : @gbiffrance