FORMATION / ATELIER(S) : Mise en œuvre d un entrepôt OAI-PMH

Documents pareils
Bibliothèque numérique de l enssib

Logiciels libres de Bibliothèques numériques : présentation. Castore & Greenstone. Les autres : CDS Invenio, EPRINTS, Dspace.

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Etude de faisabilité pour la mise en place d une archive ouverte, commune à plusieurs établissements membres d Agropolis.

Compte-rendu re union Campus AAR 3 mars 2015

Archives ouvertes : les enjeux dans les politiques d établissement et les projets internationaux

HAL, archives ouvertes. Christine Berthaud, CNRS/CCSD - Directrice

Le projet SIST. Internet et Grilles de calculs en Afrique Agropolis- Montpellier Décembre 2007

Les archives ouvertes

Archives Ouvertes : retour d expérience et rôle des documentalistes

Présentation générale du projet data.bnf.fr

GROUPE DE TRAVAIL COOPERATIF

Ministère de la Culture et de la Communication

OPEN ACCESS. ouverte INP Toulouse

Vers une convergence. Plateforme en ligne Mathrice

Formation à la recherche bibliographique en sciences

Les nouveaux sites documentaires de l IRD

Panorama des contenus

Réseaux sociaux de chercheurs : quels enjeux et quelle politique pour une institution publique de recherche

Mise en place d une politique institutionnelle d archives ouvertes

Solution documentaire globale. Présentation du 14 janvier 2010


Atelier 1. Portails documentaires : BioLib et Cemadoc

Qu'est ce qu'une Fédération d'identités? Définitions Fonctionnement de base Fonctionnement détaillé Les principaux composants

Mode d emploi de HAL, la plate-forme d archives ouvertes du ccsd

21 mars Simulations et Méthodes de Monte Carlo. DADI Charles-Abner. Objectifs et intérêt de ce T.E.R. Générer l'aléatoire.

Archives Ouvertes : définition et constat français 1

isi ScSo Un accompagnement documentaire du doctorant Sciences Sociales

Recherche d information en Sciences exactes et appliquées

Rédiger : le numérique dans la préparation de la thèse

METHODOLOGIE DOCUMENTAIRE

Exploration des technologies web pour créer une interaction entre Mahara et les plateformes professionnelles et sociales

Portail : mode d emploi

Petite définition : Présentation :

Les métadonnées des thèses électroniques françaises

Développement d applications Internet et réseaux avec LabVIEW. Alexandre STANURSKI National Instruments France

Interaction entre réseaux sociaux et sites web

Archive ouverte UNIGE Procédure pour le dépôt d un document

Suivi administratif : Catherine GREMILLET, Directrice de l AFEPTB ; catherine.gremillet@eptb.asso.fr, /

Architecture N-Tier. Ces données peuvent être saisies interactivement via l interface ou lues depuis un disque. Application

GESTION D UNE BASE BIBLIOGRAPHIQUE

Import XML HAL et HAL- Inria

Mise à jour de STAR par formulaires (Cycle mise à jour) Version :

Un exemple d'authentification sécurisée utilisant les outils du Web : CAS. P-F. Bonnefoi

Veille Internet avec les flux RSS, recherche et veille sur les réseaux sociaux

OAI-PMH FOR DUMMIES Comment mettre en place un dépôt institutionnel avec des ressources limitées?

Bien architecturer une application REST

Description de Produit Logiciel. AMI News Monitor v2.0. SPD-AMINM-10 v1.0

CONSERVATOIRE NATIONAL DES ARTS ET METIERS INSTITUT NATIONAL DES TECHNIQUES DE LA DOCUMENTATION

Gestion des documents avec ALFRESCO

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

La voix en images : comment l évaluation objectivée par logiciel permet d optimiser la prise en charge vocale

Publier dans la Base Documentaire

Architectures web/bases de données

Single Sign-On open source avec CAS (Central Authentication Service)

Infrastructure / réseau / sécurité /support utilisateur

La mémorisation des mots de passe dans les navigateurs web modernes

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques

Formation à la recherche documentaire sur le web

Séminaire «Maîtrise de l information scientifique» Exploitation de l information : optimiser sa gestion documentaire

Mendeley, pour gérer sa bibliographie et la partager. Patricia Volland-Nail

PRÉSENTATION DE LOGICIELS DE GESTION DE RÉFÉRENCES BIBLIOGRAPHIQUES

Services sur réseaux. Trois services à la loupe. Dominique PRESENT Dépt S.R.C. - I.U.T. de Marne la Vallée

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype

e-science : perspectives et opportunités pour de nouvelles pratiques de la recherche en informatique et mathématiques appliquées

4. SERVICES WEB REST 46

Examen de la saisine Définition de l'architecture du SINP. Contributeurs : Frédéric Gosselin, Pascal Dupont

Système de diffusion d information pour encourager les PME-PMI à améliorer leurs performances environnementales

PLATEFORME DE GESTION DE CONGRÈS SCIENTIFIQUES. 12 mars 2015

Les ressources informatiques et la mise en ligne des documents numérisés Enquête DLL juin-décembre 2008

Métadonnées, ontologies et documents numériques

SYSTEME INTEGRE DE GESTION DES BIBLIOTHEQUES

«Un logiciel de gestion des références bibliographiques : pourquoi faire?»

Mise en œuvre de les capteurs dans la gestion de l eau

Navigation dans les fichiers de configuration 1

La biblio vient à vous : la veille avec les fils RSS

Europresse.com. Pour les bibliothèques publiques et de l enseignement. Votre meilleur outil de recherche en ligne. Guide version 1.

FileMaker Server 12. publication Web personnalisée avec XML

Alfresco Guide Utilisateur

Architectures d'intégration de données

E-réputation Méthodes et outils pour les individus et les entreprises

Formation continue des personnels URCA. Offre de la Bibliothèque Universitaire

NOUVELLES FONCTIONNALITES VERSION 2013R2

Les guides de bonnes pratiques. Comment contribuer à ISIDORE avec ses données numériques?

La directive INSPIRE en Wallonie: le géoportail et l infrastructure de diffusion des géodonnées en Région wallonne (InfraSIG(

Mise à disposition d une plateforme de veille et d analyse sur le Web et les réseaux sociaux

Programme national de numérisation. Ministère de la Culture et de la Communication. Appel à projets de numérisation 2010

Les sites Internet dynamiques. contact : Patrick VINCENT pvincent@erasme.org

L application de Gestion Electronique de Documents (GED)

Les Architectures Orientées Services (SOA)

Le standard d'échange de données pour l'archivage (SEDA)

Rencontre avec les correspondants-formation des services communs de la documentation. Jeudi 27 septembre 2012 URFIST de Paris

ISTEX, vers des services innovants d accès à la connaissance

Recherche. Instructions d utilisation de ce Tutoriel. Suite d une action. Explication d un exemple, information supplémentaire. Avertissement. Astuce.

XML, PMML, SOAP. Rapport. EPITA SCIA Promo janvier Julien Lemoine Alexandre Thibault Nicolas Wiest-Million

Module BD et sites WEB

SCI6052 Information documentaire numérique École de bibliothéconomie et des sciences de l information

4. Personnalisation du site web de la conférence

Single Sign On. Nicolas Dewaele. Single Sign On. Page 1. et Web SSO

Transcription:

Urfist NICE Lundi 23 / Mardi 24 mai 2011 FORMATION / ATELIER(S) : Mise en œuvre d un entrepôt OAI-PMH Le temps des moissons Estelle Nivault Laboratoire d Informatique, Signaux et Système de Sophia Antipolis (I3S) Service IST commune INRIA Sophia Antipolis Méditerranée / I3S

Le protocole OAI-PMH Eléments de compréhension 1. Définition 2. Bref historique 3. A quoi ça sert? 4. Propriétés du protocole 5. Comment ça marche? 5.1. Les acteurs de l OAI-PMH 5.2. Communication entre entrepôt et moissonneur

1.Définition : OAI-PMH : Open Archives Initiative-Protocol for Metadata Harvesting Protocole international, il permet de créer, alimenter et tenir à jour des réservoirs d enregistrements qui signalent, décrivent et rendent accessibles des documents, sans les dupliquer ni modifier leur localisation d origine. Un langage commun entre des machines qui permet de faire communiquer entre elles des bases de données hétérogènes. OAI-PMH est le protocole d archives ouvertes permettant le moissonnage des métadonnées par Google Scholar, OAIster

2.Bref historique : 1999 : Convention de Santé Fé (Nouveau Mexique) Volonté de faire inter-opérer des bases d archives entre elles 2001 : L Open Archive Initiative met au point un protocole pour faciliter l échange et la visibilité des données stockées dans les Archives Ouvertes : OAI-PMH: Open Archives Initiative Protocol for Metadata Harvesting Protocole de Collecte de Métadonnées de l Initiative Archives Ouvertes 2002 : V2 considérée comme spécification définitive Adapté au partage de métadonnées de documents scientifiques ou culturels (hétérogènes et réparties), le protocole étend son champ d utilisation aux institutions, bibliothèques, musées désireux de constituer et de mettre à disposition leurs réservoirs d informations.

3. A quoi ça sert? : Le protocole OAI-PMH permet : Echanger des métadonnées entre plusieurs institutions Accroître la visibilité des collections numériques sur Internet Signaler des ressources non accessibles aux moteurs de recherche (Web invisible) Fournir un accès commun à des ressources réparties sur différents sites

4. Propriétés du protocole Le protocole s appuie sur des standards simples : HTTP, XML, DC HTTP : protocole du Web permettant de faire dialoguer un navigateur avec un serveur Web XML : langage de description de données qui permet l échange structuré d informations Dublin Core (DC): format de description bibliographique qui définit des métadonnées génériques désignant des objets Exemple : - creator : pour désigner un auteur - source : pour désigner l adresse du fichier texte

Le protocole exige que les métadonnées soient au minimum au format Dublin Core non qualifié (15 éléments de base) : dc:identifier dc:title dc:subject dc:description dc:date dc:coverage dc:creator dc:contributor dc:publisher dc:format dc:type dc:source dc:language dc:relation dc:rights Cette désignation commune va permettre l agrégation du contenu de bases différentes.

D autres ensembles de métadonnées peuvent être employés afin de fournir des descriptions plus précises (DC qualifié). Ajout de qualificatifs (raffinements) qui précisent les éléments de bases : Exemple : l élément DESCRIPTION peut être affiné par ABSTRACT : <DC:DESCRIPTION.ABSTRACT>résumé</DC:DESCRIPTION.ABSTRACT> Pour définir des correspondances entre une BDD et des objets du langage du Dublin Core, il faut faire du MAPPING : Tableau de conversion / types de documents (monographie, document sonore, image...), en fonction des pratiques et usages dans les communautés concernées. Ce travail de mapping est absolument essentiel et peut représenter plus de 50 % du temps nécessaire à la mise en ligne de corpus documentaires.

5. Comment ça marche? 5.1. Les acteurs de l OAI-PMH Fournisseur de données (data provider) : exposent des métadonnées dans des entrepôts (repository) OAI. Il doit disposer d'une application informatique compatible OAI-PMH. (Ex: HAL, ArXiv) Le fournisseur de données peut décider de proposer ses métadonnées à un service spécifique ("modèle réservé" ) ou les rendre accessibles à tous les fournisseurs de services intéressés ( "modèle partagé" ). Fournisseur de services (service provider) : «moissonne» des entrepôts de données en collectant les notices correspondant aux documents qui y sont déposés (harvesting). Il créer des services à VA en retravaillant les informations récoltées (ex : recherches à facettes, alertes, flux RSS ) Ex : Oaister, Scientific Commons

Source : François NAWROCKI, «Le protocole OAI et ses usages en bibliothèques», http://www.culture.gouv.fr/culture/dll/oai PMH.htm, Dernière mise à jour le 15 février 2005

5.2. Communication entre entrepôt et moissonneur Le moissonneur soumet des requêtes OAI à l entrepôt via le protocole HTTP grâce à de simples URL afin de récupérer les métadonnées au format XML. Les requêtes utilisent les méthodes GET (via une url HTTP, une seule requête, données "visibles" dans l'adresse de la page) ou POST (via un formulaire).

Ces requêtes (verbs) sont au nombre de 6 : Identify : Informations générales sur le serveur ListMetadataFormats : Demande la liste des formats de métadonnées disponibles dans l entrepôt ListIdentifiers : Demande de la liste des éléments contenus dans l entrepôt ListSets: Demande de la liste des ensembles OAI définis dans l entrepôt (ex : pour avoir la liste des domaines + tampons dans HAL) ListRecords : Demande des enregistrements de métadonnées contenues dans l entrepôt GetRecord: Demande d un enregistrement précis

L exemple de Hal-INRIA : http://hal.inria.fr/ Les demandes se font : via une interface graphique web à l'url suivante : http://hal.inria.fr/oai Un formulaire permet de composer des requêtes OAI et de visualiser les résultats dans le navigateur. directement avec une url http://hal.inria.fr/oai/oai.php/... en passant les paramètres en POST (ex : http://hal.inria.fr/oai/oai.php?verb=listmetadataformats) Plusieurs formats d'échange sont proposés : le format minimum d'échange est OAI_DC (Dublin core non qualifié) le format OAI_INRIA propose les données complètes de l'inria le format OAI_HAL (metadonnées de dublin core + metadonnées spécifiques de hal.ccsd)