OAI-PMH pour la diffusion de corpus documentaires numérisés ou numériques : retours d'expériences

Documents pareils
Présentation générale du projet data.bnf.fr

Infrastructure / réseau / sécurité /support utilisateur

Panorama des contenus

Bibliothèque numérique de l enssib

PloneLabs un gestionnaire de contenu pour les laboratoires

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Solution documentaire globale. Présentation du 14 janvier 2010

Ministère de la Culture et de la Communication

HAL, archives ouvertes. Christine Berthaud, CNRS/CCSD - Directrice

La Jubilothèque Du magasin à la Jubilothèque documents en ligne soit + de pages budget /an 0.7 ETP Pôle associé BnF

Atelier 1. Portails documentaires : BioLib et Cemadoc

Le projet SIST. Internet et Grilles de calculs en Afrique Agropolis- Montpellier Décembre 2007

Les archives ouvertes

Les nouveaux sites documentaires de l IRD

Les ressources informatiques et la mise en ligne des documents numérisés Enquête DLL juin-décembre 2008

Archives ouvertes : les enjeux dans les politiques d établissement et les projets internationaux

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015)

Recherche bibliographique

Evolution des catalogues et des métiers: comment se préparer aux changements? Quelques échos de la BnF. CRFCB Université de Toulouse 29 mars 2013

PLATEFORME DE GESTION DE CONGRÈS SCIENTIFIQUES. 12 mars 2015

Réseaux sociaux de chercheurs : quels enjeux et quelle politique pour une institution publique de recherche

Navigation dans les fichiers de configuration 1

De la fiche manuscrite à Internet : l informatisation des collections et de la documentation au musée du quai Branly

La modernisation technologique du réseau repose alors sur plusieurs axes de travail :

PLATEFORME DE GESTION DE CONGRÈS SCIENTIFIQUES

Une organisation internationale au cœur des enjeux de contenus et d accès à l information scientifique: L IFLA

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Couplage d une base de données documentaire à une visualisation interactive 3D sur l Internet

MODE D'EMPLOI. La gestion des versions permettra de compléter et de faire évoluer les fiches dans le temps. NOM DE LA RESSOURCE CONTACT FOURNISSEUR

Méthodologie de mise en place de

Extensions, Documentation, Tutoriels, Astuces

Content Management System V.3.0. BlackOffice CMS V3.0 by ultranoir 1

Université de Lausanne

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype

Quels apprentissages info-documentaires au collège?

Master Technologies numériques appliquées à l'histoire Deuxième année

PLATEFORME DE GESTION DE CONGRÈS SCIENTIFIQUES. h tt p : / / w w w. s c i e n c e s c o n f. o rg


Présentation du cadre technique de mise en œuvre d un Service d Archivage Electronique

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007

RIHANE Abdelhamid Maitre de conférences Université de Constantine (ALGERIE)

Journée des bibliothécaires

CONSERVATOIRE NATIONAL DES ARTS ET METIERS INSTITUT NATIONAL DES TECHNIQUES DE LA DOCUMENTATION

Le portail documentaire

Numérisation et valorisation des fonds patrimoniaux dans les collectivités

ELOECM Conference2015

Le Parc naturel régional des SIG. Restructuration d un SIG et diffusion des données dans le cadre de la directive Inspire

CATALOGUE DE LA GAMME EASYFOLDER OFFRE GESTION DE CONTENUS NUMERIQUES

La gestion des documents administratifs à la Bibliothèque nationale de France

La «confluence» documentaire et

Vers une convergence. Plateforme en ligne Mathrice

Votre référentiel documentaire. STS.net Solution de gestion et de conservation des actifs documentaires de l entreprise

Migration et import de données

Base de données Eros : Portail musiques et traditions du monde : Site Internet de la médiathèque de la Cité de la musique : TRANS'TYFIPAL :

Mise en place d une politique institutionnelle d archives ouvertes

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) JRES Novembre 2007

Dafoe Présentation de la plate-forme UIMA

Référentiel des métiers et des fonctions de l information-documentation

PRESENTATION 2009 L'ingénierie Documentaire

Administrer la base de données. Le cas concret de l'école nationale supérieure des beaux-arts

SYSTEME INTEGRE DE GESTION DES BIBLIOTHEQUES

Concevoir sa stratégie de recherche d information

Base de données opérationnelle pour les phénomènes PAN Commission SIGMA 2 - AAAF

Programme national de numérisation. Ministère de la Culture et de la Communication. Appel à projets de numérisation 2010

OAI-PMH FOR DUMMIES Comment mettre en place un dépôt institutionnel avec des ressources limitées?

Constituer et gérer une bibliographie avec le logiciel zotero. Support de cours et liens utiles

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

Conférence de presse

Archivage à long terme des données de la recherche scientifique

Formats de fichiers adaptés à l'archivage électronique à moyen et long terme

LIVRE BLANC «LA GESTION, CONVERSION, IMPRESSION, PUBLICATION ET DISTRIBUTION DOCUMENTAIRE SAP» SAP DMS SAP PLM

CATALOGUE DES PRESTATIONS

Cours TD TP EC UE EC UE CC Mixte Introduction aux sciences de. 3 Environnement. 4 l'administration et de. Anglais 28 2

Créateur de sites Internet. Développeur de logiciels.

Acquisition Indexation Classement & Recherche & Stockage Consultation. Solution d archivage sur mesure

Mode d emploi de HAL, la plate-forme d archives ouvertes du ccsd

ISTEX, vers des services innovants d accès à la connaissance

FORUM DES USAGES COOPERATIFS PATRIMOINE, HISTOIRE ET MEMOIRE EN LIGNE

L. Granjon, E. Le Goff, A. Millereux, L. Saligny MSH Dijon

PRESENTATION DE LA PLATEFORME NUMERIQUE AGORASSAS Préparation en ligne au concours d accès à l ENM. IEJ «Pierre RAYNAUD» Université Panthéon-Assas

Guide du doctorant ( )

Content Management System. bluecube. Blue Cube CMS V4.3 par Digitalcube

ARCHIVISTIQUE ET INGÉNIERIE DOCUMENTAIRE

Banque de données d offres & carte web interactive d offres

L import massif introduit plusieurs nouvelles fonctionnalités, selon que l on importe un thésaurus, un ensemble de valeurs contrôlées ou un corpus.

Messagerie & Groupeware. augmentez l expertise de votre capital humain

Mercredi 15 Janvier 2014

HAL-Pasteur. La plate-forme d archive ouverte de l Institut Pasteur. Formation au dépôt d articles.

«Outils de gestion pour TPE CRM / ERP»

Offres de stages 2011/2012

Pérennisation des Informations Numériques

JDev Atelier Datalift

Formation à la recherche documentaire sur le web

Transcription:

OAI-PMH pour la diffusion de corpus documentaires numérisés ou numériques : retours d'expériences Stéphane Pouyllau, Ingénieur d'études CNRS, Très grand équipement ADONIS / CNRS - UPS2916 www.tge-adonis.fr ~ http://blog.stephanepouyllau.org

Secteur classique de l'oai-pmh OAI-PMH : Diffusion de données via leurs métadonnées 1er secteur de l'oai-pmh : Les articles scientifiques (archives ouvertes) les publications «ordonnées» : revues, collections de revues, collections d'ouvrages

Données, corpus documentaires (1) Données numériques pour des corpus? Données «brutes» de la recherche Qui servent à faire la recherche En SHS : sources en histoire (manuscrits, imprimés), carnets de terrains, photographies, des enregistrements sonores, films, vidéos, des données de scanners 3D, etc. Autres domaines : images satellitaires, des données issues de mesures, etc.

Données, corpus documentaires (2) Corpus documentaires Données «brutes» cataloguées, décrites, référencées et indexées Données «documentarisées» = Données «brutes» + données descriptives (méta-données) : Techniques (formats, codages, contexte technique de production) Scientifiques (sémantiques) Diffusions (contexte juridique, barrières mobiles, etc.) Corpus documentaires = ensemble raisonné de données documentaires

OAI-PMH et corpus : un vecteur de diffusion Comment diffuser des données numériques de recherche avec OAI-PMH Définition du corpus exposé via OAI-PMH Questions de mapping entre schéma de description local et DC... voir + Outils utilisés Contrainte et limites OAI-PMH + DC : 1ere marche vers le web de données

OAI-PMH : un pilier d'isidore ISIDORE : le moteur de recherche en cours de développement par le TGE ADONIS Accès global aux données structurées Valorisation des données structurées Travail des documentalistes! Le moteur de recherche utilisera 4 connecteurs OAI-PMH+(DC, METS) ; RSS/ATOM ; SITEMAP+RDFa ; SRU/SRW

OAI-PMH et corpus numériques Centre national pour la numérisation de sources visuelles (CNRS)

Définition du corpus exposé avec OAI-PMH

Définition du corpus exposé avec OAI-PMH

Comment faire? Quelle politique mettre en œuvre Un entrepôt par corpus, site? Des entrepôts par thématiques? Un entrepôt global? Modèle mixte? Photo : vanna_/flickr cc http://www.flickr.com/photos/vannadoo/3942947506/

Schéma général DC MODS Web OAI-PMH Corpus

Un entrepôt global (1) Pourquoi? Asynchronisme entre publication web / OAI-PMH Dans l'autre sens = OAI-PMH / web Temps de diffusion différents Web : diffusion très rapide, visible, édition électronique OAI : notion d'entrepôt de sources ; «archive» ; URL pérennes Granularité différente : Web : données / données + enrichissements OAI : données et ventilation en Sets multiples (limite)

Un entrepôt global (2) Entrepôt OAI-PMH du CN2SV 2700 notices XML Dublin Core Metadata Element Set, version 1.1 Metadata Object Description Schema (MODS), version 3.1 2700 ressources numériques URL pérennes. 2700 notices XML donnant accès à 80000 fichiers numériques images, ouvrages numérisés, inventaires de fonds d'archives de chercheurs, de labo en SHS

Entrepôt OAI-PMH du CN2SV : DC

Entrepôt OAI-PMH du CN2SV : MODS

Granularité et mapping, ou comment se fâcher à vie dans un laboratoire! Photo : SP flickr cc

5 phases de travail A) construction du modèle idéal pour le chercheur (dialogue ch. - doc - info) B) travail documentaire de mapping C) proposition et discussion avec les chercheurs D) mapping de compromis E) implémentation informatique C'est long... dur parfois, mais pas toujours

Métadonnées scientifiques Métadonnées techniques

DC MODS Web OAI-PMH Corpus Documentation / documentalistes

Archives Documentation Recherche Informatique

Outils (1) Outils simples Solutions open sources MySQL PHP phpoai2 : http://physnet.uni-oldenburg.de/oai/ An implementation in PHP of the OAI V2 Data-Provider 2005 Phpoai2 : un logiciel PHP (web) qui permet d'exposer des méta-données contenues dans une base de données MySQL ou PostgreSQL

Outils (2) Application Métier : SIGB... CMS... ICEberg Scripts PHP MySQL MySQL PgSQL PHP Scripts PHP Validation /contrôle /enrichissement

Contraintes et limites Mise «à plat» des données Ex. avec l'ead : encoded archival description

Contraintes et limites

Contraintes et limites Vocabulaire et stratégie de diffusion Faire comprendre que l'oai-pmh apporte des flux des consultations en + 20% des visites viennent d'un portail OAI-PMH (oaister, scientificcommons, driver) Proposer + que du DC simple Implémentation de schéma plus riche Suivant les publics MODS ; Lom-fr ; etc.

Contraintes et limites Notices bibliographiques et OAI OAI-PMH : le M de PMH = méta-données Ressources numériques uniquement? Y'a-t-il «pollution» des entrepôts OAI-PMH? La notice bibliographique : où est sa place aujourd'hui? Quelles solutions?

OAI-PMH + DC : 1ere marche vers le web de données Le web est plein d'information, de BDD... Vide de données «brutes» Le web va se remplir de données? Données structurées = importance des documentalistes Données liées entre elles par des référentiels communs (linked data) qui se construise en parallèle Données liées aux publications?

OAI-PMH + DC : 1ere marche vers le web de données

OAI-PMH + DC : 1ere marche vers le web de données Raw Data Now! (données brutes maintenant!) Tim Bernes-Lee, conférence TED, 2009. http://www.ted.com/index.php/talks/tim_berners_lee_on_the_next_web.html

OAI-PMH + DC : 1ere marche vers le web de données Ok, great! But... Learn to make OAI-PMH, DC, DC terms, MODS, OAI-ORE... the 1st step? Stéphane Pouyllau, Frédoc 2009.

Merci... L'OAI-PMH en action : les posters! Stéphane POUYLLAU Ingénieur d'études CNRS TGE ADONIS / CNRS www.tge-adonis.fr