EAD et interopérabilité : comment permettre le moissonnage de métadonnées normalisées par des portails

Documents pareils
Bibliothèque numérique de l enssib

Ministère de la Culture et de la Communication

Présentation générale du projet data.bnf.fr

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Compte-rendu re union Campus AAR 3 mars 2015

Business & High Technology

XML, PMML, SOAP. Rapport. EPITA SCIA Promo janvier Julien Lemoine Alexandre Thibault Nicolas Wiest-Million

Solution documentaire globale. Présentation du 14 janvier 2010

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

Langage HTML (2 partie) <HyperText Markup Language> <tv>lt La Salle Avignon BTS IRIS</tv>

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype

Atelier 1. Portails documentaires : BioLib et Cemadoc

Programme national de numérisation. Ministère de la Culture et de la Communication. Appel à projets de numérisation 2010

Marc SALLIERES CEO ALTIC

CATALOGUE DE LA GAMME EASYFOLDER OFFRE GESTION DE CONTENUS NUMERIQUES

Urbanisation des Systèmes d'information

Programmation Internet Cours 4

Architectures web/bases de données

CONSERVATOIRE NATIONAL DES ARTS ET METIERS INSTITUT NATIONAL DES TECHNIQUES DE LA DOCUMENTATION

Exploration des technologies web pour créer une interaction entre Mahara et les plateformes professionnelles et sociales

Entrepôt de données 1. Introduction

Pelleas : Le projet XML pour le systeme d information documentaire du polytechnicum de Marne- la Vallée

Module BD et sites WEB

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) JRES Novembre 2007

Petite définition : Présentation :

Description archivistique : nouvelles technologies, nouvelles compétences?

Migration et import de données

La modernisation technologique du réseau repose alors sur plusieurs axes de travail :

La gestion électronique de documents

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

Alfresco Guide Utilisateur

Le Web de Données Dan VODISLAV Université de Cergy-Pontoise Master Informatique M2 Plan

MESDAMES ET MESSIEURS LES DIRECTEURS ET CHEFS DE SERVICE

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

Catalogue Formation «Vanilla»

Université de Lausanne

Le projet SIST. Internet et Grilles de calculs en Afrique Agropolis- Montpellier Décembre 2007

Formations QlikView / Business Intelligence

La Jubilothèque Du magasin à la Jubilothèque documents en ligne soit + de pages budget /an 0.7 ETP Pôle associé BnF

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Gestion collaborative de documents

Métadonnées, ontologies et documents numériques

Stages en archives pendant l apprentissage d agent-e en information documentaire liste de contrôle

ROYAUME DU MAROC PROJET E-RH DANS L ADMINISTRATION PUBLIQUE MAROCAINE - PREMIÈRE PHASE

Navigation dans les fichiers de configuration 1

DataStudio. Solution d intégration des données et de diffusion de l information

Description de Produit Logiciel. AMI News Monitor v2.0. SPD-AMINM-10 v1.0

De la fiche manuscrite à Internet : l informatisation des collections et de la documentation au musée du quai Branly

Annonceurs et professionnels qui l'ont expérimentée le savent, la mixité des canaux est aujourd'hui une stratégie gagnante en marketing direct.

Usine frigorifique de la Société des Entrepôts Frigorifiques Lyonnais, actuellement société Socora

Quels apprentissages info-documentaires au collège?

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

Programme de formation

Services sur réseaux. Trois services à la loupe. Dominique PRESENT Dépt S.R.C. - I.U.T. de Marne la Vallée

Web Site Story Etude, développement et valorisation de votre présence internet

Panorama des contenus

Les attentes du marché

Infrastructure de Données Spatiales

Urbanisme du Système d Information et EAI

ZOTERO. Installation. Bibliothèque de Pharmacie. Service Formation

Webmaster / Webdesigner / Wordpress

findit.lu Les guides d utilisation Leçon 17

Urbanisation des SI. Des composants technologiques disponibles. Urbanisation des Systèmes d'information Henry Boccon Gibod 1

Les services usuels de l Internet

Master Technologies numériques appliquées à l'histoire Deuxième année

Archives ouvertes : les enjeux dans les politiques d établissement et les projets internationaux

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

X2BIRT : Mettez de l interactivité dans vos archives

Solutions informatiques (SI) Semestre 1

Business Intelligence avec SQL Server 2012

Les ressources informatiques et la mise en ligne des documents numérisés Enquête DLL juin-décembre 2008

Astuce N 1 : Consulter mon catalogue articles en mode liste puis en mode fiche : recherche du prix d'une référence, consultation du stock

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Easy to. report. Connexion. Transformation. Stockage. Construction. Exploitation. Diffusion

Présentation aux entreprises du numérique

SII Stage d informatique pour l ingénieur

A. Architecture du serveur Tomcat 6

Introduction à la B.I. Avec SQL Server 2008

TOUTSURLENVIRONNEMENT.FR

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

GKR. Geological Knowledge Representation Base de connaissances métallogéniques

Glossaire. Arborescence : structure hiérarchisée et logique qui permet d organiser les données dans un système informatique.

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

Les nouveaux sites documentaires de l IRD

Constituer et gérer une bibliographie avec le logiciel zotero. Support de cours et liens utiles

Q.U.I.D QUALITÉ ET URBANISATION DE L'INFORMATION DÉCISIONNELLE. Tom BIZET & Stéphane SITBON 2008

Correspondance ancien / nouveau référentiel B2i pour le collège

Mise en œuvre de l architecture SINP. Forum ATEN des TIC 4 juin Y. Lebeau MEDDE/DGALN/DEB/PEM4

Formation continue des personnels URCA. Offre de la Bibliothèque Universitaire

Introduction à Microsoft InfoPath 2010

Activité : Élaboration, mise en forme et renseignement de documents

Business Intelligence avec SQL Server 2012

Bases de Données Avancées

Le standard d'échange de données pour l'archivage (SEDA)

Intégration de Données et Systèmes Décisionnels. Au cœur de la performance

Master Informatique et Systèmes. Architecture des Systèmes d Information. 02 Architecture Applicative

et Groupe Eyrolles, 2006, ISBN :

Informations sur la sécurité

Transcription:

EAD et interopérabilité : comment permettre le moissonnage de métadonnées normalisées par des portails Frédéric Rolland Sous-direction des systèmes d'information Lucile Grand Service interministériel des archives de France Journées d études sur la production et la publication électronique des instruments de recherche, ANOM, Aix-en-Provence, juin 2010

1. Principes de l'interopérabilité 2. Utilisation de l'oai-pmh pour participer aux portails 3. Cas des portails Collections et Généalogie 4. Exemple du portail européen APEnet

1. Les différents niveaux d'interopérabilité (DGME) : organisationnel sémantique syntaxique technique Organisationnel : se mettre d'accord (définir les rôles & responsabilités, mettre en place les ressources ) Sémantique : savoir se comprendre (s'entendre sur la signification des données qu on échange) Syntaxique : savoir communiquer (s'entendre sur la forme) Technique : pouvoir communiquer (véhiculer les informations) MCC/DAG/DSI/BIA/FR 3

1. Principes de l'interopérabilité 2. Utilisation de l'oai-pmh pour participer aux portails 3. Cas des portails Collections et Généalogie 4. Exemple du portail européen APEnet

2. Pourquoi faire le choix du système d'échange OAI-PMH (niveau technique)? Open Archive Initiative - Protocol for Metadata Harvesting Le terme " ARCHIVE " désigne des entrepôts d'informations contenant des documents numériques. Le terme "OPEN" signifie : l'ouverture de l'architecture technique de ces entrepôts d'informations par la mise en place d'un protocole commun basé sur les standards du Web qui facilite l'accès au contenu par un ensemble de services extérieurs MCC/DAG/DSI/BIA/FR 5

2. Standards du web utilisés pour l'oai : HTTP : Hypertext Transfert Protocole niveau technique Circulation des données hypertexte sur le Web XML : extensible Markup Language niveau syntaxique Balisage et encodage des données (balisage extensible) Dublin Core : métadonnées standards niveau sémantique Définition des métadonnées minimums à renseigner pour décrire une ressource sur le Web (auteur, titre, localisation, datation, etc) MCC/DAG/DSI/BIA/FR 6

2. Architecture de l'oai : Un protocole de communication posé sur le protocole de transport HTTP Fournisseur Données (provider) A XML OAI HTTP OAI B Fournisseur Services (harvester) Entrepôt OAI MCC/DAG/DSI/BIA/FR 7

2. Pré-requis pour la mise en place d'un entrepôt OAI Le protocole OAI est basé sur la notion d'items qui sont des fiches descriptives de ressources : A-t-on de telles fiches? Ces fiches possèdent-elles un code identifiant unique et pérenne? MCC/DAG/DSI/BIA/FR 8

2. Pré-requis pour la mise en place d'un entrepôt OAI Dans le cas de ressources numériques volumineuses (ex:monographies), peut-on en extraire des métadonnées? Peut-on définir facilement des «unités documentaires» qui deviendront des items en OAI? Peut-on générer le format Dublin Core simplifié? En option (recommandé pour les bases volumineuses) : Les informations sur le cycle de vie des unités documentaires sont-elles disponibles? MCC/DAG/DSI/BIA/FR 9

2. Définition des unités documentaires Ressource = objet physique décrit Item = ensemble de données descriptives, structurées et numériques décrivant une œuvre, enregistré dans une base source Identifiant Auteur Description Enregistrement = unité documentaire DC EAD... jeu de métadonnées dans un format spécifique ou standard (au minimum le Dublin Core), enregistré dans un entrepôt OAI MCC/DAG/DSI/BIA/FR 10

2. Modèle de données = libre (en plus du format Dublin Core obligatoire) DC* A EAD Protocole OAI Système cible Entrepôt OAI... NB Les systèmes source et cible doivent être d'accord sur la granularité des unités documentaires MCC/DAG/DSI/BIA/FR 11

2. Notion de Sous-ensembles (sets) : S2 S1 Entrepôt OAI S3 MCC/DAG/DSI/BIA/FR 12

2. Mises à jour : exploitation des informations sur le cycle de vie des unités documentaires - limitation des flux échangés au strict nécessaire (créations, modifications, suppressions) Entrepôt OAI source Depuis Protocole OAI Système cible Jusqu'à MCC/DAG/DSI/BIA/FR 13

1. Principes de l'interopérabilité 2. Utilisation de l'oai-pmh pour participer aux portails 3. Cas des portails Collections et Généalogie 4. Exemple du portail européen APEnet

3. Apports dans le cadre de projets de fédération de bases du MCC : Facilité de mise en œuvre Standardisation de la relation avec les bases sources (rapidité d'intégration des sources) Réduction des coûts d'exploitation et de maintenance MCC/DAG/DSI/BIA/FR 15

3. Avantage de Généalogie sur Collections : schéma de données nominatives unique mis en œuvre par la DAF Point de vigilance: Évolution maitrisée des modèles de données (niveau organisationnel) MCC/DAG/DSI/BIA/FR 16

3. Collections : Agrégateur de contenu pour le portail Europeana Avantages : Un seul point d'entrée pour le portail Europeana Masquage de la complexité des bases sources Expertise du MCC sur la mise en conformité des sources avec le modèle Europeana MCC/DAG/DSI/BIA/FR 17

3. MCC, Établissements publics, collectivités Entrepôts OAI Arts décoratifs MCC Entrepôt-OAI Collection Moissonneur Europeana AD ETL ESE ESE Archives Canada-France EAD Tables d'équivalence (AD, EAD, etc) ESE... APEnet ETL (Extract Transform Load) : outil de transformation de données MCC/DAG/DSI/BIA/FR 18

3. Pré-requis pour l'intégration d'une base dans Europeana 4 contraintes : Utiliser le protocole OAI Respecter le format de données ESE imposé par Europeana (ESE) Fournir un accès internet (URL) à une image pour chaque unité documentaire Fournir un accès internet (URL) à une page de consultation de l'unité documentaire sur le site d'origine NOTE : contrairement à Collections, le portail Europeana impose le modèle de données échangé MCC/DAG/DSI/BIA/FR 19

3. Modèle de données ESE Trois parties : DC ID fournisseur URLs Une partie Dublin Core Une partie réservée à la consolidation (identification des fournisseurs) Une partie technique pour définir l'accès Internet sur le site fournisseur aux unités documentaires en consultation et aux images publiées MCC/DAG/DSI/BIA/FR 20

3. OAI Europeana contrainte sur les ressources consultées Accès aux unités documentaires sources Accès internet obligatoire à la présentation du document source sur site (URL) Note : Prévoir une présentation contextuelle du document qui permette la navigation sur le site Accès aux images Accès internet obligatoire à une vignette ou une image Note : La moisson d'objets multimédia n'est pas prévue dans le protocole OAI : Il faut que l'objet multimédia associé à chaque unité documentaire soit accessible sur internet à travers une URL MCC/DAG/DSI/BIA/FR 21

Versement d'entrepôts OAI dans Collections et Généalogie Catalogue des fonds numérisés 1169 Archives Canada France 105000 IRCAM 125 924 Arts décoratifs 15798 Collections Musée MAGNIN 492 Gallica 175 789 BM Baud 35274 État civil Algérie 1 040 590 État civil Vendôme 827 484 Conscrits Mayenne 100 000 Généalogie MCC/DAG/DSI/BIA/FR 22

Versement de Collections dans Europeana Archim 10661 Arts décoratifs 15798 Mémoire 994 925 Louvre Atlas 26 251 Collections 2 260 717 Europeana RMN photos 419 145 Musée Branly 268 468 Joconde 423 991 Phocem 54 173 MCC/DAG/DSI/BIA/FR 23

1. Principes de l'interopérabilité 2. Utilisation de l'oai-pmh pour participer aux portails 3. Cas des portails Collections et Généalogie 4. Exemple du portail européen APEnet

4. APEnet but : développer un portail pour les archives des pays d'europe afin de donner un accès commun aux descriptions et documents numérisés. Le portail européen des archives sera l'intégrateur dans le domaine archives pour Europeana. Europeana v1.0 but : mettre en oeuvre un portail européen multi-domaine sur le patrimoine culturel, qui donne accès à des objets numérisés et à leur description (archives, musées, bibliothèques et institutions audiovisuelles.)

4. : definition du modèle logique du portail WP 5: Diffusion : Interopérabilité avec Europeana us, production des outils d'intégration et de conversion WP 2: construction du portail WP 6: gestion du projet

Processus d'interopérabilité Archives locales APEnet Europeana 4. EAD locaux APEnet Europeana - Rhine Scripts de conversion APEnet EADMapping APEnet EAD vers ESE affichage basé sur APEnet EAD de démo disponible à : http://www.apenet.eu/movies/ead2ese1/ead2ese1.html

4. Choix des standards utilisés dans le portail EAD / EAC-CPF / EAG / + METS Pas d'images haute définition (au moins dans un premier temps)

4. Tous les partenaires fournissent leurs données sous la forme de fichiers EAD XML, quel que soit le format original de leurs données - exports de bases de données déjà en EAD - utilisation de feuilles de transformation XSL, développées spécifiquement ou non

4. Création d'un schéma «européen», APEnet EAD - Permettre un affichage correct et homogénéisé des données - Pouvoir chercher correctement dans les données - Pouvoir aligner les métadonnées et développer des fonctionnalités précises - Alimenter europeana

4. Les partenaires alimenteront le portail soit par OAI-PMH, soit par FTP ou FTPS APEnet alimentera europeana par OAI-PMH

4. Collecte d'exemples - Grandes différences dans l'utilisation de l'ead, même lorsque les pays ont rédigé des manuels (France, Pays-Bas) : utilisation des balises, des niveaux, de la hiérarchie des éléments etc. Extrait du premier livrable à la commission européenne : comparaison de l'utilisation de l'ead dans 6 pays

4. Décision de préparer un modèle commun : - première version théorique : définition du dictionnaire des éléments et des attributs autorisés - écriture du schéma :

4. Développement de l'outil de conversion Il est ajusté en fonction : - des résultats obtenus - des nouveaux exemples fournis par les partenaires (par exemple, avoir la bibliographie affichée dans européana : ce n'était pas prévu au départ, il faut donc modifier le schéma pour le faire)

4.

4.

4. Les archives dans Europeana APEnet servira d'agrégateur archives

4. principale différence entre ISAD(G)/EAD et Dublin Core (ESE) Notice Contient les informations : Fonds + Series + Subseries + File Notice Contient les informations : Fonds + File Notice Contient les informations : Fonds + Series + File + Item

4.

21st EBNA Conference Madrid 19th of May 2010 Du bas vers le haut ou du haut vers le bas : comment afficher les documents numérisés

http://www.culture.fr/fr/sections/collections/moteur_collections http://www.culture.fr/fr/sections/collections/genealogie http://www.apenet.eu/ http://www.europeana.eu