Métadonnées et XML Une introduction



Documents pareils
Bibliothèque numérique de l enssib

Plan. Contexte technologique. Introduction. Environnement réseauté. Documents structurés. L écrit électronique. Introduction.

Présentation générale du projet data.bnf.fr

Le standard d'échange de données pour l'archivage (SEDA)

Gestion Électronique de Documents et XML. Master 2 TSM

MEMOIRE pour obtenir le Titre professionnel "Chef de projet en ingénierie documentaire" INTD niveau I. présenté et soutenu par Stéphane Héroult

XML, PMML, SOAP. Rapport. EPITA SCIA Promo janvier Julien Lemoine Alexandre Thibault Nicolas Wiest-Million

Langage HTML (2 partie) <HyperText Markup Language> <tv>lt La Salle Avignon BTS IRIS</tv>

CONSERVATOIRE NATIONAL DES ARTS ET METIERS INSTITUT NATIONAL DES TECHNIQUES DE LA DOCUMENTATION

Métadonnées, ontologies et documents numériques

Table des matières détaillée

Archivage pérenne : les formats conformes Version :

SII Stage d informatique pour l ingénieur

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) JRES Novembre 2007


Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

Présentation du service «photothèque-and-co» annuaire professionnel. base de données

Logiciels libres de Bibliothèques numériques : présentation. Castore & Greenstone. Les autres : CDS Invenio, EPRINTS, Dspace.

Master Technologies numériques appliquées à l'histoire Deuxième année

La directive INSPIRE en Wallonie: le géoportail et l infrastructure de diffusion des géodonnées en Région wallonne (InfraSIG(

Mettre en place un Géoportail avec ArcGIS Server Armel OUEDRAOGO Pierre TEYSSENDIER

La gestion des documents administratifs à la Bibliothèque nationale de France

Pelleas : Le projet XML pour le systeme d information documentaire du polytechnicum de Marne- la Vallée

Archivage à long terme des données de la recherche scientifique

Droits d'usage et mises à jour des logiciels Microsoft - renouvellement - autorisation de signer -

Manuel d intégration API FTP SMS ALLMYSMS.COM

Les avantages du format d'opendocument (ODF)

Rédiger : le numérique dans la préparation de la thèse

Description archivistique : nouvelles technologies, nouvelles compétences?

OUTLOOK GÉRER EFFICACEMENT SON BUSINESS D INGÉNIERIE OU DE CONSEIL AVEC OUTLOOK

Module BD et sites WEB

Séance 1 Introduction aux bases de données

Les types de fichiers

Quelques formats de fichiers courants

Un serveur d'archivage

HETEROGENEITE DES SOURCES DE DONNEES ET ENTREPOTS NUMERIQUES COLLABORATIFS UNIVERSITAIRES

LES DOSSIERS DOCUMENTAIRES ELECTRONIQUES. Clotilde VAISSAIRE CV CONSEIL SARL

Déjeuner de la Technologie 23 Mars 2007 Gestion de Documents Electroniques. Thierry GUILLOTIN - Elie FRANCIS EVER TEAM

Magento. Magento. Réussir son site e-commerce. Réussir son site e-commerce BLANCHARD. Préface de Sébastien L e p e r s

Recherche bibliographique

Web Site Story Etude, développement et valorisation de votre présence internet

PHILIPPE PAR JEAN-P EN PARTENARIAT AVEC ACCESS. (détails pages suivantes) -

Les ressources informatiques et la mise en ligne des documents numérisés Enquête DLL juin-décembre 2008

Drupal : quelques fonctionnalités (ce qu il permet, ce qu il ne permet pas)

Les tableaux de bord de pilotage de nouvelle génération. Copyright PRELYTIS

FORMULAIRE DE SOUMISSION DU PROJET PORTÉ DANS LE CADRE DU SYSTÈME D'ARCHIVAGE ÉLECTRONIQUE MUTUALISÉ (SAEM)

Autour du web. Une introduction technique Première partie : HTML. Georges-André SILBER Centre de recherche en informatique MINES ParisTech

Diffusion AFRISTAT. Quels droits accorder aux utilisateurs? - sur les données - sur les documents numériques

From supply chain to demand chain

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Gestion documentaire (Extraits du CCI version 1.2)

PRIMAVERA P6 ENTERPRISE PROJECT PORTFOLIO MANAGEMENT WEB SERVICES

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Le Web de Données Dan VODISLAV Université de Cergy-Pontoise Master Informatique M2 Plan

source : Lexique des termes numériques Atelier du SNE janvier 2010

XML et travail collaboratif : vers un Web sémantique

Sommaire. Introduction La technologie ebxml EDI conventionnels versus ebxml Web Services et ebxml Acteurs de l ebxml Conclusion

STANDARD D ECHANGE DE DONNEES POUR L'ARCHIVAGE

Les archives ouvertes

Exploration des technologies web pour créer une interaction entre Mahara et les plateformes professionnelles et sociales

Web 2.0 : Premiers pas vers... Une Industrie informatique

Introduction au projet ebxml. Alain Dechamps

PRÉSENTATION DE LOGICIELS DE GESTION DE RÉFÉRENCES BIBLIOGRAPHIQUES

XML pour la mise en valeur des informations

SOLUTION INFORMATIQUE INTÉGRÉE POUR BIBLIOTHÈQUES MÉDIATHÈQUES CENTRES DE DOCUMENTATION ARCHIVES

TMS THE MUSEUM SYSTEM

Rencontre avec les correspondants-formation des services communs de la documentation. Jeudi 27 septembre 2012 URFIST de Paris

THEME PROJET D ELABORATION D UNE BASE DE DONNEES SOUS LE SERVEUR MYSQL

Les services usuels de l Internet

XML par la pratique Bases indispensables, concepts et cas pratiques (3ième édition)

Annonces internes SONATRACH RECHERCHE POUR SA DIRECTION CENTRALE INFORMATIQUE ET SYSTÈME D INFORMATION :

XML : documents et outils

Infrastructure / réseau / sécurité /support utilisateur

Atelier 1. Portails documentaires : BioLib et Cemadoc

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015)

L importance des choix juridiques pour la médiation dans l environnement numérique

CADRE DE COHERENCE S.I. DES ETABLISSEMENTS ANNEXE TECHNIQUE MARCHE DE REALISATION OU D EVOLUTION DE COMPOSANTS SI

ES Enterprise Solutions

Le cadre des Web Services Partie 1 : Introduction

URFIST de Bretagne et des Pays de la Loire. FORMATIONS 1 er semestre Maîtrise de l information. Usages des ressources et outils numériques

Conception d'une plate-forme collaborative Microsoft SharePoint 2003

Systèmes d'informations historique et mutations

Créez votre propre Archive Darwin Core

La démarche MDA. Auteur : Projet ACCORD (Assemblage de composants par contrats en environnement ouvert et réparti)*

FICHE DE POSTE. Gestionnaire des données du Portail des savoirs (H/F)

Fiche de l'awt L'intermédiation

Petite définition : Présentation :

Dans nos locaux au 98 Route de Sauve NÎMES. Un ordinateur PC par stagiaire, scanner, imprimante/copieur laser couleur

CAHIER DES CLAUSES TECHNIQUES PARTICULIERES

Thomas Loubrieu (Ifremer) Small to Big Data Novembre 2013, Ifremer, Brest

Internet. DNS World Wide Web. Divers. Mécanismes de base Exécution d'applications sur le web. Proxy, fire-wall

Programmation Internet Cours 4

Les Services Web. Jean-Pierre BORG EFORT

WysiUpStudio. CMS professionnel. pour la création et la maintenance évolutive de sites et applications Internet V. 6.x

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype

«Expertise de ressources «pour l édition de revues numériques

Learning Object Metadata

Les documents primaires / Les documents secondaires

Transcription:

Métadonnées et XML Une introduction Formation Métadonnées MEDIADIX Saint-Cloud, 16-17 sept. 2009 Catherine Morel-Pair Département Edition et Publications numériques INIST-CNRS, catherine.morel@inist.fr partageable sous Licence Creative Commons

Un monde de ressources numériques

et challenges Comment donner accès à l information pertinente? Dans une masse exponentielle Distribuée et hétérogène Pour un arc-en-ciel d utilisateurs Recherche, tri, évaluation Interprétation, contextualisation Contexte de production Liens entre ressources : collections Comment garantir l accessibilité technique et la traçabilité, à moyen et long terme? Ressources très dépendantes de la technologie Supports, formats et logiciels Contenu plastique : évolutif, réutilisations Comment gérer les questions administratives? Propriété intellectuelle Droits d accès/usage

La curation digitale Digital curation Activités nécessaires pour rendre les documents et collections électroniques plus pérennes et interopérables Et constituer de vrais entrepôts numériques Cf Digital Curation Center, consortium d universités du Royaume Uni Les métadonnées sont la colonne vertébrale de la curation digitale (S. Higgins, DCC) Donnent un sens structurel et cognitif à l'information Participent à sa gestion à court et long terme Participent à l interopérabilité / ont besoin d interopérabilité utilisation de normes et standards internationaux

1 - Métadonnées? Une métadonnée : une donnée à propos d une autre donnée Un jeu de métadonnées : un ensemble structuré d information pour représenter des ressources Ensemble de propriétés/éléments : titre, auteur, type de contenu Décrit, explicite, localise la ressource Pour faciliter la recherche, l usage, la gestion Web et tous ensembles de ressources électroniques Ou physiques Terme ancien dans certains domaines (BD, images, géospatial), plus récent dans les métiers bib-doc Exemples Notice bibliographique, catalogue En-tête HTML, propriétés des fichiers Microsoft (et autres)

Exemples courants 1 - propriétés Windows

2 - tags image

4 - annuaire de sites

5 - carte de site

Photothèque collaborative Flick r

Métadonnées, une typologie (1) Métadonnées descriptives du contenu intellectuel Titre, mots-clés, résumé, classement, type, relations Recherche d information, labellisation, contextualisation Métadonnées sur les droits Propriété intellectuelle, responsabilité adm. Droits d usage // métadonnées sur utilisateurs Métadonnées techniques Identifiant unique, local ou standard Format, dates, comportement Gestion et accessibilité informatiques Métadonnées de structure Organisation / appartenance - collections Structuration d un document : sections, titres Contexte, gestion informatique Métadonnées administratives

Métadonnées, une typologie (2) M. de préservation : conservation - accessibilité long terme Descriptives et administratives Techniques +++ accessibilité traçabilité (migrations et intégrité, authenticité) De structure Métadonnées sur des acteurs Utilisateurs Identification droits d usage, personnalisation d applications Comportements, communautés de pratique prescription Dispositifs de lecture Créateurs de ressources Métadonnées sur des événements, des lieux Métadonnées sur les métadonnées qui, quand, pourquoi, comment?

A fonctions diverses, standards divers Domaines application IEEE-LOM,géospatiales, DDI Personnes : VCard, FOAF Droits : CC, ODRL Veille : RSS Méta-formats Formats ressources Image : IPTC, EXIF vers XMP, MIX Multimédia : MPEG 7, 21 HTML, XML (TEI ) Ressources Web Généraliste échanges Dublin Core METS MPEG 21 Préservation PREMIS Métiers Bib-doc : *MARC MODS Ind. Livre : ONIX Archivistique : EAD

2 - XML, un choix efficient extensible Mark-up Language, 1998 Structuration hiérarchique et sémantique du document <balise>valeur</balise> Standard ouvert, pérenne, interopérable Mode texte, Unicode et tous encodages Métalangage, base de différents modèles et applications Comprend Le document XML et ses modèles (DTD, schémas) Des modules de traitement intégrés Exemple : XSL transformations et réutilisations Soutenu par de gros consortiums industriels Standard effectif pour l échange de documents Bien implanté dans l environnement informatique Bureautique, BD, systèmes d exploitation, Web2 Les grands standards de métadonnées s implémentent tous en XML [ et RDF s écrit en XML]

XML, environnement Soutenu par de gros consortiums industriels, représentés par OASIS, Organization for the Advancement of Structured Information Standards, organisme de normalisation industriel international plus de 600 organismes adhérents Airbus, General Motors, Dell, Nokia, Oracle, Adobe, Reuters Liste des centaines de standards / normes de documents XML + diffuse les spécifications techniques du W3C

Le document XML en bref

Le document XML en bref En-tête Balise ouvrante racine valeur éléments fils attribut Balise fermante Balise fermante

XML et métadonnées des applications Bibliothèques numériques Corpus recherche OLAC, IMDI Archives ouvertes et protocole OAI-PMH Thèses Editeurs/chaîne livres et revues Archivistes Outils pédagogiques Profils d applications Mutualisation des services culturels et patrimoniaux Annuaires et portails Informations publiques Projet INSPIRE Outils de production Flux de production «tout XML»

Plateforme du CN2SV pour les fonds d archives des sciences http:/www.arch.cn2sv.cnrs.fr/

La plateforme du CN2SV pour les fonds d archives des sciences : XML à tous les étages Moteurs gé Annuaires Création fichier EAD ion t c ra ext METS Ajout Métas IPTC embarquées (XMP) Data center Modèle OAIS Entrepôt OAI-PMH DC- XML

Quelques documents Des métadonnées pour bien utiliser les ressources électroniques, Journée d'information AFNOR/CG46, 7 juin 2005, Bibliothèque nationale de France, http://www.bnf.fr/pages/infopro/journeespro/no-afnor2005.htm Métadonnées et XML : des standards efficients de l environnement numérique, C. Morel-Pair, 2007, http://www.enssib.fr/bibliotheque-numerique/notice-1842 Métadonnées : mutations et perspectives, Séminaire INRIA, 29 sept-3 oct 2008, Dijon, http://www.inria.fr/actualites/colloques/2008/ist08/programme.fr.ht Understanding Metadata, NISO, 2004 (maj 2007) http://www.niso.org/standards/resources/understandingmetadata.pdf