Métadonnées et XML Une introduction Formation Métadonnées MEDIADIX Saint-Cloud, 16-17 sept. 2009 Catherine Morel-Pair Département Edition et Publications numériques INIST-CNRS, catherine.morel@inist.fr partageable sous Licence Creative Commons
Un monde de ressources numériques
et challenges Comment donner accès à l information pertinente? Dans une masse exponentielle Distribuée et hétérogène Pour un arc-en-ciel d utilisateurs Recherche, tri, évaluation Interprétation, contextualisation Contexte de production Liens entre ressources : collections Comment garantir l accessibilité technique et la traçabilité, à moyen et long terme? Ressources très dépendantes de la technologie Supports, formats et logiciels Contenu plastique : évolutif, réutilisations Comment gérer les questions administratives? Propriété intellectuelle Droits d accès/usage
La curation digitale Digital curation Activités nécessaires pour rendre les documents et collections électroniques plus pérennes et interopérables Et constituer de vrais entrepôts numériques Cf Digital Curation Center, consortium d universités du Royaume Uni Les métadonnées sont la colonne vertébrale de la curation digitale (S. Higgins, DCC) Donnent un sens structurel et cognitif à l'information Participent à sa gestion à court et long terme Participent à l interopérabilité / ont besoin d interopérabilité utilisation de normes et standards internationaux
1 - Métadonnées? Une métadonnée : une donnée à propos d une autre donnée Un jeu de métadonnées : un ensemble structuré d information pour représenter des ressources Ensemble de propriétés/éléments : titre, auteur, type de contenu Décrit, explicite, localise la ressource Pour faciliter la recherche, l usage, la gestion Web et tous ensembles de ressources électroniques Ou physiques Terme ancien dans certains domaines (BD, images, géospatial), plus récent dans les métiers bib-doc Exemples Notice bibliographique, catalogue En-tête HTML, propriétés des fichiers Microsoft (et autres)
Exemples courants 1 - propriétés Windows
2 - tags image
4 - annuaire de sites
5 - carte de site
Photothèque collaborative Flick r
Métadonnées, une typologie (1) Métadonnées descriptives du contenu intellectuel Titre, mots-clés, résumé, classement, type, relations Recherche d information, labellisation, contextualisation Métadonnées sur les droits Propriété intellectuelle, responsabilité adm. Droits d usage // métadonnées sur utilisateurs Métadonnées techniques Identifiant unique, local ou standard Format, dates, comportement Gestion et accessibilité informatiques Métadonnées de structure Organisation / appartenance - collections Structuration d un document : sections, titres Contexte, gestion informatique Métadonnées administratives
Métadonnées, une typologie (2) M. de préservation : conservation - accessibilité long terme Descriptives et administratives Techniques +++ accessibilité traçabilité (migrations et intégrité, authenticité) De structure Métadonnées sur des acteurs Utilisateurs Identification droits d usage, personnalisation d applications Comportements, communautés de pratique prescription Dispositifs de lecture Créateurs de ressources Métadonnées sur des événements, des lieux Métadonnées sur les métadonnées qui, quand, pourquoi, comment?
A fonctions diverses, standards divers Domaines application IEEE-LOM,géospatiales, DDI Personnes : VCard, FOAF Droits : CC, ODRL Veille : RSS Méta-formats Formats ressources Image : IPTC, EXIF vers XMP, MIX Multimédia : MPEG 7, 21 HTML, XML (TEI ) Ressources Web Généraliste échanges Dublin Core METS MPEG 21 Préservation PREMIS Métiers Bib-doc : *MARC MODS Ind. Livre : ONIX Archivistique : EAD
2 - XML, un choix efficient extensible Mark-up Language, 1998 Structuration hiérarchique et sémantique du document <balise>valeur</balise> Standard ouvert, pérenne, interopérable Mode texte, Unicode et tous encodages Métalangage, base de différents modèles et applications Comprend Le document XML et ses modèles (DTD, schémas) Des modules de traitement intégrés Exemple : XSL transformations et réutilisations Soutenu par de gros consortiums industriels Standard effectif pour l échange de documents Bien implanté dans l environnement informatique Bureautique, BD, systèmes d exploitation, Web2 Les grands standards de métadonnées s implémentent tous en XML [ et RDF s écrit en XML]
XML, environnement Soutenu par de gros consortiums industriels, représentés par OASIS, Organization for the Advancement of Structured Information Standards, organisme de normalisation industriel international plus de 600 organismes adhérents Airbus, General Motors, Dell, Nokia, Oracle, Adobe, Reuters Liste des centaines de standards / normes de documents XML + diffuse les spécifications techniques du W3C
Le document XML en bref
Le document XML en bref En-tête Balise ouvrante racine valeur éléments fils attribut Balise fermante Balise fermante
XML et métadonnées des applications Bibliothèques numériques Corpus recherche OLAC, IMDI Archives ouvertes et protocole OAI-PMH Thèses Editeurs/chaîne livres et revues Archivistes Outils pédagogiques Profils d applications Mutualisation des services culturels et patrimoniaux Annuaires et portails Informations publiques Projet INSPIRE Outils de production Flux de production «tout XML»
Plateforme du CN2SV pour les fonds d archives des sciences http:/www.arch.cn2sv.cnrs.fr/
La plateforme du CN2SV pour les fonds d archives des sciences : XML à tous les étages Moteurs gé Annuaires Création fichier EAD ion t c ra ext METS Ajout Métas IPTC embarquées (XMP) Data center Modèle OAIS Entrepôt OAI-PMH DC- XML
Quelques documents Des métadonnées pour bien utiliser les ressources électroniques, Journée d'information AFNOR/CG46, 7 juin 2005, Bibliothèque nationale de France, http://www.bnf.fr/pages/infopro/journeespro/no-afnor2005.htm Métadonnées et XML : des standards efficients de l environnement numérique, C. Morel-Pair, 2007, http://www.enssib.fr/bibliotheque-numerique/notice-1842 Métadonnées : mutations et perspectives, Séminaire INRIA, 29 sept-3 oct 2008, Dijon, http://www.inria.fr/actualites/colloques/2008/ist08/programme.fr.ht Understanding Metadata, NISO, 2004 (maj 2007) http://www.niso.org/standards/resources/understandingmetadata.pdf