Métadonnées : les standards PDF. 1. Introduction

Documents pareils
Présentation générale du projet data.bnf.fr

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

PROSOP : un système de gestion de bases de données prosopographiques

Les documents primaires / Les documents secondaires

Formats de fichiers adaptés à l'archivage électronique à moyen et long terme

Journée des bibliothécaires

LEXIQUE DES TERMES DOCUMENTAIRES LES PLUS COURANTS

Université de Lausanne

La recherche documentaire et la recherche d informations professionnelles. BU Sciences BIU Montpellier PPE 2012

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

La directive INSPIRE pour le partage des données géographiques

ISTEX, vers des services innovants d accès à la connaissance

Memento de la recherche documentaire en santé

Les ressources informatiques et la mise en ligne des documents numérisés Enquête DLL juin-décembre 2008

GOUVERNANCE DES IDENTITES ET DES ACCES ORIENTEE METIER : IMPORTANCE DE CETTE NOUVELLE APPROCHE

Numérisation et valorisation des fonds patrimoniaux dans les collectivités

Les ressources numériques de la bibliothèque sont regroupées dans un portail web ; elles offrent des services complets et facilement accessibles.

OSIRIS/ Valorisation des données PORTAIL BO MANUEL UTILISATEUR

Enquête sur les ressources numériques en bibliothèque publique

«L utilisation d un intranet permet-il la mise en place d un travail collaboratif et/ou coopératifs? Pour quelles compétences?»

Présentation et publication d un portail e-sidoc

Table des matières La gestion de musée en toute simplicité Atouts fonctionnels Atouts techniques > > > > > > > > > > > > > >

Gestion collaborative de documents

Portail : mode d emploi

Créer un fichier PDF/A DÉPÔT ÉLECTRONIQUE

Le numérique. de vos médiathèques.

Ministère de la Culture et de la Communication

Manuel d Utilisation Nouvelle Plateforme CYBERLIBRIS : ScholarVox Management

Guide à l usage des bibliothécaires du réseau départemental

La transformation numérique : facteur de convergence pour les professionnels de l information

Plateformes vidéo d entreprise. Choisir sa plateforme vidéo d entreprise

ES Enterprise Solutions

ASTER et ses modules

Catalogue de formations. Centre de formations IDYAL. Gagnez une longueur d avance en compétitivité!

Le Programme «Archives Audiovisuelles de la Recherche»

CREER ET ANIMER SON ESPACE DE TRAVAIL COLLABORATIF

Recherche bibliographique

sommaire L organisation et la gestion des archives d entreprise...7

1. Cliquez sur dans le coin supérieur gauche de l'écran 2. Sélectionnez la Langue de l'interface désirée 3. Cliquez sur

ITSM - Gestion des Services informatiques

LIVRE BLANC Décembre 2014

1. Des chartes graphiques homogènes, élégantes, créatives

SQL Server 2012 et SQL Server 2014

Nos secteurs d activité :

Présentation du service «photothèque-and-co» annuaire professionnel. base de données

Microsoft Office system Février 2006

Introduction à Microsoft InfoPath 2010

Charte de fonctionnement de GéoNormandie

Article 2 : Conseils et meilleures pratiques pour gérer un cloud privé

Licence professionnelle Bibliothécaire

RESSOURCES HUMAINES. Yourcegid Ressources Humaines, des solutions pour les entreprises qui s investissent dans leur capital humain.

Votre solution professionnelle Open Source pour archiver, trouver, gérer, partager... tous vos fichiers multimédia!

Nos solutions pour l'education

Généralités sur l'éditeur de contenus (CMS) d'e-sidoc

en 16 différences

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Lecture critique et pratique de la médecine

Etapes de création d une revue électronique

Table des matières détaillée

Référentiel d'activités professionnelles et référentiel de certification Diplôme d'état de professeur de musique

Numérique. Mon Université.

SYSTEME INTEGRE DE GESTION DES BIBLIOTHEQUES

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007

Rapport d évaluation du master

Appui SIE :Développement de services web ADES/SIE

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) JRES Novembre 2007

Référencement dans des bases de données

Bachelier Bibliothécaire- Documentaliste!

GESTION D UNE BASE BIBLIOGRAPHIQUE

Initiation à la recherche documentaire

Manuel utilisateur Portail SAP

Microsoft Live Messenger

Du livre enrichi et de l EPUB 3

Banque d outils d aide à l évaluation diagnostique

E-book, aspects techniques

En date du 11 décembre 2008

TMS THE MUSEUM SYSTEM

Logiciel de capture et de gestion des flux de documents MOINS DE PAPIER, PLUS D EFFICACITÉ.

Pelleas : Le projet XML pour le systeme d information documentaire du polytechnicum de Marne- la Vallée

Cette liste n est pas exhaustive

METHODOLOGIE DOCUMENTAIRE

Table des matières L INTEGRATION DE SAS AVEC JMP. Les échanges de données entre SAS et JMP, en mode déconnecté. Dans JMP

Projet de Portail des thèses. SYNTHESE DE L ENQUETE DESTINEE AUX DOCTORANTS août 2010

En fin d activité, vous transformerez le fichier D4_Nom_Prenom en fichier pdf avant de l envoyer à votre enseignant/moniteur.

COMMENT LIRE UN DEVIS DE CREATION DE SITE WEB?

Business & High Technology

Créer un site WordPress

Au printemps 2012, la Bibliothèque de l Université Laval lançait sa nouvelle plateforme de

LES PROCEDURES DE LA POLITIQUE D ARCHIVAGE

2015 ADOBE DESIGN ACHIEVEMENT AWARDS

Référentiel des emplois et des compétences

Solution documentaire globale. Présentation du 14 janvier 2010

DataStudio. Solution d intégration des données et de diffusion de l information

Pack Prélèvements Confort et Confort Plus

DataCar CRM V2.5.1 Gamme Expert Release Notes. DataCar CRM v Release Notes

V 8.2. Vous allez utiliser les services en ligne de la plate forme de dématérialisation de la Salle des Marchés achatpublic.com.

Panorama des contenus

Transcription:

Métadonnées : les standards PDF 1. Introduction

1.2 Généralités Les métadonnées doivent être interopérables parce qu elles vont permettre à d autres systèmes de les exploiter à la condition qu elles respectent certains standards. Cette adéquation vous permet, ainsi qu à d autres utilisateurs de faciliter la recherche avec des critères précis et uniformes entre des objets équivalents.

1.3 Définition d'un standard Au premier abord, décrire une ressource à l aide d un tableau paraît simple. Il suffit de remplir les champs jugés pertinents pour décrire la ressource. Mais comment être sûr de ne pas avoir oublié des informations importantes? Ou rempli correctement chaque champ pour que tout le monde le comprenne? Et bien avant de chercher quelles informations donner et comment les indiquer, sachez qu il peut déjà exister un modèle correspondant à vos attentes. C est ce que l on appelle un standard de métadonnées.

1.4 Les enjeux L utilisation d un standard est complexe et leur nombre est multiple. Un standard peut être intégré dans un autre standard afin de le compléter en fonction des spécificités propres aux données. Ils ne sont pas concurrents entre eux mais complémentaires en fonction de la gestion et des objectifs que vous avez choisi pour vos documents. L enjeu est de permettre quelle que soit la machine ou son lieu de stockage de retrouver vos ressources, les protéger en terme de propriété intellectuelle et de les diffuser le plus largement.

Nous vous proposons d aborder les différents standards existants ainsi que les outils, guides répertoires pouvant vous aider dans le choix et l utilisation d un standard. Enfin la rubrique à retenir sera la synthèse des points importants ainsi que des conseils.

2. Les différents standards A fonctions diverses standards divers - pratiques diverses. Vos ressources ainsi que leurs métadonnées vont être liées à un contexte d utilisation. En effet les standards existants répondent à 4 besoins. Le premier : le type de ressources. Par exemple : les champs des standards varient en fonction des métadonnées d une vidéo, d une image ou d une publication scientifique. Deuxième besoin : le domaine scientifique ou technologique. Un standard généraliste s avère parfois insuffisant pour représenter finement certaines données dans des applications spécifiques (exemple : données spatiales, géographiques, artistiques etc.). Troisième critère à prendre en compte : les communautés. Chaque communauté a ses standards. Par exemple des standards pour les bibliothécaires, les conservateurs, la presse, le monde de la musique etc Dernier critère : le dépôt. En fonction du choix de l entrepôt où vous allez déposer vos ressources, ceux-ci disposent déjà de standards offrant le plus souvent un vocabulaire fermé avec une saisie contrôlée vous garantissant une qualité et une interopérabilité. Une fois le standard choisi en fonction de vos ressources, les champs à renseigner doivent se faire dans un «vocabulaire contrôlé», c est à dire un ensemble restreint de termes utilisés logiquement et définis avec soin. Ceci est appelé standard de vocabulaire.

2-1. Par type de ressource Le type de ressources conditionne le choix du standard. Chaque ressource ayant une spécificité, il existe différents type de standards adaptés comme indiqué dans ce tableau. Par exemple : le format LOM fournit un schéma de métadonnées normalisé au niveau mondial pour les objets d apprentissage. Il comprend une cinquantaine de champs destinés aux ressources scolaires et supérieur pour les Universités Numériques. Pour les ouvrages, prenons l exemple de Mets. Ce standard comprend la description intégrale d'objets numériques textuels ou graphiques. Il est particulièrement destiné aux échanges entre institutions patrimoniales comme la Bibliothèque Nationale de France. Pour les images, le standard IPTC a été développé par un consortium regroupant la plupart des agences de presses du monde. La société Adobe s est appuyée sur ce standard pour définir son propre modèle, destiné à son logiciel PhotoShop. Ainsi est apparu en 2001, le modèle XMP avec une amélioration notable du modèle standard IPTC.

Voici 2 exemples de métadonnées utilisant un standard décrivant d une part une image et d autre part une ressource pédagogique avec le standard LOM exposé précédemment (voir page suivante)

2-2. Par domaine En fonction de votre domaine, vous pouvez utiliser un standard interdisciplinaire ou un standard spécifique à votre disciple. Un exemple de standard interdisciplinaire : Dublin Core. Son format descriptif à la fois simple et générique comprend 15 éléments différents incluant des éléments bibliographiques comme le titre, l auteur, l éditeur, etc. (suite page suivante)

mais aussi des éléments qui concernent plus particulièrement les ressources en réseau, par exemple le type et le format, les relations entre ressources et les mentions de droits de propriété intellectuelle. Dublin Core devenu une norme internationale en 2001 est le minimum requis pour toutes métadonnées

Un standard généraliste comme Dublin Core s avère parfois insuffisant pour représenter finement certaines données dans des applications spécifiques (exemple : données spatiales, géographiques, artistiques etc.). Des standards spécialisés permettent d éviter d appauvrir les métadonnées techniques ou/et technologiques en les complétant par des données plus spécifiques (ex : notions d échelles mesure géométrique dans le domaine de la géographie).

Voici 2 exemples de métadonnées provenant d une ressource en géographie et une en chimie (page suivante). Vous constaterez que les métadonnées présentes dans ces champs sont plus précises, riches et spécifiques au domaine d activité.

2-3. Par communauté Des standards existent pour chaque type de communauté avec lesquelles vous désirez partager vos ressources. Les communautés afin de répondre à leurs besoins d échanges d informations se sont associées au niveau mondial afin d adapter les standards existants. Dans ce tableau, vous trouverez quelques exemples de communautés avec les standards utilisés.

Prenons l exemple d un musée qui a une approche documentaire différente d une bibliothèque. Toute son attention se porte sur l identification de l objet en décrivant les caractéristiques physiques comme les dimensions du tableau ou la patine de la sculpture.

2-4. Par dépôt Un entrepôt de données est un réservoir constitué de données décrites par des métadonnées permettant une recherche optimale. Son rôle est la mise en commun d éléments descriptifs tout en assurant une qualité de référencement. Ils proposent des standards à respecter au minimum pour décrire les jeux de données qu'ils hébergent. Si vous déposez vos données dans un tel entrepôt, il vous suffit de vous conformer à leurs exigences.

Grâce à ses entrepôts vous pouvez mieux gérer vos données au niveau de la cohérence de vos métadonnées et de leurs pérennités (format de données, conditions d accès et de réutilisation etc.). Ils offrent aussi l attribution d un identifiant unique et pérenne pour chacune de vos ressources permettant un lien pérenne vers vos données. Un autre atout ils garantissent une interopérabilité avec les autres systèmes grâce à la saisie contrôlée des données lors du dépôt. Une liste des entrepôts existants est disponible sur re3data.

Exemple L entrepôt DataCite est destiné aux organismes qui gèrent des données de recherche et les rendent accessibles. Il met à disposition un outil permettant de générer ses métadonnées au format XML. Bien que spécifique au schéma DataCite, l outil reste assez généraliste et peut être utile quel que soit le contexte.

2-5. Standard vocabulaire Et le standard de vocabulaire c est quoi??? Une fois le standard choisi en fonction de vos ressources, les champs à renseigner doivent se faire dans un «vocabulaire contrôlé», c est à dire un ensemble restreint de termes utilisés logiquement et définis avec soin.

Cela peut améliorer considérablement les résultats de recherche car les ordinateurs sont bons à comparer des mots caractère à caractère mais mauvais à comprendre comment les personnes se réfèrent à un concept avec des mots différents (synonymes).

Sans un minimum de contrôle de la terminologie, la présence de métadonnées incohérentes ou incorrectes peut dégrader profondément la qualité des résultats de recherche. Par exemple : entrer «infarctus du myocarde» au lieu du terme plus familier «attaque cardiaque».

3. Les outils Les standards varient en fonction du type de ressource du domaine de la communauté et du dépôt. Mais comment créer ses métadonnées et choisir le standard le plus adapté?

Liste / outils / annuaires 3ème et dernière question à se poser est où vais-je entreposer ma ressource?. Dès la création de votre ressource, des métadonnées sont automatiquement créées par votre outil informatique (excel, word, ). Pour les enrichir, un annuaire des outils est disponible sur le site DCC (Digital Curation Center). Par exemple, Colectica est un ensemble d'applications de bureau pour créer, visualiser et éditer des métadonnées. Lors de l enrichissement, les termes saisis doivent répondre à des normes en matière de vocabulaire. Dans le cas présent, un catalogue des standards de vocabulaire est disponible sur le site W3C dont l objectif est de soutenir l'interopérabilité des portails de données à travers l'europe. Une fois vos métadonnées créées, la question de votre domaine d activité se pose. Votre discipline nécessite- t-elle un enrichissement plus complexe? Si oui, des standards par discipline sont disponibles sur le site DCC. Dans le cas contraire, utilisez le standard Dublin Core comprenant 15 champs correspondant au minimum requis pour toutes métadonnées. 2 solutions soit sur le web soit dans un entrepôt. Pour la toile, le site W3C outre les standards de vocabulaire, propose une liste de présentations, guides, outils pour vous aider. Pour l entrepôt soit le choix est déjà fait, dans ce cas-là les standards sont définis, soit vous ne connaissez pas d entrepôt vous pouvez consulter l annuaire de re3data.

4. A retenir / conclusion Les métadonnées peuvent être créées a priori avec la ressource selon un standard simple et peuvent être combinées a posteriori avec d autres pour les systèmes de recherche Plus un schéma est contraignant à savoir qu il impose une description riche, précise et normalisée plus la ressource décrite a de chance d être visible Utiliser des normes, standards, vocabulaires contrôlés (lexique, thésaurus) pour faciliter le partage et l intégration de données Privilégier les standards d usage de votre communauté pour faciliter la publication de vos ressources

4.1 Pour simplifier Autre point : ce schéma évoqué dans la partie outils d aide peut être simplifié si vous connaissez dès la création de vos métadonnées l entrepôt

En effet, il vous suffit de suivre leur standard.

Fin