data.bnf.fr Mieux exposer des données hétérogènes, grâce aux outils du Web sémantique SemWeb Pro 02 mai 2012



Documents pareils
Présentation générale du projet data.bnf.fr

Evolution des catalogues et des métiers: comment se préparer aux changements? Quelques échos de la BnF. CRFCB Université de Toulouse 29 mars 2013

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Une organisation internationale au cœur des enjeux de contenus et d accès à l information scientifique: L IFLA

Le contexte actuel : Nos catalogues sont régis

Exemples de reque tes dans data.bnf.fr

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Bibliothèque numérique de l enssib

La gestion des documents administratifs à la Bibliothèque nationale de France

JOURNÉE D ÉTUDE AFNOR/BNF

Documents et Applications : CMS nouvelle génération

Les modèles conceptuels FRBR et FRAD présenté par Pat Riva

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007

Recherche bibliographique

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype

Intégration de données complexes pour une vision 360 du client. Chloé Clavel EDF R&D Département ICAME

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) JRES Novembre 2007

Les travaux internationaux et leurs conséquences sur les règles françaises

FORMULAIRE DE SOUMISSION DU PROJET PORTÉ DANS LE CADRE DU SYSTÈME D'ARCHIVAGE ÉLECTRONIQUE MUTUALISÉ (SAEM)

Ministère de la Culture et de la Communication

Etude sur l'évolution du CCFr dans l'environnement numérique

Les documents primaires / Les documents secondaires

Une nouvelle plateforme communautaire de distribution de documents numériques sur internet

Les nouveaux sites documentaires de l IRD

Recommandations pour une diffusion du livre numérique par les bibliothèques publiques

Journée des bibliothécaires

PloneLabs un gestionnaire de contenu pour les laboratoires

TOUTSURLENVIRONNEMENT.FR

Linked Data et description du produit automobile SemWeb Pro, Paris, 2 mai 2012

Numérisation et valorisation des fonds patrimoniaux dans les collectivités

Le Web de Données Dan VODISLAV Université de Cergy-Pontoise Master Informatique M2 Plan

CONVENTION DE PARTICIPATION AU SUDOC Pour un signalement des publications en série en qualité d entrée secondaire N EXX

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

Formation continue des personnels URCA. Offre de la Bibliothèque Universitaire

Repérer et utiliser différents types de documents

Archives ouvertes : les enjeux dans les politiques d établissement et les projets internationaux

Initiation à la recherche documentaire

La modernisation technologique du réseau repose alors sur plusieurs axes de travail :

Table des matières détaillée

Université de Lausanne

Le documentaliste face aux nouveaux supports l'exemple de l'e-book

Zotero Gérer ses références bibliographiques

Ouvrir les bibliographies pour le futur Un modèle de bibliographies collaboratif et mû par la recherche

Initiation au logiciel de gestion bibliographique Zotero

Livres électroniques et tablettes de lecture (e-books et e-readers) en bibliothèque: défis et expériences

Liste des applications ipads utilisées en collège

Master Technologies numériques appliquées à l'histoire Deuxième année

Datalift. + + Architecture Modularité Déploiements. d j = 09/04/2015 Laurent BIHANIC

Société française des intérêts des auteurs de l écrit

La stratégie de Radio France dans la production et la gestion de données musicales

Concevoir sa stratégie de recherche d information

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

Programme national de numérisation. Ministère de la Culture et de la Communication. Appel à projets de numérisation 2010

LES FORMULES DE PUBLICATION

LEXIQUE DES TERMES DOCUMENTAIRES LES PLUS COURANTS

La recherche avec l interface COLLEGE

Catalogue des formations Edition 2015

Guide du doctorant ( )

Rédiger : le numérique dans la préparation de la thèse

Éditeur Elsevier Langue(s) Multilingue

REALISATIONS, STRATEGIES ET PERSPECTIVES DE LA PRESSE NUMERIQUE FRANCOPHONE

HAL, archives ouvertes. Christine Berthaud, CNRS/CCSD - Directrice

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

JDev Atelier Datalift

CONSERVATOIRE NATIONAL DES ARTS ET METIERS INSTITUT NATIONAL DES TECHNIQUES DE LA DOCUMENTATION

e-science : perspectives et opportunités pour de nouvelles pratiques de la recherche en informatique et mathématiques appliquées

Le bénéfice maximal de votre documentation

Référentiel des métiers et des fonctions de l information-documentation

ISTEX, vers des services innovants d accès à la connaissance

Extensions, Documentation, Tutoriels, Astuces

Les archives de l entreprise à l ère du numérique. Présentée par: HAMMA Mustapha

Convention N 2013/P1/MMSH/015

FRBR OO et PRESS OO : présentation rapide

Réseaux sociaux de chercheurs : quels enjeux et quelle politique pour une institution publique de recherche

Séminaire «Maîtrise de l information scientifique» Exploitation de l information : optimiser sa gestion documentaire

Constituer et gérer une bibliographie avec le logiciel zotero. Support de cours et liens utiles

Présentation du Modèle de Référence pour les Bibliothèques FRBR

SpringerLink La Connaissance est importante. Choisissez SpringerLink.

21 mars Simulations et Méthodes de Monte Carlo. DADI Charles-Abner. Objectifs et intérêt de ce T.E.R. Générer l'aléatoire.

La «confluence» documentaire et

Un site web collaboratif avec Drupal. Judith Hannoun - Journées INSHS 16 Octobre 2012

Les ressources informatiques et la mise en ligne des documents numérisés Enquête DLL juin-décembre 2008

Twitter et Netvibes pour la veille

Quels apprentissages info-documentaires au collège?

L apport des nouvelles technologies

METHODOLOGIE DOCUMENTAIRE

CALAMEO. Publier et partager vos documents sur la toile

WysiUpStudio. CMS professionnel. pour la création et la maintenance évolutive de sites et applications Internet V. 6.x

Le livre numérique désigne le contenu de lecture que l on intègre dans ces liseuses. Ses synonymes sont : le livre électronique, l ebook et le livrel.

Base de données relationnelle et requêtes SQL

AVANT-PROPOS INTRODUCTION INSTALLATION INSTALLER LE PLUGIN ZOTERO INSTALLER LE MODULE DE CITATION...

GERER SES REFERENCES BIBLIOGRAPHIQUES AVEC ZOTERO

Transcription:

data.bnf.fr Mieux exposer des données hétérogènes, grâce aux outils du Web sémantique SemWeb Pro 02 mai 2012 Romain Wenz Bibliothèque nationale de France Conservateur Département de l information bibliographique et numérique

Contexte - Quelles données? - Nouvelles attentes du public - Des missions de bibliothèques - Sur le Web: cadre technique et légal

BnF: Des contenus 1,5 millions d objets dans Gallica La plus grande bibliothèque numérique francophone 15 millions de notices bibliographiques Dépôt légal de l édition Française Dizaines de milliers d archives et manuscrits Médiévaux, fonds d auteurs 24% 2% 54% 19% 297 000 livres 816 000 presse et revues 364 000 images 32 000 cartes 13 000 manuscrits 1 500 documents sonores 5 700 partitions musicales

La Bibliothèque nationale de France des millions de documents: échelle. ouverture aux publics Web par la numérisation. Livres, manuscrits: logiques diverses.

Logiques diverses catalogues classiques «collection gérée et localisée» Format issu des fiches (MARC) fonds d archives, «constitution organique» Modèle d arbre et format XML-EAD contexte de la numérisation : «search» Format simple, Dublin Core

Ressources souvent dissimulées dans le «Web profond», c est-à-dire dans le fond des catalogues, disséminées sous diverses adresses.

Ce qui se passe: moins de passage par les pages d accueil accès direct aux pages du site recherches par mots-clés associés au contenu final exemple: titre d un livre suivi de liens sur des blogs, sites, réseaux

Data.bnf.fr: Des liens Pour les auteurs, les œuvres et les thèmes Liens vers des livres, manuscrits, images diffusion à tous publics, pages HTML faciles à utiliser

Comment ça marche? Les documents numérisés Pages Web pour les lecteurs BnF Archives et Manuscrits BnF Catalogue général Regroupement - Alignement Données pour les machines

publication HTML sur une même page toutes les informations relatives à un auteur ou à une œuvre entrée de formats hétérogènes outils du Web sémantique

Quoi? Des services Hors des silos Pour tous les publics

Data.bnf.fr Ouvrir les données Gratuitement Fournir des liens fiables

Outils Web sémantique Des URI pour les ressources Des URI http Des informations (URI actionnables) Un cadre de description (RDF) Des URI pour les concepts Alignements et regroupements automatiques Appui sur les fichiers d «autorités»

Qu est-ce qu une notice d autorité? Fiche d identité d une entité (personne, collectivité, œuvre ) - la forme retenue - les formes rejetées - des notes - des sources - des liens avec d autres notices - un identifiant ARK (identifiant)

Qu est ce qu un fichier d autorité? Un ensemble de notices d autorité présentant entre elles : une cohérence des relations intellectuelles des liens hypertextuels

Les liens entre notices d autorité Robert de Boron (Personne) Merlin (Œuvre) Histoire du Saint Graal (Œuvre) Romans de la table ronde (Œuvre) Merlin (personnage légendaire) (Thème) Perceval (personnage légendaire) (Thème)

Les différents niveaux d une œuvre Les trente-six vues du Mont Fuji : Les trente-six vues du mont Fuji Sous la grande vague au large de Kanagawa Vent calme et beau temps L'orage sous le sommet de la montagne Katsushika, Hokusai (1760-1849)

Identifiants pérennes: ARK Référence stable : nommer trouver citer identifiant : reconnaître la ressource de manière unique long terme Deux objectifs : accès préservation

Liens dans Gallica

FRBR Fundamental Requirements for Bibliographic Records

FRBR Création, vue à un niveau abstrait Œuvre Expression Manifestation Item Exemple : Les Nouvelles Histoires Extraordinaires, Poe Version sous laquelle une Œuvre est disponible (type, langue, contributeur) Exemple : traduction Française par Baudelaire Publication (production du livre: imprimeur, éditeur) Exemple : Édition 1875 Paris M. Lévy frères. XXXI-330 p. Exemplaire matériel Exemple : ouvrage numérisé ark:/12148/bpt6k2029183 Romain WENZ BnF-IBN 22

Pourquoi FRBR? Relier des personnes et des œuvres selon les niveaux de contribution - Auteur de l œuvre - Contributeur d une édition: traducteur, préfacier, - Producteur : exemplaire matériel avec imprimeur, distributeur - Lié à objet unique: possesseur, annotateur

Norme RDA http://www.rdatoolkit.org/backgroun dfiles/relationshipsoverview_10_9_0 9.pdf Définition selon les rôles d un auteur Auteur principal Lié à édition (langue, type de document) Lié à «manifestation» (publication) Lié à objet

Vocabulaires Pas de «notices», juste des données SKOS pour les concepts FOAF pour les auteurs RDA pour les oeuvres Romain WENZ BnF-IBN 25

Ontologie complexe Romain WENZ BnF-IBN 27

l'intégration de Rameau dans data.bnf.fr. intégré à data.bnf.fr, avec des identifiants pérennes et une ouverture technique puisque tout est téléchargeable en ligne gratuitement. Une ouverture juridique Forte demande lors du lancement Décision d ouverture (licence d attribution) détails techniques sur http://data.bnf.fr/semanticweb.

Liens existants: DBpedia/Wikipédia Bibliothèque du Congrès: http://id.loc.gov Bibliothèque nationale allemande: DNB Voir http://files.d-nb.de/pdf/linked_data_e.pdf Documentation complète sur les techniques. Une vue «RDF» des autorités existantes, Un travail sur les données brutes Bientôt: Agrovoc Thésaurus W Geonames Sudoc Romain WENZ BnF-IBN 29

Exemple de page «auteur» -fournir du contenu -lier vers les ressources -conduire aux services Exemple page Alexandre Dumas Romain Wenz- BnF- IBN- 2011 30

bénéfices visibilité Trouver les ressources sans les connaître Sur le chemin des utilisateurs augmentation des connaissances Pages simples et grand public Créant des liens En expérimentant pour l institution En permettant de réutiliser

Exemples Timeline Appli Développements ailleurs Liens : sameas.org, id.loc.gov

Servez-vous construit automatiquement plusieurs centaines de milliers sera progressivement élargi. http://echanges.bnf.fr/pivot/databnf _all_rdf_xml.tar.gz?user=databnf&pa ssword=databnf

dans le «Web de données» dans le «Linked Open data» Linking Open Data cloud diagram, http://lod-cloud.net/

Merci romain.wenz@bnf.fr Projet: data@bnf.fr