Journée GO!Doc E-book : nouveaux supports, nouveaux usages Les e-books à la BnF Le projet Gallica
Plan Présentation de la bibliothèque numérique Gallica Historique Fonds Fonctionnalités Du document numérisé à l e-book Qu est ce qu un bibliothèque numérique? Qu est ce qu un document numérisé et qu est-ce qu un ebook? Quels sont les ebooks disponibles dans Gallica? Les perspectives d avenir
Historique de la bibliothèque numérique Gallica Le 14 juillet 1988, le Président de la République annonce «la construction et l'aménagement de l'une ou de la plus grande et la plus moderne bibliothèque du monde...» La BnF lance dès 1997 sa bibliothèque numérique : Gallica, bibliothèque encyclopédique et raisonnée. Dès 2003, le site qui n accueillait initialement que des monographies de la BnF s est ouvert à : D autres types de documents (images, sons, périodiques, cartes, etc.) D autres partenaires (pôles associés de la BnF). En 2007, la BnF décide de refondre son système et crée Gallica 2 sur des bases entièrement nouvelles Dès mars 2008, Gallica 2 s ouvre à l édition contemporaine et intègre des documents sous droits dans le cadre d une expérimentation d un an avec le SNE Début 2009, Gallica 2 remplace Gallica
Fonds Aujourd hui, Gallica contient : 124 776 livres, dont 69 801 consultables en mode texte 3751 titres de périodiques, représentant 572 380 fascicules dont 238 905 en mode texte 111 644 images 5009 cartes et plans 1056 documents sonores 4164 manuscrits 2127 partitions 17967 documents provenant de partenaires 5834 document provenant de bibliothèques partenaires 12133 documents provenant de l édition contemporaine
Démonstration : http://gallica.bnf.fr Fonctionnalités
Gallica est une bibliothèque numérique «Une bibliothèque numérique (ou en ligne ou électronique) est un ensemble d'écrits numérisés et accessibles à distance (en particulier via Internet).» L approche privilégie une organisation des fonds et l utilisation de la structuration des informations tout en offrant une recherche plein-texte, au cœur des documents.
Le document numérisé et ses formats Un livre numérisé peut l être en mode image ou en mode texte ou les deux! Le mode image représente le facsimilé de l ouvrage original Le mode texte contient l ensemble des mots du document. Il permet la recherche plein-texte.
Numérisation et reconnaissance de caractères Numérisation Reconnaissance de caractère
Qu est-ce qu un ebook? Terme polysémique pour : Une tablette de lecture Un document numérique pouvant être lu sur cette tablette
Ebook reader Utilise une technologie novatrice pour l affichage : l encre électronique (ou e-ink) Pas de retro-éclairage fatiguant Consommation électrique faible Permet le stockage d un grand nombre de livres électroniques Possède (potentiellement) quelques fonctions absentes d un livre «classique» : grossissement de caractères, recherche dans le texte, vocalisation
E-book Livre électronique dont le format permet la «recomposition» c est-à-dire la capacité à s adapter aux différents e-readers (voire à une lecture sur d autres médias : ordinateur, téléphone mobile) Les formats les plus répandus sont : epub, mobi, prc, pdf, html, text
Du document numérisé à l e-book Pour créer un e-book, il est nécessaire d avoir le texte original de l ouvrage : il est difficile de créer un e-book à partir d un document issue d une reconnaissance optique de caractère Il peut-être intéressant, dans le cas d un document illustré, de pouvoir ajouter des illustrations. Les e-books sont donc très majoritairement des documents récents (dont le format électronique est natif ou dont la typographie est bonne).
Quels sont les ebooks disponibles dans Gallica? Plus de 12 000 documents référencés provenant de plateformes de e-distributeurs Les collections patrimoniales de la BnF (domaine public) 125 000 monographies Plus de 6 numérisés 000 documents dont 70 000 en mode texte référencés provenant d autresd 3750 titres de périodiques, bibliothèques représentant (domaine 570 000 public) ² fascicules (presse comprise) 110 000 images 5000 cartes et plans 1000 documents sonores 4000 manuscrits 2000 partitions Total 840 000 documents
Une offre de documents sous droits Portail de recherche unique permettant recherche plein texte dans les ouvrages sous droits et les ouvrages dans le domaine public Accès libre et gratuit à l intégralité du texte pour les œuvres tombées dans le domaine public (modèle de bibliothèque numérique) Accès libre et gratuit à une notice enrichie de l ouvrage pour les œuvres sous droits (notice, table des matières, première de couverture, quatrième de couverture, résumé, ) Accès contrôlé et payant, via des e-distributeurs, au texte intégral pour les œuvres sous droits (modèle de librairie numérique) Modalités variables selon les e-distributeurs : - Offre : feuilletage, téléchargement de tout ou partie dans des formats divers (pdf, e- book, ), accès limité dans le temps à livre ou ensemble de livres, achat du livre papier - Prix : pour achat du livre complet sous format numérique, fourchette observée de 50% à 100% du prix du livre papier Démonstration!
Une offre de documents sous droits Cadre juridique Contrats auteurs / éditeurs pour cession des droits numériques Contrats éditeurs / e-distributeurs : libre choix de l éditeur / fixation des modalités offertes aux internautes et des prix / pour l instant, un e- distributeur par ouvrage Contrats BnF / e-distributeurs : s apparente à un contrat de licence : autorisation gratuite donnée à la BnF par l e-distributeur (qui certifie en avoir reçu lui-même l autorisation de l éditeur : de rapatrier et indexer les métadonnées et de les afficher dans les listes de résultats de rapatrier et indexer le texte le cas échéant et d en diffuser un court extrait dans les listes de résultats de créer un lien vers le site de l e-distributeur / garantie apportée par l edistributeur de détenir l autorisation de l éditeur pour ce faire
Architecture Métadonnées : protocole OAI-PMH {format DC et Onix} Contenu : protocole FTP {format XML simple} Access au site web : protocole HTTP {HTML/Ajax}
Le schéma de l expérimentation e-librairie e-librairie Etc. 2 gallica2.bnf.fr NUMILOG CYBERLIBRIS TITE-LIVE GALLIMARD La Documentation française EDITIS Editeur Indépendant i-kiosque SOFEDIS En cours : HDS Digital (Groupe Lagardère) CAIRN
Si les lecteurs mp3 et mp4 sont omniprésents autour de nous, les e-books readers peinent à percer auprès du grand public. Néanmoins, l offre de contenu s étoffe : Google a annoncé la semaine dernière 1 millions d ebooks sur son site les nouveautés sortent désormais simultanément en papier et en électronique (et à un tarif inférieur). L expérimentation BnF/éditeurs a montré l intérêt de ce type de média et va perdurer dans le temps La BnF envisage également de généraliser la diffusion de ses documents patrimoniaux au format e-book. Les perspectives d avenir
Des e-books libres de droits sur Gallica?
Le dépôt légal des e-books Le dépôt légal concerne également les e-books ou livres numériques, termes de plus en plus utilisés pour désigner un objet numérique ressemblant en partie à une monographie imprimée sur papier et diffusée en ligne. Il est à préciser que seul le contenu (le texte numérique ainsi que les fonctions d annotation, les outils interactifs, etc.) est visé par le dépôt légal, et non l outil de lecture ou tablette. Les modalités de dépôt sont celles du dépôt légal de l Internet, prévues par le Code du patrimoine (art. L.131-2, L.132-2, L.132-2- 1). L éditeur n a aucune démarche active à effectuer auprès de la BnF. En effet, la Bibliothèque réalise des collectes automatiques grâce à des robots. Compte tenu de la masse d informations disponible sur l Internet, elle procède par échantillonnage, selon des critères visant à assurer la meilleure représentativité possible de ses collections. Si la diffusion d un livre numérique coexiste avec une version sur support papier ou électronique, celle-ci reste soumise à l'obligation de dépôt légal. Un type de dépôt ne se substitue pas à un autre.
Questions?
stephane.pillorget@bnf.fr Merci!
Démonstration Page d accueil
Démonstration - affinage
Démonstration Zoom sur les cartes
Démonstration consultation d un livre
Démonstration consultation d un livre
Démonstration consultation d un manuscrit
La recherche plein-texte Les internautes utilisent désormais naturellement et prioritairement ce type de recherche Les requêtes «mots» envoyés peuvent porter sur n importe quelle propriétés du document (le nom de l auteur, le titre mais également un mot du contenu du document). Le volume de données est extrêmement important () : il est nécessaire d éviter : le silence et le bruit. A l idéal, elle doit porter sur des documents référencés par Gallica 2 mais n appartenant pas seulement à la BnF... Utilisation du moteur de recherche Lucene, assurant une indexation homogène des métadonnées et du contenu du texte, la mise en œuvre de la pertinence des résultats et capable d assumer la volumétrie.