BnF Lecture et documents numériques Janvier 2013 Jean-Didier Wagneur et Eric Dussert
Sommaire Introduction Les contextes Conditions, contraintes, évolutions. Valorisation, usages
Introduction
Historique documentaire et technologique Des origines de la numérisation au premier site Gallica Les principes 1997-2007: constitution raisonnée d une bibliothèque de référence approche encyclopédique et pluridisciplinaire réalisation de dossiers thématiques (Voyages en France, en Afrique, Gallica Classique, Anthologie ) des programmes ciblés comme la numérisation de la Presse ou les Sociétés savantes à l exception des dossiers thématiques, numérisation à partir d exemplaires achetés en antiquariat (massicots) ou de microformes et pas des exemplaires originaux BnF
Des documents à lire : lesquels? La qualité dépend d un rapport entre savoir et opportunités Elle est informée par des choix politiques et un état de la recherche en cours Elle se base sur une connaissance des fonds, de l histoire des disciplines, des documents eux-mêmes. Elle tient compte des acquis et des lacunes antérieures (redondance, etc.) Elle ne peut négliger le coût relatif du traitement d un document
Des outils pertinents Outils bibliographiques (veille scientifique) Outils informatiques Outils juridiques Outils logistiques (expertise conservation) Pour choisir à bon escient, sans redondance (doublonnage), en concertation (Pôles associés, etc.)
Modélisation initiale des sélections Principes de sélection du fonds général Auteurs de référence Mise en contexte : groupes, revues Impact : détermination du corpus élargi des auteurs Périodiques généralistes, spécialisés, d érudition, de création Mémoires de la Révolution française - Archives de la linguistique française - Grands écrivains de la France - Bibliothèque Elzévirienne ( ) Fonction de libre accès, de «boîte à outils» Etats du savoir Etats de la langue
Etapes technologiques (modélisation) + + + + + Editorialisation E-pub Numérisation en couleur OCR HQ DL Web Documents spécialisés Imprimés patrimoniaux Presse Documents audiovisuels Images Microfiches de consultation Mode Texte Inalf PL S Tables des matières Bitmap NB PLA O
La qualité unitaire du document Pertinence du document (contextualisation) Conformité à l original (intégrité, couleur, etc.) Exemplarisation adaptée à la nature du document Extraits enrichis Table des matières Données catalographiques et métadonnées OCR Mais le cadre technique de mise en ligne conditionne la perception de la qualité d un document (ex. png Vs jpg)
Un contrôle visuel significatif
Conditions et contraintes de la qualité Technologie utilisée Pertinence documentaire Etat de conservation du document original
Les univers documentaires Fonction traditionnelle des bibliothèques Expertise et pédagogie Dégager du sens et inviter à la découverte Un principe : l homogénéisation raisonnée d un ensemble hétérogène
Enrichissement de l offre de contenus Numérisation des collections de la BnF Nouveau marché de dématérialisation des imprimés (2011-2014) Programmes de numérisation des collections spécialisées Partenariats public-privé Partenariats avec les bibliothèques françaises Au sein du réseau des Pôles associés (soutien à la numérisation) Grâce aux programmes nationaux de numérisation concertée (soutien à la numérisation) Par l ouverture du marché BnF aux bibliothèques partenaires Par l interopérabilité avec les autres bibliothèques numériques Partenariats avec l édition Référencement des ebooks dans Gallica Numérisation des œuvres indisponibles
Amélioration des interfaces de consultation Améliorer le confort de consultation des documents à l écran Trois modes de consultation principaux : Mode standard (jpeg) Mode feuilletage plein écran (technologie Flash) Mode zoom généralisé à tous les types de documents (jpeg2000)
Renouvellement du moteur de recherche interne Le moteur actuel de recherche de Gallica est un moteur Open Source (Lucène) qui propose des fonctions de recherche basiques Pour offrir à ses usagers des fonctionnalités avancées, la BnF a sélectionné (via un appel d offres) un nouvel outil «Cloudview» de la société Exalead Les travaux ont débuté et le remplacement du moteur interne de Gallica devrait être opérationnel fin 2011 Ce moteur offrira à terme des fonctionnalités sémantiques : aide à la saisie, élargissements de la recherche, extraction d entités nommées, extraction de concepts...
Appropriation des contenus Une stratégie d ensemble préalable à la dissémination : le stock au service des stratégies d incitation Structuration (cartographie, pédagogie, «amers» au sens maritime, contenus et éveil de la curiosité, ) Adaptation à des publics divers (niveau énonciatif neutre), granularités diverses. Adaptation à l évolution de la recherche, à l actualité «réappropriations» «relectures» diverses. Modalités : Délimitation des champs et explication des modalités de sélection. Offre étendue, pluridisciplinaire sans avis préconçu sur les besoins. Interface de consultation : fluidité et qualité (dictionnaire, gros doc., etc.) Moteur de recherche opérationnel et fiable. Signalisation et appropriation. Condition de la qualité de la valorisation vis-à-vis des internautes : Uniformité des outils mis à disposition (ts documents) : transparence des solutions techniques Clarté et fluidité des accès
Des nouveaux outils de lecture
Le lecteur exportable Exemple d utilisations Par les particuliers Par les professionnels de l édition Par les professionnels des bibliothèques Par les professionnels de l éducation Permet la prévisualisation des documents numérisés par la BnF sur un site personnel, un blog etc.
Le lecteur exportable Le lecteur est disponible en 4 tailles 300 px 450 px 600 px 800 px
Permaliens et vignettes exportables 21
La lecture socialisée Les réseaux sociaux Les sites collaboratifs Les produits éditoriaux, La Lettre de Gallica
La page Facebook Découverte ludique et conviviale de Gallica Enrichissement quotidien : mise en valeur de documents remarquables ou insolites Forte réactivité des «fans» http://www.facebook.com/gallicabnf Jeux et énigmes
Le fil Twitter «140 caractères de culture par jour» Reprise de toutes les informations concernant Gallica http://twitter.com/gallicabnf Mettre en valeur les trouvailles des internautes dans Gallica et la façon dont les documents de la bibliothèque numérique sont réutilisés sur le web
Le compte Pinterest Mise en valeur des fonds iconographiques et cartographiques de Gallica Mise en valeur des réutilisations de contenus de Gallica sur les blogs des Gallicanautes http://pinterest.com/gallicabnf/
Les produits éditoriaux Objectifs : Accompagner les internautes dans la découverte des contenus numériques et des fonctionnalités de Gallica Gallica : pas seulement un moteur de recherche, mais une bibliothèque numérique impliquant médiatisation et valorisation Réalisations : Le Blog La Lettre d information A venir : Des produits éditoriaux à l intérieur du site Gallica (articles, dossiers, produits plus élaborés ), différenciés en fonction des publics
Le blog Gallica 170 billets publiés depuis mars 2009 Cordonné par le DCP Alimenté par des correspondants IBN, DSC, DSI, DCP, DCO, DelCom http://blog.bnf.fr/gallica/ 27
La Lettre de Gallica Une lettre d information électronique, gratuite, mensuelle 35 000 abonnés Plusieurs rubriques : «Gallica raconte» «C était hier» «Quoi de neuf?» «Le blog Gallica» «Gallica pratique» http://www.bnf.fr/lettre_gallica/?
Appropriation des contenus Lecteur exportable : appropriation Un outil pour favoriser la réappropriation des contenus à l extérieur du site Gallica Compatible avec Facebook La BnF a reçu le prix de l initiative i-expo 2011 pour cette réalisation (décerné par le GFII et Km forum) Partenariat avec Wikimedia France (07/04/2010) Expérimenter la correction collaborative de l OCR (reconnaissance optique de caractères) de 1 400 ouvrages de Gallica dans Wikisource En cours : sélection de 1 000 documents à diffuser sur les plateformes de partage de contenus
Editorialisation des corpus Un enjeu Cartographier les ensembles significatifs qui constituent la bibliothèque numérique Gallica Donner à voir la collection ; décrire les corpus ; éditorialiser l accès aux contenus de Gallica Un défi Du fait du nombre de documents (près d 1,5 million) Du fait de leur diversité, ainsi que des différentes provenances (BnF, autres bibliothèques, éditeurs ) Un travail coopératif Les ressources de Gallica peuvent être valorisées thématiquement et/ou localement par d autres professionnels ; l éditorialisation de Gallica pourra se faire en partie en dehors de Gallica
Conclusion La qualité en terme de lecture Un horizon difficile à atteindre Un seuil en fonction de la technologie à un temps T Une préoccupation permanente Et un effort collectif permanent -> La qualité offerte au temps T ne peut pas regresser à un temps T+1 Pour progresser : -> Refaire ou corriger? -> Connaître nos lecteurs (enquêtes)
La notion de qualité La qualité, c est : 1/La pertinence documentaire des choix effectués (qualité symbolique) Le document en tant que lui-même ou en temps qu élément d un ensemble (pertinence contextuelle) 2/ La conformité à l original des fichiers numériques (qualité réelle) La Bibliothèque national de France est une institution de référence, et de dernier recours 3/ La signalisation adaptée aux usages 4/ la pérennité de l offre Postulats La Qualité est une tension maintenue entre le Plan Qualité de chacune des étapes constitutives des programmes de numérisation. Soit, des pratiques stratégiques et tactiques en fonction des gisements, des moyens et des technologies mis en œuvre. Toute baisse de qualité à une étape donnée retentit sur la qualité d ensemble.
Qualité absolue/qualité relative Mais la qualité n est pas une donnée absolue, elle est relative aux solutions technologiques ; à la volonté politique ; aux moyens humains et financiers mis en œuvre ; aux projets concurrents.
FIN Merci de votre attention
Annexes 35
Bibliothèques partenaires 130 000 documents d une quarantaine de bibliothèques partenaires sont signalés dans Gallica Bibliothèques partenaires récemment arrivées dans Gallica (via moissonnage) : oavril 2011 : Numdam (numérisation des documents anciens de mathématiques) omai 2011 : Museum national d histoire naturelle ojuin 2011 : la bibliothèque numérique de Roubaix onovembre 2011 : INHA, Médiathèque de l agglomération troyenne, patrimoine numérisé de Besançon, Centre culturel irlandais omars 2012 : Centre national de la Danse, Montpellier agglomération
Les bibliothèques partenaires une interface personnalisée avec le logo de la bibliothèque partenaire
Partenariat avec l édition 80 000 documents d une quinzaine de e- distributeurs partenaires sont signalés dans Gallica À venir en 2012 :
http://www.bnf.fr/fr/professionnels/cooperation_nationale/a.gallica_numerisation_partagee.html
http://www.bnf.fr/fr/professionnels/numerisation.html
Historique documentaire et technologique Des origines de la numérisation au premier site Gallica Les principes 1997-2007: constitution raisonnée d une bibliothèque de référence approche encyclopédique et pluridisciplinaire réalisation de dossiers thématiques (Voyages en France, en Afrique, Gallica Classique, Anthologie ) des programmes ciblés comme la numérisation de la Presse ou les Sociétés savantes à l exception des dossiers thématiques, numérisation à partir d exemplaires achetés en antiquariat (massicots) ou de microformes et pas des exemplaires originaux BnF
Des outils pertinents Outils bibliographiques (veille scientifique) Outils informatiques Outils juridiques Outils logistiques (expertise conservation) Pour choisir à bon escient, sans redondance (doublonnage), en concertation (Pôles associés, etc.)
Le lecteur exportable Le lecteur est disponible en 4 tailles 300 px 450 px 600 px 800 px
Permaliens et vignettes exportables 21
La lecture socialisée Les réseaux sociaux Les sites collaboratifs Les produits éditoriaux, La Lettre de Gallica
Bibliothèques partenaires 130 000 documents d une quarantaine de bibliothèques partenaires sont signalés dans Gallica Bibliothèques partenaires récemment arrivées dans Gallica (via moissonnage) : oavril 2011 : Numdam (numérisation des documents anciens de mathématiques) omai 2011 : Museum national d histoire naturelle ojuin 2011 : la bibliothèque numérique de Roubaix onovembre 2011 : INHA, Médiathèque de l agglomération troyenne, patrimoine numérisé de Besançon, Centre culturel irlandais omars 2012 : Centre national de la Danse, Montpellier agglomération
Les bibliothèques partenaires une interface personnalisée avec le logo de la bibliothèque partenaire
Partenariat avec l édition 80 000 documents d une quinzaine de e- distributeurs partenaires sont signalés dans Gallica À venir en 2012 :