Par Thierry CLAERR, Service du Livre et de la Lecture Jean-François MOUFFLET, Service interministériel des Archives de France Ministère de la Culture et de la Communication
Stockage et conservation des données Quel stockage pour les fichiers d archivage? Comment pérenniser l information numérique?
Trois risques majeurs : L obsolescence des applications informatiques et des formats de fichiers ; La fragilité et la durée de vie relativement faible des supports La difficulté de retrouver des fichiers informatiques s ils n ont pas été bien décrits à l origine et bien suivis. Données Support Des intermédiaires menacés par l obsolescence
Supports fragiles
Supports obsolescents, dépendants du marché de l informatique
L utilisation des fichiers n est pas toujours sans risque Attention à bien conserver une image de référence en haute qualité («fichier de conservation»), un fichier maître, jamais altéré
Attention à bien distinguer : La conservation des données sources Il s agit d archiver les fichiers «maîtres», à partir desquels on pourra toujours dériver des fichiers destinés à la consultation Cela doit faire l objet d une véritable politique d archivage électronique afin de pérenniser les investissements du projet Cet archivage peut être externalisé auprès de prestataires spécialisés Ex. : le CINES à Montpellier archive tous les fichiers de numérisation des bibliothèques universitaires L hébergement des données qui sont diffusées aux utilisateurs Les données qui sont consultées sont stockées sur des serveurs qui répondent aux requêtes des utilisateurs Là aussi l hébergement peut être externalisé.
Supports magnétiques Bandes magnétiques LTO (jusqu à 1,5 To LTO 5, 2010) Support professionnel Qualité contrôlée Support assez utilisé Haute fiabilité Obsolescence rapide Disques magnétiques internes / externes Disque dur Support professionnel Qualité contrôlée Support assez utilisé Risque technologique élevé (fiabilité et pérennité peu connues) Source : SLL Supports optiques CD-R (ou CD-WORM) = compact disc recordable : disque compact inscriptible. CD-RW = compact disc rewritable : disque compact réinscriptible. DVD-R, DVD-RW = digital versatil disc, recordable, rewritable : disque numérique polyvalent, inscriptible, réinscriptible Capacité : 700 Mo Support grand public Qualité inégale Risque technologique faible Fabrication doit répondre à la norme 42-011-2 gravure doit répondre à la norme ISO 9660 Capacité : 4,7 Go Support grand public Qualité très inégale Risque technologique faible Double couche ou double face (capacité 17 Go)
Un format ouvert, c'est à dire un format dont la documentation est librement accessible. Un format peut être secret mais il devra être suffisamment documenté pour en permettre une large utilisation un format largement utilisé, un format normalisé si possible un format indépendant (notamment des autres formats et des plateformes)
Stockage et conservation des données Quel stockage pour les fichiers d archivage? Comment pérenniser l information numérique? Mode de diffusion des données Les données consultées sont-elles hébergées en interne ou en externe? Quels sont les différents points d accès sur le Web?
Diffusion sur le site Web du service Le serveur d hébergement peut être : Au sein des services informatiques du service Les exigences qualitatives comme le temps de réponse à une requête, la maintenance sont supportées en interne Confié à un prestataire facturant une prestation d hébergement Les exigences doivent être formalisées dans un CCTP faisant l objet d un marché Qui se propose? Des prestataires de numérisation Des éditeurs de logiciels métier Des sociétés d édition de sites Internet
Diffusion sur le site Web du service Diffusion sur un site prestataire ou conventionné
Faire héberger ses collections numériques numérisées sur des plateformes publiques et privées Exemples : Gallica, Bibliothèque numérique de Nîmes en partenariat avec e-corpus, Bibliothèque numérique de l'inha en mode Saas...
Exemple de la bibliothèque des Champs Libres et de son catalogue enrichi
Diffusion sur le site Web du service Diffusion sur un site tiers Diffusion sur un portail culturel
Portail : une porte d accès unique vers des ressources numériques diverses, éloignées «physiquement» Utilisation de technologies et standards permettant l échange de métadonnées et l interopérabilité : Protocole OAI-PMH qui permet de récupérer les métadonnées descriptives des fonds numérisés OAI PMH = Open Archive Initiative Protocol for Metadata Hervesting Protocole de moissonnage des métadonnées Fiche technique : www.culture.gouv.fr/culture/dll/oai-pmh.htm
Le protocole OAI-PMH
Portail culturel du ministère de la Culture : accès unique aux ressources culturelles numérisées par les services culturels Le portail «Collections»
Exemple : banque numérique des patrimoines martiniquais
Stockage et conservation des données Mode de diffusion des données Quel stockage pour les fichiers d archivage? L outil de consultation Les données consultées sont-elles Quel outil logiciel et hébergées en interne quelles ou en externe? fonctionnalités? Comment pérenniser l information numérique? Quels sont les différents points d accès sur le Web? Quelle interaction avec le public?
1. Une interface de recherche documentaire 2. Un outil de visualisation des données
Accès par les catalogues et inventaires
Certains services choisissent de donner accès aux documents numérisés depuis leurs instruments de recherche encodés en XML-EAD et publiés en ligne. Archives départementales du Val-de-Marne : iconographie Archives départementales des Pyrénées-Atlantiques : notaires Catalogue de manuscrits des bibliothèques
Interrogation par bases de données spécifiques Accès par les catalogues et inventaires
Les bases de données Elles sont alimentées par les informations d indexation issues : Des notices et instruments de recherche préexistants Du récolement effectué lors de la préparation des documents De l indexation complémentaire des vues
Métadonnées descriptives : informations d indexation sur les images Informations sur les ressources, pour les retrouver à partir d outils de recherche
Métadonnées descriptives : informations d indexation sur les images Informations sur les ressources, pour les décrire
Informations d indexation Serveur stockage
Annotations structurées : Faire remplir les champs d une base de données (généalogique en général)
Annotations structurées : Exemple des Archives du Cantal
Interrogation type bases de données Accès par les catalogues et inventaires Accès thématiques, éditorialisation
Certains services proposent des accès plus thématiques Regrouper des documents différents autour d une même thématique Dossiers thématiques Exemple de la banque d images des Archives nationales : Archim Exemple du site RMN/DAF : L histoire par l image
Certains services proposent des accès plus thématiques Regrouper des documents différents autour d une même thématique Dossiers thématiques Exemple de la banque d images des Archives nationales : Archim Exemple du site RMN/DAF : L histoire par l image Expositions virtuelles Ex. AD Ardennes http://archives.cg08.fr/ Ex. AD Aube http://www.archives-aube.com/extras/chemin_de_fer_aube.php
Exposition virtuelle «Trésors d archives» des Archives départementales du Var
Certains services proposent des accès plus thématiques Regrouper des documents différents autour d une même thématique Dossiers thématiques Exemple de la banque d images des Archives nationales : Archim Exemple du site RMN/DAF : L histoire par l image Expositions virtuelles Diffusion ludique http://www.archivesaube.com/jeux/cordeliere/mystere.php
Exemple des dictionnaires participatifs Initiatives soutenues par le ministère de la Culture en 2010 AD Vendée : wiki historique de la Vendée
Exemple des dictionnaires participatifs Initiatives soutenues par le ministère de la Culture ure en 2010 AD Vendée : wiki historique de la Vendéee
Exemple des dictionnaires participatifs Initiatives soutenues par le ministère de la Culture en 2010 AD Vendée : wiki historique de la Vendée
Fournitures de contenus : Initiatives soutenues par le ministère de la Culture en 2010 AD Lot-et-Garonne : fourniture de cartes postales numérisées et indexation de la base de cartes postales
1. Une interface de recherche documentaire 2. Un outil de visualisation des données
Navigation au sein du lot d images Consultation des informations Miniature pour se déplacer Impression Zoom Blocage des réglages Outils luminosité / contraste
Affichage progressif en jp2 (tuilage)
Récupération de l image, copyright Archives Bas-Rhin Filigrane sur l image de consultation
Récupération de l image, copyright Archives Maine-et-Loire
La numérisation est certes un outil de conservation du patrimoine écrit, mais aussi de diffusion et de valorisation des collections, qui se développe en France, dans le respect du droit d'auteur, avec : un nombre croissant de programmes et de nouveaux contenus numériques, un besoin de coordination, de coopération et de formation, des perspectives de nouvelles coopérations entre établissements, tant en matière d accessibilité que de conservation numérique. Perspectives : - Mettre en place un dispositif de veille et d'informations technologiques, ainsi qu'un cadre d'organisation partagée fixant des bonnes pratiques, des recommandations techniques en matière de production, de diffusion et de conservation - Poursuivre la concertation le plus loin possible - Favoriser les passerelles (concertation et intéropérabilité) avec les différentes initiatives autour du numérique (Bibliothèque numérique Gallica - BnF, moteur Collections du ministère de la Culture, Europeana, politique numérique de l'ina, des services d'archives, des musées...)