LA CONSERVATION DES SUPPORTS INFORMATIQUES : CONSEQUENCES POUR LES SID SUPPORT ET INFORMATION La conservation, dans le domaine de l'informatique, a cela de particulier qu'il est possible de distinguer, dans une certaine mesure, la conservation du support et celle de l'information qu'il contient. En effet, si dans le cas d'un livre "classique", par exemple, le support et l'information qu'il contient sont intimement liés, le document électronique n'est plus forcément un objet matériel. Il n'est pas accessible de manière directe, mais doit être lu par machine interposée. On pourrait objecter que ce phénomène n'a rien de totalement nouveau : les microformes aussi nécessitent une lecture par machine. Mais l'accès au document informatique, qui est codé, demande encore une transcription que l'on pourrait qualifier cette fois d'intellecuelle : les logiciels. L'accès à l'information est ainsi devenu, en suivant les évolutions technologiques, dépendant de facteurs de plus en plus nombreux, que l'on pourrait représenter de manière simplifiée : Livre, parchemin Microforme, cassette audio Document numérique Support => information Suppport + machine => information Support + machine (hardware) + logiciels => information Pour que l'information soit intelligible sur le long terme, ce qui est le sens même de la conservation, il est impératif de préserver non seulement le support, mais aussi les couches technologiques permettant son appréhension. Nous allons donc étudier les choix offerts à un producteur d'information sur support informatique et les conséquences de ces choix sur la conservation. Le choix de la machine : Il sera déterminant, dans une certaine mesure, pour l'intelligibilité de l'information. Comme pour toute machine de lecture (phonographe, lectueur de cassettes audio ou vidéo ), ses caractéristiques techniques lui permmettent d'interpréter certains types de codes : dans le cas du matériel informatique, il s'agira de pouvoir décoder les instructions présentes sous formes de bits dans les logiciels. Si les caractéristiques techniques d'une machine permettant l'interprétation d'un logiciel particulier sont perdues, l'information codée à l'aide de ce programme sera impossible à interpréter, donc perdue elle-aussi. On comprend alors l'intérêt, si l'on en reste à ce niveau, de conserver le hardware. Mais on imagine les difficultés de stockage rencontrées : problèmes de place et durée de vie des pièces limitée avec le risque de ne plus trouver de pièces de rechange en cas de besoin.
L'évolution extrêmement rapide du matériel informatique rend ce problème encore plus aigu. Le choix du logiciel : Les programmes informatiques déterminent eux-aussi la compréhension du document : selon le logiciel qui aura permi la création d'un document, la forme de celui-ci pourra être parfois modifiée et, la plupart du temps, il ne sera simplement pas être consulté. La perte d'un logiciel risque donc de conduire à la perte de toute l'information qu'il a permis de coder. C'est ainsi que la première base de donnée sur les personnes handicapées créée aux Etats-Unis a littéralement disparu, non pas physiquement mais "intellectuellement", par le biais d'un changement de logiciel. En France, les logiciels sont d'ailleurs compris dans le dépôt légal, ce qui repréente une entorse à la lettre de la loi, le dépôt légal ne concernant normalement que les œuvres de l'esprit et non les œuvres techniques comme le sont les programmes informatiques. Mais le lien entre les œuvres produites avec des moyens informatiques et les logiciels ayant permis leur création est trop étroit pour que l'on puisse les dissocier. Le choix du support : C'est dans ce domaine que la diversité des choix est peut-être la plus évidente : de la disquette magnétique 5 ¼ p. aux DVD, en passant par le CD-Rom ou le disque dur, la palette offerte est des plus larges. L'enregistrment est magnétique, optique, ou encore magnétique et optique à la fois, ce qui influence naturellement les conditions de conservation à leur appliquer. Si les choses s'arrêtaient là, la situation serait encore relativement simple à étudier : chacun de ces supports a une capacité de stockage donnée et une durée de vie plus ou moins longue encore que l'on manque de recul pour s'assurer de l'espérance de vie des disques optiques. Mais comment considérer le cas des documents présents sur Internet? pour la première fois, un document peut être consulté par un grand nombre de personnes de manière simultanée : la question se pose alors de savoir si le support du document est le serveur auquel il est rattaché, l'endroit physique où il occupe de la mémoire, ou le réseau sur lequel il peut être consulté, comme un objet immatériel. La conservation de tels documents accessibles en réseau est un cas particulier et sera traitée à part, en étudiant le projet PANDORA de la "National Library of Australia".
DOCUMENTS NUMERIQUES DE SUBSTITUTION L'arrivée de documents électroniques dans les SID a suscité de nombreuses réactions : nous nous intéresserons plus particulièrement aux bibliothèques nationales ainsi qu'aux archives, institutions pour lesquelles la conservation est une des missions. La conservation des documents électroniques n'est pas toujoursune priorité, et l'informatique a été et est encore aujourd'hui source de paradoxes. De nombreux SID s'en servent comme d'un outil pour la sauvegarde. Le scanning de documents rares, anciens ou fragiles permet une consultation souvent plus aisée et en tous les cas profitable pour les originaux, qui évitent ainsi en partie chocs thermiques et hygrométriques, manipulations maladroites et usure liés à leur sortie des magasins. Cette pratique, qui au premier abord, ne semble offrir que des avantages, trouve rapidement ses limites : la numérisation de documents coûte cher. L'argent qui est alloué à cette opération risque d'être pris sur le budget alloué à la conservation et/ou à la restauration. Or, s'il n'existe pas, en parallèle, une réflexion sur la sauvegarde à long terme du document numérique, on arrivera à une double perte. Les soins que l'on n'aura pu apporter aux originaux nuiront à leur durée de vie et les documents de substitution seront perdu rapidement. L'importance d'une véritable politique de conservation des documents électroniques est évidente : d'un côté sauvegarde des documents électroniques originaux, de l'autre sauvegarde des documents électroniques de substituion et donc protection des documents nonélectroniques originaux. DOCUMENTS NUMERIQUES ORIGINAUX La constante évolution des machines, des logiciels et des supports ainsi que leur grande hétérogénéité pose naturellement problème à qui veut conserver des documents sur supports informatiques. Certains auteurs préconisent simplement d'imprimer une version papier des documents, ce qui permet de se défaire des contraintes techniques. Mais la perte d'information est importante : plus de possibilité de navigation hypertexte, présentation différente. La notion d'original, jusque là prépondérante disparaît alors complètement. D'autres proposent la migration, à savoir le passage d'un document d'un système informatique vers un système plus moderne de manière régulière : dans ce cas, la conservation du matériel et des logiciels anciens perd son importance. Le but étant d'avoir des documents les plus normalisé possibles afin de faciliter ces passages. Si cette solution paraît plus respectueuse de la forme originale du document, elle n'en conduit pas moins à une perte d'information due à la différence entre logiciels (ou entre diverses versions d'un logiciel). Cette perte semble d'ailleurs inéluctable, sous peine de "transformer la bibliothèque en musée de la technologie" (Klaus-Dieter Lehmann, "La Deutsche Bibliothek", p.33). Les institutions se doivent de donner la priorité à la conservation du contenu, au détriment du matériel. Malgré cette concession, semble-t-il inévitable, la solution
migratoire reste encore extrêmement coûteuse et demande une somme de travail non négligeable, si l'on songe qu'un changement du parc informatique est nécessaire tous les cinq ou dix ans. Les facteurs temps et finances poussent ainsi les bibliothèques nationales à se regrouper : le problème du dépôt légal de documents électroniques a ainsi amené à la réalisation du projet NEDLIB (Networked European Deposit Library), auquel participe la Bibliothèque nationale suisse, à côté des bibliothèques nationales des principaux pays européens. LE PROJET "PANDORA" Le projet PANDORA (Preserving and Accessing Networked Documentary Resources of Australia) date de juin 1996. La "National Library of Australia" ayant pour mission de conserver les Australiana, il lui est revenu le devoir de préserver les E-Australiana, ou du moins de concevoir le système général permettant de remplir cette mission. Le travail à fournir étant en effet trop important pour une seule institution, une important collaboration devaitse mettre en place entre différentes bibliothèques du pays. Chaque institution participante s'engage à respecter certains principes s'occuper d'une aire de responsabilité délimitée, effectuer un catalogage normalisé, de façon à entrer dans la "National Bibliographic Database", assurer la conservation à long terme des titres dont elle est responsable, négocier avec les éditeurs pour assurer à long terme un accès ouvert, accessible en réseau et gratuit. Les documents présents sur Internet présentent une grande hétérogénéité : les formats les plus standards (HTML, PDF) sont recherchés, à défaut d'une norme acceptée par tous. Si ce n'est pas le cas, la NLA demande à l'éditeur une copie dans un format standard, une copie du logiciel ayant permis la création de la publication, ou, si ces deux requêtes ne sont pas satisfaites, elle convertit elle-même la publication dans un des formats standards d'archivage. Les stratégies mises en œuvre ont été les suivantes identifier les requis fonctionnels pour un système de gestion et de conservation, identifier, tester et évaluer une palette de tehniques, de standards et des produits compris dans le procédé de conservation, incluant la saisie, le catalogage et l'archivage, estimer les ressources financières, matérielles et humaines requises pour la gestion des publication sélectionnées pour une conservation nationale,
développer des recommandation set des stratégies pour la conservation à long terme et l'accès aux publication sélectionnées, incluant des considérations de ragraîchissement des données, de reformatage et de migration pour contrer l'obsolescence ou la perte, développer une proposition pour approche nationale de la conservation à long terme de ces publications. Le cas de l'évolution constante du document électronique, sorte de "palimpseste informatique" et de la disparition toujours possible de certains sites est aussi résolu par le projet : il s'agit pour la NLA d'attribuer à chaque version, édition, sortie ou publication d'un document un PURL (Persistent Universal Resource Locator). LES PERIODIQUES ELECTRONIQUES Le cas des périodiques électroniques, généralement dans le domaine scientifique est particulier. Lorsque la publication existe à la fois en ligne et en version papier, il reste possible de choisir l'un ou l'autre des supports pour la conservation. Mais, de plus en plus souvent, le seul accès offert est électronique. Les éditeurs n'étant pas à proprement parler de grands philanthropes, il est difficile de négocier une conservation des numéros déjà parus, surtout dans le cas où un abonnement est résilié : et les institutions ont beau argumenter qu'auparavant, aucun éditeur n'aurait eu l'idée de venir chercher les collections papier dans les fonds d'une bibliothèque, les détenteurs des droits prétendent que les deux situations ne sont pas comparables et que tout accès "rétrospectif" est exclu. AVENIR DE LA CONSERVATION DANS LES SID Le mandat des services d'archives les oblige à conserver le document original, donc de préserver la forme originale. Pour les documents électroniques, nous l'avons vu, le respect absolu de cette instruction exigerait la sauvegarde du support, du logiciel ayant permis sa création et d'une machine capable de lire le programme. Situation intenable qui demande une remise en cause de ces directives. Les archives semblent donc devoir adopter la politique de migration préconisée par la plupart des auteurs. Ainsi les agences fédérales américaines en rapport avec les National Archives and Records Administration sont tenues de "1234.20(c) Establishing procedures for regular recopying, reformatting, and other necessary maintenance to ensure the retention and usability of electronic records throughout their authorized life cycle"(see Sec. 1234.28). (In : gopher://gopher.nara.gov/00/about/cfr/records/1234.txt, consulté le 14.02.99).
L'élément mis en avant est donc la sauvegarde de l'accès au document plutôt que la conservation du document "original". Pour les bibliothèques nationales, une plus grande collaboration entre institutions à l'intérieur de chaque pays et au niveau international semble la seule solution viable. Elle aurait deux avantages : réduction des coûts par la création d'instituts centralisés s'occupant plus particulièrement des documents électroniques, réflexion commune sur les formats standards de conservation à adopter. La rapidité des changements dans le monde de l'informatique est un nouveau défi pour les SID, qui doivent obligatoirement se remettre en question. Le manque de recul qu'ils peuvent avoir quant à l'évolution du matériel, des formats rend les choix particulièrment difficiles et peu sûrs : cependant, l'arrivée relativement récente de ces nouveaux supports permet d'espérer que les premiers balbutiements, les premières erreurs ne sont que la conséquence naturelle de l'adaptation à une technologie nouvelle, qu'un peu plus d'expérience permettra d'éviter. Le grand nombre de projets de conservation de documents électroniques en bibliothèque ou dans des centres d' archives (nous n'avons étudié que le cas australien, mais les Etats-Unis et les Européens ne sont pas en reste) démontre d'ailleurs que la réaction s'organise de manière positive. Raphaël Althaus