«E-archiving» étude préliminaire

Dimension: px
Commencer à balayer dès la page:

Download "«E-archiving» étude préliminaire"

Transcription

1 Consortium des bibliothèques universitaires suisses «E-archiving» étude préliminaire Version F Zurich, 2005

2 Etude préliminaire sur l e-archiving réalisée à la demande de la Conférence universitaire suisse Matthias Töwe avec la collaboration d Arlette Piguet 2005 Consortium des bibliothèques universitaires suisses «e-archiving» c/o ETH-Bibliothek Rämistrasse 101 CH-8092 Zurich Tous les hyperliens cités sans date ont été contrôlés pour la dernière fois en décembre

3 Table des matières Table des matières Résumé Situation initiale Accès durable aux périodiques électroniques Archivage à long terme de données électroniques Rétronumérisation des périodiques Coordination de serveurs de documents Archivage partagé des périodiques imprimés Institutionnalisation Situation initiale Les médias électroniques dans les bibliothèques Disponibilité croissante Transformation des habitudes de publication Définition des types de documents traités dans cette étude Périodiques électroniques Littérature grise Périodiques numérisés Licences pour l accès en ligne Imprimés et documents en ligne Licences E-only : documents en ligne et imprimés Contenu des contrats de licence Accès durable et clauses relatives aux archives Particularités des objets numériques Authenticité et contrôle Aucune détérioration mais une conservation limitée Infrastructure et dépendances Accessibilité et archivage à long terme Accès à long terme Accès à long terme aux contenus sous licence Accès à long terme à la littérature grise des hautes écoles Archivage à long terme des objets numériques Obsolescence des supports de stockage Obsolescence technologique Périodiques imprimés Rétronumérisation Processus technique Avantages de la numérisation La numérisation peut-elle servir à la conservation des catalogues? Conservation des formes numérisées Questions techniques: accès Sauvegarde Interface et utilisation Authenticité Contrôle de l accès Droit d écriture Droit de lecture Adressage durable Schéma URN Amorces de solutions techniques: la conservation à long terme Archéologie des données Musée informatique

4 5.3 Formats standards PDF et PDF/A TIFF (Tagged Image File Format) XML (extensible Markup Language) et autres langages de balisage ASCII Migration Emulation Universal Virtual Computer (UVC) Capsules temporelles et viewpaths Documentation, répertoires et référentiel Répertoires des formats (Format Registries) Référentiels de logiciels Besoins des bibliothèques: résultats d un sondage Résumé Questions stratégiques pour les bibliothèques universitaires Le rôle futur des bibliothèques universitaires Donner accès aux informations Fonction de mémoire Open Access et services de publication Savoir-faire technique Logiciels Open Source Contrôle Coopération Prestations personnelles des bibliothèques Le concept pour la Suisse Comparaison avec des projets internationaux Situation initiale en Suisse Bibliothèques Hautes écoles Consortium Objectif Points de vue concernant les sous-projets Accès à long terme aux contenus acquis par transaction commerciale Différenciation des contenus Evaluation des risques et priorités Scénarios pour garantir l accès Accès continu chez le fournisseur d origine Installations maison locales ou régionales Accès par l intermédiaire de fournisseurs tiers Fourniture de documents La politique des maisons d édition Recommandations pour assurer l accès aux revues Archivage à long terme Aspects juridiques de l archivage Concepts de fonctionnement Scénarios de répartition des tâches et des responsabilités Renseignements sur les coûts de l archivage à long terme Archivage à long terme d autres données Modèles de financement Attrait Recommandations pour l archivage à long terme Archivage partagé des périodiques imprimés Objectifs Exemples Etapes prévues pour une réalisation du projet dans le cadre du Consortium 165 4

5 8.7.4 Recommandations pour l archivage partagé des imprimés Libre accès et serveurs de documents Libre accès aux articles parus formellement dans des revues («archivage» de prépublications et de postpublications par l auteur) Publication de revues en libre accès Serveurs de documents universels des hautes écoles Recommandations Numérisations propres Procédure Aperçu des projets partiels Recommandations pour les bibliothèques Contrats de licence Clarifier le mandat des bibliothèques Documentation Formats Entretien actif des contacts et acquisition Contrôle central dans la bibliothéconomie d une haute école Serveurs de documents Résumé de la stratégie globale Stratégie: orientation institutionelle Stratégie concernant le contenu Accès Accessibilité élargie L archivage Perspective Références Autre littérature Annexe I : enquête auprès des bibliothèques Interprétation des résultats du questionnaire Fonds de périodiques électroniques (section 4 du questionnaire) Contrats de licence E-only (section 5 du questionnaire) Fonds imprimés (section 6 du questionnaire) Mandat d archivage (section 7 du questionnaire) Archivage de périodiques imprimés (section 8 du questionnaire) Accès durable aux périodiques électroniques (section 9 du questionnaire) Accès libre et archivage institutionnel de documents (section 10) Numérisation des fonds existants (section 11 du questionnaire) Autres projets ou mesures apparentés (section 12 du questionnaire) Questionnaire et réponses Annexe II: DSpace Testinstallation: Ergebnisse Warum DSpace? Durchführung der Tests Ergebnisse Bedienung Struktur Metadaten Skalierbarkeit Suchfunktionen und Indices Weitere Detailprobleme Arbeitsabläufe/Workflow-Konzept Langzeitarchivierung Open Source, Support und weitere Entwicklung Fazit Weiteres Vorgehen Annexe IIIa: Ein Vergleich der Systeme GetInfo, OPUS, MILESS und MyCoRe Annexe IIIb: Ein Vergleich der drei Systeme DSpace, EPrints und CDSWare

6 16. Annexe IV: Musterformulierungen für Vereinbarungen zur elektronischen Archivierung in den Lizenzverträgen des Konsortiums Einführung Auszüge aus internationalen Muster-Lizenzvereinbarungen Musterformulierungen für Einzelregelungen Annexe V: Das Umfeld des E-Archiving-Projektes des Konsortiums der Schweizer Hochschulbibliotheken

7 1. Résumé Cette étude présente les défis fondamentaux de l archivage électronique et esquisse un concept global pour le traitement à long terme des sources d information électroniques dans les bibliothèques universitaires suisses. Elle contient des propositions de mesures que ces dernières devraient prendre face à certains types de documents d une importance particulière dans le cadre du projet «e-archiving», qui se déroulera de 2005 à 2007, et replace ces activités dans le contexte d une stratégie plus globale. Il s agit des types de documents suivants : contenus des périodiques électroniques de fournisseurs commerciaux qui ont été acquis par contrat d approvisionnement (abonnement ou licence) ; littérature grise des hautes écoles (manuscrits, publications universitaires, supports d enseignement, etc.) dans la perspective de l Open Access ; périodiques scientifiques numérisés ultérieurement ou devant encore être numérisés ; en raison du caractère hybride de la majorité des périodiques, les revues imprimées doivent également être prises en compte dans ces réflexions. Le champ de cette étude est ainsi très vaste, comparé à d autres projets. La relation existant entre ses différentes composantes s est avérée particulièrement féconde, car toutes tournent autour de «l accessibilité aux informations scientifiques» et «l archivage à long terme». Il serait du reste utile à l avenir de ne perdre de vue aucun de ces domaines. Il ne faut toutefois pas se bercer d illusions : dans la mise en œuvre pratique, les différentes parties de ce projet ne pourront être exploitées, ne serait-ce que tant soit peu, avec la même intensité. 1.1 Situation initiale Dans le monde entier, les bibliothèques scientifiques sont aujourd hui des institutions hybrides dont l offre globale comporte aussi bien des contenus traditionnels, généralement imprimés, que des données électroniques. Cette situation ne devrait pas changer à long terme, même si certains produits ne sont plus disponibles qu en version électronique, et que, pour leurs nouvelles acquisitions, certaines bibliothèques insistent fortement pour obtenir des titres uniquement sous forme électronique. L étude commente les forces et les faiblesses de certaines offres, pour autant qu elles ont des répercussions sur le sujet. Il n est pas question de juger ici de la généralisation des offres électroniques. C est l affaire des bibliothèques, dans les échanges qu elles entretiennent avec leurs clients. Il ne s agit pas toutefois de laisser l initiative des changements aux maisons d édition et aux autres fournisseurs, dont les intérêts ne concordent pas nécessairement avec ceux des usagers et des bibliothèques. Le principal atout des bibliothèques scientifiques réside dans la gestion des contenus qu elles sélectionnent, traitent et mettent à disposition de manière durable. Pour les données électroniques également, cela devrait servir de point de départ pour l orientation de leur 7

8 engagement. Dans le contexte d un concept d e-archiving, cela signifie qu il va falloir résister à la tentation de considérer que toutes les activités tournant autour de la sauvegarde et de l archivage électronique doivent être assumées par les seules bibliothèques. Sans aucun doute, les bibliothèques universitaires doivent se préoccuper de la façon dont elles vont garantir les contenus qu elles ont acquis et les conserver à long terme. Mais il n est pas question qu elles se chargent elles-mêmes, voire à elles seules de toutes ces tâches. Bien que les coûts liés à la garantie de l accès et à l archivage ne puissent être exactement chiffrés, toutes sont conscientes que, si l on ne fait rien à l heure actuelle, cela entraînera des dépenses encore bien supérieures à l avenir. De plus, des mesures prises en temps voulu offrent généralement des résultats plus satisfaisants du point de vue de la qualité que des interventions après coup. L ensemble du secteur de l information et des publications évolue constamment. Les décisions prises aujourd hui dans la perspective de l archivage électronique sont, vraisemblablement, loin d être toutes judicieuses. A l heure actuelle, il est donc nécessaire de collecter des expériences pratiques qui permettront un jugement plus précis, même si cela comporte certains risques. Sinon, il est probable que les bibliothèques seront contraintes tôt ou tard, par l extérieur, de prendre certaines décisions, et ce pas forcément à leur avantage ou pour le bien de leurs clients. Cela vaut également pour le mouvement en faveur du libre accès aux informations scientifiques (Open Access) : il y a beaucoup d optimisme, on fait des expériences intéressantes, il existe aussi des doutes justifiés et des questions en suspens, mais on ne peut ignorer ce mouvement. 1.2 Accès durable aux périodiques électroniques La garantie d accès aux contenus sous forme électronique est ce qui intéresse en premier lieu les bibliothèques universitaires et leurs usagers. On ne peut la mettre sur le même niveau que l archivage à long terme des objets numériques. Le débat portant sur la nécessité et la possibilité de garantir l accès durable aux périodiques électroniques même après échéance des accords de licence est surtout dominé par la perspective d une dépendance manifeste par rapport à quelques grandes maisons d édition commerciale qui fournissent la majorité des titres mis à disposition par les bibliothèques. Il faut pourtant tenir compte également des petites et moyennes maisons d édition, nombreuses, qui fournissent le reste de l offre. Les principales possibilités de garantir l accès sont les suivantes : 8 La bibliothèque continue d avoir accès aux années acquises auprès de l éditeur. Au bout de quelques années, ce service sera payant. Hébergement (Hosting) local des années acquises dans au moins un lieu en Suisse, avec les charges d exploitation correspondantes. Contrats avec d autres prestataires qui permettent un accès payant sur la base des licences conclues précédemment. Approvisionnement par le biais des services de livraison de documents. Aucune de ces solutions ne peut entrer seule en ligne de compte pour tous les fournisseurs ou toutes les bibliothèques. Certainement il faudra envisager des solutions basées sur une

9 combinaison des différentes options. Les coûts à plus long terme constituent à cet égard un aspect non négligeable, mais ils ne doivent pas être l argument qui l emporte sans autre considération, car les solutions ne sont ni équivalentes ni interchangeables. Archives papier ne sont pas explicitement discutées dans le contexte de l accès aux contenus électroniques. Du point de vue de l accès en tout temps et en tout lieu, on est loin de répondre à toutes les attentes, et les exemplaires imprimés ne sont pas considérés comme un substitut capable de pallier totalement la perte de l accès aux données électroniques. Bien entendu, les titres imprimés doivent rester à la disposition du public partout où cela constitue la forme d utilisation privilégiée. Ils font en tout cas partie intégrante de l archivage à long terme. Dans un concept différencié, les archives papier ont surtout leur place là où l on escompte des taux d utilisation assez bas, qui ne justifient pas les dépenses liées à la préparation électronique des données. En revanche, les grandes bibliothèques, qui ont un mandat d approvisionnement déterminé, peuvent se voir contraintes de sauvegarder effectivement elles-mêmes les contenus qu elles ont acquis et de les tenir à la disposition du public. Dans leur optique, devoir se fier aux promesses de tiers peut s avérer problématique. De par leur mandat, elles sont en effet dans l obligation de développer un fonds et de le rendre disponible. Dans ce cas, un simple examen de la demande, généralement en baisse depuis des années, ne suffit plus face aux coûts qu entraîne la mise à disposition continue des documents électroniques. C est pourquoi l on propose les mesures suivantes (détails, voir chap ) : élaboration d un concept détaillé de système de stockage distribué, avec (deux ou) trois serveurs, qui soit en mesure de reprendre les contenus commerciaux des éditeurs et de les mettre à disposition des clients (serveur miroir inclus) ; une répartition par maison d édition est prévue ; mise en place, dans un premier temps, d un serveur, si possible d ici la fin 2005 / début 2006 : o là où cela est possible, les exigences en matière d archivage à long terme devront être prises en compte ; o on définira des critères pour la reprise des données ; parallèlement, examen de la possibilité d intégrer des backfiles ; indépendamment, installation test de LOCKSS par des partenaires intéressés ; évaluation approfondie des charges et formulation d une stratégie pour les organismes responsables à long terme, sur la base de la mise en œuvre pratique ; en cas de résultat positif, les deux serveurs manquants seront installés en 2006/ Archivage à long terme de données électroniques La question de l archivage à long terme concerne toutes les données numériques, quelle que soit leur origine. Des processus techniques qui ont été proposés pour résoudre le problème se trouvent encore au stade expérimental et dans la phase de recherche. Par conséquent, il 9

10 n existe aucune estimation fiable et généralement reconnue sur les coûts de ces procédures. En Suisse, la Bibliothèque nationale (BN) et les Archives fédérales (AF) ont acquis du matériel informatique qui constitue la base nécessaire pour un archivage à long terme. Les processus qui vont permettre l enregistrement, la distribution, et surtout, la conservation des données de manière à ce qu elles puissent être décryptées, doivent encore être développés. Quelles que soient les possibilités d accès effectives, il faut s attendre à ce que la conservation à long terme des données électroniques dont le contenu se rapporte au pays soit effectuée à l avenir par presque toutes les bibliothèques nationales. Vous trouverez les recommandations détaillées au chapitre Jusqu à nouvel ordre, aucune infrastructure des bibliothèques universitaires ne sera mise en place à des fins d archivage à long terme de manière comparable au système d archivage de la BN. Pour la mise en place d un système permettant de garantir l accès aux données (cf ), il faut tenir compte des exigences posées par l archivage à long terme. Cela facilite l enregistrement de données dans des archives ou un développement ultérieur visant à constituer des archives. Approfondissement des contacts avec la BN. Examen des possibilités de collaboration (concrètement, p.ex., attribution d un URN, métadonnées, planification stratégique de conservation (Preservation Management), développement d un système ou de composantes compatibles OAIS). Les bibliothèques universitaires sont à cet égard très intéressées par l utilisation des contenus (accès au modèle OAIS, cf. chap ). Sur la base des expériences faites à l échelon national et international, évaluation approfondie des charges liées à de telles options (système propre, participation à des systèmes d autres institutions, d autres prestataires, etc.). 1.4 Rétronumérisation des périodiques En ce qui concerne la numérisation ultérieure des contenus de périodiques imprimés existants, l accès est à nouveau au centre de nos préoccupations, car la forme numérique permet une diffusion facilitée, en tout lieu et à toute heure. La rétronumérisation n est pour l instant pas un moyen d archivage à long terme de contenus. Cela sera toutefois de plus en plus le cas si l on réussit à mettre au point des méthodes fiables pour conserver les données numériques longtemps, de manière stable, tout en garantissant leur lisibilité. Les contenus de trois revues de mathématiques sont numérisés dans le cadre de ce projet. Vous trouverez des recommandations détaillées au chap Clôture des travaux entrepris pour la mise à disposition en ligne des trois revues de mathématiques L Enseignement Mathématique, Commentarii Mathematici Helvetici, Elemente der Mathematik en Une solution proposant une perspective une fois le projet terminé devra être trouvée pour la présentation permanente de contenus numérisés. Evaluation des résultats et expériences pour une utilisation ultérieure dans des projets de bibliothèques partenaires.

11 Entretien des logiciels choisis, aussi longtemps que les bibliothèques s y intéressent. Possible dans le cadre du projet jusqu à la fin du projet, en 2007 au maximum ; ensuite, par des partenaires (bibliothèques et éditeurs). Dans l ensemble, la numérisation, qui mobilise d importantes ressources, ne doit pas être poursuivie en priorité dans le cadre du projet. 1.5 Coordination de serveurs de documents Les serveurs de documents des hautes écoles offrent un moyen d améliorer l accessibilité et la visibilité des informations scientifiques. Ils sont un instrument important pour les deux concepts du mouvement du libre accès (Open Access). Il s agit, d une part, de l autoarchivage de preprints et de postprints de publications traditionnelles, d autre part, de la mise à disposition de publications propres en libre accès. Ce n est qu en garantissant la disponibilité de ces documents sur une longue période que l on créera la confiance nécessaire pour que cette forme de publication soit une alternative au modèle traditionnel. Vous trouverez une version détaillée de ces recommandations au chapitre Dans l année 2005, l utilisation commune d un serveur de documents doit être mise à l essai avec des partenaires intéressés. Recherche de témoignages d institutions intéressés par les métadonnées ou la sauvegarde de contenus. On cherchera des partenaires qui contribuent activement à la mise en place de ce serveur (participation à des groupes de travail, adaptations sur leur serveur propre). Il faudra décider quelles données doivent être sauvegardées. Cela concerne aussi bien le choix des contenus que la forme (quelles métadonnées, etc.). Les possibilités de collaboration avec des serveurs existants, en particulier celui de RERO, doivent être examinées. L utilisation d un service commercial a été abandonnée. Les postprints offrent la meilleure perspective de réunir rapidement un nombre significatif de documents importants. Pour cela, il faut que, parallèlement à la mise en place technique dans les différentes bibliothèques, des mesures soient planifiées sur place, pour qu il soit possible de motiver les auteurs à participer sur le plan local au sein de leur haute école. La forme de la collaboration devra être réglée. Ce faisant, on veillera à ce que les processus et les accords puissent être adaptés, au cas où aucune institution centrale ne subsiste une fois le projet terminé. 1.6 Archivage partagé des périodiques imprimés L archivage partagé des périodiques imprimés vient compléter, d une part, les efforts visant à assurer la sécurité de l approvisionnement qui vont être nécessaires pour les offres électroniques. D autre part, il permet de répartir entre les différents partenaires la charge de 11

12 travail résultant de la quantité de documents, et, finalement, de coordonner plus étroitement l achat de périodiques. Pour les recommandations détaillées, voir le chapitre Dans la deuxième moitié de 2005, les premières mesures doivent être prises, conformément à la procédure décrite au point On procédera, à titre de modèle, pour un ensemble limité de périodiques imprimés (p.ex. ceux d un éditeur), à la répartition entre les bibliothèques des titres devant être archivés. Au cas où, en raison d un archivage coordonné, des résiliations d abonnements seraient possibles déjà en 2006, cette partie du projet devra être privilégiée et traitée en priorité, au détriment d autres travaux. Il faudra prendre une décision à cet égard. 1.7 Institutionnalisation Pour réaliser la préparation et la mise en œuvre des mesures il n'est pas envisagé de créer de nouvelles structures. La coordination des activités est faite par le personnel du projet. Des installations techniques sont organisées entre les bibliothèques universitaires avec le soutien du projet ou réalisées en coopération avec d'autres partenaires. Après la fin de la durée du projet, une certaine coordination doit être garantie en relation étroite avec le bureau du consortium. Déjà dans le projet en cours des mécanismes pour la formation d opinion et la prise de décisions entre les bibliothèques doivent être expérimentés. 12

13 2. Situation initiale Assurer l accès durable aux informations scientifiques fait partie des tâches traditionnellement dévolues aux bibliothèques, et l émergence du support électronique n y a en principe rien changé. Que les ressources électroniques mises à disposition soient des publications acquises auprès d éditeurs commerciaux, de la «littérature grise», ou qu il s agisse de produits de numérisation, les bibliothèques sont tenues de garantir également leur accès et leur lisibilité à long terme. Ces nouvelles exigences demanderont à l avenir d importants efforts aux bibliothèques scientifiques. Les discussions qu une telle évolution a suscitées jusqu à présent dans le monde entier et les projets qui ont été lancés prouvent que les bibliothèques scientifiques, les bibliothèques nationales ainsi que d autres «organisations dédiées à la mémoire» sont prêtes à relever ce défi. 2.1 Les médias électroniques dans les bibliothèques Disponibilité croissante Pour être en mesure de répondre à une forte demande d informations en ligne de la part des usagers, les bibliothèques scientifiques s efforcent depuis des années de fournir une offre plus étendue et de haute qualité en matière de ressources électroniques ; elles l ont développée parallèlement ou en supplément des fonds traditionnels, sous forme imprimée, qui jouent toujours un rôle essentiel. C est ainsi que les bibliothèques mettent à la disposition de cercles d usagers bien précis des bases de données spécialisées, des ouvrages de référence et de plus en plus de périodiques numériques (e-journals) ainsi que des livres électroniques, les e-books, mais aussi des images et des cartes en ligne. Par ailleurs, des mesures de numérisation ciblées permettent d améliorer l accessibilité de textes et d images n existant jusqu à présent que sous forme imprimée. Des portails personnalisables ainsi qu une mise en réseau judicieuse des ressources aident les clients à trouver les informations souhaitées. Afin de pouvoir mettre à disposition des informations toujours plus coûteuses de manière plus efficace et plus avantageuse, les bibliothèques se sont associées en groupements d achat depuis plusieurs années déjà ; des coopérations existantes ont été également étendues à l acquisition commune de ressources électroniques. Voilà plus de quatre ans que le Consortium des bibliothèques universitaires suisses achète en coopération des bases de données, des ouvrages de référence et des périodiques électroniques. Grâce aux subsides supplémentaires importants alloués par la Confédération de 2000 à 2005, l offre d informations électroniques dans les établissements universitaires et les hautes écoles spécialisées suisses a pu être considérablement développée Transformation des habitudes de publication Les habitudes des scientifiques en matière d information, de communication et de publication se sont considérablement transformées, et ce à plusieurs niveaux. Ils sont de plus en plus 13

14 nombreux à utiliser le World Wide Web 1 comme plate-forme de publication libre. D aucuns envisagent même, à terme, que la globalité des internautes constitue elle-même une communauté de fournisseurs d informations. L un des exemples les plus anciens et les plus réussis de ce mouvement prônant un libre accès (Open Access) aux publications scientifiques est celui des archives e-print de P.H. Ginsparg 2. Dès 1991, il invite les théoriciens de la physique des particules à publier sur Internet des prépublications (preprints), autrement dit des manuscrits n ayant pas encore été soumis à une procédure d expertise. Les textes, accessibles par un moteur de recherche, sont ainsi mis gracieusement à la disposition du public dans le monde entier. Ce mode de publication permettant une divulgation rapide des articles scientifiques est désormais de plus en plus prisé par les hautes écoles et leurs bibliothèques, qui mettent en place des serveurs de documents ou Institutional Repositories. Bon nombre de ces serveurs ont été développés, en premier lieu, pour assurer la libre diffusion des thèses de doctorat sous forme électronique. Compte tenu de l insatisfaction notoire des chercheurs à l égard des systèmes de publication conventionnels, ces derniers voulaient en outre mettre à disposition le plus rapidement possible et gratuitement d autres résultats de recherche (notamment des preprints) sur Internet. Les maisons d édition se montrant plus ouvertes à la diffusion de postpublications (postprints), à savoir des manuscrits validés par le biais de ces plates-formes (cf. chap ), ces modes de publication s en trouvent revalorisés sur un plan qualitatif. Il est ainsi possible d améliorer l accessibilité et la diffusion de contenus scientifiques sans remettre d emblée en question le modèle de publication traditionnel ou devoir lutter contre la résistance des éditeurs. Les efforts entrepris pour publier des périodiques complets selon le principe du libre accès (cf. chap ) vont encore plus loin. Certaines bibliothèques s y emploient déjà, et d aucuns y voient un potentiel non négligeable (cf. p.ex. (Halle 2004)). Il est encore trop tôt pour dire si ce nouveau mode de publication, comme ses acteurs le préconisent, se substituera effectivement aux revues onéreuses et s il pourra faire baisser de manière durable les coûts de la chaîne d information, tout en maintenant un niveau de qualité au moins identique. Dans un contexte qui se transforme, avec de nouveaux «partenaires» et une évolution technologique rapide et permanente, les bibliothèques universitaires se voient, elles aussi, confrontées depuis quelques années à de nouveaux défis, mais aussi à de nouvelles opportunités concernant la fourniture durable d informations aux scientifiques et aux étudiants. Elles dépendent manifestement toujours plus d infrastructures complètes. Ce n est qu en prenant des mesures appropriées et en continuant d innover que les bibliothèques réussiront à intégrer les sources d information hétérogènes dans une offre globale et à les rendre accessibles à long terme également à leurs groupes cibles, à toute heure et en tout lieu, si possible. 1 Le World Wide Web représente uniquement un service sur Internet et n est pas synonyme avec ce dernier. 2 Autrefois appelé Los Alamos-Preprint-Server, aujourd hui ArXiv, à la Cornell University: 14

15 Même si la question de la garantie d accès et de l archivage à long terme des données numériques n a pas encore été résolue, les bibliothèques devraient d ores et déjà coopérer, et avec des ressources limitées anticiper les questions organisationnelles, juridiques et techniques qui vont se poser en la matière. C est la raison pour laquelle l e-archiving doit être considéré comme un projet de coopération de la plus haute importance pour les bibliothèques universitaires suisses, si elles veulent continuer de fournir de manière durable aux milieux universitaires des ressources d information électroniques. 2.2 Définition des types de documents traités dans cette étude Si l on veut assurer la sauvegarde des connaissances scientifiques, il est essentiel de préserver l accessibilité et la lisibilité des informations primaires pour les générations futures. Les bibliothèques et les institutions apparentées peuvent apporter leur contribution à cet égard. Traditionnellement, leurs compétences se concentrent sur la gestion du savoir publié. Pour d autres tâches, p.ex. la gestion des boîtes aux lettres électroniques, elles ont recours à d autres partenaires, notamment les services des archives et les centres informatiques des hautes écoles. Le projet d e-archiving du Consortium suisse se limite donc aux types de publication suivants, qui sont étroitement liés au travail réalisé jusqu ici par le bureau central de coordination : 1. les périodiques électroniques, en tenant compte de leurs pendants imprimés ; 2. la littérature grise des hautes écoles ; 3. les périodiques numérisés. Ces trois types de documents sont brièvement présentés ci-après Périodiques électroniques Malgré quelques expériences plus anciennes faites avec des périodiques exclusivement électroniques sans pendant imprimé, les périodiques électroniques proposés parallèlement aux titres imprimés ont fini par s imposer vers le milieu des années Cette attitude dénotait une certaine méfiance face au caractère éphémère du médium électronique, mais elle était, plus encore, liée à une question de prestige : ce qui est imprimé «noir sur blanc», de manière durable, est considéré comme «officiel» et vérifiable en permanence. Une coexistence des formes d édition imprimée et électronique n étant guère gérable à long terme, le besoin se fait sentir de donner à la version électronique, qui rencontre un grand succès, une valeur comparable à celle des périodiques imprimés quant à la fiabilité et la vérifiabilité, au moyen d un archivage à long terme. En présence de processus de publication en grande partie électroniques, à un certain moment, la décision de considérer telle ou telle version comme type de publication principale a été surtout une question de politique éditoriale (pour une présentation exhaustive, voir (Keller 2001)). Compte tenu des différences croissantes au niveau des contenus entre les versions électronique et imprimée, la question se pose différemment. Ces différences ne concernent pas, généralement, le contenu des articles, mais le périodique dans son ensemble : les informations sur les éditeurs, la publicité et d autres indications du même genre ne figurent pas dans la version électronique. Elles ne sont pas non plus nécessaires 15

16 aux disciplines scientifiques qui les utilisent actuellement, mais elles peuvent être des sources précieuses pour le traitement historique ultérieur de la recherche contemporaine. D autre part, il arrive que la version en ligne soit enrichie de matériel supplémentaire mis à disposition par les auteurs. Ils le font souvent à l aide de liens vers des sources extérieures aux documents en question. Les liens correspondants peuvent également être mentionnés dans une version imprimée, mais leur actualité s en trouvera toutefois réduite en raison de la rupture existant entre les deux supports. A plus long terme, on ne peut plus tabler sur la validité des liens si leur contenu n a pas été archivé en même temps que le document qui y renvoie. Le Consortium des bibliothèques universitaires suisses a, dans l intervalle, conclu des contrats de licence avec 15 maisons d édition scientifiques pour l accès aux versions électroniques des titres qu elles publient. Grâce aux contrats consortiaux, les scientifiques ainsi que les étudiants des hautes écoles suisses disposent de plus de 4800 titres en ligne sur leur lieu de travail (cf. Tableau 1). Mais les bibliothèques plus modestes ont pu également, grâce à ces contrats, élargir considérablement leur offre de titres pouvant être consultés sur place qui, jusqu à présent, n existaient que sous forme imprimée. Editions AAAS (American Association for the Advancement of Science) ACS (American Chemical Society) Accessible depuis Nombre de titres disponibles toutes les années BioMed Central? 31 Blackwell (Blackwell Synergy) Elsevier (Science Direct) Emerald IOP (Institute of Physics) JSTOR toutes les années toutes les années Kluwer Academic Publishers Kluwer Law International?? 19 LWW (Lippincott Williams & Wilkins; Journals@OVID) ?? 120 SAGE (Cambridge Scientific Abstracts)?? 64 NPG (Nature Publishing Group) Springer (Springer LINK) Wiley (Wiley InterScience) Tableau 1: Périodiques électroniques sous licence actuellement au sein du Consortium suisse [Etat : fin 2004]. 16

17 Aussi longtemps que le Consortium pourra renouveler ces licences chaque année, le risque de perdre l accès à ces titres et contenus est, dans la perspective actuelle en tout cas, relativement restreint. Mais l accès à des contenus acquis antérieurement sera-t-il encore assuré lorsque la licence ne pourra plus être renouvelée? Quelles alternatives s offrent pour les bibliothèques si l éditeur ne garantit plus l accès une fois la licence arrivée à échéance? Toutes les bibliothèques continueront-elles d accéder à tous les titres d une maison d édition? Qui peut garantir la lisibilité des données à long terme? Ces questions qui n ont pas encore trouvé de réponse montrent que, dès maintenant, il va falloir trouver des idées et des solutions pour garantir l accès à des contenus acquis dans le passé, si l on veut s attaquer à la lisibilité des données à long terme. Dans le présent concept, il est impératif de prendre en considération les offres des éditeurs pour lesquels un contrat de licence a été conclu au cours des années passées. Avec une solution portant sur l accès aux titres de ce fournisseur, une grande partie de l offre en cours pourra également être assurée pour les bibliothèques plus grandes. En dehors du Consortium, toutes les bibliothèques achètent des titres d un nombre plus ou moins grand d autres éditions. Il s agit souvent de plus petits fournisseurs dont certaines publications ont toutefois une importance et une diffusion internationales, ainsi que de nombreux fournisseurs d importance et de diffusion plutôt régionales (cf. également à ce sujet chap ). Notons ici que les réserves faites en général pour les éditeurs consortiaux valent encore plus pour les offres de maisons d édition plus petites : beaucoup d entre elles n offrent aucune solution fiable pour un accès durable ou même un archivage, et il n est pas non plus envisageable à l avenir, faute de ressources Littérature grise Les nouveaux modes de publication et de communication permettant la diffusion d informations via Internet ainsi que le mouvement Open Access ont entraîné un intérêt accru pour la «littérature grise», à savoir les contenus qui ne sont pas formellement publiés, comme vecteur d informations scientifiques. En mettant en place des serveurs de documents ces deux dernières années, les établissements d enseignement supérieur et les bibliothèques universitaires ont jeté les bases propices à des formes de publication alternatives. Au sens de la présente étude, la littérature grise comprend tout d abord toutes les sortes de documents numériques produits par des membres des hautes écoles. Elle inclut donc les thèses d agrégation et de doctorat ainsi que les manuscrits d articles scientifiques, tout comme les travaux d étudiants et le matériel didactique. Rien que dans cette liste, on relève deux problèmes fondamentaux relatifs au traitement de la littérature grise. Dans les exemples cités, des questions se posent quant à la pérennité visée ou escomptée : il s agit, soit de matériaux de travail actuels, qui seront remplacés par une mise à jour au trimestre suivant ou l année qui vient, soit de travaux scientifiques qui doivent être vérifiables en permanence. A cela est liée la question, encore plus cruciale, de la qualité des contenus. Avec une définition aussi ouverte, on y trouve aussi bien des travaux qui ont été soumis à un contrôle de qualité (thèses de doctorat et manuscrits acceptés après expertise ou 17

18 postprints), que des travaux publiés par des particuliers sans que le contenu n ait été validé par des tiers. L archivage électronique ne permet pas de fournir de réponse aux questions de qualité et de pérennité des contenus. Les institutions concernées vont plutôt devoir décider elles-mêmes au préalable quels sont les matériaux qui doivent être traités, et de quelle manière. Dans plusieurs bibliothèques universitaires suisses, on a mis en place et développé, avec plus ou moins de succès, des serveurs de documents au cours des dernières années. Si l on veut que les offres de documents en libre accès soient prises au sérieux et que la communauté scientifique ainsi que la direction des écoles supérieures s y intéresse, le contrôle de qualité des contenus et l archivage sécurisé sont une condition sine qua non. Etant donné que seules les thèses de doctorat relèvent de la compétence de la BN en tant que bibliothèque nationale (cf. projet «e-helvetica»), la littérature grise doit être également traitée dans le cadre du projet d e-archiving Périodiques numérisés Dans le contexte de la numérisation, une vision est évoquée de temps à autre, celle que tous les contenus des bibliothèques soient accessibles en ligne en texte intégral. Une telle conception ne tient pas compte des nombreuses disciplines, pas plus que des différents types de documents qui font une bibliothèque. Compte tenu des moyens financiers limités, il faut partir du principe que, pour une période très longue, des décisions vont devoir être régulièrement prises sur la nécessité de numériser des documents, ou tout au moins avec quel degré de priorité. Il va falloir notamment évaluer si, pour les documents imprimés peu utilisés, il faut s attendre à une utilisation plus intensive ou nettement simplifiée grâce à une mise à disposition en ligne supplémentaire, ou si le contenu ne rend pas la chose improbable. La numérisation des années antérieures des périodiques a jusqu ici été surtout effectuée par de grandes maisons d édition pour leurs propres titres. L objectif était d en améliorer l accessibilité, afin de pouvoir exploiter commercialement une fois encore ces contenus sous une nouvelle forme. Cela se fait soit au moyen de licences séparées portant sur les années antérieures (backfiles), soit de manière implicite, grâce à l attrait accru de l offre globale en relation avec la licence portant sur les années actuelles. Les périodiques des fournisseurs plus modestes, souvent des sociétés spécialisées à but non lucratif, ne peuvent espérer de tels efforts. De tels titres font notamment l objet de projets de numérisation à but non lucratif comme JSTOR 3 aux Etats-Unis ou DIGIZeitschriften 4 en Allemagne. Rappelons à ce sujet que, malgré un financement de départ de certains projets (en l occurrence, la Fondation Andrew W. Mellon ou la Deutsche Forschungsgemeinschaft DFG), ces derniers entraînent des dépenses considérables au niveau du développement et de l exploitation ultérieures. Malgré ce financement, ces deux projets ont été contraints d augmenter les taxes pour l utilisation de leur offre, afin de garantir leur survie économique. 3 JSTOR Journal Storage: 4 DIGIZeitschriften (société enregistrée) : 18

19 Dans le cadre d un projet pilote, trois titres appartenant au domaine des mathématiques ont été choisis pour être numérisés et mis à disposition en ligne pour un public d utilisateurs le plus large possible (cf. à ce sujet chap. 8.9). 2.3 Licences pour l accès en ligne Comparées aux médias imprimés, les ressources électroniques offrent certains avantages. A. Keller mentionne notamment le fait que les périodiques électroniques sont disponibles en tout temps et en tout lieu, accessibles plus rapidement et plus simplement, et qu ils présentent de bonnes possibilités de recherche (Keller 2001). Depuis l introduction des médias électroniques, les bibliothèques sont devenues plus dépendantes de l infrastructure technique et les acquisitions sont plus compliquées. Dans le domaine des publications électroniques, l achat des contenus, qui constituait jusqu à présent la norme, est l exception. L utilisateur doit acquérir auprès du fournisseur des droits d accès et d utilisation qui seront gérés pendant la durée du contrat et devront être renégociés ensuite. Les modèles de licences régissant l acquisition de médias électroniques ou leur accès sont d une grande complexité organisationnelle et contractuelle, surtout quand elles sont négociées conjointement par plusieurs institutions. Une tâche essentielle du bureau central de coordination du Consortium suisse consiste à négocier des contrats de licence appropriés, qui garantissent aux bibliothèques universitaires suisses l accès aux ressources électroniques, actuellement mais aussi à long terme, et l archivage des médias électroniques, notamment les documents en texte intégral. Nous allons brièvement esquisser ci-après les modèles commerciaux et types de licence concernant les périodiques électroniques qui sont les plus intéressants pour les consortiums, car ils constituent une base essentielle pour le droit d accès à long terme aux données acquises antérieurement Imprimés et documents en ligne L acquisition de périodiques électroniques en commun permet généralement à chaque bibliothèque d étendre considérablement son offre. Depuis que les contrats consortiaux ont cours en Suisse, la plupart des contrats passés avec des maisons d édition scientifiques telles Springer, Elsevier ou Wiley ont été conclus selon le modèle suivant : Le modèle de calcul et de licence se base sur tous les abonnements imprimés de l année en cours ou de l année précédente conclus par les différentes institutions ou, plus précisément, sur le volume des coûts inclus. En règle générale, elles sont soumises à de sérieuses restrictions, voire l interdiction totale de procéder à des résiliations d abonnements qui réduiraient ce volume. Le Consortium paie un certain supplément, selon la maison d édition de 8% à 15%, sur le volume global des coûts. Ce supplément doit être réparti de manière appropriée entre les institutions impliquées. Ainsi, tous les partenaires consortiaux, en l occurrence les usagers, ont accès à un certain nombre d années de tous les titres dont il existe au moins un abonnement au sein du Consortium (cross access). Souvent, ce qu on appelle l additionnal access est compris dans ce supplément : les 19

20 institutions partenaires ont ainsi accès à l ensemble de l offre de la maison d édition et, par la même, à des titres auxquels aucune bibliothèque n était abonnée jusqu à présent. Les éditeurs exigent de plus en plus souvent une taxe supplémentaire pour cette forme d accès complémentaire Licences E-only : documents en ligne et imprimés De plus en plus d éditeurs proposent l option d acquérir les contenus uniquement sous forme électronique et, ce faisant, de renoncer partiellement ou totalement aux éditions imprimées. Ces licences sont souvent conclues selon le modèle décrit ci-dessus. Dans le meilleur des cas, le prix proposé pour la version électronique est de 10% moins cher que celui de l édition imprimée. C est ainsi que les éditions Elsevier proposent certains titres exclusivement sous forme électronique à 90% du prix de la version imprimée. L économie effectivement réalisée par la bibliothèque en question est toutefois plus restreinte, car la TVA prélevée pour les médias électroniques est plus élevée que pour les médias imprimés, ces derniers étant soumis à un taux réduit. Les exemplaires imprimés peuvent, en outre, être achetés en supplément à un prix plus avantageux Contenu des contrats de licence Parmi les données de base devant figurer dans un contrat de licence entre une maison d édition et la bibliothèque ou le Consortium, figurent notamment la définition des contenus qui font l objet du contrat, les titres disponibles en ligne, la durée du contrat, le cercle d utilisateurs autorisés, les droits d utilisation ainsi que les droits et les devoirs des partenaires de contrat. Sont en règle générale autorisées d accès les personnes appartenant aux institutions partenaires, à savoir le personnel scientifique et les étudiants, ainsi que les visiteurs des bibliothèques en question (licence pour campus). Selon la maison d édition, l accès aux titres sous licence sera accordé à partir de telle ou telle année. La limite est souvent fixée entre les années 1995 et 1997, à partir desquelles les titres ont été disponibles sous forme électronique. Il existe toutefois encore d autres réglementations. L American Chemical Society ou l Institute of Physics, par exemple, garantissent l accès aux dix dernières années (rolling file). De plus en plus souvent, les maisons d édition numérisent les années antérieures, qui n étaient jusqu à présent pas disponibles en ligne. Elles doivent toutefois être acquises ou faire l objet d une licence séparée. En règle générale, une taxe unique est prélevée. Certains modèles de prix prévoient en outre une taxe annuelle. Jusqu ici, seules quelques bibliothèques universitaires suisses ont acquis de tels backfiles, et ce dans le cadre de contrats individuels, indépendamment du Consortium. Pour être plus complets, nous mentionnerons encore le modèle de licence pour la revue Science et la plupart des titres du Nature Publishing Group. Il ne s agit pas en l occurrence de modèles consortiaux. Les prix pour l accès en ligne sont en relation avec la taille des titulaires de licence institutionnels. Ces derniers paient suivant le nombre d utilisateurs autorisés d accès pour les titres choisis par chaque institution. Pour la plupart des titres de cet éditeur, les personnes intéressées se limitent aux disciplines les plus importantes. Ces 20

21 redevances sont indépendantes des abonnements imprimés, un cross et un additional access ne sont pas garantis. L achat en commun permet aux bibliothèques de profiter d un rabais sur la taxe dont doit s acquitter chaque institution Accès durable et clauses relatives aux archives Dans le monde entier, les bibliothèques scientifiques manifestent une certaine réserve quant à une renonciation pure et simple aux éditions imprimées existant en parallèle des versions électroniques. La raison principale invoquée est que l on manque d expérience en ce qui concerne la disponibilité et la lisibilité des contenus électroniques à long terme. Une bibliothèque aura-t-elle encore accès à des contenus acquis antérieurement, lorsque le contrat de licence ne pourra plus être renouvelé? Dans les contrats qu elles concluent avec les éditeurs, les bibliothèques essaient d ores et déjà de définir tout au moins les principes de base qui permettront de faire face aux scénarios susceptibles de se présenter à l avenir. Il est ainsi devenu courant d introduire une «clause relative aux archives» dans les accords de licences portant sur des périodiques électroniques. Des associations internationales telles que l ARL 5, ICOLC 6, IFLA 7 ou LIBER 8 ont publié des recommandations générales correspondantes pour la formulation des textes de contrat (cf. à ce sujet également le chapitre 16 (annexe IV). L accès aux mêmes contenus sera-t-il garanti une fois le contrat avec l éditeur arrivé à échéance? Les accords passés avec l éditeur concernant l accès à long terme visent à garantir aux bibliothèques un droit d accès durable aux données acquises antérieurement, sans que cela n entraîne de coûts supplémentaires importants, et à laisser ouverte l option d archivage individuel. Il est nécessaire de définir clairement les responsabilités en matière d archivage et de disponibilité à long terme. En ce qui concerne les spécifications techniques, par exemple le format de livraison des documents en texte intégral ou la quantité de documents fournis, des réglementations trop détaillées ne sont pas souhaitables, car elles pourraient se solder par des limitations à l avenir. Ces réglementations figurant dans les contrats de licence actuels devaient répondre aux questions suivantes (pour de plus amples détails, cf. chap ): A quels contenus (titres, années) le Consortium ou la bibliothèque partenaire aurontils accès à long terme, après la fin du contrat? L accès par le biais du serveur de l éditeur continuera-t-il d être garanti? Si oui, à quelles conditions? L éditeur fournit-il, sur demande, au Consortium les données et les métadonnées définies? A quelles conditions? 5 ARL (Association of Research Libraries) : Principles for Licensing Electronic Resources ( de ICOLC (International Coalition of Library Consortia) : Statement of Current Perspective and Preferred Practices for the Selection and Purchase of Electronic Information de 1998, avec mise à jour en 2001 ( 7 IFLA (International Federation of Library Associations Committee on Copyright and other Legal Matters (CLM) : Licensing Principles ( de LIBER (Ligue des Bibliothèques Européennes de Recherche) : Licensing Principles ( de

22 En règle générale, le cross access et l additional access, qui sont inclus dans de nombreux contrats consortiaux, ne font pas partie des droits relatifs aux archives, c est-à-dire que, pour chaque partenaire du Consortium, l accès est exclusivement limité aux titres pour lesquels le contenu a été acquis par le biais d un abonnement. Ce dernier n inclut généralement que les années parues pendant la durée du contrat, et dans certains cas, l ensemble des contenus publiés dès l origine de manière numérique, qui remontent à 1995 au maximum. L ICOLC 9 impute aux éditeurs la responsabilité de l archivage et de l accès à long terme des données. Il est peu vraisemblable que les éditeurs commerciaux se préoccupent à l avenir sérieusement d archivage sans qu ils y trouvent un intérêt économique. L ICOLC somme donc les éditeurs de ne pas empêcher les bibliothèques, les consortiums, les bibliothèques nationales ou d autres prestataires de mettre en place des solutions alternatives pour l archivage de données électroniques. L expérience du Consortium suisse montre que tous les éditeurs ne sont pas prêts à fournir le texte intégral des périodiques ou, dans le meilleur des cas, les métadonnées. Aujourd hui, plus de 70 éditeurs, dont Blackwell et Emerald, fournissent leurs données à l OCLC 10. L OCLC se considère elle-même comme capable d assurer une disponibilité des documents à long terme (trusted archive). Moyennant versement d une taxe modeste, les bibliothèques et leurs utilisateurs ont accès via OCLC ECO 11 à des titres et des années acquis antérieurement. Toutefois, ce prestataire tiers ne garantit aux bibliothèques qu un droit d accès qui prend fin à l échéance du contrat. Si l éditeur change de propriétaire, la politique d archivage relative aux titres publiés pourra s en trouver modifiée. C est ainsi que les titres d Academic Press n ont pu être consultés sur OCLC ECO que jusqu en Avec le changement d éditeur, ils sont désormais disponibles via Science Direct et obéissent désormais à la politique d archivage des éditions Elsevier. Ces explications font déjà comprendre que, jusqu à ce jour, les bibliothèques ne peuvent se fier à aucune stratégie fiable et éprouvée permettant de garantir l accès à long terme à des journaux électroniques sous licence. C est la raison pour laquelle, dans cette étude, nous allons également nous demander si les bibliothèques doivent s équiper pour l avenir en mettant sur pied leurs propres archives numériques. Des réflexions identiques valent également pour les bases de données bibliographiques : la majorité d entre elles disposent d un droit d utilisation, mais aucune acquisition de données sous licence n a été convenue. Pour certains produits, il existe en Suisse des serveurs chapeautées par le Consortium qui ont fait leurs preuves. Une base locale ne signifie toutefois pas automatiquement la même chose que l acquisition de données. Dans les cas où les données sont effectivement achetées, il reste à savoir comment elles seront utilisées après la fin du contrat de licence portant sur l interface d accès. 9 ICOLC (International Coalition of Library Consortia) : 10 OCLC (Online Computer Library Center) : 11 OCLC ECO (OCLC Electronic Collections Online) : 22

23 2.4 Particularités des objets numériques Consortium des bibliothèques universitaires suisses Des objets disponibles sous forme numérique offrent des avantages manifestes à l usage quotidien par rapport aux formats traditionnels. Il est possible de les utiliser pratiquement sans restriction de lieu ou de temps et de les traiter, si l on dispose de l infrastructure correspondante. Une utilisation régulière intensive n entraîne pas non plus de phénomène de détérioration de l objet 12 et, au besoin, de nombreuses copies de même qualité peuvent être réalisées rapidement. A y regarder de plus près, force est d admettre toutefois que tous ces avantages posent des problèmes si l on se place dans l optique des bibliothèques, des archives et institutions apparentées. Il s agit en l occurrence de questions essentielles, qui sont déjà importantes dès la création d un objet. En élargissant l angle de vue à plus long terme, ces problèmes deviennent toujours plus brûlants et plus incontrôlables Authenticité et contrôle Des objets numériques sont, en principe, relativement faciles à transformer, volontairement ou involontairement. Plus le nombre de personnes bénéficiant d un accès potentiel à un objet est grand et plus le risque s accroît. Il peut s agir de modifications du contenu ou de remaniements au niveau de la forme, et donc de nouvelles versions d un objet ; mais il peut aussi s agir de manipulations qui vont altérer l objet. Son authenticité n est alors pas garantie : un objet peut être autre chose que ce qu il prétend être. Des mesures techniques doivent être prises pour empêcher des modifications de cet ordre, ou tout au moins les déceler. En cas de mises à jour autorisées, il convient de définir la façon dont celles-ci vont être effectuées. En dehors de cet aspect technique et organisationnel, la possibilité de modifier, de réutiliser ou de copier des documents numériques a des conséquences juridiques et économiques non négligeables. Les bibliothèques doivent pouvoir garantir, en tant que partenaires contractuels de fournisseurs commerciaux, que les contenus qu elles transmettent ne seront utilisés que dans les conditions contractuelles établies, et donc uniquement par les personnes y étant autorisées. Dans le cas des publications électroniques, le danger est bien plus grand, d une part, que des contenus manquent pour les raisons les plus diverses, et d autre part que ces lacunes ne puissent être constatées par l usager final. Prendre la décision consciente de se procurer le contenu manquant dans une autre institution devient alors impossible (Covi and Cragin 2004) Aucune détérioration mais une conservation limitée La possibilité de reproduire et d utiliser à volonté des objets numériques semble les rendre largement immunes contre les risques qui menacent des objets physiques tels que les livres. 12 Cela ne concerne toutefois que l objet numérique les supports pouvant être usés, cf. également

24 La détérioration ou la perte par des usagers ou des facteurs externes tels que le feu ou l eau peuvent être amplement évités grâce à des sauvegardes multiples. Par contre, il existe des menaces moins évidentes pour les fonds des bibliothèques, et plus encore, pour l utilisation des objets numériques. Ces dangers ont ceci en commun qu à la différence des pertes spectaculaires des supports physiques, ils peuvent occasionner de manière insidieuse des dommages considérables. Cela réside encore une fois dans la nature des objets numériques : ils peuvent être rendus inaptes à une utilisation normale si, à un endroit décisif, un bit manque ou a été modifié. De telles pertes peuvent survenir sans intervention particulière, avec le temps, car les supports de mémoire de l information numérique ne présentent qu une stabilité limitée pour des raisons physiques et/ou chimiques. Une information peut ainsi être perdue pour cause de démagnétisation ou d altération des supports. En ce qui concerne l objet numérique en question, cette perte se produit de manière soudaine, sans aucune comparaison avec le défraîchissement d un imprimé qui, malgré tout, reste encore longtemps lisible. De plus, des objets peuvent devenir inutilisables même si les données en question sont toujours complètes et sauvegardées dans leur forme originale. La raison en est que les objets numériques ne peuvent être directement interprétés par l homme. Leur décryptage dépend de multiples opérations liées à un environnement complexe qui, malheureusement, restent souvent opaques Infrastructure et dépendances Comme nous l avons mentionné au point 2.4, l utilisation des données électroniques à tout moment et en tout lieu nécessite une infrastructure appropriée. On pense surtout à un ordinateur doté d un accès Internet. Mais d autres conditions doivent encore être requises pour utiliser des données de manière judicieuse. Les données numériques ne peuvent être interprétées directement. Nous avons besoin pour ce faire d appareils techniques (du matériel informatique), capables de lire un train de bits (bitstream) à partir d une mémoire et de les traiter pour les rendre compréhensibles. La manière dont l information est cryptée dans le fichier est définie par son format. Ce sont les programmes d application, les «logiciels» qui permettent la conversion des données ainsi cryptées sous une forme qui nous soit compréhensible ; il s agit, généralement, de programmes qui ont été aussi utilisés pour la création des données en question. Les programmes d application ont besoin à leur tour d une autre sorte de logiciels pour fonctionner, à savoir un système d exploitation qui garantisse la communication avec le matériel. Dans la pratique, le problème réside dans le fait que tous les éléments de cette chaîne allant de la mémoire à l homme se transforment avec l évolution technique. C est ainsi qu en un laps de temps particulièrement court (quelques années), les chaînons «matériel système d exploitation programme d application objet» peuvent ne plus être compatibles. Dans ce cas, le fichier correspondant ne pourra plus être utilisé sous sa forme habituelle. Dans la perspective d une utilisation durable des données numériques, cela ne constitue que l un des facteurs devant être pris en compte. La question est analysée de manière plus détaillée au point

25 3. Accessibilité et archivage à long terme Au nombre des tâches classiques d une bibliothèque ou de tout organisme comparable, on compte la conservation à long terme des documents acquis et la mise à disposition permanente de ceux-ci aux clients. Par clients, il faut entendre aussi bien les utilisateurs finals proprement dits que les institutions pour les membres et le compte desquelles sont fournies les prestations, avant tout les bibliothèques scientifiques. Comme on l a vu plus haut, les bibliothèques scientifiques ont changé d aspect ces dernières années en s engageant fortement dans la diffusion d informations par voie électronique. Si les bibliothèques ont pu s implanter avec autant de succès et aussi naturellement sur le terrain de l information électronique, elles le doivent également aux attentes envers elles et à la conscience qu elles ont de leur mission traditionnelle de collecte et de diffusion du savoir à l ère du numérique. Ces attentes se sont manifestées clairement surtout au niveau des bibliothèques nationales dont le mandat a déjà été élargi ou le sera prochainement (cf ). Les bibliothèques elles-mêmes font valoir cette exigence. Une enquête réalisée dans le cadre de la présente étude parmi les bibliothèques des hautes écoles helvétiques l a confirmé (cf. 6). Ci-après, nous nous pencherons sur les difficultés liées à cette exigence et sur les solutions envisageables. Dans le contexte d un archivage à long terme des données électroniques, il paraît utile pour une discussion approfondie de faire une distinction claire entre l accès et la conservation, ces deux aspects ayant chacun un arrière-plan distinct et pouvant nécessiter, selon l organisme concerné, une réponse différenciée. Il ne faut cependant pas voir là une volonté d anticiper des solutions organisationnelles ou techniques séparées. Il s agit plutôt de présenter de manière transparente ces différentes tâches que l on a assez souvent tendance, à tort, d assimiler, voire, à l occasion, d amalgamer en plus avec des aspects de la rétronumérisation (cf. 3.4). 3.1 Accès à long terme Aussi longtemps que les bibliothèques se contentaient de diffuser des documents sur des supports physiques, ces documents étaient généralement achetés et conservés dans les fonds de l institution. Cette acquisition incluait le droit de les prêter aux usagers. Dans le cas des informations électroniques, ce sont d autres formules commerciales et contractuelles qui s appliquent largement. Les bibliothèques concluent des contrats de licence afin que leurs clients puissent accéder à un ensemble prédéfini de données (y compris d éventuelles mises à jour) durant une période fixée à l avance (le plus souvent un an). Les autres modalités contractuelles diffèrent fortement d un produit ou d un fournisseur à l autre. Ainsi, un contrat peut prévoir que toutes les livraisons annuelles antérieures d un ensemble de données sont comprises dans le prix ou seulement un certain nombre d entre elles (rolling file). Il se peut ainsi, par exemple, qu un client ne puisse accéder qu aux informations des dix dernières années. La différence par rapport au modèle traditionnel se 25

26 manifeste dès lors très clairement : le contenu mis à la disposition de l utilisateur est dissocié des fonds possédés par la bibliothèque. Une telle situation n est guère conciliable avec les exigences des clients et des bibliothèques elles-mêmes Accès à long terme aux contenus sous licence Nous entendons par «accessibilité à long terme» avant tout le droit et la possibilité pratique d accéder à des contenus une fois acquis même après expiration du contrat de licence ou de toute autre convention comparable. Par «contenus acquis» au sens strict du terme, il faut entendre les livraisons annuelles d un ensemble de données pour lesquelles ont été payés des droits de licence. Selon les contrats, d autres critères peuvent cependant s appliquer. Les questions juridiques prédominent, car tout ce qui est faisable techniquement n est pas forcément admissible au regard de la loi. Inversement, la mise en œuvre d impératifs légaux peut se heurter à des obstacles techniques. Les principales interrogations sont les suivantes : Quels sont les contenus pour lesquels il subsiste des droits à l échéance du contrat de licence, par ex. sur quelles livraisons annuelles d une revue? Qu englobent ces droits : Un accès permanent auprès du fournisseur? o Le transfert des données de contenus sur le serveur de la bibliothèque, dans un format adéquat? o Le transfert des métadonnées sur le serveur de la bibliothèque, dans un format adéquat? o L utilisation ultérieure ou la reprise du visionneur du fournisseur? o Y a-t-il une obligation de mise à jour ou un droit à celle-ci? Contenus/métadonnées : le retrait d un article par un auteur ou son éditeur doit-il ou peut-il être suivi par la bibliothèque? Technologie : quid de l évolution des visionneurs? o Quelle est la durée garantie? o Quels sont les coûts (redevances uniques ou périodiques, prix coûtant ou but lucratif)? o Possibilité de coopérer avec d autres institutions : l accès à d autres bibliothèques peut-il être concédé si celles-ci ont acquis les droits de licence? Peut-on acquérir les données d archives (contenus et métadonnées) d autres années? o A un prix forfaitaire ou moyennant une redevance annuelle? La bibliothèque concernée dispose-t-elle des ressources techniques et humaines nécessaires afin d assurer un accès à long terme ou ces ressources peuvent-elles être dégagées à un coût raisonnable? 26

27 Cette brève énumération montre bien que le problème de l accessibilité à long terme n est pas uniquement de nature technique. D autres aspects, organisationnels, légaux, commerciaux et de contenus, doivent être examinés. Les solutions techniques sont bien sûr très importantes pour toutes les options envisageables. Mais avant de pouvoir réaliser, par exemple, un contrôle d accès technique ne permettant que des consultations autorisées, il s agit d abord de vérifier quels sont les contenus et les publics bénéficiant d une autorisation d après les contrats. Tôt ou tard, ce ne seront plus des contraintes juridiques qui limiteront les possibilités d accès, mais de plus en plus des problèmes technologiques qui feront obstacle à la consultation de données pour lesquelles il existe pourtant un droit dûment acquis. A ce moment-là, l archivage à long terme proprement dit devra entrer en jeu si l on veut éviter des pertes d informations (cf. 3.2). Vu sous cet angle-là, il convient de considérer la garantie de l accès et l archivage à long terme proprement dit comme deux missions complémentaires, l une tantôt plus importante que l autre. L accès permanent auprès de l éditeur est abordé au chapitre L annexe IV (chapitre 16) formule, quant à elle, des recommandations concrètes relatives aux contrats de licence du point de vue de l accès aux données et de leur transfert. D ores et déjà, on se souviendra qu il est bon d éviter de conclure des accords trop détaillés, car ils risquent d être difficilement renégociables à une date ultérieure Accès à long terme à la littérature grise des hautes écoles Indépendamment des contenus acquis par une licence (plus rarement en pleine propriété) décrits ci-dessus, il existe aussi la littérature grise produite à grande échelle dans les établissements d enseignement supérieur et dans les centres de recherches. La production des organismes scientifiques englobe, d une part, des documents tels que les thèses, soumises à un statut particulier, et, d autre part, tout ce qui, de facto, est écrit à des fins d enseignement ou de recherche, mais n est pas publié et diffusé formellement. Les préet postpublications (preprints/postprints) d articles scientifiques entrent également dans cette catégorie. Un preprint est la version d un article qui n a pas encore été examiné dans une procédure d expertise (peer review revue par pairs) ; elle peut donc être différente de la version finalement publiée. Un postprint est, à l inverse, la version d un article qui a été passé en revue puis publié ; elle concorde donc avec l article paru pour ce qui est du contenu. Du point de vue de la présentation graphique, il peut toutefois y avoir des différences dues au processus de production. La mise à disposition en libre accès de preprints et, plus encore, de postprints sur les serveurs des universités et des laboratoires («auto-archivage par l auteur») est un des chevaux de bataille du mouvement open access et entre ainsi de plus en plus dans les mœurs. Sous cette forme, l auto-archivage est lié à l existence d une publication formelle en parallèle (cf ). La valeur de ce genre de collections de publications (parallèles) plus ou moins informelles dépendra très fortement du soin mis à les rendre disponibles à long terme au même titre que les publications provenant de maisons d édition traditionnelles. Dans ce contexte, le contrôle d accès peut être plus simple, même s il est admis que certains documents seront confinés à un usage intérieur. S agissant des pre et des postprints, des restrictions d accès peuvent facilement intervenir, notamment à la demande des éditeurs (cf ). 27

28 3.2 Archivage à long terme des objets numériques L archivage à long terme proprement dit d objets numériques est lui aussi une tâche complexe du point de vue organisationnel et juridique. Cependant, diverses questions techniques en suspens occupent davantage le devant de la scène, d où le risque qu elles monopolisent l attention. Tout d abord, nous étudions ici par le menu les raisons techniques qui peuvent entraver l archivage à long terme. Puis sont présentées en termes généraux les solutions technologiques envisageables. Autant que faire se peut, la vision technologique est intégrée dans le contexte général de l archivage à long terme Obsolescence des supports de stockage Actuellement, deux grandes méthodes sont largement répandues pour le stockage passif de données numériques, c est-à-dire un stockage ne nécessitant pas d alimentation électrique. D une part, on utilise des disquettes, des bandes et des disques durs dont les couches de stockage contiennent du métal et dont la magnétisation peut être modifiée d un état à un autre (deux orientations possibles de l aimantation). D autre part, on fait appel à des supports tels que le CD-ROM et le DVD où le procédé de stockage consiste à graver des alvéoles sur une couche en plastique réfléchissante. Optique, la lecture est assurée par un rayon laser, une alvéole donnant ainsi un 0, tandis qu un espace donne un 1. Aucun de ces supports n est stable après quelques décennies ; utilisés régulièrement, la plupart ne durent même que quelques années. L effet du champ magnétique terrestre et d autres champs électromagnétiques présents dans notre environnement accélère la détérioration des couches magnétisées. De plus, les supports synthétiques sont soumis à un vieillissement qui touche aussi les disques optiques et les dégrade plus ou moins rapidement selon la qualité du produit et son type d utilisation. Autre point faible : la liaison entre la pellicule métallique et le support en plastique. La durée de vie de ces supports peut aussi souffrir de conditions inadaptées (températures ou hygrométrie trop élevées) et d une utilisation intensive. Ces effets sont connus depuis longtemps et peuvent être contournés en transférant régulièrement les données sur un nouveau support du même type. Lorsque les informations en question sont déjà conservées sur un système de stockage conçu en conséquence, ce processus de restauration peut être largement automatisé. C est pourquoi les bibliothèques cherchent habituellement à dissocier les données contenues dans des disquettes ou des CD-ROM joints pour les copier dans des mémoires puissantes permettant une telle automatisation. Cela fait partie notamment du projet «e-helvetica» 13 de la Bibliothèque nationale suisse. Techniquement, le vieillissement physique des supports de stockage peut donc être considéré comme un problème maîtrisé, le défi étant toutefois d organiser soigneusement la 13 Projet «e-helvetica» : 28

29 procédure de copie comprenant des itérations régulières et portant sur des volumes en pleine croissance (à l échelle du téraoctet 14 ). On ne peut pas en revanche négliger le problème des dispositifs anti-copie et de toutes les autres mesures visant à protéger les droits d auteur et de diffusion (DRM Digital Rights Management / gestion des droits numériques ou ERM Electronic Rights Management / gestion des droits électroniques). Du point de vue pratique, il est souvent possible de contourner ces dispositifs de verrouillage. La législation sur les droits d auteur de différents pays interdit toutefois expressément ce genre de manipulation. Il n est à tout le moins pas clair si les privilèges accordés traditionnellement aux bibliothèques autorisent des exceptions afin de leur permettre de remplir leur mandat de conservation (dépôt légal). Une révision partielle de la loi sur le droit d auteur est actuellement en consultation en Suisse et prévoit une interdiction de contourner les dispositifs anti-copie 15. L impact possible sur les bibliothèques n est pas encore tout à fait clair. Pour des raisons de principe et en raison des problèmes associés à ces dispositifs, de nombreux diffuseurs renoncent à toute forme de protection technique des droits de propriété intellectuelle. Même sans obstacles techniques, la copie ou la conversion de données à des fins de conservation peuvent être problématiques d un point de vue juridique : différentes législations nationales les autorisent en faveur des bibliothèques et des dépôts d archives, mais uniquement si le format d origine est déjà obsolescent (Ayre and Muir 2004) Obsolescence technologique L évolution extrêmement rapide que connaissent certains secteurs de l informatique est bien connue et a pour corollaire des composants toujours plus performants. La meilleure illustration en est la croissance du nombre de transistors sur les puces d ordinateurs, qui double tous les 18 à 24 mois. Ce constat fait par Gordon Moore (Intel) en 1965 est toujours valable actuellement et a pris le nom de «loi de Moore» (Moore 1965). Le revers de la médaille est tout aussi connu des utilisateurs d ordinateurs : ce qui est aujourd hui ultramoderne sera démodé en peu de temps. On pourrait en prendre son parti si ce phénomène revenait simplement à constater que son matériel n est plus le plus performant, le plus rapide ou le meilleur du marché. Mais dans le domaine de l archivage à long terme, les problèmes sont plus sérieux. Bien qu il reste des secteurs et surtout des principes de base qui connaissent une pérennité considérable, force est d admettre que la stabilité et le fonctionnement des systèmes en général sont limités par l existence de composants dont le cycle de vie est faible : si le produit de remplacement n est plus entièrement compatible avec les autres éléments du système, c est tout l ensemble qui en pâtit. Les explications qui suivent sont valables pour tous les types d objets numériques. Cela frappe tout de suite si l on compare un logiciel standard diffusé dans le monde entier avec un programme utilitaire scientifique conçu dans le cadre d une thèse de doctorat dans une 14 1 téraoctet = 1000 gigaoctets = mégaoctets ; 1 disquette standard = 1,44 mégaoctet 15 «Le DFJP met en consultation un projet de révision», : 29

30 grande école. Malgré un contexte technique similaire, les intérêts des utilisateurs et du fournisseur ainsi que le besoin de pérenniser le programme sont évidemment très différents Supports de stockage Alors que sous nous avons parlé de la durée de vie des différents supports de données, nous étudions ici la longévité des concepts technologiques qui sont à la base des supports de stockage. L exemple le plus parlant de l évolution rapide des technologies est celui des supports mobiles tels que les disquettes. Extérieurement, elles sont passées du format 8 pouces (IBM, 1971) au format 5¼ pouces (Shugart, 1976) pour finir au format 3½ pouces (Sony, avant 1984 ; norme ISO ,2 de 1989). Et on néglige ici toutes sortes d autres formats propres à quelques constructeurs qui n ont jamais réussi à s imposer. Chacun de ces formats nécessite un lecteur spécifique pour pouvoir accéder à l information mémorisée. A côté du format, c est aussi la densité de mémorisation qui a évolué. Ainsi, certaines disquettes 3½ pouces sont conçues pour être enregistrées sur les deux faces plutôt que sur une seule. D autres sont de type «haute densité» (HD), voire «extra-haute densité» (ED). Certains lecteurs de disquettes 3½ pouces supportent plusieurs types de densité d écriture, mais un risque de perte de données existe si la disquette a été formatée pour une autre densité que celle qui était prévue. Plusieurs complications peuvent découler de ce qui précède : 30 La durée de vie limitée du support nécessite en fin de cycle un transfert de sauvegarde sur un support de même type. La longévité du standard technique (quand on a la chance d avoir affaire à un standard formel) est restreinte et conduit à terme à un remplacement du support. La durée de fonctionnement limitée des lecteurs raccourcit d autant le laps de temps durant lequel il est possible de lire les données stockées sans complications. D un côté, les défauts matériels entravent une exploitation normale à long terme ; de l autre, le passage à un nouveau système d exploitation ne va pas toujours de pair avec une mise à jour des pilotes de lecteurs désuets. Cela touche aussi bien les transferts de sauvegarde que les remplacements de supports. Dans les bibliothèques, des disquettes accompagnent fréquemment des ouvrages sur papier, ce qui les englobe dans la thématique de la conservation à long terme (cf. e- Helvetica 13 ). La présente étude n entre pas dans les détails de ce sujet, car il ne joue aucun rôle pour les contenus relevant du consortium. L obsolescence des concepts technologiques est bien illustrée par l exemple des disquettes. Les mêmes problèmes (durabilité du support, pérennité du standard, fonctionnement du matériel nécessaire) affectent cependant tous les types de supports de stockage, quelle que soit la technologie (optique ou magnétique), donc aussi les supports utilisés dans les entreprises et les institutions pour stocker de gros volumes de données. Ainsi, certains formats anciens de bandes magnétiques ayant servi à un stockage à long terme réputé sûr ne sont plus lisibles aujourd hui faute d appareils de lecture adaptés. La NASA, et c est un exemple connu et bien réel, n arrive plus à accéder directement à des informations précieuses concernant d anciennes missions spatiales. On a perdu aussi de nombreuses images satellite des forêts pluviales du Brésil remontant aux années 1970 et qui pourraient aujourd hui fournir des données comparatives précieuses ((1995), p. 31). Cela souligne bien

31 l importance de l accès aux données anciennes : lorsque celles-ci reflètent des périodes écoulées, il n est plus possible, par principe, de les reconstituer. Dans d autres cas, cela ne pourrait être possible qu au prix d une folle dépense d énergie. Pour contrer les pertes dues à l obsolescence des supports et des appareils de lecture, il faut prévoir un transfert de sauvegarde sur un support moderne et considéré comme stable. Cela doit se faire de manière coordonnée avec les opérations de copie nécessaires au transfert (cf ). Les données primaires évoquées ci-dessus ne font pas l objet de la présente étude. La manière de traiter ces informations doit néanmoins être clarifiée, notamment dans les établissements d enseignement supérieur : quelle est l institution chargée de mettre à disposition l infrastructure ad hoc et que doivent faire les scientifiques afin d assurer une mémorisation correcte de leurs productions, voire une conservation à long terme. Dans maints secteurs, on peut penser qu un stockage pendant par ex. dix ans est suffisant pour permettre de prouver des résultats publiés sur cette période. Des cas d escroquerie intellectuelle venus au jour ces dernières années ont incité plusieurs organismes de recherche ou de soutien à formuler cette exigence. Dans d autres domaines, notamment l astronomie ou l aérospatiale, il est judicieux de conserver observations et comparaisons sur de longues périodes, car la valeur future d une mesure isolée ne peut pas toujours être déterminée à l avance. C est une des raisons pour lesquelles la NASA et d autres grands organismes scientifiques s engagent aujourd hui dans la conservation à long terme de leurs données de mesure 16 électroniques. Les bibliothèques de ces institutions auront l importante tâche de définir et assumer leur rôle dans la sauvegarde méthodique des informations et leur archivage en fonction des besoins. Ce qui ne veut pas dire que ce sont forcément les bibliothèques qui doivent s occuper de ces données. Il faut mentionner ici encore qu il est souvent possible, si les circonstances sont favorables et qu on s y prenne à temps, de récupérer des données conservées sur des supports devenus illisibles. L opération est généralement très lourde, car dans ce genre d archéologie numérique (cf. 5.1), on a toujours affaire à un traitement au coup par coup. En outre, on peut rarement récupérer la totalité des informations. Une telle solution ne peut donc qu être l exception et n offre aucune garantie de succès. Au vu des volumes de données en cause, il semble aujourd hui totalement irréaliste de vouloir compter sur ce genre de méthodes pour faire face à une situation de crise Plate-forme matérielle, système d exploitation et logiciels applicatifs Les entreprises, les administrations et les particuliers modernisent tout à fait naturellement leur parc informatique afin, généralement, d obtenir des performances accrues. Ce gain de puissance des matériels est nécessaire pour faire fonctionner des systèmes d exploitation et des logiciels d application toujours plus performants ; souvent, il stimule même le développement de programmes plus efficaces. On oublie facilement, toutefois, que cet accroissement toujours plus rapide des performances n est pas toujours basé sur les mêmes fondements méthodologiques, mais peut aller de pair avec une mutation profonde de la technologie même de l ordinateur. 16 Consultative Committee on Space Data Systems ou comité consultatif sur les systèmes de données spatiales (CCSDS): 31

32 Tant que les matériels et les logiciels d exploitation et d application qui évoluent demeurent compatibles entre eux et avec leurs prédécesseurs, aucun problème ne se pose. On se rend compte rapidement si un programme utilisé jusqu ici commence à ne plus fonctionner correctement après un changement de matériel ou de système d exploitation. En règle générale, de telles incompatibilités sont annoncées à l avance. Dans un tel cas de figure, les difficultés sont inéluctables. Une rupture de maintenance logicielle affectant un programme face à un nouveau système d exploitation (cas «C» du Figure 1) peut avoir différentes causes : le fournisseur a par exemple décidé de changer de technologie ou de politique commerciale. Ou un programme écrit par des professionnels ou des amateurs pour une application bien particulière a rempli son but immédiat et n est plus nécessaire après un certain temps. Le même phénomène touche les systèmes d exploitation qui sont étroitement liés à un environnement matériel donné (cas «D» sur le Figure 1). S il est vrai que le nombre de systèmes d exploitation est sans commune mesure avec celui des logiciels applicatifs, il n en reste pas moins qu une certaine quantité de programmes voient leur fonctionnement entravé par l arrivée d un système d exploitation d un nouveau genre. Il arrive également qu un applicatif ou qu un système d exploitation continuent à être utilisés tels quels, sans mise à niveau, créant ainsi un environnement qui se transforme en un îlot en parfait état de fonctionnement, l usager n ayant pas d autres besoins. Cette coupure face à tout développement ultérieur aboutit à une situation où tout ce qui est créé dans un tel environnement ne peut plus être affiché et traité correctement qu à l intérieur même de l îlot (voir aussi à ce propos le point ). Comme on le montre plus loin, un tel îlot technologique peut avoir été voulu sciemment et de manière planifiée. 32

33 Figure 1: Problèmes de compatibilité potentiels dans la chaîne «matériel système d exploitation logiciel d application fichier». Dans ces exemples, seul le cas de figure de gauche (A) garantit une utilisation et un traitement corrects du document Logiciels et fichiers Au point , on a souligné l importance que revêt la relation technologique entre matériel et logiciel. Pour avoir un environnement pleinement opérationnel, il faut encore que tous les fichiers nécessaires soient disponibles dans un format pris en charge par le logiciel en cause (cas «A» du Figure 1). Il est surprenant de constater que cette condition peut rapidement ne plus être remplie, car de nombreux fichiers qui ont été créés à un moment donné et pour une finalité précise ne sont plus susceptibles d être affichés, voire traités, quelque temps plus tard. Seules une édition et une sauvegarde sous une version plus récente du programme, qui doit être évidemment rétrocompatible, permettent à un fichier et à son format d être mis à jour. Si la mise à jour n est pas effectuée au fil des nouvelles générations du programme, on peut rencontrer après quelques années déjà des problèmes pour ouvrir et afficher correctement un fichier (cas «B» sur le Figure 1). Dans bien des cas, un affichage, à tout le moins, du document demeurera possible sous un autre programme ou une autre version de programme, mais avec des restrictions fonctionnelles et de présentation. Une telle option n est toutefois pas admissible si on ne sait pas dès le départ dans quel but les objets numériques seront réutilisés plus tard. En tant qu utilisateur final, on peut se représenter ces différents cas de figure en songeant à son propre environnement de travail, où l on trouvera probablement Microsoft Word comme logiciel de traitement de texte. On constatera que certains documents sont utilisés régulièrement, tandis que d autres ne sont plus repris pendant de longues périodes. Aucun 33

34 problème ne se pose si ces derniers ne sont plus nécessaires, ni pour une réutilisation ni pour une conservation en tant que justificatif. Si, en revanche, il existe une obligation ou tout autre besoin de conserver un document pendant une durée non déterminée à l avance pour pouvoir le réutiliser le moment venu, il s agira d arrêter des mesures ad hoc dès la création du document Conséquences générales Une des tâches des bibliothèques ou de toute organisation chargée de conserver la mémoire de l histoire consiste à prendre des décisions intelligentes lorsqu il s agit de sélectionner les documents et médias dignes d être conservés à long terme. La marge de manœuvre dans ces choix n est toutefois pas sans limite et il est souvent indispensable de conserver des objets dont on ne peut pas prévoir à l avance l utilité future. Cela valait déjà jusqu ici pour tous les médias traditionnels. Il va de soi que la préservation des fonds imprimés nécessite des choix éclairés et le respect de certaines conditions ainsi que d autres interventions. Une fois que ces conditions ont été déterminées de manière satisfaisante, le matériel conservé peut surmonter de longues phases durant lesquelles il sera peu sollicité (benign neglect) : il ne va pas disparaître ou devenir inaccessible subitement, même si certains types de papier (acide par ex.) finissent par se dégrader. Mais même pour les méthodes traditionnelles de conservation des fonds, des mesures anticipatrices permettront de réduire le travail et ses coûts. Comme on l a vu ci-dessus, la conservation des données numériques exige d importantes activités permanentes sur des périodes (exprimées en années) nettement plus courtes, activités qui doivent être prospectives là où c est possible. Il convient donc dès le début du cycle de vie d un objet numérique de prendre des décisions portant sur la question de savoir si et comment on veut le conserver et le mettre à disposition à long terme. Le fait de négliger ces objets sur une longue période ne signifie pas forcément qu il y aura perte totale des données, mais des pertes partielles sont quasiment inévitables. A coup sûr, le risque de perte croît au fil du temps, de même qu augmentent encore plus les coûts induits par d éventuelles mesures de sauvetage. Cette corrélation se retrouve dans le domaine de la conservation de médias analogiques. 3.3 Périodiques imprimés Le rôle des périodiques imprimés dans l archivage à longue échéance fait depuis longtemps l objet de discussions (Keller 2001). Nombreux sont les spécialistes qui pensent que la publication parallèle d une version électronique et d une version imprimée pour une seule et même revue constitue un phénomène passager. D une discipline à l autre, on observe toutefois des attentes et des comportements très variés de la part des utilisateurs (voir aussi les remarques sur les chapitres 5 et 6 de l enquête (chap. 0 et 0). Un argument important en faveur de la conservation des éditions imprimées tient au fait que seule la version sur papier, réputée quasiment infalsifiable, d une revue scientifique est perçue comme faisant véritablement foi et comme étant digne d être conservée durablement (copy of record). C est pourquoi l archivage des revues imprimées n a jamais été contesté jusqu ici. Notre enquête a également montré que les usagers souhaitent qu un exemplaire des revues imprimées soit conservé en Suisse. 34

35 Il en découle aussi qu il apparaît de plus en plus suffisant aux yeux des personnes concernées qu un seul exemplaire d une revue imprimée soit conservé dans le pays, quel qu en soit l endroit. Ce genre d approvisionnement minimum garanti a des avantages économiques évidents, les bibliothèques universitaires suisses n ayant plus besoin d avoir chacune le même exemplaire d une publication. L évolution technologique de ces dernières années permet d en tirer les conséquences qui s imposent sans pour autant que l offre de services ne s en ressente pour la majorité des clients : selon la discipline, la plupart d entre eux utilisent déjà avant tout la version électronique et n ont plus besoin de consulter sur place, et physiquement, l original 17 sur papier. Les différences que l on note d un domaine à l autre ne peuvent pas être négligées dans ce contexte. Il sera question plus loin (voir le chapitre 8.5.3) des modèles envisageables pour un archivage distribué et coordonné des fonds de revues imprimées. Les revues électroniques devenant actuellement des ensembles interconnectés et dotés de fonctions toujours plus complexes, il est douteux que leur version imprimée puisse à l avenir continuer à refléter correctement et intégralement le contenu offert sur Internet. A l avenir, la version imprimée restera certes très proche du point de vue du contenu, mais ne sera plus identique à la forme électronique de la revue. La vitesse de cette évolution a néanmoins souvent été surestimée, car on observe jusqu ici que les différences entre les deux versions d un article publié sont plutôt l exception. En revanche, il est fait usage occasionnellement de la possibilité de mettre à disposition électroniquement du matériel supplémentaire dont la forme et, en partie, le contenu sortent du cadre proprement dit de la publication. Forts de ce constat, nous pouvons dire que l archivage des «originaux» sur papier demeure utile. Tandis qu il semble acceptable d archiver électroniquement certains suppléments (par ex. les vidéos), l archivage traditionnel des versions imprimées devrait permettre pour pas mal de temps encore de préserver de manière adéquate une grande partie du contenu publié formellement. Cela est d autant plus souhaitable qu un exemplaire disponible physiquement pourra toujours, à l avenir, être converti en format numérisé. Un exemple remarquable de cette approche est fourni par le Center for Research Libraries, aux Etats-Unis, qui entend créer et conserver durablement un fonds complet de tous les titres numérisés en format JSTOR 18. Cette démarche a naturellement une deuxième facette : un fonds commun ainsi consolidé permet aux différentes bibliothèques de se débarasser de séries qui ne sont plus consultées régulièrement. Conformément à la nature du projet JSTOR, il s agit avant tout, actuellement, de périodiques n existant plus ou de très anciennes livraisons, les numéros plus récents s ajoutant au fur et à mesure. En revanche, le projet ne vise absolument pas à archiver une sortie imprimée d une revue qui ne serait publiée que sous forme électronique. Nous n abordons pas ici les problèmes liés à la sauvegarde des revues parues entre 1850 et les premières décennies de la seconde moitié du 20 ème siècle, car ces fonds n ont rien à voir avec l archivage de contenus électroniques natifs. Occasionnellement, des voix prônent inversement une numérisation généralisée de ces fonds anciens, action qui n aurait donc pas pour objet de sauver l objet physique (contrairement à ce qu il advient avec une 17 On ne peut plus parler dans tous les cas de la version imprimée comme étant l «original», même si subjectivement ce sont cette perception et cette appréciation qui continuent à prédominer. 18 JSTOR (Journal Storage): 35

36 désacidification de masse), mais son contenu sous forme d une reproduction numérique (cf. 3.4). 3.4 Rétronumérisation Afin d éviter tout malentendu, nous utilisons ici sciemment la notion de «rétronumérisation» bien que le terme ne soit pas immédiatement compréhensible. Il faut entendre par là exactement le même processus que celui qui est désigné ailleurs par le mot plus court de «numérisation 19». La rétronumérisation se distingue, d une part, de la publication sous forme électronique qui, techniquement parlant, n a pas besoin d un original analogique et, d autre part, de l archivage électronique pour lequel, à la base, il est indifférent de savoir comment l objet numérique a été créé. Dans le présent rapport, nous parlons souvent sans nuancer de «données électroniques», car leur origine ne joue généralement aucun rôle du point de vue de la conservation : les problèmes à résoudre sont les mêmes quelles que soient la provenance ou la méthode de production. Lorsqu il est question d accès confortable aux données, par exemple, il peut valoir la peine de faire une distinction entre les différents types de documents et de comprendre les différences conceptuelles. Au chapitre 3.1, il n a pratiquement été question que de contenus créés dès le départ sous forme numérique, par exemple la production actuelle des éditeurs ou la littérature «grise» récente. D un point de vue qualitatif et quantitatif, on ne peut négliger toutefois les objets numériques qui ont été créés après coup sur la base d un original analogique. Cela concerne notamment les numéros de périodiques publiés avant la première moitié des années 1990 (typiquement avant 1995/1996) : certains d entre eux sont intégrés de manière transparente dans l offre actuelle des éditeurs de revues et offrent des fonctionnalités comparables. La manière d arriver à ce résultat n est toutefois pas la même que pour les documents électroniques natifs. Dans l optique du projet d e-archivage, l attention se porte sur la numérisation des périodiques. Ce qui correspond à une extension des activités actuelles du bureau central, l objectif étant d examiner quels sont les besoins et les possibilités en matière de mise en ligne sous une forme attrayante de contenus provenant de revues, qui ne sont pas encore disponibles sous forme électronique. L attractivité d une telle offre dépendra fortement de son ampleur et de sa qualité, elles-mêmes tributaires de moyens financiers importants. Un catalogage de grande qualité limite concrètement la quantité de contenus susceptibles d être numérisés et, d ailleurs, un catalogage poussé n est pas toujours indispensable. Ainsi, deux très grands projets de numérisation (Internetarchive et Google, voir le chapitre ) renoncent à saisir des métadonnées essentielles et privilégient l extraction sur la totalité du texte pour arriver aux résultats de recherche souhaités. Cela permet de couvrir de nombreux besoins, mais ne donne pas accès aux avantages fournis par des métadonnées saisies avec soin. 19 Au sens le plus large, la numérisation désigne aussi la diffusion et l importance croissantes des médias et des services numériques. Dans le présent travail, la numérisation n indique que la création de copies numériques à partir de documents analogiques. 36

37 Inversement, les projets mis en œuvre dans les différentes bibliothèques consortiales visent généralement à numériser des fonds spéciaux rares ou uniques : manuscrits, gravures anciennes, contenus d intérêt régional (0). De tels projets apportent une plus-value lorsqu ils s accompagnent d un catalogage soigné ou ont pour but d ajouter de nouvelles fonctions à un ouvrage descriptif existant Processus technique Par principe, tout document bidimensionnel peut faire l objet d une numérisation, qu il s agisse d un manuscrit, d une estampe, d une carte, d une photo, d un livre, d un journal ou d une revue. Dans certains musées, il est même question de numériser des objets en trois dimensions, la technique consistant habituellement à balayer les contours de l objet pour en créer un modèle 3D sur ordinateur. Il est également possible de digitaliser des phonogrammes et des vidéogrammes. La numérisation d un texte imprimé consiste à lire l image de chaque page par un balayage optique (scanning). Cette image numérique reproduit certes la totalité de l information disponible, mais uniquement sous la forme d une image par page, dans laquelle il n est pas possible de dissocier les différents éléments. Techniquement parlant, on n a pas encore affaire à un texte. Sous cette forme, l image numérique ne peut être que regardée, mais pas encore faire l objet d une recherche plus ou moins efficace ou d un autre traitement comparable. Cette étape est atteinte au moyen d une reconnaissance optique des caractères (ROC ou OCR [Optical Character Recognition]) qui permet de reproduire le contenu du texte à partir de l image des pages. Au besoin, le contenu du texte ainsi capturé peut être utilisé en tant que tel si seul le contenu présente un intérêt. Il doit cependant rester relié à l image correspondante si l on tient à conserver l apparence extérieure de l original tout en exploitant simultanément son contenu Avantages de la numérisation La numérisation a l avantage incontestable d améliorer considérablement l accès aux documents. Des ouvrages qu il fallait consulter in situ dans les bibliothèques sont tout d un coup disponibles dans le monde entier sous forme numérique. En fonction de la technique de numérisation utilisée, tout ou partie de ces mêmes ouvrages peuvent devenir accessibles aux malvoyants par le biais d une reproduction acoustique sur leur ordinateur 21. A cet effet, la mise à disposition des images des textes ne suffit pas, il y faut la version purement textuelle du contenu. Un autre objectif de la production d une copie numérique de bonne qualité peut être celui de réduire l usure de l original due à des sollicitations physiques trop intenses. En fonction du type de document et des pratiques de gestion des bibliothécaires, cet objectif peut parfois être contrecarré, car une visibilité accrue des copies peut entraîner une demande excessive de l original (Zotter 2003). Ce risque est toutefois plus élevé pour les manuscrits, d une 20 Un exemple de ce dernier cas est fourni par le catalogue en ligne intitulé «Griechischer Geist aus Basler Pressen» : 21 Accès pour tous Fondation suisse pour une technologie adaptée aux handicapés : 37

38 nature particulière, que pour une revue contemporaine, l original étant, dans ce dernier cas, d une importance secondaire. Selon la nature de l original, il est aussi possible de fournir des fonctions supplémentaires que l original ne saurait apporter, par exemple des fonctions de recherche ou de création d index. Il va de soi encore que les besoins et les possibilités varient fortement en fonction du type d original : la reconnaissance des caractères fonctionne bien sur des périodiques modernes utilisant une police Antiqua, mais nettement plus mal sur un document en caractères gothiques La numérisation peut-elle servir à la conservation des catalogues? Malgré leurs avantages convaincants en matière d accessibilité, les formes numérisées ne sont pas encore perçues complètement comme une alternative aux microfilms comme forme secondaire servant à l archivage à long terme (par ex. (Lusenet 2003) et, toujours largement valable, (Smith 1999)). Les raisons de ces réticences peuvent aisément se comprendre si l on se remémore les points évoqués aux chapitres 2.4 et 3.2 : tant qu il ne sera pas prouvé ou qu on ne sera pas convaincu que les documents numérisés peuvent eux-mêmes être conservés à longue échéance, ils apparaîtront trop peu sûrs en tant que forme secondaire ayant pour but de préserver des originaux menacés. A l été 2004, un organisme réputé rassemblant plusieurs bibliothèques, en l occurrence l Association of Research Libraries (ARL) américaine, a pris position en faveur de la numérisation en tant que format secondaire pour l archivage à long terme (Arthur, Byrne et al. 2004). Abandonnant ses réticences, l ARL souhaite manifestement engager un débat sur les règles et les standards à suivre pour que l archivage numérique à long terme puisse devenir une alternative valable pour certains genres de documents. Elle souligne, à l appui de sa thèse, que les méthodes de conservation sur durées courtes garantissent aujourd hui déjà que l on aura assez de temps à disposition pour trouver une solution définitive. En outre, les formes numérisées d excellente qualité permettent une reproduction physique des originaux. S agissant des documents dont l original physique ne présente pas un intérêt prépondérant, la numérisation en tant qu outil de préservation du contenu va gagner en importance. On mettra dans cette catégorie les journaux et les revues qui sont menacés par la dégradation du papier et qui sont souvent très volumineux. La numérisation est alors en concurrence avec la production de microformes ou de photocopies et avec la désacidification de masse Conservation des formes numérisées Tandis que les formes numérisées servent actuellement avant tout à améliorer l accessibilité des documents qu elles reproduisent, l ambition est aussi, bien naturellement, de conserver durablement et de mettre à disposition les copies numériques réalisées au prix de grands efforts. Techniquement parlant, elles sont affectées par les mêmes problèmes que d autres objets numériques, les différences étant plutôt à rechercher du côté de leur nature de forme secondaire. Exemple : l image numérique d une page doit rester reliée au contenu textuel provenant de la reconnaissance de caractères. 38

39 39

40 4. Questions techniques: accès Nous traiterons ici du malentendu selon lequel les problèmes d accès et de conservation à long terme seraient purement des problèmes techniques qui requérraient des solutions également techniques. Il est exact que toutes les ébauches de solution qui sont discutées comportent une part technique importante pour que les objets numériques, qui sont des objets à caractère technique, puissent être gérés de manière appropriée. Ce noyau technique doit être intégré dans un environnement institutionnel à la fois solide et fonctionnel. La technique est en ce sens un outil incontournable, qui a des tâches concrètes à remplir dans le cadre d une organisation globale et judicieuse des processus de conservation. L implication des bibliothécaires est très importante pour ce travail d organisation: ils doivent réfléchir aux contenus qu il faut conserver et se demander pourquoi, pour qui et sous quelle forme. 4.1 Sauvegarde Par «sauvegarde», il faut entendre l enregistrement des informations sous forme de bits, les bits en question figurant ensuite sur un support de données pendant une période de temps plus ou moins longue. La sauvegarde n équivaut pas à l archivage ou à la conservation à long terme, mais elle est un préalable nécessaire à ces dernières. Dans le débat sur l accès et la conservation à long terme, on entend dire parfois que les problèmes seraient maintenant beaucoup plus faciles à résoudre du fait que l espace mémoire est devenu bon marché. Il est exact que les prix ont fortement chuté ces dernières années si l on se réfère à un volume constant, la baisse n ayant toutefois pas touché de la même manière les unités de stockage et les mémoires vives. Mais il ne faut pas oublier que, dans le même temps, les besoins en espaces mémoire ont massivement augmenté et qu ils continuent à augmenter. Les travaux de haut niveau qualitatif et quantitatif exigent des solutions de qualité supérieure qui restent coûteuses. En ce qui concerne les questions de l accès et de la conservation à long terme, on peut donc seulement constater qu il n existe pour ainsi dire pas de limitations dues à l espace mémoire ou à la mémoire vive disponible. La disponibilité de l espace mémoire est certainement un atout appréciable pour la résolution pratique des questions en suspens, mais elle n apporte rien du point de vue conceptuel. Même si le coût de l espace mémoire physique a diminué, il n en va pas de même de l opération de stockage proprement dite et de la maintenance des données, qui requièrent un personnel qualifié : les centres informatiques des établissements publics sont, eux aussi, de plus en plus souvent tenus de se facturer entre eux certaines prestations comme la mise à disposition d espaces mémoire et le suivi des sauvegardes correspondantes. Il s agit là de frais récurrents qui doivent être budgétés sur le long terme. Pour estimer ces frais, il est possible de s appuyer sur les informations figurant au point Le volume des données à traiter dépend fortement des documents concernés et de leur contenu. En ce qui concerne les contenus de périodiques qui ont une importance particulière 40

41 pour l étude, l edepot 22 de la Bibliothèque Royale des Pays-Bas à La Haye est une très bonne référence en raison de sa vaste expérience pratique: en 2003, 1,6 million d articles issus de 1400 périodiques étaient mémorisés dans ce dépôt et l espace mémoire requis s élevait à 1,2 téra-octets 23. Pour 2004, les prévisions sont de 4,5 millions d articles (en provenance de 2600 périodiques) sur un espace mémoire de 3,0 téra-octets (Steenbakkers 2004). Il convient de souligner ici qu il s agit principalement de périodiques d un seul éditeur, dont beaucoup sont en format PDF. De plus, la longueur des articles varie fortement en fonction des sujets traités. Techniquement, la capacité de ce système devrait pouvoir être portée à 500 téra-octets. En ce qui concerne la sauvegarde de tous les titres actuellement abonnés par le biais du Consortium, il faut tabler, pour un volume de données comparable, sur une capacité à un chiffre en téra-octets. Selon une extrapolation effectuée avec les chiffres de 2004 pour les titres à disposition dans le Consortium, soit actuellement plus de 4000 titres, la capacité mémoire requise s élèverait à plus de 4,6 téra-octets. Mais cette extrapolation effectuée à partir des titres n est absolument pas fiable : plusieurs éditeurs doivent être pris en considération et, en règle générale, le Consortium n est pas autorisé à archiver les fonds d anciennes années ayant été numérisées ultérieurement («Backfiles»), alors que la Bibliothèque Royale dispose de ce droit. Ces droits devraient, le cas échéant, être perçus en sus. Une extension de la sauvegarde aux éditeurs avec lesquels des bibliothèques universitaires ont localement passé des accords de licence ne ferait vraisemblablement pas fortement augmenter le volume de données. La simple sauvegarde de tels volumes de données ne présente en principe aucun problème pour les unités de stockage utilisées à cet effet. Certains projets de recherche dans le domaine de la physique de l atmosphère et des particules produisent chaque année des quantités d informations beaucoup plus grandes, et ces informations doivent, elles aussi, être mémorisées ((1995), p.23 et 27). Par contre, un accès rapide aux données mémorisées exige non seulement une puissance de calcul appropriée, mais aussi une véritable gestion des données. Il existe pour cela des solutions commerciales qui ont fait leurs preuves. Elles permettent de combiner judicieusement des mémoires de données dédiées à une rapide mise à disposition en ligne (en règle générale, des disques durs) et d autres dédiées à une mise à disposition différée, aussi appelée «nearline» (à partir de bandes magnétiques ou de disques WORM 24 ). Naturellement, des fonctions de sauvegarde sont dans tous les cas de figure à disposition. Compte tenu des volumes de données qui doivent être non seulement mémorisés mais aussi régulièrement déplacés, les liaisons internes (et externes) assurant la transmission des données peuvent devenir des goulets d étranglement. Les mécanismes qui rafraîchissent régulièrement les bits de données enregistrés («Refreshing») ont également fait leurs preuves. Il devrait donc être possible de sauvegarder les simples suites de bits. Si les mesures requises sont bien planifiées, cette 22 edepot, Koninklijke Bibliotheek, Den Haag: (accès ) 23 1 téra-octet = 1000 giga-octets = méga-octets; disquette standard: 1,44 méga-octet 24 WORM: Write Once, Read Many support de stockage optique sur lequel on ne peut écrire qu une seule fois et qui ne permet ensuite que la lecture. 41

42 sauvegarde devrait même être possible en cas de changement du matériel informatique de base. 4.2 Interface et utilisation En principe, la sauvegarde organisée d objets numériques sur un serveur sous le contrôle direct des bibliothèques permet avant tout de mettre ces données à disposition à des fins d utilisation et c est tout. Toutefois, l utilisation proprement dite ne peut se faire que de manière très rudimentaire, par ex. en passant par toute une hiérarchie de dossiers. Le confort offert par les interfaces d utilisation et d exploration modernes des éditeurs - confort auquel les utilisateurs sont habitués -, fait défaut (feuilles dans divers indices, recherche via différents champs). Pour atteindre un tel niveau de confort, il faudrait enregistrer et gérer de très nombreuses métadonnées. Dans l idéal, ces métadonnées se trouveraient avec les données sur les contenus, et il suffirait de les mettre en forme avec un logiciel de recherche et de présentation (création d indices, etc.). En règle générale, un tel logiciel ne peut pas être obtenu du fournisseur de contenus ou seulement moyennant finances. La plupart du temps, il est conçu en fonction des données de l éditeur en question. Si de tels logiciels propriétaires étaient utilisés, il faudrait donc mettre en place une offre pour chaque éditeur, ce qui rendrait le système totalement inefficace. Il existe quelques logiciels commerciaux qui ont la prétention de pouvoir traiter les métadonnées de plusieurs éditeurs 25. Ces solutions coûtent normalement très cher. Le cas du Los Alamos National Laboratory est intéressant à cet égard : il possède une installation matérielle, qu il a en grande partie développée lui-même et sur laquelle tourne néanmoins la version modifiée d un tel logiciel de commercial (Giacomo, Martinez et al. 2003). Comme alternative, il a été suggéré d utiliser, pour la recherche à l intérieur du contenu d un serveur, un ensemble de métadonnées avec l aide d Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH 26, voir aussi le chapitre ) (Bennett, Conway et al. 2002). Il existe en outre toute une série de projets de logiciels Open Source qui portent essentiellement et en priorité sur l exploitation de mémoires de documents au sens des «Institutional Repositories» (de plus amples informations sont données au point ). Parmi les produits concernés, certains offrent une vaste gamme de fonctions pour la gestion des métadonnées. Mais compte tenu du fait qu ils se concentrent sur des offres de littérature grise, la plupart de ces programmes ne sont pas en mesure de représenter les hiérarchies de manière satisfaisante, alors qu une telle représentation est impérativement requise pour pouvoir bien utiliser les périodiques. L évolution dans ce domaine n est en aucun cas terminée, et on peut s attendre à ce que des améliorations suivent si un intérêt suffisant existe. 25 Par ex. ENCompass Solutions, Endeavor Information Systems Inc.:

43 4.3 Authenticité La facilité avec laquelle les objets électroniques peuvent être manipulés sans que cette manipulation laisse normalement de traces est un avantage inestimable dans le cadre de travail quotidien. Mais cette caractéristique pose en même temps un problème chaque fois qu un tel «objet» doit présenter un caractère documentaire, c est-à-dire qu il doit documenter une situation et donc rester intelligible de manière durable et incontestable. Dans ce contexte, il y a authenticité quand il y a correspondance entre l objet et un état original prédéfini ou des caractéristiques ayant été attribuées à l objet. La crédibilité et l image de marque des offres et des établissements qui s appuient sur des documents électroniques dépendent de la crédibilité des documents en question. Faire la preuve de l authenticité de tels documents est un problème qui ne se limite pas aux médias numériques : il se pose aussi pour les microformes et les documents analogiques, mais sans être associé à une modificabilité aussi facile. Parmi les interventions qui compromettent l authenticité des documents, il faut faire une distinction entre, d une part, les modifications indésirables provoquées par des erreurs techniques ou des falsifications intentionnelles et, d autre part, les remaniements et les nouvelles versions. Les premières doivent être, autant que possible, évitées ou du moins décelées, tandis que les secondes doivent déboucher sur un versionnage structuré. La conservation des différentes versions, dûment signalées en tant que telles, vise, en pareil cas, à pouvoir retracer les remaniements subis par un objet. Cela est en particulier important pour les documents au sens strict du terme. C est principalement sur ces documents que porte normalement le travail de collecte des bibliothèques et ils doivent donc, à cet égard, être considérés comme la règle. Il semble judicieux de respecter les habitudes en vigueur pour les documents imprimés: les innombrables versions produites durant le processus de création ne sont pas toutes conservées : seules les versions ayant été définies comme correspondant à une nouvelle édition remaniée d un ouvrage imprimé sont enregistrées. Ce versionnage ne relève déjà plus uniquement de la technique, mais doit être soigneusement ancré dans le processus de travail concerné. La technique doit, par exemple, empêcher que des fichiers existants puissent être écrasés par erreur, suite à l enregistrement d un nouveau contenu sous le même nom. Pour éviter de telles erreurs, il faut que l objet puisse être identifié sans équivoque, ce qui ne peut pas être obtenu uniquement avec le nommage. Une solution serait de calculer une somme de contrôle cryptographique capable d identifier clairement un objet numérique d après tous les critères pratiques. Il ne faut pas confondre l identification de l objet même avec le nommage durable, qui est effectué au moyen de ce qu on appelle un Persistent Identifier (voir 4.5). La somme de contrôle la plus souvent utilisée est celle appelée MD5 («Message Digest»). Elle est obtenue avec d un algorithme Hash 27, qui extrait de l objet une suite de caractères de longueur fixe : cette suite de caractères change totalement si la moindre modification est apportée à l objet. L opération peut être reproduite : autrement dit, la même somme de contrôle sera toujours attribuée au même objet : c est comme une empreinte digitale. Le processus ne peut pas être inversé: autrement dit, il n est pas possible de déduire les caractéristiques de l objet en question à partir de la somme de contrôle. Seule l identité peut donc être confirmée ou infirmée: la nature des divergences ne peut pas être connue. 27 Du verbe anglais: to hash hacher 43

44 Figure 2: Possibilités de comparaison au moyen d une somme de contrôle. A: Confirmation de l exhaustivité et de l exactitude d une copie, B: Constatation qu il s agit d une copie divergente, C: Confirmation de la non-identité d un prétendu original, D: Preuve du remaniement pas rapport à l original. Plusieurs applications sont donc possibles (voir. Figure 2): il est possible de vérifier si un objet a été modifié ultérieurement si l on dispose de la somme de contrôle de l original. Les détériorations ou les manipulations peuvent ainsi être décelées. Pareillement, si l on a deux objets, il est possible de comparer leurs identités entre elles ou avec un original. De cette manière, on peut voir, en cas d appellation identique, s il s agit d une nouvelle version qui doit être gérée comme un objet supplémentaire, mais avec référence à l original. La comparaison des sommes de contrôle permet non seulement de protéger les objets contre toute modification, mais aussi de vérifier si les objets n existent pas à double : lors de l enregistrement d un nouvel objet dans une mémoire, il est possible de comparer sa somme de contrôle avec celles des objets existants pour éviter un inutile enregistrement à double sous un autre nom. 44

45 La somme de contrôle ne peut plus être utilisée quand il s agit de comparer un objet numérique avec un objet issu de la conversion de l objet d origine (voir par ex. la migration, chapitre 5.4). Elle ne convient pas non plus pour obtenir confirmation du bon déroulement d une telle opération ou de la non-altération du contenu. 4.4 Contrôle de l accès Le contrôle de l accès aux objets numériques dans une mémoire doit remplir trois fonctions : il doit, pour commencer, établir l identité de la personne qui essaie d accéder à un objet (identification), puis vérifier si cette identité est juste (authentification). Pour finir, il doit attribuer de manière appropriée les droits d accès qui reviennent à la personne en question, par ex. en raison de son appartenance à un groupe (autorisation) Droit d écriture La mesure de sécurité la plus fondamentale contre les accès non autorisés consiste à limiter aux seules personnes autorisées les possibilités d accès aux données enregistrées dans un système de stockage. Cela semble banal au premier abord. Alors que le droit de lecture ne devrait être limité que pour les contenus protégés par un contrat de licence ou dotés de délais de protection, le droit d écriture (de surfrappe) devrait être le plus possible limité et contrôlé. Il est d usage que les auteurs puissent eux-même annoncer et mettre à disposition de nouveaux contenus destinés à être mémorisés dans un système. Normalement ces contenus n arrivent pas directement dans la mémoire, mais doivent explicitement recevoir l aval des personnes autorisées. Ce sont là des conditions qui doivent être mises en oeuvre sur le plan technique, mais qu il faut surtout définir et ancrer dans le processus de travail concerné. Il apparaît déjà ici qu une infrastructure de sauvegarde et d archivage peut comporter plusieurs niveaux d accès et de sécurité. Il existe différents concepts qui reposent sur une telle structure à plusieurs niveaux, mais plus les exigences en matière de sécurité et de conservation à long terme sont élevées, plus l accessibilité diminue (voir par ex. (Shirky 2002)). Pour la couche la plus sûre et la plus fortement verrouillée, il a même été proposé d effectuer, en pareil cas, une séparation physique qui rend l accès aux données impossible («Air gap») Droit de lecture D une manière générale, les bibliothèques veulent posséder un fonds aussi vaste que possible et le rendre accessible à un cercle d utilisateurs aussi étendu que possible. Jusqu à présent, les bibliothèques pouvaient, pour ce faire, s appuyer sur des privilèges traditionnels qui leur permettaient de prêter des fonds à des tiers. En ce qui concerne les documents imprimés, le nombre d «accès» parallèles à un document se limite, en règle générale, à une seule utilisation, étant donné qu il s agit d un support physique. Du point de vue des éditeurs et autres fournisseurs, cette situation constitue, d une certaine manière, un mécanisme de contrôle, qui protège leurs intérêts en ce qui concerne l utilisation des documents. Mais les possibilités de reproduction sous forme de photocopies et, plus récemment, de scans numériques ont amoindri ce contrôle, au grand mécontentement des éditeurs (Cronau and 45

46 Sprang 2004). C est la raison pour laquelle ils essaient de contrôler et de limiter par d autres moyens l accès aux données dont ils assurent la diffusion. Les moyens utilisés varient selon les fournisseurs. Il existe encore des offres pour lesquelles seul un nombre défini d utilisations simultanées («Simultaneous users») est prévu. Mais normalement, les consortiums concluent aujourd hui ce qu on appelle des «Site licences» (licences autorisant l accès pour tout un campus), qui permettent à n importe quel nombre d utilisateurs d accéder simultanément aux données pour autant que l utilisation soit uniquement réservée aux membres de l établissement concerné. Le contrôle de ces autorisations n est que rarement effectué par mot de passe de nos jours: c est encore le cas quand les autres solutions sont éliminées pour des raisons techniques. La variante la plus commode consiste à reconnaître l adresse IP 28 de l ordinateur depuis lequel l accès est demandé. Cette adresse permet de savoir si un poste de travail fait partie du réseau d ordinateurs d une organisation dont les membres sont autorisés à accéder à certains contenus. La méthode en elle-même est fiable et a fait ses preuves. Dans la pratique, des problèmes surviennent régulièrement lorsque les adresses des ordinateurs ne sont pas correctement mises à jour après des changements et dans les constellations où les adresses IP ne sont pas «visibles» à l extérieur. Cela est par exemple le cas quand le réseau d un établissement est coupé d Internet par un serveur Proxy pour des raisons de sécurité. Seule l adresse IP du serveur Proxy est alors visible depuis l extérieur. Pendant la période d accès à des contenus sous licence chez des éditeurs, les bibliothèques sont seulement tenues de communiquer les éventuels changements d adresses IP. Le fournisseur concerné doit alors veiller à ce que les utilisatrices et les utilisateurs autorisées soient reconnus en tant que tels. Quand des contenus ne sont plus consultés chez l éditeur, mais dans un système de sauvegarde de la/des bibliothèque(s) qui reste à définir, la responsabilité du contrôle des autorisations en cas d accès en ligne est transférée aux établissements qui gèrent l infrastructure. Ils doivent veiller, vis-à-vis des fournisseurs, à ce qu un accès différencié soit assuré pour les années dont les différents établissements ont acheté le contenu. Ce contrôle peut exiger beaucoup de travail compte tenu de toutes les variantes possibles: Les bibliothèques passent chacune des contrats de licence pour différents produits via le Consortium et leurs fonds d abonnements à des périodiques imprimés sont différents. La durée de la participation à la licence consortiale avec un éditeur varie d une bibliothèque à l autre. Dans plusieurs bibliothèques, il existe des droits supplémentaires sur certains contenus qui remontent, par ex., à d anciens contrats individuels de ces établissements. Des années plus anciennes de périodiques électroniques ont été localement achetées en plus (backfiles). 28 IP: Internet protocole protocole de transmission qui permet, entre autres, l adressage des données transportées via Internet 46

47 En dehors des éditeurs du Consortium, il faut éventuellement aussi tenir compte de données d autres éditeurs qui ne doivent pas être archivées dans les différentes bibliothèques. Changement de titres de l éditeur. Cela signifie donc pour le contrôle des accès aux différentes offres des éditeurs : l établissement qui effectue la sauvegarde doit, pour chaque éditeur qui doit être pris en compte dans un système de sauvegarde, déployer des efforts plus importants que ceux déployés jusqu à présent par chaque éditeur pour sa propre offre, et ce en raison de la forte différenciation des autorisations! Cette situation se traduit par une augmentation des sources d erreur possibles. Des alternatives au contrôle des adresses IP, qui est relativement rigide, sont en cours de développement. Le projet SWITCHaai 29 est particulièrement important pour la Suisse. Il prévoit la mise en place d une infrastructure d authentification et d autorisation (Authentication and Autorisation Infrastructure (AAI) qui permettrait aux utilisatrices et aux utilisateurs d accéder à toutes les ressources pour lesquelles ils ont une autorisation après une seule authentification, sans autre mot de passe ou équivalent. L AAI procède à l authentification et attribue l identité constatée aux autorisations que possède la personne en question. Dans sa version définitive, ce système doit fonctionner librement entre les hautes écoles et institutions de recherche suisses : cela signifie qu une personne qui aura été clairement identifiée pourra accéder de partout à toutes les ressources qui lui auront été préalablement attribuées, le mot ressources étant pris aux sens large : il peut s agir de l offre de bibliothèques, de services d administration de hautes écoles ou d offres proposées par des tiers reconnus comme partenaires. Techniquement, le projet repose sur l initiative Middleware Shibboleth Adressage durable Le problème de l adressage durable est connu des bibliothèques : le message «Pas disponible sur place» est redouté, car il peut signifier toutes sortes de choses, jusqu à la perte totale. Dans la plupart des cas, il s agit d un livre qui a été mal rangé par inadvertance, mais pour les personnes qui demandent ce livre cela équivaut à une perte totale, dans la mesure où elles ne peuvent pas l obtenir. Le problème se pose de la même manière avec les objets numériques. L adresse sous laquelle un objet numérique est enregistré ne dépend pas de l intégrité de l objet en question. Un document parfaitement intact peut être introuvable si on ne peut plus l appeler sous son adresse habituelle. Inversement, l adressage n a pas d impact sur l intégrité de l objet : même si l adresse habituelle ne répond pas, l objet peut tout à fait être en parfait état. Les adresses utilisées dans le World Wide Web sont en très grande majorité des URL (Uniform Resource Locators). Elles comportent trois parties et contiennent les informations requises pour trouver un objet à un emplacement donné : 29 SWITCHaai: 30 Shibboleth en tant que projet Internet2: 47

48 <Protocole>:// <Serveur web>/ <Fichier sur serveur> lib.consortium.ch/ external_files/workshop_mai_2004_d_pdf.pdf Chacun sait, pour en avoir fait l expérience dans le cadre de son travail quotidien, avec quelle rapidité l emplacement un fichier peut changer et un dossier peut être renommé pour cause d évolution des besoins. Ce sont justement ces interventions qui menacent la stabilité des adresses URL. Il est utile de bien comprendre que l instabilité n est en aucun cas une caractéristique intrinsèque des URL (Berners-Lee 1998), qui peuvent, en principe, avoir n importe quelle durée. Par contre, des modifications sont massivement apportées à ces URL lorsque des exigences ou des souhaits nouveaux le requièrent. Il résulte de l interprétation a contrario que les URL devraient être choisis avec précaution afin de réduire à un minimum les modifications ultérieures. Cette prévoyance a naturellement ses limites. Pour sortir de cette situation, plusieurs types d identificateurs persistants («Persistent identifiers») sont discutés et utilisés dans des proportions diverses. Ils partent d une même idée, à savoir la mise en service d une instance centralisée («Resolver» ou service intermédiaire de résolution), qui établit la correspondance entre le nom d un objet et son emplacement, ce qui permet, pour la plupart des modèles, de désaccoupler le nom d un objet (Uniform Resource Name, URN) de son emplacement sur un serveur donné. A y regarder de plus près, ce concept ne fait que déplacer le problème du bon adressage et le ramène à une liaison : pour que le nom d un objet puisse diriger l internaute vers la bonne adresse, l emplacement en question doit, au préalable, être communiqué au système de résolution («Resolver»). Lorsque l emplacement a été modifié, il est nécessaire, en cas de renvoi aux URL normaux, d actualiser individuellement tous les renvois figurant dans le World Wide Web, étant donné qu ils contiennent toutes les informations relatives à l emplacement (voir Figure 3). 48

49 Figure 3: Impact des concepts Uniform Resource Locator et Uniform Resource Name en cas de modification de l emplacement d un objet numérique. Par contre, l utilisation d un URN 31 ne prévoit qu un seul renvoi à l emplacement effectif, à savoir celui du service intermédiaire de résolution. Tous les autres renvois à l objet renvoient uniquement à ce service de résolution intermédiaire. Les modifications ne doivent donc être faites qu à ce seul emplacement et les autres renvois n ont aucune validité (voir Figure 3). On voit donc clairement que, en cas d utilisation d une URN, cet emplacement doit faire l objet d un entretien actif: aucun renvoi à l emplacement de stockage n est en soi stable sur la durée Schéma URN Une liste des principales applications du concept URN est brièvement dressée ci-après (voir à ce sujet par ex. (Borghoff, Rödig et al. 2003), p.100ss). D un point de vue formel, les URL satisfont aussi au concept URN : dans ce cas de figure, le service intermédiaire de résolution est un Domain Name System (DNS), qui génère un nom de domaine plus ou moins intuitivement compréhensible (par ex. qui vient s ajouter à l adresse IP du serveur concerné. 31 Le terme URN désigne aussi bien le concept général d attribution d un nom, qui n indique pas de manière explicite l emplacement d un objet, qu un schéma de mise en application de ce concept. C est ici du concept de base dont il est question. 49

50 Digital Object Identifier (DOI) Les Digital Object Identifiers (DOI) sont utilisés spécialement pour les articles de périodique. Ici, l intérêt consistait, entre autres, à pouvoir proposer en ligne des articles qui étaient prêts à être publiés et à permettre la citation de ces articles avant que l on ne connaisse le numéro des pages de l article dans le document imprimé, numéro qui doit être sinon indiqué lorsque l on fait une citation. Grâce aux DOI, les conditions permettant de citer clairement des articles qui ne sont pas publiés sous forme imprimée sont alors remplies. C est la Fondation DOI, dont le financement est assuré par les cotisations de ses membres, qui est responsable des DOI. L attribution de DOI n est donc pas gratuite, mais liée à l adhésion à cette fondation. Un DOI est composé d un préfixe et d un suffixe. Le préfixe correspond au numéro d identification de l éditeur dans le répertoire du service intermédiaire de résolution. Lorsqu un document est recherché via son numéro de DOI, le préfixe permet de transmettre la requête au bon fournisseur, qui peut alors trouver l article demandé à partir du numéro d identification du document contenu dans le suffixe. <Répertoire.Code maison d édition>/ < Identification interne> DOI: / s A l heure actuelle, les navigateurs standard ne sont pas encore capables d interpréter sans problème les DOI, c est-à-dire de les envoyer au service intermédiaire de résolution pour obtenir en retour l adresse de la source des données. Il faut soit doter le navigateur d un plug-in spécial, soit utiliser un serveur Proxy 32, qui fournit l adresse concernée au navigateur sans se trouver entre le navigateur et l objet (pour de plus amples informations à ce sujet, voir aussi 4.4.2). Les DOI restent actifs tant que les contenus concernés peuvent être utilisés chez l éditeur et que la maintenance des liens est assurée. Par contre, si le contenu est en plus déplacé sur le serveur, par ex. une bibliothèque, le mécanisme de résolution doit alors conduire les utilisateurs jusqu à la copie qui leur est destinée. Dans ce cas de figure, une demande adressée via un numéro de DOI devrait conduire les membres d une haute école vers la copie qui se trouve dans leur établissement et les autres demandes vers l éditeur. Le problème discuté ici est celui de la copie adéquate (appropriate copy), un problème qui peut être résolu (Beit-Arie, Blake et al. 2001). Les mécanismes de résolution de DOI utilisent le Handle System Handle System Le Handle System du CNRI (Corporation of National Research Initiatives) fournit, entre autres, les bases nécessaires à l utilisation de DOI. Ce sont donc essentiellement les mêmes informations que pour les DOI qui sont utilisées ici. Mais, contrairement aux DOI, le Handle System n est pas axé sur un type de document donné. Un serveur Proxy 33 peut, ici aussi, être utilisé pour la résolution des DOI. 32 L adresse pour l exemple en question sera: 33 L adresse pour l exemple en question sera: 50

51 <Institution dénommante>/ <Identification interne> hdl: / 4007 Le Handle System est également pris en charge par le logiciel de serveur de documents DSpace (Tansley, Bass et al. 2003) du MIT et de Hewlett-Packard Uniform Resource Name Il ne s agit pas ici du concept URN général, mais d une mise en application concrète, qui porte le même nom. Elle est notamment utilisée par plusieurs bibliothèques nationales. Le concept de la Bibliothèque nationale suisse (Bättig and Locher 2003) est utile pour bien comprendre. Un exemple d URN attribué par la BN est donné ci-après. L espace de nommage NBN (National Bibliography Number) est utilisé par toutes les bibliothèques nationales participantes et structuré en sous-noms via des codes pays. <Espace de nommage NBN:pays>: <Bibl. responsable>- <Identification interne> urn: nbn:ch: bel Dans leur forme actuelle, les URN des bibliothèques nationales ne conviennent qu à des objets statiques, qui peuvent cependant comporter plusieurs parties. La démonstration de la résolution d un URN attribué en Suisse peut être effectuée dans le cadre d un service de la Deutsche Bibliothek 34. Un autre exemple suisse de l utilisation des URN se trouve sur le portail d information de la Chancellerie fédérale sur l administration publique en Suisse 35. Il présente certaines différences conceptuelles par rapport aux URN attribués par les bibliothèques, surtout lorsque ces URN sont utilisés pour représenter des corrélations hiérarchiques PURL Il ressort des explications données précédemment qu aucun standard ne s est clairement imposé bien que l objectif soit le même pour tous. Cette absence de standard est considérée comme une des causes de la faible diffusion des identificateurs persistants ((Borghoff, Rödig et al. 2003), p.102). C est pourquoi l OCLC (Online Computer Library Center, Inc.) a proposé et mis en application 36, à titre de solution transitoire, des Persistent URL (PURL). Il s agit d URL dont la pérennité est assurée grâce à une déviation vers un service de résolution intermédiaire. Un URL normal conduit l internaute directement à l emplacement où se trouve l objet recherché. Un PURL est un URL doté d un service de résolution intermédiaire et du nom de l objet recherché. Lorsqu un PURL est utilisé, la demande est tout d abord envoyée à un service de résolution intermédiaire, qui va voir où se trouve l objet recherché, puis communique l URL correspondant à l ordinateur qui a envoyé la demande d information. Cet URL permet alors d accéder directement à l emplacement actuel de l objet recherché (voir Figure 4). 34 Lien vers la démonstration du service de résolution intermédiaire de la DDB sous 35 Portail d information de la Chancellerie fédérale sous 36 Autres informations sur les PURL sous 51

52 Figure 4: Echange d informations lorsqu un PURL est utilisé pour appeler un objet. La communication utilise le protocole standard HTTP (Hypertext Transfer Protocol) du World Wide Web. Le résultat se présente comme indiqué dans la Figure 3. La grande différence avec les URN réside dans le fait que, pour traiter les PURL, les navigateurs standard doivent être équipés de logiciels supplémentaires et que d autres modifications doivent aussi être effectuées côté utilisateurs. Il est également possible d utiliser des serveurs Proxy comme expliqué aux points et Dans ce cas de figure, les serveurs sont des outils qui ne font pas partie du concept URN proprement dit. Les PURL peuvent être attribués indépendamment de l OCLC. 52

53 5. Amorces de solutions techniques: la conservation à long terme Les différentes méthodes techniques qui sont étudiées pour rendre les informations numériques utilisables sur le long terme se différencient les unes des autres notamment par le moment où intervient la mise en application des premières mesures. Ces méthodes doivent aussi être différemment évaluées selon que l on se trouve devant un grand volume de données de même type ou une multitude de formats présentant des caractéristiques différentes. Les questions relatives à l authenticité, au contrôle des accès, à l adressage, etc., qui ont déjà été discutées précédemment, gardent toute leur importance. Etant donné que les différentes méthodes n aboutissent pas toutes au même résultat, il est nécessaire de définir les caractéristiques ou les fonctions des objets numériques dont la perte peut être tolérée. C est là quelque chose d extrêmement difficile à faire dans la mesure où il faut partir du principe que des données qui ont été créées dans un certain contexte sont susceptibles d être utilisées à l avenir dans un autre contexte et d une autre manière. Il n existe pas d instruments permettant de faciliter de tels changements d utilisation ((Hedstrom, Ross et al. 2003), p.20). Le succès de certaines mesures ne peut être évalué qu à la suite de leur mise en application en «situation d urgence», ce qui pose problème. Des recherches doivent d ores et déjà être effectuées pour augmenter les chances de réussite de leur mise en application. Une grande partie de ce travail ne pourra pas être pris en charge par la plupart des bibliothèques. Il est donc important pour elles de trouver des partenaires si elles veulent que l intérêt qu elles portent à ces travaux se concrétise, d autant plus qu il existe dans la plupart des hautes écoles des instituts ou des départements d informatique, de techniques de l information ou de domaines apparentés qui ont les moyens d effectuer de telles recherches. 5.1 Archéologie des données L expression archéologie des données recouvre différentes méthodes qui sont employées pour lire et utiliser des données numériques auxquelles on ne peut plus accéder suite à un problème logique ou physique (Ross and Gow 1999). En ce qui concerne les problèmes physiques, il peut s agir, par exemple, d un support de données qui a été endommagé et qui est devenu illisible. En ce qui concerne les problèmes logiques, il peut arriver, par exemple, que l on ne puisse plus déterminer le format dans lesquels des données ont été mémorisées et le logiciel qui permet de les lire. Des données qui sont toujours correctement mémorisées dans leur forme originelle, c est-à-dire une suite de bits, peuvent donc très bien être illisibles. L utilisation de ces méthodes est plus ou moins laborieuse selon l état et l âge des données concernées. Lorsque les problèmes de lecture sont d ordre physique, des méthodes physiques extrêmement sensibles, comme la microscopie à force magnétique, peuvent être utilisées. Mais on devine déjà qu il s agit là de méthodes qui ne peuvent pas être utilisées pour traiter de grands volumes de données. Ces méthodes sont très lourdes et il est probable que leur utilisation ne peut se justifier sur le long terme que s il s agit de données 53

54 vitales pour l existence d une entreprise, de données ayant valeur de preuve ou de données essentielles d un point de vue culturel ou historique. Si on ne dispose que des données à déchiffrer, le travail exigé sera naturellement beaucoup plus important que si l on possède aussi des informations sur la nature des données en question et sur leurs propriétés. Lorsque ces informations doivent être recherchées pour une grande quantité d objets numériques de même type, l utilisation de méthodes aussi lourdes se justifie davantage que s il s agit d un cas isolé. Les expériences en matière d archéologie des données fournissent des indications très utiles quant aux mesures préventives qui doivent être prises dès aujourd hui pour que l on n ait plus besoin de recourir à cette forme d archéologie dans le futur ou qu elle soit du moins fortement simplifiée: si les formats et les programmes sont documentés de manière exhaustive et durable, on évite d avoir à récupérer ultérieurement ces informations et à les reconstituer par des voies détournées. Mais il ne suffit pas de créer et de sauvegarder cette documentation : encore faut-il pouvoir la mettre en relation avec les objets concernés. Dans l idéal, un objet devrait pouvoir donner lui-même des renseignements sur ce qu il est, sur la manière dont il faut le traiter et sur l endroit où l on peut trouver des informations le concernant. Il est néanmoins possible de prendre des mesures appropriées, par ex. en bricolant un logiciel obsolète pour qu il tourne sur un système d exploitation émulé (pour l émulation voir 5.5). Si la documentation est à disposition sous une forme directement lisible par l Homme, cela est utile (voir chapitre 5.8). 5.2 Musée informatique Il a été mentionné que le comportement des techniques de base du matériel informatique (par ex. ordinateurs et unités) posait problème pour l utilisation et la conservation à long terme des données numériques. L archivage dudit matériel informatique a donc été logiquement proposé afin pouvoir accéder ultérieurement à des supports de stockage obsolètes et faire tourner des logiciels obsolètes sur du matériel informatique tout aussi périmé. En y regardant de plus près, un musée informatique n est pas une solution : La simple conservation des appareils dans un musée ne suffit pas : il faut que les appareils soient entretenus avec soin pendant un laps de temps indéterminé et restent en parfait état de fonctionner. Même si un stock de pièces détachées illimité existait, le problème ne serait pas résolu pour autant, étant donné que, avec le temps, les processus physiques rendraient forcément les différents composants inutilisables. Le nombre d appareils à conserver augmenterait très rapidement. Une documentation complète devrait être établie sur les interdépendances entre le matériel informatique et les logiciels. Toute erreur constituerait une menace supplémentaire pour les données. D une manière générale, une telle documentation est néanmoins la condition du succès des stratégies de conservation et pas une particularité du musée informatique. Un tel musée ou de tels musées ne pourraient remplir leur mission que sur place. 54

55 L ensemble de toutes les exigences auxquelles de tels projets devraient satisfaire rendraient ces derniers pour le moins très lourds. A cela s ajoute le fait que, en ce qui concerne l utilisation de supports de stockage obsolètes, les perspectives de lecture des données sont déjà limitées par les caractéristiques physiques des supports : en l espace de quelques années, on en arriverait au point où un lecteur d origine ne serait plus en mesure de lire toutes les données enregistrées sur le support adéquat car ce dernier aurait été perdu. Par contre, il pourrait être utile de conserver pendant quelques années les appareils dont on a plus besoin dans le cadre d une exploitation régulière, mais dont le bon fonctionnement pourrait être maintenu sans trop d efforts. De cette manière, il serait possible de continuer à lire et à copier facilement, pendant quelque temps encore, des données qui feraient «tardivement» surface et seraient intactes. La proposition qui a été faite d étudier plus intensivement de quelle manière les périphériques conservés (lecteurs, écrans) pourraient communiquer avec du matériel informatique plus récent (Hedstrom, Ross et al. 2003) va dans ce sens. Néanmoins, il serait plus utile d avoir des lecteurs modernes capables de lire des supports de données obsolètes. En ce qui concerne la mise à disposition d une plate-forme matérielle obsolète pour les logiciels obsolètes, on pourrait, en un certain sens, réaliser un musée informatique virtuel : c est au fond exactement ce que tente de faire l émulation discutée au point Formats standards La définition et la conservation de standard ouverts, internationaux et bien documentés peut aider à réduire au moins quelques problèmes de conservation à long terme auxquels on peut s attendre. Par moments, on a toutefois l impression qu il y a plutôt trop que pas assez de standards de ce type. Si, dans le cas des mesures d archivage, la multiplicité des solutions techniques est considérée, dans une certaine mesure, comme une protection contre des erreurs fondamentales, c est une standardisation judicieuse qui l emporte dans le cas des formats, cette standardisation visant à créer, dès l élaboration des documents, des conditions favorables à une conservation à long terme pour le futur. Les standards revêtent une importance capitale pour les formats de fichiers des objets numériques qui doivent être mémorisés et archivés. Jusqu à présent, les bibliothèques n ont guère pu émettre de souhaits quant au format de fichier dans lequel elles désiraient recevoir les contenus. Pour parvenir à une certaine unité, il faudrait éventuellement que les articles remis par la bibliothèque soient convertis dans le format qui a sa préférence. Une telle conversion ne devrait être effectuée que si elle n entraîne aucune modification et aucune perte de données indéfendable. En principe, les formats devraient présenter les caractéristiques suivantes pour l archivage : Spécification ouverte: o o Les caractéristiques techniques des formats doivent être totalement divulguées. Cette communication ouverte ne doit pas être limitée par des brevets ou des secrets d entreprise (caractère non-propriétaire). Spécification syntactique: le bon codage des formats doit être connu. 55

56 o Spécification sémantique : la signification des différentes balises doit être connue. o Spécification complète en soi, qui ne doit pas se référer à des sources extérieures. De plus, elle doit être à disposition indépendamment des supports, c est-à-dire être aussi disponible sous une forme non numérique. Standardisation assurée par une organisation internationale : cette dernière veille à ce que toutes les informations se réfèrent au même format et à ce qu aucune divergence ne se produise sans être décelée (voir à ce sujet par ex ). Large diffusion et acceptation : plus le nombre de contenus disponibles dans un format est grand, plus la pression qui s exerce sur la recherche et sur le marché pour trouver des solutions est forte. Abandon des techniques cryptographiques, qui gênent l utilisation. Dans l idéal, pas de compression des données. Quand une compression est inévitable, elle doit être effectuée de manière à ce qu aucune donnée ne soit perdue. On considère aujourd hui que la durée de vie des formats n excède pas 10 ans. Même dans le cas du format ASCII, qui semble prouver le contraire, des problèmes de représentation se posent, lors de l utilisation du jeu de caractères étendu, quand on passe du monde Microsoft au monde UNIX. Des définitions et des standards clairs sont donc nécessaires. Trois formats de données utilisés pour l archivage ou, du moins, intensivement discutés sont examinés ci-après. De plus, il existe des formats standards pour d autres types d objets (Borghoff, Rödig et al. 2003), surtout si l on considère que leur durée de vie est en général plus longue. Cela mis à part, ces formats peuvent plus ou moins bien convenir à l archivage. Des standards pour les objets composés font en partie défaut PDF et PDF/A Aujourd hui, les bibliothèques sont surtout confrontées à des documents texte en format PDF (Portable Document Format). Ce format est très apprécié car l aspect extérieur des documents est préservé en cas de transmission à d autres ordinateurs. De plus, le logiciel d affichage Acrobat Reader de la société Adobe est en accès libre, ce qui a fortement contribué à la diffusion de ce format à travers le monde. Cependant, le format PDF ne satisfait que partiellement aux exigences mentionnées plus haut. Ce n est pas véritablement un standard, mais seulement un format très répandu, qui est défini et amélioré par la société Adobe. La spécification de l avant-dernière version du programme a été jusqu à présent divulguée. Mais Adobe n a logiquement aucune obligation à cet égard et pourrait à tout moment changer de politique. Ce logiciel permet également d effectuer des compressions et accepte certaines mesures cryptographiques, l intégration d autres fichiers ainsi que le renvoi à des jeux de caractères et à des contenus situés hors du fichier concerné. Par ailleurs, il existe des outils de différentes marques qui permettent de créer des fichiers PDF, ce qui peut déboucher sur des incohérences. C est la raison pour laquelle des travaux sont actuellement en cours pour définir, à partir du format PDF, un standard ISO «PDF/A», qui contiendrait certaines propriétés du format PDF et améliorerait 56

57 l adéquation de ce format à l archivage. La nécessité d une telle démarche est encore plus forte si l on considère l étendue des nouvelles fonctions qui devraient être proposées dans la version 7.0 du logiciel Adobe Acrobat au début de l année Ce sont les besoins exprimés par l Administrative Office of the U.S. Courts (AOUSC) qui sont derrière le développement de ce standard. Les tribunaux américains acceptent les documents sous forme électronique, mais ces documents doivent être remis en format PDF pour que la mise en page (surtout la pagination) soit préservée. Pour satisfaire à l exigence des tribunaux, ce format doit cependant remplir encore d autres critères. L exigence en question se fonde sur l obligation d archivage, parfois pendant plus de 40 ans, avec remise à l archive nationale NARA. Il faut donc que la présentation extérieure puisse être restituée durablement et que d autres caractéristiques soient préservées. Les questions que cela soulève devraient se poser au monde entier à plus ou moins longue échéance. C est ainsi que les tribunaux allemands ont, eux aussi, récemment mis en place des procédures pour la remise électronique de documents sous forme de pièces jointes envoyées avec un message électronique 38. Les travaux entrepris en Suisse dans le domaine de l «e-government 39» pourraient à plus long terme prendre le même chemin. L approche choisie par les comités de l ISO se fonde sur la spécification publique 1.4 et définit un certain nombre de composants PDF dont l utilisation pour la création de fichiers est classée impérative, recommandée ou interdite. Un nouveau format de fichier n est donc pas défini : seule l utilisation du format PDF existant est réglementée. Le standard ne fait explicitement pas référence à la conversion de documents papier en PDF. On distingue deux niveaux de conformité (totale et minimale). Toutes les directives visent à, Faire en sorte que les fichiers PDF puissent être, autant que possible, indépendants des plates-formes et des logiciels et accessibles pour permettre une analyse et une lisibilité directes (device independence). Réunir dans un fichier toutes les informations et toutes les ressources requises pour qu une interprétation et une reproduction à la fois fiables et prédictibles soient possibles (self-containment). Garder à disposition, à l intérieur même du document, des métadonnées descriptives, administratives, structurelles et techniques aussi complètes que possible (selfdocumentation). La conception d un standard PDF/A a été validée pour un deuxième tour de consultation internationale («Committee Draft Ballot»). Sa publication comme standard est prévue pour le printemps En principe, les restrictions mentionnées se traduisent par la perte d intéressantes propriétés offertes par les nouvelles versions PDF, notamment les éléments multimédias. Il est, par exemple, interdit d utiliser la fonction «transparent» et les contenus cachés ne sont pas admis. Adobe (ainsi que d autres éditeurs de logiciels) participent à l élaboration du standard Case postale électronique des tribunaux et de l administration: 39 Stratégie E-Government de la confédération: 40 Le est cité sur la page Internet de l ISO, ce qui serait étonnament tard (accès effectué le ). 57

58 Il paraît qu Adobe proposera une option «PDF/A» dans son logiciel une fois que le standard aura été adopté. Ce sont les besoins des archives proprement dites qui sont à l origine de PDF/A. Les tribunaux qui ont donné le coup d envoi de ce développement peuvent naturellement imposer de telles conditions à leurs clientes et clients. Il est donc difficile de savoir comment ce standard sera accepté dans des domaines moins réglementés. La plupart des documents PDF auxquels les bibliothèques sont confrontées n utilisent qu une petite partie des nombreuses fonctions qui seront restreintes par ce standard. Il y a tellement de personnes qui veulent savoir avec certitude si le format PDF peut être utilisé comme format d archivage, que ce format connaîtra certainement une large diffusion. Cette dernière devrait être soutenue par les bibliothèques, qui peuvent créer de telles obligations pour leurs propres serveurs de documents. En ce qui concerne les documents fournis par les éditeurs, certaines questions ne se posent pas. Cependant le standard PDF/A peut, ici aussi, contribuer à une uniformisation. Il va de soi que l utilisation du format PDF/A ne peut pas, à elle seule, créer un archivage, mais elle peut faciliter l opération. Le groupe qui a élaboré le standard PDF/A s occupera aussi de formuler les spécifications auxquelles un format d archivage doit satisfaire d une manière générale. Indépendamment du travail qu il a fallu effectuer pour limiter les fonctionnalités du format PDF, ce dernier a principalement un désavantage: son format de données est binaire, autrement dit le codage n est pas effectué avec des caractères texte et l interprétation du contenu nécessite des logiciels ad hoc. Le contenu ne peut donc pas être affiché et traité avec un simple éditeur de textes. Il existe des formats de fichiers qui, à la différence du format PDF, permettent de mémoriser les données en format texte (voir 5.3.3). Pour cette même raison, le format PDF, qui est excellent pour l affichage des documents, n est pas capable de saisir leur structure de manière aussi profonde TIFF (Tagged Image File Format) TIFF est un format utilisé pour mémoriser des graphiques bitmap. Lors de la numérisation, les enregistrements maîtres sont en règle générale saisis sous forme de fichiers TIFF. Un des avantages du format TIFF réside dans le fait qu il a fait l objet d un long développement structurant. Cela signifie que les anciennes spécifications sont incluses dans les nouvelles. Une compatibilité ascendante et descendante existe donc d une «manière générale» (Borghoff, Rödig et al. 2003) pour le cas où seuls les formats qui étaient déjà contenus dans d anciennes spécifications pourraient être utilisés. La multiplicité des extensions apportées à ce format entraîne un certain manque de clarté (voir 5.8.1). Les fichiers TIFF sont également mémorisés sous forme binaire et pas sous forme de caractères texte, qui pourraient être compris par les gens (voir 5.3.3) XML (extensible Markup Language) et autres langages de balisage XML XML et les langages apparentés sont capables de décrire de manière très détaillée la structure d un document et les fonctions de ses différents éléments. Jusqu à présent, ils ont 58

59 surtout été utilisés pour des documents texte, mais ils permettent aussi de coder des graphiques, des formules mathématiques, des langages parlés, etc. (Borghoff, Rödig et al. 2003). XML est un standard ouvert. C est le World Wide Web Consortium (W3C) 41 qui l a défini 42. Ce groupe de langages de balisage (Markup Languages) a une caractéristique commune : la description des documents est effectuée en caractères texte. Lorsqu un document texte est mémorisé sous cette forme, le balisage d un élément (Tag) apparaît avec son contenu. C est la grande force de ces formats : à ce niveau du codage, ils resteront vraisemblablement très longtemps lisibles et leurs exigences concernant des applications propriétaires spéciales ne sont pas élevées. Dans le cas de XML, la présentation et la structure sont strictement séparées : grâce à l affectation d un formatage donné à un codage, il est possible de choisir et d adapter un contenu donné en fonction de l utilisation que l on veut en faire. Le désavantage manifeste de cette séparation réside dans le fait que les instructions de présentation, qui figurent dans un document séparé, doivent toujours être à disposition pour que la forme de présentation souhaitée à l origine puisse être restituée. Les documents qui contiennent ces instructions sont des DTD (Document Type Definitions) ou bien des schémas XML, dont les propriétés sont un peu différentes et qui possèdent des capacités étendues. Pour l archivage, cette séparation se traduit par une augmentation des exigences, dans la mesure où que le fichier d instructions authentique et valable doit toujours être relié au document dans lequel se trouve le contenu. Cette situation ainsi que l utilisation, qui est encore lourde actuellement pour les utilisateurs, ont jusqu à présent retardé la diffusion du langage XML. Les programmes Office proposent bien une édition «XML» en option, mais celle-ci recèle en partie des modifications propriétaires indésirables. Chez les éditeurs qui travaillent de manière professionnelle, le passage au format XML pour les processus de production internes a, en règle générale, déjà été effectué. L importance attribuée à la séparation entre structure et présentation est si grande que XML est choisi en priorité pour les documents qui doivent être archivés sur le long terme ou que l on pense réutiliser pendant longtemps. Inversement, le format HTML (Hypertext Markup Language) est regardé d un oeil critique pour la même raison : il mélange présentation et structure d une manière qui pose problème pour une ultilisation ultérieure et pour la conservation. XML s est imposé plus rapidement pour la saisie des métadonnées que pour le codage des textes, ce qui va de soi quand on sait que, pour les métadonnées, c est l utilisation des données dans toutes sortes de corrélations qui présente un intérêt majeur et pas la présentation optique. Actuellement, XML est d ores et déjà le format standard pour la saisie des métadonnées. Mais XML ne donne aucune indication quant aux métadonnées qui doivent être saisies: il indique seulement comment il faut les coder à un niveau très formel. Un standard comme METS (Metadata Encoding and Transmission Standard) 43 définit à cet effet le schéma formel à employer. XML comme METS ne peuvent être judicieusement utilisés que si un standard 41 World Wide Web Consortium: 42 Extensible Markup Language (XML): 43 METS (Metadata Encoding and Transmission Standard): 59

60 existe pour le contenu des métadonnées. Ce sont des standards comme le Dublin Core Metadata Element Set 44 ou les définitions de formats données dans les règles de catalogage courantes qui sont entendus par-là. Il n est pas possible d en discuter ici, bien que les métadonnées jouent un rôle important dans la conservation lorsqu il s agit de saisir et de transmettre des informations techniques ou l historique du remaniement d un objet TeX et LaTeX TeX 45 fonctionne comme un langage de balisage, mais son but est la création de documents d impression au sens d un programme de composition. C est pourquoi la présentation extérieure doit être ancrée dans le document. LaTeX permet surtout d utiliser plus facilement les possibilités offertes par TeX grâce à des macros prédéfinies. Le point fort de TeX réside dans le fait que l édition est indépendante du matériel utilisé: la présentation définie à l origine reste. C est une des raisons pour lesquelles ce langage est apprécié des mathématiciens et des scientifiques qui utilisent un grand nombre de formules dans leurs publications. C est pourquoi TeX est également utilisé par les éditeurs dans ce domaine. Une plus large diffusion de ce langage s est pendant longtemps heurtée au fait que le résultat n apparaît pas pendant l écriture comme cela est le cas avec les programmes de traitement de texte traditionnels. Du point de vue de la disponibilité à long terme, on voit tout de suite que le langage TeX qui a été lancé au début des années 80 était un système très évolué. La gamme de commandes proposées est considérée comme achevée depuis 1985, et peu d erreurs ont dû être corrigées depuis. Cette stabilité est extrêmement précieuse pour l archivage à long terme, pour autant que les autres exigences posées par la documentation soient aussi satisfaites (interpréteur pour le langage de programmation, pilote d impression pour l édition). En dehors de la diffusion qui reste limitée, on remarquera que, avec TeX, certaines informations sont seulement implicites car cela correspond à la forme de sortie souhaitée, ce qui n est pas le cas avec XML (Borghoff, Rödig et al. 2003). Citons comme exemple le point de multiplication dans le numérateur d une fraction mathématique : il disparaît en cas de conversion dans d autres formats, alors qu il devrait apparaître explicitement dans ces formats pour que la présentation soit correcte. On ne connaît pas encore bien l importance de ce type de défaut par rapport aux avantages, surtout que l objectif consiste à éviter que de telles conversions soient nécessaires ASCII Etant donné que l importance du codage dans une forme texte lisible a été évoquée à plusieurs reprises, il est d ores et déjà clair qu un texte pur revêt une importance particulière pour la conservation. Avec des suites de caractères texte, il est possible de décrire des objets complexes, y compris leur formatage. Mais la suite de caractères elle-même n est pas formatée. C est en cela et dans la durée de vie du codage des caractères, que l on sait élevée par expérience, que réside la force des formats texte purs. C est le format ASCII (American Standard Code for Information Interchange) lancé à la fin des années 60 qui s est révélé comme étant le format avec la plus longue durée de vie. Compte tenu de ses limites, il 44 Dublin Core Metadata Initiative: 45 TEX Users Group: 60

61 a donné naissance à de multiples variantes et extensions qui ne sont pas compatibles entre elles ni même parfois avec le premier standard. De plus, la présentation n est pas identique sur les ordinateurs Windows et les ordinateurs Apple. Théoriquement, les documents texte peuvent être convertis dans ce format s il est possible de renoncer au formatage et aux signes spéciaux ou si ces éléments n existent pas. Cela peut notamment être le cas pour l exportation de bases de données. 5.4 Migration Comme cela a été présenté au point 3.2.2, l utilité des informations numériques est en règle générale liée à une certaine configuration du matériel informatique et des logiciels. On dispose donc, en principe, de deux approches possibles pour s assurer que les données restent utilisables : soit on adapte les données à un environnement matériel et logiciel qui évolue, soit on s arrange pour que les propriétés du matériel actuellement en place restent disponibles pour pouvoir continuer à utiliser des données qui, elles, n auraient pas changé. L adaptation des données passe par la migration, c est-à-dire la conversion des données depuis leur forme d origine. Le passage à un nouveau type de support de données est, en ce sens, aussi une migration. Lorsque l ancien support et le nouveau présentent des différences au niveau de leurs fonctions logiques, des adaptations logicielles sont déjà nécessaires. C est ainsi que les bandes magnétiques doivent essentiellement être lues de manière linéaire pour des raisons techniques, ce qui n est pas le cas, par exemple, des disques durs. La migration est cependant plus délicate lorsque le format de fichier lui-même doit être modifié pour que l on puisse continuer à utiliser pleinement un fichier, par exemple avec une nouvelle version logicielle. Dans le cas le plus simple, le fichier est ouvert dans la nouvelle version du même programme d application et mémorisé une nouvelle fois. De même, on peut souhaiter convertir des objets dans un format standard qui présente de meilleures chances de conservation ou qui est plus facile à échanger. Dans le domaine de l archivage, pour qu une migration réussisse et soit surtout réalisée au bon moment, il faut surveiller les développements techniques et savoir, à tout moment et pour chaque format, quelles sont les méthodes de reproduction («Viewpaths») dont on dispose. Dès que l on pressent que certaines de ces méthodes ou toutes deviennent obsolètes ou doivent être changées pour cause de progrès techniques, des mesures doivent être prises pour préserver l accès à d autres méthodes d utilisation ou développer de telles méthodes via la conversion dans d autres formats (voir 5.8). Ce type de migration comporte quelques avantages: Les documents qui ont été adaptés aux évolutions techniques peuvent être lus et traités avec du matériel informatique et des logiciels modernes. En cas de migration réussie, des améliorations de la qualité sont possibles dans les nouvelles versions, qui présentent de nouvelles caractéristiques produits. Du point de vue de l archivage, cet aspect est à double tranchant : lorsque la présentation et la fonction d origine doivent être impérativement montrées ou prouvées, une telle «amélioration» n est alors pas souhaitée. 61

62 Les formats qui ont été adaptés aux évolutions techniques requièrent une formation moindre pour le personnel que les formats historiques ; les formats actuels et largement répandus bénéficient d une meilleure assistance de la part des fabricants que les formats anciens et dépassés. De plus, une migration périodique permet de vérifier régulièrement la lisibilité des documents, lisibilité qui peut être corrigée le cas échéant. Parmi les risques, il y a les aspects suivants : La migration doit être réitérée périodiquement. Compte tenu des très nombreuses caractéristiques, il est exclu de pouvoir convertir les formats sans enregistrer de perte au niveau de la fonction et de la présentation, et ce d autant plus que l intervalle avec le format d origine est grand. La migration n est pas un processus établi et uniforme. En dépit des contrôles de qualité qui sont effectués, des erreurs de lecture, d écriture et de conversion risquent de ne pas être découvertes. Il faudrait, par sécurité, conserver à chaque fois l original, ce qui augmente la charge de travail. Mais c est actuellement la procédure normale. Une migration demande beaucoup de travail, car chaque objet doit être individuellement converti. (Il faut compter environ un an pour convertir 100To dans une nouvelle version avec un débit de 3Mo/sec., et ce sans contrôle de qualité). Il existe tellement de formats qu il faudrait beaucoup de temps pour suivre l évolution de chacun d entre eux. Il peut être utile de se concentrer ici sur les formats standard, mais cette concentration peut se traduire par des pertes de votre côté. Les nouvelles propriétés d un format peuvent empêcher sa conversion dans d autres formats : c est ainsi que les GIFS animés ne peuvent plus être reproduits en format TIFF, ce qui n est pas le cas des GIFS statiques. L impact sur les filigranes, les signatures et autres caractéristiques de sécurité cryptographiques peut être négatif. Il est difficile de contrôler si la conversion a été effectuée correctement. Le concept d émulation, qui est présenté avec la migration dans la Figure 5, contourne certains de ces désavantages. 62

63 Figure 5: Schéma de comparaison des concepts de migration, d émulation et Universal Virtual Computer. La migration se caractérise par une accumulation d erreurs, alors que l émulation doit préserver la présentation et les fonctions. Universal Virtual Computer essaie surtout de rendre l émulation moins compliquée et plus prévisible. 5.5 Emulation L émulation poursuit un autre but que la migration, si bien qu une décision en faveur exclusivement de l une ou de l autre de ces deux méthodes ne sera vraisemblablement jamais prise. La procédure choisie par la Bibliothèque Royale de La Haye en est un exemple: dans le cadre de sa mission, cette bibliothèque doit veiller à ce que l état original des contenus mémorisés reste utilisable en utilisant l émulation. Parallèlement, elle estime qu une migration vers les formats actuels est nécessaire afin que les contenus puissent être fournis dans les formats actuels à des fins d utilisation ultérieure (Oltmans 2004). Alors que la migration porte sur la modification des différents fichiers, l émulation se préoccupe toujours de technologies. Il s agit de préserver le comportement et la présentation des documents lorsqu un objet est créé («Look and feel»). Cela présuppose que les éléments nécessaires à l utilisation restent disponibles. Il existe plusieurs moyens de parvenir à ce but. On peut, d une part, tirer profit du fait que chaque programme informatique qui a été écrit dans un langage de programmation courant doit tout d abord effectuer une traduction dans son propre langage machine. Le compilateur, qui se charge de cette traduction, change avec les générations de matériel informatique. Pour pouvoir continuer à utiliser d anciens programmes, il faut donc disposer d un 63

64 compilateur qui a été spécialement écrit pour traduire dans le langage machine du nouveau matériel informatique ces anciens programmes écrits avec un langage de programmation donné (portage par traduction (Borghoff, Rödig et al. 2003)). Après la traduction, on peut parfaitement continuer à utiliser ces programmes. L autre méthode est l émulation au sens strict. L émulation consiste à développer des programmes (émulateurs) que l on fait tourner pendant que les logiciels obsolètes sont utilisés. Ces programmes interprètent au fur et à mesure les commandes de l ancienne plate-forme et les traduisent en instructions pour la nouvelle. Cela montre déjà que la nouvelle plate-forme doit être plus puissante que l ancienne car, sinon, l émulation ralentirait trop fortement les opérations. Lorsque l objectif visé consiste à reproduire le comportement et la présentation d origine : l émulation peut alors émuler soit l ensemble de l environnement composé du matériel, du système d exploitation et des logiciels d application, soit uniquement le matériel et le système d exploitation. L émulation du matériel est la variante privilégiée car la diversité est beaucoup moins forte si l on doit seulement prendre en compte le matériel que si le matériel et les logiciels sont combinés. Le fait que le matériel soit plus facile à décrire est également important. Parfois, certains nouveaux composants matériels sont même émulés durant leur développement à des fins de test (Borghoff, Rödig et al. 2003). L inconvénient de cette approche réside dans le fait que l environnement doit aussi être archivé pour chaque objet, afin que cet environnement puisse être représenté et utilisé (programme d application et système d exploitation). L environnement requis doit être, pour le moins, clairement identifié sous une forme appropriée auprès de l objet. On considère que l émulation présente les avantages suivants: 64 Il n est pas nécessaire de traiter individuellement tous les objets qui sont formatés de la même manière : il suffit d intervenir sur les différentes configurations matérielles. Toutes les variantes d une génération de matériel ne sont même pas nécessaires, étant donné qu une certaine marge de manœuvre existait déjà lors de la publication de la spécification. Du point de vue des coûts, l émulation devrait l emporter sur la migration lorsque l opération porte sur de grandes quantités d objets de même type. Pour les objets, une conservation au niveau des bits, avec rafraîchissement et changement des supports, est suffisante. La fonction et la présentation des objets sont conservées. Désavantages (voir entre autres (Borghoff, Rödig et al. 2003)): On sait par expérience que certains cas typiques d émulation ont réussi 46, mais on n a pas encore la preuve que cette méthode constitue globalement une approche solide pour l archivage. La poursuite de l utilisation ou la réutilisation ultérieure de logiciels sous licence soulève des questions de droit d auteur, tout comme la «reconstruction» de matériel informatique sous la forme d émulateurs. 46 CAMiLEON (Creative Archiving at Michigan & Leeds: Emulating the Old on the New): et Borghoff, Uwe M., Rödig, Peter, et al. (2003). Langzeitarchivierung - Methoden zur Erhaltung digitaler Dokumente. Heidelberg, dpunkt.verlag., S. 254ff

65 La conservation de la présentation «Look and feel» devrait être exagérée pour de nombreux objets. Pour des raisons de coûts, l émulation devrait donc être utilisée de manière ciblée ou avec des simplifications lorsque les exigences sont moindres. A ce sujet, il est intéressant de jeter un oeil sur la couche d utilisateurs, qui ne présente guère de différences (Hedstrom and Lampe 2001). L exigence de conservation de la fonction et de la présentation présuppose implicitement que l on continuera encore longtemps à utiliser un clavier et une souris pour travailler à l ordinateur. Cela devrait être le cas pendant un certain temps, mais rien n est sûr. Si un changement technologique fondamental se produisait, il faudrait alors, normalement, utiliser les copies issues d une migration. Le projet de sauvetage d un produit BBC («BBC-Domesday Book») dans le cadre du projet CAMiLEON 46 a montré que l opération aurait demandé beaucoup moins de travail si elle avait été entreprise quelques années plus tôt, ce qui indique que l émulation nécessite, elle aussi, que l on dispose d informations complètes sur ce à quoi on a à faire. La migration et l émulation se valent du point de vue du résultat. Mais il convient de comparer brièvement les coûts auxquels il faut s attendre. Selon une estimation encore grossière mais plausible, le coût de l émulation pour une courte période de temps (selon le nombre d objets par ex. dix ans) et pour un nombre donné d objets serait supérieure à celui de la migration du fait que l élaboration d outils ad hoc est très onéreuse (Oltmans 2004). Sur des périodes de temps plus longues, l émulation est cependant toujours moins chère lorsque l on se trouve dans une situation idéale, c est-à-dire proche du modèle, car la migration doit être périodiquement réitérée. Lorsque le nombre d objets à traiter dépasse une certaine limite, l émulation peut alors être d emblée la méthode la plus avantageuse. Mais il faut expressément signaler que, dans le cas de la migration, les effets d échelle qui permettent de réduire les coûts, ont été négligés et que, en dehors du nombre d objets, la quantité des données devrait aussi jouer un rôle. Il convient de signaler que les tarifs des prestataires de service pour le stockage des données sont normalement fixés en fonction du volume de données (voir ). Différentes méthodes devraient permettre de réduire le volume de travail qu exigerait l émulation de chaque ancienne plate-forme sur chaque nouvelle. Pour simplifier l opération, on utilise, entre autres, des machines virtuelles qui sont définies comme adaptateurs. Ces machines sont conçues de manière à pouvoir être facilement définies et émulées sur n importe quelle plate-forme. Dans la pratique, chaque ancienne plate-forme n est alors émulée qu une seule fois sur la machine virtuelle, et c est ensuite cette seule machine virtuelle qui est émulée sur chaque nouvelle plate-forme. Ce concept change lorsque l approche Universal Virtual Computer (UVC) est utilisée pour l archivage à long terme. 5.6 Universal Virtual Computer (UVC) Cette approche a la prétention d éviter certaines faiblesses de la migration et de l émulation (Lorie 2001; Lorie 2002). En ce qui concerne l émulation, le fait conserver et de maintenir en état de fonctionner des logiciels d application complexes alors que seul le contenu de certains objets doit être visualisable dans la plupart des cas, est souvent considéré comme exagéré. Par ailleurs, le fait que l on ne puisse plus vérifier si l émulation d un matériel 65

66 informatique disparu est correcte par rapport au matériel en question pose aussi problème. L approche UVC a pour point de départ la séparation entre l archivage du comportement des programmes et l archivage de documents : c est l UVC qui fait le lien. Ce dernier doit être clairement défini, intelligible sur le long terme et relativement facile à mettre en oeuvre, sa «construction» ne devant pas être physique. Le concept se présente comme suit pour l archivage orienté données : Au moment de l archivage, un programme permettant d obtenir une «vue logique» (Borghoff, Rödig et al. 2003) des objets à archiver est écrit pour l UVC, ce dernier étant défini en profondeur. Le programme peut déjà être testé à ce moment-là. Au moment de l utilisation depuis l archive, seul l UVC est émulé dans un environnement moderne. Le programme écrit à l origine tourne sur cet UVC et fournit la vue logique. Cette dernière est alors interprétée par un programme de restauration (visualiseur) de manière à obtenir une présentation utilisable. La vue logique est un aspect du concept qui n est pas facile à comprendre. Elle vise à permettre une interprétation ultérieure grâce à la représentation de la structure de l objet : les informations indiquant quels sont les éléments contenus dans l objet, où ils commencent et où ils se terminent doivent figurer dans un programme, dont la fonction est de veiller à ce que la représentation soit ultérieurement correcte. Ce programme est nécessaire car, s il n existait pas, on ne trouverait qu une suite de bits qui n aurait en elle-même aucun sens. Un modèle logique du document, similaire à une description XML par sa structure, est proposé. Il existe déjà des exemples pratiques d archivage orienté données (Wijngaarden and Oltmans 2004). Par contre, l archivage orienté comportement des programmes rencontre encore des problèmes fondamentaux dans la mesure où il faut tenir compte des fonctions de saisie et de sortie. On estime que l approche UVC présente les avantages suivants (selon (Borghoff, Rödig et al. 2003)): Il n y a pas émulation d une machine réelle, ce qui diminue ou supprime les problèmes techniques et de droits d auteur. Il n y a pas obligation de s accorder sur des standards pour les formats, mais uniquement sur certaines conventions concernant l utilisation de l UVC. Seul l UVC doit être réécrit pour de nouveaux matériels, pas les informations archivées. Etant donné que l UVC se présente de manière très générale et très simple, son concept devrait avoir un long avenir devant lui. Les questions qui ne sont pas encore résolues concernent, entre autres, le choix des caractères à utiliser et l élargissement des possibilités pour la structure logique. 5.7 Capsules temporelles et viewpaths Il ne s agit pas forcément ici de concepts indépendants, mais de constructions subsidiaires qui sont importantes pour toutes les solutions envisagées et peuvent aussi, dans une 66

67 certaine mesure, être reconnues dans les packages d informations du modèle de référence OAIS (voir ). Les capsules temporelles ont pour objectif principal d encapsuler les objets numériques avec tout ce qu il faut pour les représenter ou les utiliser dans le futur, ce qui, théoriquement, inclut aussi des programmes, des systèmes d exploitation ainsi que les spécifications du matériel informatique compatible. Pour des raisons pratiques, on se limite à la documentation qui renvoie à ces composants ou on se contente d attribuer un grand nombre d objets à une «capsule», qui contient tout ce dont on a besoin pour ce type d objets. Pour que ces capsules puissent être utilisées, il faut définir avec précision les informations qui doivent être disponibles sous une forme facilement lisible en dehors de la capsule (Rothenberg 1999). Dans l idéal, cet encapsulage doit éviter les migrations multiples. Naturellement, certaines mesures comme le rafraîchissement restent nécessaires. Une émulation est alors requise pour l utilisation des contenus. Ce qui pose problème, c est surtout le fait que l on ne puisse pas vérifier si le processus de conservation a fonctionné avant la première utilisation. La notion de capsule n est pas forcément incompatible avec la séparation des données et des programmes requise pour faciliter la conservation. Cette exigence intervient à un niveau plus profond et se réfère déjà au mode de fonctionnement et à la structure des programmes de traitement des données, où les données doivent être accessibles. Les Viewpaths désignent par contre un concept qui appartient au domaine de la «surveillance technique». Un Viewpath est une combinaison de logiciels, de systèmes d exploitation et d autres composants (pilotes, enregistrements, etc.). Cette combinaison est requise pour l affichage et l utilisation d un certain type de fichier. Selon l importance du type de fichier en question, il est possible, par exemple, de stipuler que deux voies de présentation distinctes et complètes doivent être en permanence à disposition et en état de fonctionner. Dès que le système de surveillance du développement technique indique qu une de ces deux voies est menacée, des mesures permettant d ouvrir une nouvelle voie, par exemple à l aide de la migration ou de l émulation, doivent être recherchées. 5.8 Documentation, répertoires et référentiel Les difficultés découlant des changements de technologies et des modifications plus subtiles apportées aux versions des programmes et aux standards ont déjà été évoquées à plusieurs reprises (3.2.2). Une mission essentielle de l archivage à long terme mission qui est en même temps une importante méthode, se dessine ici : il faut évaluer à quel stade de son cycle de vie ou de son cycle de produits chaque élément important se trouve. La «veille technologique» consiste à suivre l évolution des formats, des logiciels et du matériel informatique et à planifier à l avance et en temps utile certaines mesures comme les changements de supports, de formats, de logiciels et de matériel Répertoires des formats (Format Registries) Pour disposer d instruments ad hoc, différents établissements ont mis en place des registres, qui se concentrent sur les formats de fichiers, leurs interdépendances avec les logiciels et le matériel informatique ainsi que leurs relations avec d autres formats. 67

68 Les principaux exemples de tels répertoires sont le répertoire PRONOM 47 des Archives britanniques nationales et le Global Format Registry de la Digital Library Federation. Des travaux préliminaires et un test existent pour ce dernier (FRED 48 ). L objectif à long terme est double. Il s agit, premièrement, de publier, en s appuyant sur les informations saisies, des avertissements concernant les formats ou les combinaisons formats-logiciels qui requièrent une action. Cela peut être le cas quand un éditeur de logiciels annonce qu il va arrêter de fournir des services d assistance pour un programme. Deuxièmement, les répertoires doivent également permettre, au stade final de leur développement, d apporter des solutions concrètes à de tels problèmes et de faire des recommandations : Quels sont les formats que l on peut convertir et dans quels nouveaux formats? Quels sont les logiciels qui permettent d effectuer ces conversions? Est-ce que des informations seront perdues? Lesquelles? Si l on disposait de ces informations, on pourrait non seulement trouver des solutions techniques pour une situation initiale définie, mais aussi évaluer leurs effets (Abrams and Seaman 2003). Citons comme exemple de répertoire orienté fonds les Digital Formats for Library of Congress Collections 49. Le Preservation Manager, qui a été développé par la Bibliothèque Royale de La Haye pour son edepot 50 ainsi que d autres activités du nouveau Digital Curation Centre en Grande- Bretagne sont apparentés aux Digital Formats for Library of Congress Collections. Le projet JHOVE 51 de JSTOR et de l Université de Harvard est important pour l identification et la validation de formats. Les registres de formats de fichiers ont pour fonction de soutenir les mesures ci-après et leur automatisation : création de fichiers, enregistrement de ces fichiers dans une archive, conservation à long terme des fichiers archivés et accès à ces derniers. Pour ce faire, ils doivent répertorier toutes les informations nécessaires à la visualisation et à l utilisation des fichiers concernés : format des fichiers, logiciels requis, systèmes d exploitation, matériel informatique, supports de stockage, etc. La granularité de nombreux formats pose ici problème. Le format «TIFF», par exemple, existe aujourd hui en quatre versions dotées de diverses extensions, si bien que l on peut considérer qu il existe au moins 10 à 15 versions. Cela pose la question de la délimitation des versions : Quels sont les modes de compression du format TIFF qui donnent naissance à une nouvelle version? Quels sont les modes de compression qui n entraînent pas de changement de version? Il est également important d indiquer les relations qui existent avec d autres formats auxquels on doit recourir. C est ainsi que SVG (Scalable Vector Graphics) est mentionné sur XML, car c est sous cette forme que XLM a été codée. Les programmes utilisés pour ouvrir et convertir un format doivent également être indiqués avec le format. Aujourd hui, on sait seulement si un certain type de conversion entraîne une perte d informations. Dans l avenir, il devrait cependant être aussi possible d indiquer la nature et l étendue des effets secondaires pour une voie de conversion donnée. Ces effets secondaires doivent être déduits à partir de tests. 47 PRONOM The file format registry: 48 Format REgistry Demonstrator: 49 Digital Formats for Library of Congress Collections: 50 edepot, Koninklijke Bibliotheek, Den Haag: (Zugriff ) 51 JHOVE - JSTOR/Harvard Object Validation Environment: 68

69 Les différents niveaux d ouverture des formats font que les informations sont plus difficiles à obtenir : pour les formats propriétaires, les informations peuvent/doivent parfois être acquises moyennant finance; d autres fois, il faut recourir à l ingénierie inverse et faire appel à des tiers pour cette opération (ce qui pose un problème de fiabilité). D autres informations sont dans le domaine public, mais protégées par le droit d auteur et peuvent, en conséquence, être retirées à tout moment. Seule une faible partie des informations appartient véritablement au domaine public et ne peut pas être retirée. Les autres sources d information sont, surtout pour les anciens formats, les personnes qui ont participé au développement, d autres sortes de répertoires, les musées dédiés au matériel informatique et aux logiciels ainsi que des particuliers passionnés par ces questions. Actuellement, le projet PRONOM, par exemple, se concentre sur les produits commerciaux aujourd hui largement répandus. A l avenir, les formats Open Source devraient également être inclus et une «archéologie des formats» devrait être mise en place pour les formats qui ne sont plus utilisés Référentiels de logiciels Il a été proposé d étendre le champ d investigation aux référentiels de logiciels (voir (Hedstrom, Ross et al. 2003), S.V), qui doivent rassembler, conserver et mettre à disposition les logiciels que l on ne peut plus acheter ou se procurer sous licence. Il s agit essentiellement de préserver la disponibilité des logiciels afin de pouvoir les utiliser pour émuler ou sauver des données mémorisées dans des formats obsolètes. La collecte et la conservation de logiciels devraient exiger un important travail de recherche en raison des nombreux composants propriétaires et aussi de la complexité des interdépendances entre formats, logiciels, systèmes d exploitation et matériel informatique. 69

70 6. Besoins des bibliothèques: résultats d un sondage En août 2004, un vaste questionnaire a été envoyé par le Bureau central à 20 personnes dans les grandes bibliothèques et grands services de coordination des bibliothèques des hautes écoles universitaires de Suisse et des instituts de recherche du domaine EPF. Les questions posées concernaient principalement l accès et l archivage à long terme de périodiques électroniques et imprimés. D autres sujets étroitement liés à ces questions ont également été discutés, notamment les modèles de licence e-only et la mise en place de serveurs de documents institutionnels comme éléments de soutien à l Open Access. Le questionnaire figure dans l annexe I (chapitre 12) avec les réponses et des commentaires détaillés. Voici en bref les résultats de ce sondage. 6.1 Résumé Les résultats du sondage sont marqués par les orientations très diverses des différents établissements et de leurs bibliothèques. Les matières enseignées, mais aussi la taille des établissements et les autorités responsables jouent un rôle important. Des différences fondamentales entre les bibliothèques de Suisse romande et les bibliothèques de Suisse alémanique n ont pas été observées. On notera seulement que, pour la question des serveurs de documents, les Suisses romands ont, à diverses reprises, fait référence au serveur commun du RERO, qui n a pas d équivalent pour les bibliothèques de l IDS. Les réponses au questionnaire du sondage ont fait clairement ressortir les nombreuses corrélations qui existent entre, d une part, les travaux passés et futurs du Bureau central et des bibliothèques et, d autre part, les objectifs de l archivage électronique et ses perspectives. Alors que les attentes et les besoins en matière de modèles de licence e-only sont très divers, tout le monde s accorde à penser que les incertitudes actuelles qui entourent l accès à long terme et la fiabilité de l archivage à long terme empêchent de passer à des modèles purement électroniques. En dépit des différences liées aux matières enseignées, les réponses confirment clairement l importance élevée que revêt, pour l utilisation, la mise à disposition en ligne des périodiques. Les appréciations sont plus différenciées en ce qui concerne le rôle des éditions imprimées pour l usage courant, les personnes sondées faisant davantage référence aux différences qui existent entre les disciplines STM (Science Technology Medicine) et les autres. L importance des exemplaires imprimés pour l archivage est incontestée: on continue de penser qu il est important de conserver et garder à disposition un exemplaire des périodiques imprimés en Suisse. Cela correspond à l attitude de presque toutes les bibliothèques (18 sur 20), qui déclarent conserver sur le long terme leurs propres périodiques imprimés. 70

71 En ce qui concerne l accès à long terme, la plupart des bibliothèques estiment qu il est important de conserver la convivialité et la gamme de fonctions habituelles pour la mise à disposition à long terme des contenus. Un accès aux articles via le catalogue est diversement apprécié, la tendance étant plutôt au refus. En ce qui concerne le projet d archivage électronique et un hébergement local, plus de la moitié des bibliothèques indiquent vouloir utiliser ultérieurement les contenus qui se trouvent sur les serveurs des hautes écoles suisses. Un tiers des bibliothèques seraient prêtes à participer à de telles actions en mettant des moyens à disposition, tout en réalisant que ces questions sont, d une manière générale, délicates : on sait vraiment peu de choses sur ce que cela représenterait comme travail et, au final, ce sont des questions auxquelles les directions des différentes bibliothèques doivent répondre. Pratiquement toutes les bibliothèques consultées déclarent être conscientes du problème posé par l archivage électronique et les possibles scénarios de mise en application sont tous approuvés par une claire majorité. Cela concerne en particulier le rôle des bibliothèques universitaires, qui doivent se pencher sur la question de l archivage au niveau national. Les bibliothèques restent à cet égard ouvertes vis-à-vis d autres partenaires, une délégation complète de cette mission à des tiers étant cependant clairement rejetée. En ce qui concerne la question de l Open Access, on remarque que certaines bibliothèques s attaquent seules à cette question, qui ne suscite pas vraiment beaucoup d intérêt dans de nombreuses hautes écoles. Il faut agir localement à ce sujet pour relier les activités des bibliothèques avec celles des scientifiques. L engagement des directions des hautes écoles et des départements est aussi indispensable, car l expérience a montré que les scientifiques n on souvent pas un lien étroit avec le domaine des bibliothèques. Il suffit de voir le nombre de documents qui sont hébergés dans les serveurs de documents pour comprendre que cela a un impact direct. Ce nombre souffre du fait que l acquisition de documents pour les serveurs se fait rarement de manière active. La fréquente utilisation de fichiers PDF comme format standard sur les serveurs de documents souligne l importance de ce format, d autant plus que, dans la majorité des cas, il est prévu d archiver tous les documents mémorisés dans le serveur concerné. La moitié des bibliothèques consultées sont intéressées par un accès commun aux métadonnées. L archivage des documents qui n entrent pas dans le mandat donné par la Bibliothèque nationale est également souhaité (travaux qui se situent en dessous du niveau de la thèse, etc.). Une grande partie des bibliothèques sont prêtes à participer à l élaboration de standards. En ce qui concerne les projets de numérisation, ils portaient surtout, jusqu à présent, sur les impressions/manuscrits ainsi que sur le matériel iconographique anciens. La mise à disposition en ligne de périodiques n est cependant souhaitée que par une seule bibliothèque pour ses documents patrimoniaux. Les interdictions de désabonnement dans les conventions de licence sont un point critique. Elles réduisent la marge de manœuvre des bibliothèques pour le développement de leurs fonds, si bien que de nombreuses hautes écoles ne les respectent pas en douce, ce qui, d après les contrats, entraîne des pénalités importantes. Dans ce contexte, et si l on considère le travail passé et futur du Bureau central, il est décevant de voir que, aujourd hui encore, les bibliothèques centrales ne reçoivent souvent pas automatiquement de la part des 71

72 bibliothèques décentralisées de leurs hautes écoles des informations sur leurs fonds. Et il faut encore moins envisager qu elles puissent, à un niveau centralisé, disposer de moyens financiers pour les périodiques et prendre des décisions quant à l évolution de leurs fonds. Des problèmes importants sont imputables rien qu à ces informations manquantes. Exceptionnellement, il peut arriver que des erreurs dans les listes d abonnements d un éditeur peu coopératif soient difficiles à prouver à cause de ces problèmes. 72

73 7. Questions stratégiques pour les bibliothèques universitaires L octroi d un accès durable à certains contenus numériques et à leur archivage à long terme soulève une foule de questions dans toutes sortes de domaines, notamment organisationnel, technique, juridique et économique. Mais ces questions ne doivent pas empêcher d aborder correctement d autres questions plus fondamentales, la recherche ciblée de solutions et l heureux aboutissement de ces efforts étant conditionnés par les réponses à ces questions. Même si, dans le détail, des questions nouvelles surgissent et si d autres évoluent, l objectif premier, qui consiste à fournir avec fiabilité des informations scientifiques exhaustives et de haut niveau aux bibliothèques, reste valable. Les bibliothèques ne considèrent pas que la fourniture de ce service est une fin en soi. Il s agit plutôt d aider les membres des hautes écoles et des institutions dans leur travail. Dans le domaine de la recherche scientifique proprement dite, on peut même aller jusqu à affirmer qu une recherche sérieuse n est pas possible si on ne dispose pas d une littérature appropriée. Le mouvement Open Access montre que certains scientifiques sont conscients de ces corrélations. Mais il s agit d une minorité. L idée qu ils se font de la fonction des bibliothèques universitaires en ce début de XXIe siècle est parfois marquée par des conceptions totalement dépassées: pour eux, une bibliothèque est avant tout un lieu où on entrepose des livres. Suite au développement d offres purement électroniques par les bibliothèques, de nombreux trop nombreux scientifiques ont eu le sentiment de ne pas avoir besoin de bibliothèque, alors qu ils utilisent intensément l offre des bibliothèques depuis leur ordinateur. Et, de manière tout à fait compréhensible, cela ne les intéresse pas, car ils ne doivent pas en supporter les coûts. Et même s ils prenaient conscience de l existence de ce service, ils ne se rendraient pas compte du fait que les supports physiques font l objet d une demande très forte, et même parfois de plus en plus forte, de la part des étudiants, mais pas seulement. La coexistence entre les intérêts des étudiants et ceux des scientifiques, qui ne sont pas les mêmes, affaiblit d une certaine manière la position des bibliothèques, qui doivent répondre à tous, sans que chaque communauté ait conscience du service fourni à l autre et l apprécie. De plus, de manière absurde, toutes les insuffisances qui sont indiscutablement imputables aux éditeurs sont attribuées aux bibliothèques. Il est vraiment très important que les bibliothèques soient conscientes de cette attitude fondamentale des éditeurs pour que leurs attentes vis-à-vis de partenaires potentiels soient réalistes. Les bibliothèques vont devoir trouver leur place ou redéfinir leur place dans un secteur de l information et des publications qui a changé (Barth and Lüthi 2004). Techniquement, on peut imaginer des modèles où les bibliothèques seraient, d une certaine manière, pratiquement exclues du processus d information scientifique. Mais cela aurait pour conséquence que certaines prestations ne seraient plus fournies et ne seraient plus à la disposition des scientifiques. Dans les modèles Open Access actuels, l hypothèse selon laquelle les scientifiques assumeraient eux-mêmes une part importante du processus de publication et de communication, est plus ou moins explicite. C est surtout le cas des modèles qui prévoient une véritable production en libre accès des périodiques. En raison du surcroît de travail que cela entraînerait pour les scientifiques, ceux-ci devraient être peu 73

74 enclins à participer à certaines activités qui seraient souhaitables. En même temps, on ne peut guère demander aux scientifiques de consacrer une partie notable de leur temps à des travaux qui pourraient être ensuite proposés à d autres sous forme de services à valeur ajoutée à caractère non scientifique, à savoir par les bibliothèques. Cela ne serait pas justifiable. Les bibliothèques performantes et actives peuvent parfaitement bien proposer leurs services pour d autres travaux dans le domaine de la mise à disposition d informations scientifiques. Mais, dans la compétition qui oppose, les différents modèles et établissements, elles ne peuvent plus s attendre à être automatiquement le premier point de contact pour ce qui est des informations et de leur diffusion. 7.1 Le rôle futur des bibliothèques universitaires Jusqu à présent, les bibliothèques universitaires suisses ont non seulement assumé leur rôle traditionnel, mais elles se sont aussi imposées avec succès comme plaque tournante de la mise à disposition d informations scientifiques sous forme électronique (périodiques et bases de données). Cela semble logique, en particulier pour les périodiques, étant donné que les éditions électroniques ont tout d abord été proposées en plus des abonnements aux éditions imprimées des même titres et pas comme une offre indépendante. Cependant, cette relation étroite entre éditions imprimées et éditions électroniques s affaiblit lentement comme le montre le débat sur les modèles de référence e-only. Malgré quelques réserves, il existe plusieurs exemples de licences purement électroniques (voir par ex. (Goodman 2002) encore les licences de l Office national de la planification et de la coordination nationale (BIBSAM) 52 auprès de la Bibliothèque Royale en Suède. Les incertitudes qui pèsent sur l accès et l archivage à long terme forment un contexte important pour le retrait purement électronique. Ces incertitudes freinent le changement de la forme de prêt et le passage au e-only (voir 0). Mais, sur un autre plan, elles ont aussi pénalisé la confiance dans les documents qui sont uniquement publiés sous forme électronique, ce qui a empêché les publications purement électroniques d être largement acceptées, aussi bien par les auteurs que par les bibliothèques et les utilisateurs (voir aussi (Keller 2001), p. 63ss). En dehors de cette séparation formelle, il faut aussi s attendre à ce que les périodiques imprimés et les périodiques électroniques s écartent de plus en plus les uns des autres au niveau du contenu. La fourniture de matériel supplémentaire avec les articles n est pas encore entrée dans les mœurs comme on peut l observer. Une telle pratique n a cependant plus rien de bizarre. Nous allons essayer ci-après d aborder différentes questions qui revêtent une importance stratégique pour les bibliothèques universitaires durant cette phase de bouleversement et au-delà. Pour ce faire, les différents sujets ont une fois de plus été fractionnés. Ce fractionnement ne doit pas masquer le fait qu il manque à la plupart des bibliothèques une idée globale, voire même un concept homogène quant à la manière dont leurs services doivent évoluer dans l avenir. 52 BIBSAM - the Royal Library s Department for National Co-ordination and Development: 74

75 Si les bibliothèques ne parviennent pas à développer de tels concepts, alors elles n auront plus qu une seule solution: réagir aux conditions cadres que les éditeurs, les fournisseurs et les organismes qui les financent auront mis en place. Leur capacité de réaction vis-à-vis des attentes de leurs clients en sera réduite. L élaboration de concepts ne peut, à elle seule, garantir qu il en sera autrement, mais ces concepts peuvent permettre de savoir quels sont les objectifs qui doivent être atteints et où en est une bibliothèque Donner accès aux informations Dans tous les domaines où il est avant tout question de mise à disposition électronique de contenus récents, les bibliothèques doivent s attendre à ce que la concurrence augmente entre les fournisseurs de ces contenus, notamment entre les éditeurs eux-mêmes. Il existe déjà depuis longtemps des techniques qui permettent de bloquer certaines utilisation («Pay per view», commande d articles individuels). Etant donné que, dans le cadre d une offre en ligne, il devient toujours plus difficile de se rendre compte de l importance du rôle joué par les bibliothèques au niveau de la mise à disposition, ce rôle est remis en question. Pour les utilisateurs candides qui se procurent facilement les contenus désirés depuis leur poste de travail via Internet, le rôle joué par la bibliothèque locale au niveau des contenus qui arrivent via le Web n apparaît pas de manière intuitive, en dépit des logos qui sont incrustés. Le travail de sélection et d acquisition de contenus, voire d élaboration d un accès intellectuel grâce à une saisie complète des informations sur les catalogues n est souvent pas perçu en tant que tel et largement sous-évalué. Moins les bibliothèques posséderont de contenus physiques et donc, d une certaine manière, exclusifs, moins leur rôle sera clair pour les personnes qui n utilisent pas elles-mêmes intensivement leurs services (Keller, Reich et al. 2003). Nous partons du principe que les bibliothèques universitaires suisses non seulement continueront à jouer leur rôle de prestataire de services essentiel pour la communication d informations au sein des organismes qui les financent, mais aussi qu elles s attacheront à développer ce rôle en fonction des besoins. Ce développement ne reposera plus seulement sur les collections en possession des différentes bibliothèques. Les bibliothèques n ont pas d autre alternative si elles veulent conserver ou augmenter la valeur ajoutée de leurs services par rapport à d autres fournisseurs potentiels. Cette démarche n est pas une fin en soi mais est dans l intérêt des utilisateurs directement concernés et des hautes écoles. Sans cette décision consciente de faire évoluer les services, des réflexions plus poussées n auraient plus de fondement Fonction de mémoire En dehors de leur fonction de fournisseur d informations, les bibliothèques ont une deuxième mission qui consiste à être la mémoire de l information et du savoir, plus précisément du savoir sous une forme codifiée. C est grâce à cette fonction que la publication sous forme d articles scientifiques a acquis son importance actuelle: si on n avait pas la certitude de pouvoir, grâce aux collections des bibliothèques, prouver et contrôler même des années après, ce qui a été publié, une base importante aurait manqué aux publications scientifiques traditionnelles. 75

76 Ce mécanisme n est pas lié à la publication sous forme imprimée. Cette forme de publication a simplement permis aux bibliothèques de s acquitter de leur mission de mémoire jusqu à présent. Grâce au mode de publication électronique, l accessibilité aux contenus s est fortement améliorée, ce qui, paradoxalement, a rendu plus difficile la mission de fournisseur d informations des bibliothèques en créant une distance avec les utilisateurs. Jusqu à présent, les bibliothèques universitaires n ont pratiquement pas fait office de mémoire pour les informations électroniques étant donné que, en règle générale, elles ne disposent pas physiquement des contenus dont elles ont fait l acquisition. Les bibliothèques universitaires vont donc devoir décider si elles veulent ou non devenir aussi la mémoire des contenus électroniques, ou seulement partiellement, par ex, comme fournisseur de l accès à long terme, mais par de l archivage à long terme. Mais cette responsabilité ne signifie pas forcément qu elles doivent résoudre elles-mêmes les aspects techniques. Il s agit plutôt pour elles de se convaincre et de convaincre les utilisateurs et les organismes qui les financent que des solutions fiables existent. Comme le montre le sondage, les bibliothèques universitaires sont prêtes à le faire, même si, dans certains cas particuliers, un archivage à long terme proprement dit n est pas l objectif. C est pourquoi il est conseillé, dans de nombreux cas, de discuter avec les organismes chargés du financement pour préciser la mission des bibliothèques en ce qui concerne les collections Open Access et services de publication Le projet d archivage électronique «e-archiving» se trouve à la croisée de plusieurs développements. En dehors des questions posées par l accès et l archivage à long terme de contenus commerciaux, Open Access est forcément un sujet qui interpelle. Les bibliothèques sont ici concernées soit en tant qu acteur, soit en tant que victime : si Open Access venait à gagner beaucoup de terrain comme modèle de publication, les licences et les abonnements payants ainsi que les périodiques imprimés pourraient voir leur importance diminuer. Cela est surtout valable si des produits autonomes en libre accès comme les périodiques avec peer-review et taxes d auteur venaient à s imposer. Mais cela serait beaucoup moins vrai si les auteurs poussaient les bibliothèques à archiver seulement les postimpressions de périodiques uniquement vendus sur abonnement. C est surtout dans la phase actuelle d expérimentation et de transition qu il faut s attendre à quelques convoitises en relation avec l introduction de taxes d auteur. Jusqu à présent, les bibliothèques ont acheté l accès aux informations pour leurs clientes et leurs clients via des abonnements et des licences, mais si cette manière de faire n était plus nécessaire dans un monde en libre accès idéal, la question suivante se poserait alors tôt ou tard dans les hautes écoles du point de vue des auteurs : Faut-il ou non envisager une nouvelle distribution des moyens financiers, depuis le financement des abonnements jusqu au financement d Open Access. Dans les administrations et les directions des hautes écoles, certains pensent déjà et c est désastreux qu Open Access doit surtout aider (les bibliothèques) à faire des économies. La plus grande implication des scientifiques au niveau de la rédaction est en particulier oubliée, même si, du point de vue financier, cela pourrait être synonyme de coûts importants pour les hautes écoles. Les bibliothèques pourraient ici être très utiles en regroupant les services et en déchargeant les scientifiques de ce travail. 76

77 Même s il existe des doutes quant à la solidité du modèle Open Access et que ces doutes doivent être pris au sérieux, les efforts déployés en faveur du libre accès aux publications scientifiques ont acquis une formidable dynamique, comme le prouvent les articles sur le libre accès que l on trouve même parfois dans la presse quotidienne (voir par ex. (Lindinger 2004)). La position des bibliothèques universitaires n est pas claire de prime abord: on peut tout à fait imaginer qu Open Access ne soit pour les bibliothèques qu un moyen opportun de décharger le budget très tendu des périodiques, et que les bibliothèques s en remettent à l engagement des auteurs. Ces derniers chercheront alors dans leurs établissements ou départements d autres partenaires qui proposent de tels services ou souhaitent créer et gérer des infrastructures correspondantes. Open Access contribuerait alors à l éparpillement des ressources dans les hautes écoles. Un affaiblissement et une baisse de qualité seraient alors inévitables, ce qui va à l encontre de l objectif déclaré. Et cela ne serait pas sans conséquences pour les bibliothèques. L autre possibilité qui s offre aux bibliothèques consiste à se profiler plus fortement qu avant comme des pionniers de l accès libre (Halle 2003; Barth and Lüthi 2004) et à accompagner les documents tout au long de leur cycle de vie, depuis leur création et leur publication jusqu à leur archivage, en passant par la mise à disposition, mais aussi à exercer une influence sur ce processus. Une telle approche nécessite toutefois un soutien clair de la part de la haute école concernée. Contrairement à la bibliothèque, la direction a la possibilité d imposer des conditions et des obligations pour, par exemple, obliger les auteurs à publier des pré-impressions ou des postimpressions en libre accès sur le serveur de la bibliothèque concernée. D autres services de publication et bibliographiques pourraient alors, en principe, être proposés aux auteurs, si une telle chose était souhaitée. Mais ce rôle, les bibliothèques vont devoir aller le chercher il ne va pas tomber du ciel, notamment en acquérant les compétences nécessaires. Les bibliothèques universitaires vont devoir choisir entre se mettre entre les mains d Open Access dans leurs établissements ou bien répondre à l impulsion donnée par Open Access en étant actives et en proposant de nouveaux services dans le domaine de la publication électronique. Les options offertes par l accès libre sont expliquées en détail au point 0. L engagement en faveur de l accès libre n est pas sans risque, mais ce développement connaît déjà une dynamique telle qu il ne peut plus être ignoré. Les bibliothèques ont actuellement encore la possibilité de contribuer activement à façonner l Open Access et à exercer une influence sur la manière dont les publications scientifiques doivent évoluer Savoir-faire technique A long terme, des solutions techniques pour la préservation des données électroniques pourraient être fournies sans problème par d autres fournisseurs (voir chapitre ). Il existe des solutions commerciales qui répondent à divers objectifs bien délimités et, compte tenu de l augmentation des besoins, d autres fournisseurs et d autres produits adaptés aux besoins des bibliothèques universitaires et de leurs utilisateurs devraient arriver sur le marché (voir par ex ). A cela s ajoute le fait que l on devrait, par expérience, bien connaître ces besoins. 77

78 Il est éventuellement possible de faire ici un parallèle avec le développement des systèmes de bibliothèques intégrés: dans les années soixante-dix et quatre-vingt, certaines bibliothèques ont développé leurs propres systèmes en fonction de leurs besoins, certains de ces systèmes ayant atteint des performances et une durée de vie appréciables. Il a fallu attendre pour disposer de systèmes commerciaux qui ne se contentaient pas d exécuter les fonctions prévues par les développeurs, mais permettaient aussi une intégration complète de toutes les fonctions d une bibliothèque. Ces solutions impliquent toutefois des concessions qui, dans certains cas, ne leur permettent pas de satisfaire à toutes les exigences habituelles. Il est clair que ce sont les bibliothèques elles-mêmes qui connaissent le mieux leurs propres procédures et situation. Il faut s efforcer d intégrer les efforts d archivage déployés par les bibliothèques dans les activités des hautes écoles qui ont un rapport avec l archivage, en particulier les centres informatiques, les centres de médias et les services apparentés. Compte tenu de l ampleur du travail, les bibliothèques ne devraient pas prendre sur leur dos toutes les prestations techniques, et elles ne peuvent pas non plus se permettre de recréer ce qui a déjà été fait par d autres services internes ou externes à la haute école. En outre, les bibliothèques doivent pouvoir compter sur des installations de sauvegarde pour leurs propres serveurs. Les bibliothèques doivent clairement décider si elles veulent ou, pour dire les choses plus justement, dans quelle mesure elles veulent s en remettre à des partenaires (autres bibliothèques ou autres partenaires) pour les développements techniques ou bien si elles tiennent à ce que leurs propres expériences et besoins soient pris en compte dans les développements techniques et souhaitent ainsi se constituer un nouveau savoir-faire susceptible de renforcer leur position au sein de leur établissement. Les deux options ont leur prix Logiciels Open Source Les solutions Open Source suscitent un intérêt particulièrement élevé dans les hautes écoles. D après sa définition, Open Source implique que toute personne puisse voir le code source des programmes et, en principe, aussi modifier ces programmes 53. Mais la définition mentionne surtout que la licence concernée doit suffire et admet différentes variantes. Le logiciel est perfectionné avec la participation de toutes les personnes intéressées dans le monde entier, ce qui permet d identifier rapidement les erreurs. Malgré le succès légitime remporté par les logiciels Open Source (Linux 54, Open Office 55, Firefox 56, entre autres) et l enthousiasme des utilisateurs au bout de la chaîne, il convient de faire quelques remarques critiques. Il est exact qu un système d exploitation comme Linux, qui a des millions d utilisateurs potentiels et un adversaire intéressant comme Microsoft, a bénéficié d un important soutien. Mais il a fallu des années avant que ce système puisse aussi être utilisé de manière appropriée sur un PC par la communauté lambda des utilisateurs et il a fallu pour cela que 53 The Open Source Definition OSD: 54 Système d exploitation Linux: 55 Office Paket Open Office: 56 Navigateur Web Firefox: 78

79 des entreprises créent des offres packagées conviviales. Cela fait maintenant longtemps que Linux a entrepris de pénétrer dans les entreprises et les administrations 57. En ce qui concerne les applications requises pour les bibliothèques et l archivage électronique, il est en principe difficile d atteindre une masse critique de personnes intéressées. Les besoins sont certes urgents et en augmentation dans les trois domaines du projet, mais pas très élevés du point de vue quantitatif. Nous suivons par exemple avec beaucoup d intérêt le développement de DSpace, dont le MIT et Hewlett-Packard veulent faire un logiciel Open Source pour les serveurs de documents (dans la perspective assez vague d un archivage à long terme). Maintenant que la phase de démarrage est terminée, des tentatives sont faites depuis quelque temps pour créer, à partir des nombreuses personnes intéressées, une communauté d établissements et de personnes qui continueraient à développer ce logiciel. Au total, il n existe que quelques centaines de serveurs de documents qui utilisent un système Open Source connu (CDSware, DSpace, Eprints, MILESS/MyCoRe, voir chap ) ou autre, et beaucoup d entre eux ne peuvent pas participer au travail de développement proprement dit faute de personnel ou d autres ressources. Cependant, c est le domaine des serveurs de documents qui semble le plus propice à une solution Open Source qui répondrait aux besoins des hautes écoles ou pourrait être adaptée à ces besoins. Les éditeurs de logiciels qui intègrent des logiciels Open Source dans leurs produits doivent normalement indiquer qui se charge de corriger les éventuelles erreurs dans cette partie du logiciel. Faut-il attendre jusqu à ce que la communauté des développeurs soit prête à le faire? Et que se passe-t-il si le développement Open Source du produit s arrête? A-t-on en pareil cas la possibilité de recourir contre l éditeur? Ce moyen de pression fait défaut dans le cas d Open Source. Cependant, si le nombre des développeurs et des établissements participant est suffisamment élevé, il est très probable qu une solution sera trouvée à chaque problème. Mais si le nombre de partenaires est insuffisant, comme on peut s y attendre pour des applications plutôt spécialisées, cela devient incertain. Dans certaines circonstances, une participation intensive au développement d Open Source peut, dans l absolu, revenir beaucoup plus cher que l achat et l entretien de logiciels coûteux. Les partenaires intéressés devraient donc se demander combien de personnes ils peuvent mettre à disposition pendant une longue période de temps pour collaborer à de tels projets et ce que cela coûtera. Le projet KOPAL (KOPAL - Kooperativer Aufbau eines Langzeitarchivs digitaler Informationen) de la Deutsche Bibliothek, d IBM, de la Bibliothèque universitaire et d Etat de Göttingen (SUB) et de la Société pour le traitement des données scientifiques (Gesellschaft für wissenschaftliche Datenverarbeitung) de Göttingen, dont nous avons déjà parlé à plusieurs reprises, doit mettre ses résultats en libre accès pour qu ils puissent être utilisés par la suite. Mais c est, une fois de plus, le système DIAS, qui a été développé par la Bibliothèque Royale de La Haye en collaboration avec IBM et qui fait aujourd hui partie du catalogue IBM, qui se trouve au cœur de cette installation. Les personnes participant au projet «e-archiving» surveillent cette approche, et nous sommes intéressés par une 57 Communiqué de presse du : Aktuelle Studie der META Group zum Einsatz von Open Source Software in deutschen Unternehmen 2004: 79

80 collaboration. Mais il ne faut pas se faire d illusions: il est clair que le manque de partenaires potentiels pour le développement d Open Source devra au début être compensé par le travail des établissements participants et par un financement massif du projet ( 4 millions) 58. On ne sait donc pas à quoi pourrait ressembler l évolution future. On peut donc tout à fait s imaginer soutenir une évolution Open Source pour certains composants. Mais, jusqu à présent, on ne sait pas bien où il existe un potentiel et un intérêt pour ces travaux de développement dans les hautes écoles. Rappelons à ce sujet qu une solution qui serait développée dans un seul établissement par des collaborateurs motivés peut tout à fait bien remplir sa fonction sans être Open Source au sens strict. Cela présente des risques pour le développement à long terme Contrôle Dans quelle mesure une bibliothèque doit-elle garder le contrôle sur les contenus qu elle propose? Cette question est étroitement liée à la confiance dans les autres établissements et à l authenticité des contenus proposés par ces derniers. Dans le monde des publications électroniques, certaines questions se posent pour la première fois, du fait que la possibilité d utilisation des contenus est très largement désaccouplée de l emplacement de ces contenus, alors que le contrôle de l utilisation et la garantie d authenticité d un objet dependent beaucoup du lieu de sauvegarde ou de l installation qui se charge de la sauvegarde. Cela devient particulièrement manifeste quand des articles sont retirés sans commentaire par des éditeurs. Les critiques émises au sujet des pratiques de certains éditeurs en matière de retrait ont conduit les éditeurs à faire quelques corrections pour mieux s adapter aux besoins de la communauté scientifique (Plutchak 2003), qui souhaite que le discours scientifique soit entièrement reproduit. On considère que le comportement des éditeurs sur ce point reflète leur conception générale de l archivage et de la conservation, conception qui s écarte de celle des bibliothèques. En exagérant les choses, une sauvegarde sur site dans les bibliothèques aurait pour motivation: [ ] a Web page with a set of links (to publisher sites) is not a library, and a Web page with a set of obsolete, denied or expired links is nothing at all. (Keller, Reich et al. 2003). Les bibliothèques des hautes écoles doivent décider si elles veulent vraiment garder le contrôle sur tous les contenus qu elles ont acquis, c est-à-dire les garder en Suisse. Dans le sondage, les bibliothèques ont surtout refusé que chaque bibliothèque prenne individuellement la responsabilité de l archivage et de sa mise en oeuvre technique (voir 0) Coopération La collaboration entre bibliothèques n est pas nouvelle dans certains domaines, notamment quand il s agit de documenter conjointement des fonds de bibliothèques dans des catalogues collectifs. Une documentation commune est intéressante car, dans le cas idéal, les utilisateurs des établissements concernés bénéficient d un meilleur accès à des fonds de bibliothèques beaucoup plus vastes et les bibliothèques d un allègement du travail de 58 Le Ministère fédéral de l éducation et de la recherche (BMBF) soutient l archivage numérique à long terme avec une subvention de 4 millions d euros : 80

81 catalogage. Mais il ne faut pas oublier que, dans de nombreux cas, ce type de coopération ne peut se dérouler qu à la surface. Une coopération minimale pourrait même consister uniquement en une mise à disposition passive des informations sur les catalogues. Par contre, dans le cadre de coopérations approfondies, les partenaires peuvent fournir activement des prestations, par ex. via la gestion de serveurs pour tous les partenaires, etc. Une coopération intensive entre les bibliothèques universitaires au niveau opérationnel est souvent limitée à la région linguistique. Compte tenu de leur caractère national, les activités du Consortium dont il est ici question doivent donc faire face à des défis particuliers. Mais cela leur confère en revanche une importance qui pourrait leur permettre, en cas de réussite, d impulser d autres projets communs. Mais dès que la collaboration implique de toucher aux fonds des bibliothèques, la volonté de collaborer diminue fortement ou bien la collaboration devient vite très compliquée. Etant donné que, au final, tous les services reposent sur les fonds de bibliothèques quelle que soit leur forme, on comprendra que les bibliothèques aient du mal à accepter que leur liberté d organisation soit limitée à ce niveau-là. Et, en règle générale, c est de telles restrictions dont il sera question en cas de collaboration au niveau des fonds de bibliothèques. Les craintes se situent à deux niveaux: une bibliothèque peut en effet redouter, d un côté, que son propre fonds, et donc la bibliothèque, devienne plus petit et en conséquence moins attractif ou, au contraire, que son utilisation devienne plus intéressante pour les externes, ce qui empêcherait les utilisateurs habituels de pouvoir profiter de la bibliothèque comme avant. Dans le cas concret du projet «e-archiving», la coopération au niveau des fonds de bibliothèques dans le cadre de l archivage distribué des périodiques imprimés est un sujet qui ne peut être traité que dans le cadre d une collaboration approfondie. L objectif déclaré en pareil cas consiste même à passer, avec certains partenaires, des conventions portant sur des restrictions concrètes au niveau de la gestion de certains périodiques. Généralement, les utilisateurs peuvent continuer à accéder aux ressources en ligne lorsque celles-ci sont utilisées par d autres personnes (voir par ex. le prêt de e-books au format pdf (Schallehn 2004)). Paradoxalement, il n est toutefois pas possible de réduire le nombre d exemplaires virtuels, étant donné que chaque bibliothèque doit acquérir son propre droit d utilisation. Par contre, il est tout à fait possible d éviter une sauvegarde multiple des ressources en faisant en sorte qu un exemplaire puisse être consulté par d autres partenaires selon les droits d utilisation acquis par ces partenaires. Cette approche nécessite de toute évidence une certaine collaboration. Et cela est encore plus le cas pour l archivage à long terme, qui pose des défis qui vont bien au-delà de ceux que soulève actuellement l acquisition d informations. D autres projets ne touchent pas directement les fonds de bibliothèques, mais doivent, pour leur mise en oeuvre, utiliser plus ou moins fortement certaines ressources des bibliothèques participantes (temps de travail du personnel, services informatiques, matériel informatique, espace..). Etant donné que ces prestations ne peuvent que très rarement être compensées dans le cadre de la collaboration, les bibliothèques ont besoin que les organismes qui les financent leur laissent une certaine marge de manœuvre à ce sujet. Avec les relations variées et spéciales qu elles entretiennent entre elles et à l extérieur, les bibliothèques ont 81

82 aujourd hui déjà du mal à faire comprendre aux services concernés dans les hautes écoles la nature et l utilité de ces relations ainsi que la manière dont elles sont facturées. Les bibliothèques universitaires suisses sont donc confrontées à toute une série de tâches qui, dans une mesure plus ou moins grande, soulèvent la question suivante: Dans quelle mesure une collaboration est-elle souhaitable, politiquement réalisable et gérable du point de vue de l organisation? Les formes de collaboration qui ne sont pas, au minimum, tolérables pour tous les partenaires n ont aucune chance de réussite à long terme. Coopérer ne veut pas dire se décharger sur les autres de tâches lourdes ou désagréables. Une coopération exige non seulement que l on apporte au projet ses propres prestations, mais aussi que l on travaille à organiser l action commune. Une telle coopération va au-delà des relations qui existaient jusqu à présent avec le Bureau central. Certains partenaires attendent parfois d avoir été relancés plusieurs fois avant de fournir d importantes informations, ou ne les procurent jamais, et cela freine fortement le travail du Bureau central qui œuvre en faveur de toutes les bibliothèques. La qualité du travail s en trouve naturellement pénalisée, et même les partenaires qui collaborent régulièrement et sérieusement avec le Bureau central sont touchés. Deux conséquences possibles peuvent être tirées de ce qui précède: soit on recherche un niveau de coopération qui soit acceptable pour tous les participants, c est-à-dire une coopération basée sur le plus petit dénominateur commun, soit on recherche une collaboration plus intensive qui ne concernerait que les partenaires capables et intéressés de supporter un tel projet. Une décision dans un sens ou dans l autre peut être prise individuellement pour les différentes parties du projet tant qu aucune compensation complète ne doit être versée pour le travail fourni. La question relative à la manière dont les processus décisionnels doivent se présenter se pose surtout là où tous les partenaires consortiaux ne participent pas à la réalisation du projet. Les bénéficiaires du projet et ceux qui le réalisent ne sont alors pas les mêmes. En dépit des avantages formels que cela présente, il serait peu satisfaisant de créer ici un pur rapport de prestation de service, dont le fonctionnement ne serait plus à proprement parler coopératif Prestations personnelles des bibliothèques Les questions concernant le contrôle, le savoir-faire et la coopération sont liées à celle concernant la volonté des bibliothèques d apporter leur prestation personnelle. Il faut à cet égard vérifier dans quelle mesure et de quelle manière les bibliothèques sont prêtes à participer aux travaux qui doivent être effectués en commun ou en mesure de le faire. Les possibilités vont ici de la gestion active de serveurs à la simple remise de données et au paiement d une contribution financière. Comme toujours, il faut évaluer si l engagement demandé implique l abandon d autres activités et/ou si d autres financements réguliers peuvent ou doivent être sollicités. Dans le cadre de projets CUS certaines prestations personnelles des bibliothèques sont obligatoires de toute façon. Si la nature de la participation sous forme de mise à disposition de ressources ne peut être déterminée qu au moment de la mise en oeuvre concrète, il faut, dès la phase de projet, avoir clairement conscience du fait que les bibliothèques participantes ont un rôle à jouer au niveau du contenu du projet. Certains interlocuteurs dans les bibliothèques vont devoir consacrer une partie de leur temps à ce projet, et ce d autant plus que l engagement de la 82

83 bibliothèque concernée sera fort. Le minimum attendu est une bonne transmission des informations. Actuellement, on ne sait pas encore clairement comment les partenaires des différents sousprojets doivent être choisis. Certaines bibliothèques ont signalé qu elles étaient intéressées à certaines parties du projet, et nous souhaitons pouvoir nous appuyer sur ces intérêts qui existent localement. Mais d autres partenaires doivent aussi avoir la chance de participer. Il reste encore à établir si une sorte d appel d offres interne devrait être effectué pour cela et si la facturation des prestations qui peuvent être clairement attribuées au projet doit être prévue dans ces appels d offres. En dehors du concours que le personnel des bibliothèques participantes devra obligatoirement apporter au projet sur le court terme, les bibliothèques devront, au fil de l avancement des travaux, planifier à long terme leur engagement concernant des services productifs. Les modalités de choix pour déterminer quelle bibliothèque va participer à quelle partie du projet devront être définies et testées dès la phase de projet. 83

84 8. Le concept pour la Suisse 8.1 Comparaison avec des projets internationaux Comme cela a été pertinemment relevé dans une vue d ensemble récapitulative, l étude des questions relatives à l archivage électronique a principalement débouché, jusqu à aujourd hui, sur des modèles et des directives à caractère abstrait ou bien sur des solutions très spécifiques pour un format donné ou un cadre institutionnel donné (Hedstrom, Ross et al. 2003). Dans ce dernier cas de figure, les solutions sont liées à une situation concrète et leurs auteurs n ont souvent aucun intérêt direct à tester, voire même à encourager, leur transférabilité vers d autres applications. A l inverse, les concepts très abstraits sont encore loin de pouvoir être convertis en solutions concrètes, même quand ils remportent une large adhésion. C est dans ce contexte que les projets et les initiatives énumérés dans l annexe V, chapitre 17, doivent être considérés. Dans les tableaux figurant dans cette même annexe, on trouve également les détails sur les projets mentionnés ici. A ce stade, ces projets ne sont pas ici discutés individuellement étant donné que les principaux d entre eux sont traités ailleurs dans ce rapport, dans le contexte concerné. Il s agit seulement ici de faire quelques remarques. Les projets de recherche qui portent sur les processus techniques comme la migration, l émulation et les autres alternatives (UVC, entre autres) sont étonnamment rares. S il en est ainsi, c est surtout, semble-t-il, parce que l on s est rendu compte que, avant de pouvoir procéder à ces opérations, qui sont requises à long terme, il fallait tout d abord que le stockage des données soit fiable. Les projets de développement portant sur les systèmes de stockage sont donc, en toute logique, plus fortement représentés, notamment dans le cadre du développement de l edepot par la Bibliothèque Royale à La Haye et IBM, de sa refonte dans le cadre du projet KOPAL en Allemagne ou de développements maison effectués dans le cadre du projet PANDORA en Australie pour l archivage sur Internet (informations sur tous ces projets dans l annexe V). Alors que l archivage sur le Web est effectué ou mis en place par diverses bibliothèques nationales, l edepot est un des rares projets qui travaillent déjà de manière productive avec des fonds de bibliothèques (périodiques). Dans les années à venir, il sera nécessaire de renforcer la recherche sur les processus techniques de conservation à long terme. Seule une toute petite partie des projets de recherche proprement dits peut être prise en charge par les bibliothèques. L important c est de collaborer avec d autres partenaires intéressés aux résultats (archives, etc.) et avec les spécialistes les mieux qualifiés pour effectuer des recherches dans ce domaine, par ex. les instituts des hautes écoles spécialisés dans les domaines concernés. On ne sait pas encore très bien s il faut privilégier des solutions centralisées ou bien des solutions décentralisées pour l archivage à long terme. Or cette question est importante. Une mise en concurrence des différentes approches est souhaitée. Jusqu à présent, les décisions en faveur de l une ou de l autre de ces deux possibilités ont aussi été dictées par les réalités politiques. Dans des pays à caractère fédéral comme l Allemagne ou l Australie, ce sont des 84

85 solutions décentralisées qui sont recherchées (nestor, KOPAL, D) ou déjà réalisées (PANDORA 59, AUS). Tel est également l objectif du projet général américain NDIIPP, bien qu il soit placé sous la responsabilité de la Library of Congress. Parmi les avantages qui sont attribués à une approche décentralisée, il y a, en dehors de l indépendance vis-à-vis des réalités politiques et culturelles, une meilleure protection contre les menaces de toutes sortes et une meilleure évolutivité. En dépit des nombreuses questions qui restent encore sans réponse, le souhait des Bibliothèques universitaires suisses de privilégier une solution distribuée est ainsi bien étayé et il ne s agit donc pas d une voie à part au plan international. On peut même dire, d une manière générale, que les questions soulevées par les Bibliothèques universitaires suisses sont d une brûlante actualité dans le monde entier et encore loin d être résolues d une manière satisfaisante. Le lien qui existe entre les trois aspects «Contenus commerciaux», «Serveurs de documents et Open Access» et «Numérisation» est cependant atypique. Cette interconnexion débouche, d une part, sur d intéressantes impulsions entre les différents domaines, alors que, d autre part, chacun de ces aspects pris individuellement est associé à d importants défis. Il ne semble guère possible de pouvoir relever tous ces défis en même temps ou bien à intervalles rapprochés. A cela s ajoute le fait que la garantie de l accès et l archivage à long terme ne sont même pas toujours réunis au sein d un projet. Alors que la garantie de l accès est considérée comme incombant aux bibliothèques universitaires, des attentes élevées sont placées dans les bibliothèques nationales et autres établissements pour l archivage à long terme. De leur côté, les bibliothèques nationales participent à toutes sortes de projets, et de nombreux travaux portent sur l archivage de pages Internet à caractère national. Mais c est surtout pour les tâches sortant du cadre du mandat qui leur était précédemment confié que les bibliothèques nationales doivent encore fournir une réponse. Concrètement, cela concerne la littérature étrangère sans aucun caractère national ainsi que la manière de gérer les restrictions d utilisation imposées par les éditeurs. Ces questions seront abordées en détail en relation avec la Bibliothèque nationale suisse (voir chapitre et suivants). Il existe des points communs avec des projets menés par des services d archives, qui ont parfois dû s intéresser au problème de l archivage électronique avant les bibliothèques. Une grande importance est ici attribuée au domaine du pré-archivage, qui est un domaine où l on tente d exercer une influence sur la création des documents. Cela est normalement possible, jusqu à un certain point, dans les administrations d Etat, mais pas dans les bibliothèques la plupart du temps. Jusqu à ce que ces mesures produisent leur effet et vraisemblablement même au-delà les Archives seront, encore plus que les bibliothèques, confrontées à une multiplicité de formats. En toute logique, ce sont donc surtout les Archives qui s engagent en faveur de la standardisation et de la documentation des formats. L engagement des archives américaines NARA en faveur de l élaboration du standard PDF/A (voir chapitre 5.3.1) et le répertoire des formats PRONOM des Archives nationales britanniques (voir chapitre 5.8.1) en sont deux exemples. Le projet du Consortium présente une particularité de par la manière dont il est organisé: lorsqu un projet comprend des tâches de conception et des tâches de réalisation, il est confié à un Consortium, qui est censé représenter tous les établissements d un certain type dans le 59 La cyberarchive PANDORA se présente actuellement sous la forme d une installation centrale avec utilisation collaborative. 85

86 cadre d une tâche donnée. Le Bureau central du Consortium est affaibli par le fait qu il doit tenir compte d intérêts très différents, voire même parfois contradictoires, alors que les partenaires consortiaux décident de manière indépendante. Cela vaut également pour le projet «e-archiving». Le Bureau central est l hôte d une bibliothèque qui le soutient bien et le fait profiter de ses ressources, mais ce ne sont pas une ou plusieurs bibliothèques qui sont le moteur du projet même et le font avancer. A l étranger, par contre, l organisation de tels projets est la plupart du temps confiée à quelques bibliothèques intéressées, qui se chargent aussi de faire avancer les choses. Cela est également valable pour les projets distribués. Il pourrait s avérer nécessaire, pour certaines parties du projet «e-archiving», de définir de nouveaux processus décisionnels plus clairs, notamment quand, parmi les partenaires consortiaux, un groupe effectue un travail pour tous. 8.2 Situation initiale en Suisse Même les activités du Consortium dans le domaine de l acquisition sous licence de contenus électroniques n ont jamais été indépendantes de la situation des différentes bibliothèques au sein de leur haute école et des relations que les hautes écoles entretiennent entre elles. Cela est beaucoup moins le cas pour l archivage électronique qui touche aussi d autres établissements et d autres activités (publication) : étant donné que la stabilité à long terme est une exigence de l archivage électronique, ce dernier requiert une plus forte prise en compte de l environnement institutionnel des établissements participants. C est pourquoi il convient d éclairer brièvement la situation des bibliothèques, des hautes écoles et du Consortium Bibliothèques Il s agit ici de bibliothèques centrales ou services de coordination de douze hautes écoles universitaires suisses ainsi que des bibliothèques des quatre instituts de recherche du domaine EPF. Ces dernières ne sont presque jamais considérées de manière séparée dans l étude. Les bibliothèques des hautes écoles spécialisées ne sont jamais prises en compte séparément : étant donné qu elles comptent une multitude de petits sites, elles n entrent guère en ligne de compte pour participer activement au projet de conservation à long terme en tant que partenaires indépendants. Cette structure représente aussi une gageure supplémentaire pour d autres parties du projet. C est la raison pour laquelle les intérêts des hautes écoles spécialisées n ont pas pu être pris en compte de manière convenable jusqu à présent. Une très forte hétérogénéité caractérise déjà l ensemble des bibliothèques universitaires : en dehors des différences linguistiques évidentes, ces bibliothèques présentent des caractéristiques très différentes en ce qui concerne leur spécialité, leur taille, les organismes qui les financent, leur intrégration dans l établissement concerné et l idée qu elles ont d ellesmêmes. Cette situation a des conséquences sur leurs priorités et sur l intérêt qu elles portent 60 Pour être précis, il s agit de 17 établissements qui sont représentés par 16 personnes. 86

87 d une manière générale à une disponibilité et à un archivage à long terme, mais aussi sur la contribution qu elles peuvent ou qu elles désirent apporter aux efforts communs. Les bibliothèques scientifiques ne peuvent se livrer qu une concurrence limitée. C est la raison pour laquelle elles élaborent souvent des solutions coopératives, qui sont utiles à tous les clients et à toutes les clientes des établissements participants. Les bibliothèques conduisent néanmoins un grand nombre de projets individuels en vue de se profiler comme un prestataire de services compétent auprès des organismes qui les financent. Elles se livrent donc surtout une concurrence professionnelle pour proposer des offres convaincantes. D une manière générale, les bibliothèques se considèrent comme des prestataires de services pour le domaine scientifique, si bien qu une collaboration pourrait s appuyer sur une certaine base commune en dépit de toutes les différences. Sur le plan opérationnel, les bibliothèques collaborent aujourd hui entre elles au sein de deux grands groupements de nature différente, qui suivent en grande partie les frontières linguistiques (Informationsverbund Deutschschweiz, IDS et Réseau des bibliothèques de Suisse occidentale, RERO). Un échange au niveau national peut avoir lieu dans la Conférence des bibliothèques universitaires (CBU 61 ) de la Conférence universitaire suisse (CUS 62 ). Sur le plan opérationnel, seul le Bureau central du Consortium travaille au niveau national pour les bibliothèques des hautes écoles, les hautes écoles spécialisées y comprises. Certaines bibliothèques universitaires sont, dans le cadre de leur double fonction, intégrées dans un échange avec la Bibliothèque nationale suisse, échange qui englobe toutes les bibliothèques cantonales. Nous parlerons plus loin plus en détail de ces activités ( ) Hautes écoles En dehors de la coordination formelle effectuée au sein de la CBU et de la Conférence des recteurs des Universités suisses (CRUS 63 ), les hautes écoles suisses collaborent ponctuellement de manière très étroite entre elles, par exemple pour harmoniser leurs offres de cours dans certaines disciplines et éviter que des offres spéciales soient proposées à double. Mais compte tenu de leur proximité géographique, elles sont aussi en concurrence pour attirer les étudiants, le succès remporté dans cette compétition décidant aussi des moyens financiers, etc. Cette compétition vient se greffer, à un autre niveau, sur une concurrence internationale et qui existe depuis longtemps déjà pour attirer un personnel de recherche et d enseignement compétent. Dans les années à venir, la compétition pour attirer les étudiants devrait, elle aussi, se renforcer du fait qu une grande mobilité est désormais demandée aux étudiants et encouragée 64. L efficacité des services universitaires est appelée, avec de nombreux autres facteurs, à jouer un rôle important dans cette compétition. Les bibliothèques universitaires doivent évaluer correctement l impact de leurs activités à l extérieur et organiser activement ces dernières en conséquence. Dans ce contexte, il va peut-être falloir expliquer plus soigneusement aux hautes écoles pour quelles raisons leur 61 Conférence des bibliothèques universitaires (CBU): 62 Conférence universitaire suisse CUS: 63 Conférence des recteurs des Universités suisses CRUS: 64 Tel est l objectif des réformes «Bologna», qui sont coordonnées en Suisse par la CRUS : 87

88 bibliothèque doit coopérer avec celles des établissements «concurrents» et pour quelles raisons cette coopération est une bonne chose pour tous les intervenants. Il existe également une concurrence à l intérieur des hautes écoles suisses, où les bibliothèques doivent s imposer contre d autres intérêts. Il est donc important que les décideurs des hautes écoles aient conscience des vastes tâches auxquelles les bibliothèques doivent faire face dans l intérêt des hautes écoles : l archivage à long terme des données électroniques, par exemple, n est pas le problème des bibliothèques, mais, globalement, celui de la science et de la recherche, les bibliothèques pouvant et devant apporter leur contribution en tant qu entité qualifiée pour trouver une solution Consortium Questions structurelles Le Consortium des bibliothèques universitaires suisses est un projet de la Conférence universitaire suisse. Il comprend un module dédié à l acquisition sous licence d informations électroniques pour les hautes écoles suisses et un petit nombre d autres établissements (projet financé de 2000 à 2005) et un module dédié à l archivage d informations électroniques («e-archiving», projet financé de l automne 2002 à 2007). L exécution des travaux pour les deux modules incombe au Bureau central, qui est délégué à la bibliothèque de l EPF à Zurich. Etant donné que le projet est limité dans le temps, des modèles capables de bénéficier à long terme d un solide support même après la fin du projet doivent être développés pour toutes les activités du Bureau central. Des entretiens en ce sens ont lieu en ce moment pour le module des licences. De par leur nature, les efforts déployés dans le domaine de la conservation à long terme d informations numériques ne peuvent donner toute leur mesure que s ils peuvent être poursuivis sur le long terme. En outre, ce type de conservation exige une plus grosse infrastructure technique que l acquisition d informations sous licence. Le fonctionnement à long terme d une telle infrastructure requiert, d une part, un financement suffisant et, d autre part, une solide structure technique et organisationnelle. Ce qui ne veut absolument pas dire qu une infrastructure maison soit impérativement nécessaire ou souhaitable Sous l angle des contenus Lorsque l on parle de périodiques électroniques dans le cadre du projet «e-archiving», il s agit la plupart du temps, du point de vue du Consortium, de titres de grands éditeurs internationaux à caractère purement commercial et d offres de grandes sociétés scientifiques acquises dans le cadre d une transaction commerciale. C est également aux mêmes titres qu il est fait référence lorsque les fonds imprimés sont aussi inclus dans les réflexions. Cette vision restreinte des choses ne répond que partiellement aux besoins des différentes bibliothèques. C est pourquoi nous essayons, par endroits, de faire expressément référence à des questions qui concernent spécifiquement les relations avec les petits fournisseurs, c est-à-dire les fournisseurs dont nous ne nous occupons pas dans le Consortium. En outre, on espère que certains aspects de cette étude pourront être utilisés, sous une forme 88

89 appropriée, pour d autres types de documents et que ces aspects seront les plus nombreux possibles. Ni la littérature grise des hautes écoles, ni la rétronumérisation ne font partie du domaine d activité du Bureau central du Consortium en sa qualité de bureau de coordination des licences. La littérature grise, en particulier, préoccupe les bibliothèques des hautes écoles, mais cela fait déjà plusieurs années que c est le cas, et divers signes montrent qu une collaboration dans ce domaine pourrait apporter quelques avantages. L archivage est considéré ici comme une condition nécessaire pour conférer plus de poids et de fiabilité aux activités Open Access. Le Bureau central est tout désigné pour assurer la collaboration nationale, dans la mesure où il a déjà des contacts avec les responsables des médias électroniques dans les bibliothèques des hautes écoles. De plus, l intérêt croissant dont bénéficient les modèles Open Access est en grande partie dû au mécontentement que suscite le comportement des grands éditeurs, c est-à-dire justement des éditeurs dont s occupent intensivement les collaboratrices du Bureau central. 8.3 Objectif De vastes domaines de l échange d informations scientifiques et de connaissances ont été depuis longtemps transformés par les objets numériques. Cela concerne aussi bien la communication informelle, qui est dominée par les services de messagerie électronique, que la communication qui passe par des processus de publication formels. Les défis qui résultent de cette situation pour les prestataires de services primaires sont tout aussi vastes. Dans le cas des s, ce sont avant tout les centres informatiques et les archives qui se sentent concernés, pour les publications proprement dites et les autres contenus scientifiques ce sont les bibliothèques. En ce qui concerne le projet «e-archiving» du Consortium suisse, certains objectifs ont été fixés à l avance. Ces derniers découlent, d une part, des activités effectuées jusqu à présent par le Bureau central et pointent, d autre part, en direction de champs d activité des bibliothèques universitaires qui sont en partie nouveaux ou qui en partie ont simplement pris une forme nouvelle. Les concepts proposés doivent donc poursuivrent plusieurs objectifs : 1. Mise en place de solutions permettant aux bibliothèques partenaires du Consortium de bénéficier d un accès à long terme aux contenus pour lesquels le Consortium a acheté des droits durables dans le cadre des contrats de licence consortiaux (surtout périodiques). 2. Archivage a. Concept pour l archivage à long terme, sous forme électronique, des contenus cités. b. Extension à d autres contenus, y compris la littérature grise. 3. Proposition d un concept pour l archivage distribué et coordonné d exemplaires de périodiques imprimés avec possibilité d acquisition coordonnée. 4. Serveurs de documents: Création ou perfectionnement d une infrastructure d appui pour des activités renforcées dans le domaine des publications, dans l esprit des deux concepts Open Access complémentaires (archivage, par les auteurs, de 89

90 contenus publiés ailleurs et publication en libre accès des propres périodiques par la bibliothèque). 5. Evaluation des perspectives en matière de numérisation, avec prise en considération particulière des contenus de périodiques. Naturellement, les différents objectifs sont plus ou moins étroitement liés entre eux et se complètent mutuellement. Cet aspect doit être pris en considération lors de leur traitement et de leur mise en application. Il est non seulement possible, mais aussi requis de considérer les différents domaines comme des modules d un concept global et de les formuler en conséquence : aucun module isolé ne peut entraîner la mise en application forcée de tous les autres. La séparation entre les points Garantie de l accès (1.) et Archivage (2.) doit être principalement comprise comme une séparation conceptuelle et sa mise en application technique n est pas une obligation. Toutefois, il pourrait être judicieux, principalement pour des raisons de sécurité, de séparer les couches d un système de stockage auxquelles tout le monde peut accéder, plus ou moins publiquement de la couche exclusivement dédiée à l archivage (Shirky 2002). La restriction aux contenus acquis dans le cadre du Consortium mentionnée au point 1 est actuellement surtout motivée par des raisons pratiques. Mais on espère toutefois que les solutions concernant ces contenus pourront, avec quelques modifications, aussi s appliquer aux contenus acquis localement par les bibliothèques. Indépendamment de la mise en application des concepts proposés, il convient de faire, au minimum, des recommandations quant à la manière dont les bibliothèques doivent aborder les tâches qui les attendent Points de vue concernant les sous-projets Dans l idéal, les aspects suivants devraient être pris en compte dans tous les sous-projets. Mais on estime actuellement que de nombreux points ne trouveront pas de réponse. 1. Enregistrement des fonds 2. Urgence a. Quels sont les contenus et les métadonnées qu il faut saisir? b. Peut-on ou doit-on effectuer une sélection parmi ces contenus et ces métadonnées? D après quels critères cette sélection doit-elle être effectuée et par qui? 3. Avantages et inconvénients a. Avantages pour le client (c est-à-dire pour les utilisateurs finals et les organismes qui financent les bibliothèques ) i. Est-ce que le concept servira aux clientes et aux clients des bibliothèques participantes? ii. Est-ce que l avantage qu ils en retireront est assez important pour justifier le travail requis? 90

91 b. A quoi s engagent les établissements participants? Consortium des bibliothèques universitaires suisses c. Quel avantage en retireront les établissements qui ont des intérêts divers? d. A quels effets secondaires, positifs et négatifs, faut-il s attendre? 4. Organisation 5. Droit a. Combien de bibliothèques et lesquelles doivent participer au projet pour qu une mise en application judicieuse soit possible? b. Quelles sont les formes de collaboration possibles et lesquelles sont réalistes? c. Comment se fera la mise en application dans la réalité: Qui discutera avec qui et à quelle fréquence? d. Quels établissements assumeront quelles responsabilités? e. Qui sont les partenaires potentiels? f. Dans quelle mesure un service centralisé doit-il est mis en place? g. Quelles sont les tâches qui devront être réalisées au niveau local (étendue et qualité)? a. Quelles sont les mesures pour lesquelles des vérifications juridiques doivent être faites? b. Où se situent les limites juridiques pour la prise en charge des tâches? 6. Personnel et infrastructure technique a. Quel sera le personnel requis et quelle qualification devra-t-il avoir? b. De quelle infrastructure technique aura-t-on vraisemblablement besoin? c. Quelles sont les parties de cette infrastructure qui existent déjà et dont l utilisation peut être partagée ou reprise? d. Quelles sont les ressources techniques minimales que chaque partenaire doit mettre à disposition? 7. Solidité économique a. Est-ce que la mise en place peut avoir lieu au sein du projet «e-archiving»? b. Quels sont les moyens requis pour l exploitation courante? c. Comment ces moyens pourront-ils être mis à disposition une fois que le projet sera terminé? 91

92 8.4 Accès à long terme aux contenus acquis par transaction commerciale Les conditions d utilisation des contenus électroniques des éditeurs sont complexes. En ce qui concerne l accès durable, il s agit de mesures qui permettent de continuer à faire usage de droits d accès préalablement acquis même lorsqu une licence n est pas continuée Différenciation des contenus La plupart des conventions de licence conclues jusqu à présent dans le cadre du Consortium suisse pour des périodiques électroniques se fondent encore, pour le calcul du prix, sur les abonnements en cours à des périodiques imprimés des bibliothèques concernées. Chez les grands éditeurs en particulier (Elsevier/Academic Press, Springer/Kluwer, Wiley), l accès, pour l ensemble des partenaires, à l intégralité des offres concernant les périodiques électroniques est compris dans les licences. Du point de vue des bibliothèques, cela conduit à distinguer trois types de contenus : 1. Les contenus qu une bibliothèque se procure elle-même sous forme imprimée et pour lesquels elle acquiert la version électronique. Selon les éditeurs, l accès en ligne à des années plus anciennes des périodiques est aussi accordé. Mais, en règle générale, un droit d archivage n existe que pour les années qui ont été publiées pendant la durée de la licence. Seuls ces contenus sont donc «acquis» au sens strict. 2. Les contenus qui sont seulement abonnés sous forme imprimée par une ou plusieurs autres bibliothèques, mais pas par sa propre bibliothèque. Il est alors fréquent que tous les partenaires contractuels profitent, dans le Consortium, de l accès en ligne à ces contenus («cross access», car il s agit d un accès croisé aux contenus d autres bibliothèques). En pareil cas, les contenus concernés ne sont acquis pour une utilisation durable que par les bibliothèques qui sont aussi abonnées à l édition imprimée. En règle générale, les autres bibliothèques ne peuvent plus accéder à ces contenus lorsque leur propre convention de licence est arrivée à terme, et ce quelle que soit la solution technique en place. 3. Les contenus pour lesquels aucune bibliothèque du Consortium ne possède une édition imprimée, mais qui sont malgré tout utilisés par tous («additional access»). En pareil cas, aucune des bibliothèques n a droit au contenu concerné une fois que la licence a pris fin. Selon l expérience du Bureau central, les solutions packagées offrant un accès aussi vaste que possible («big deal»), comme mentionné plus haut, sont de plus en plus difficiles à négocier. Il faut donc s attendre à ce que la situation change dans les années à venir. Différents modèles sont évoqués par les éditeurs, dont certains sont très complexes et exigent en conséquence un travail de vérification préalable beaucoup plus important qu avant avec les bibliothèques. Il n est absolument pas sûr que, sous cette forme, les licences consortiales soient encore intéressantes et faciles à gérer pour les partenaires du Consortium. Ce qui est proposé, ce sont, par exemple, des modèles où l accès collectif est limité à un ensemble choisi de titres. Selon la variante, les bibliothèques ont la possibilité 92

93 d ajouter des titres supplémentaires. L avantage avancé réside dans une certaine flexibilité, mais cette dernière est contraire à la constitution systématique et à long terme d un fonds de bibliothèque. Par ailleurs, cette approche engendrerait un surcroît de travail pour les bibliothèques et le Bureau central, s ils devaient s occuper de la variation des accès aux titres et en informer les utilisateurs finals. Des expériences limitées ont été faites avec les modèles de licence e-only pour périodiques électroniques, bien que cela fasse déjà longtemps que l on estime que ces modèles sont appelés à devenir la règle à plus ou moins long terme compte tenu de la lente disparition des éditions imprimées (Keller 2001). Dans le cadre des licences e-only, la licence est prise directement pour les titres électroniques, et les éditions imprimées peuvent ou doivent être acquises séparément si elles sont requises. Selon une nouvelle proposition faite par un fournisseur, le Consortium ne recevrait qu un seul jeu d exemplaires imprimés. Il est probable que l avènement des licences e-only aboutisse à la disparition des concepts cross access et additional access. Les exigences auxquelles l archivage doit répondre restent donc les mêmes que pour l acquisition parallèle (version imprimée et version électronique). Mais l urgence serait certainement plus forte si plus aucun exemplaire imprimé n était conservé, voire même fabriqué. Selon les bibliothèques, seuls les contenus pouvant être acquis comme indiqué au point 1 ou issus d un modèle e-only entreraient alors en ligne de compte pour l accès à long terme Evaluation des risques et priorités Au commencement des travaux entrepris pour cette étude, une évaluation des risques devait être faite pour les activités effectuées par le Consortium en faveur des installations locales, étant donné que l accès aux contenus concernés pourrait être perdu. A cette époque, un des critères retenu pour l évaluation des risques était de savoir si un fournisseur archivait luimême ses contenus avec sérieux ou s il confiait ce travail à une institution digne de confiance Fiabilité des concepts d archivage Il ressort du débat sur les questions de l accès et de l archivage que même un archivage sûr, effectué par une organisation tierce digne de confiance, ne permet pas de savoir pendant combien de temps le preneur de licence pourra accéder aux contenus. Au contraire, c est surtout quand les données sont confiées à des tiers (le plus souvent des bibliothèques nationales) que l on se trouve dans la situation où ces institutions ne peuvent permettre l accès aux données qu à l intérieur de leurs murs, aussi longtemps que l éditeur ou un quelconque successeur est encore en mesure d accorder à ses clientes ou ses clients potentiels un accès aux contenus concernés (voir par ex. (Steenbakkers 2004)). Autrement dit: dans le cas peu spectaculaire mais vraisemblable où une licence serait résiliée, les scénarios d archivage typiques n offrent aucune garantie d accès à long terme. On ne peut donc pas se baser, comme critère déterminant, sur la qualité des concepts d archivage pour juger de la probabilité avec laquelle l accès à certains contenus pourrait être perdu. 93

94 Perte totale due à une catastrophe La question de la fiabilité d un archivage pur est toujours implicitement liée au besoin de se protéger du mieux possible contre une perte totale des données par suite de catastrophe. Techniquement, il est possible de gérer toute la communauté internationale des utilisateurs d un périodique électronique depuis un seul serveur. Sur le plan pratique, c est toutefois quelque chose que l on évite naturellement de faire afin de pouvoir, si nécessaire, se tourner vers d autres installations, notamment en cas d incident. Chez les grands éditeurs, l exploitation courante se déroule déjà en différents points du monde, via des serveurs miroir, pour augmenter les performances. Avec cette approche, le risque de perte de données ou de perte d accès chez les éditeurs qui travaillent au niveau international peut donc être considéré comme faible : étant donné que les contenus sont la base de leur activité professionnelle, les éditeurs ont un intérêt quasi existentiel à les conserver à tout prix aussi longtemps qu ils ont une valeur commerciale. Concernant les petits fournisseurs, qui travaillent plutôt au plan régional, on peut se demander s ils sont en état de prendre toutes les mesures requises et si leurs ordinateurs sont suffisamment distants les uns des autres. Mais il est en même temps évident que, face à certaines catastrophes, même les mesures les plus scrupuleuses ne servent à rien qu elles aient été prises par les éditeurs ou par les bibliothèques. Le risque restant ne constitue donc pas une raison suffisante pour que des mesures supplémentaires soient prises par les bibliothèques Intensité de l utilisation L intensité avec laquelle les différents titres sont utilisés est un autre critère qui pourrait être retenu pour évaluer l urgence d un stockage local : selon toute vraisemblance, la perte d accès à un titre très sollicité pénalise le travail d un plus grand nombre de personnes que s il s agit d un titre moins utilisé. Cette manière de voir les choses aboutit à des distorsions au niveau des contenus, même si l on part du principe que toutes les statistiques d utilisation sont directement comparables ce qui n est pas le cas malgré certains progrès réalisés dans le cadre de l initiative COUNTER 65. Les distorsions en question sont dues au fait que le comportement en matière de publication et d utilisation varie beaucoup d une discipline à l autre. Dans plusieurs disciplines, les publications effectuées par chaque scientifique sont, en moyenne, moins nombreuses mais plus longues, ce qui se traduit automatiquement par des chiffres d utilisation plus faibles. L importance et l intensité d utilisation des périodiques dépendent aussi de la discipline concernée (Tenopir and King 2001; Keller 2002). De plus, le nombre d utilisatrices et d utilisateurs n est pas comparable pour toutes les disciplines ni localement, ni au niveau suisse. De ce fait, des ressources revêtant une importance essentielle pour certaines disciplines risqueraient d être sous-évaluées et de ne pas être suffisamment prises en compte. De même, une évaluation sérieuse des particularités et priorités locales exigerait un énorme travail. De plus, il faut partir du principe que le comportement en matière d utilisation est actuellement encore en cours de transformation (Tenopir, King et al. 2003). Des décisions prises sur la base de l utilisation actuelle pourraient ne pas avoir un effet suffisant. 65 COUNTER, Counting Online Usage of NeTworked Electronic Resources: (Zugriff am ) 94

95 Une sélection est-elle judicieuse? Consortium des bibliothèques universitaires suisses Fondamentalement, il faut se demander s il est vraiment judicieux de sélectionner des titres spécifiques. On s attend à ce que la mise en place de serveurs de stockage coûte beaucoup d argent et de temps, mais on part du principe qu une simple extension quantitative exigerait surtout des extensions techniques sans entraîner de nouvelles mesures coûteuses. C est ce qu indiquent les expériences faites par la Bibliothèque Royale de La Haye avec l edepot 66 et celles faites par l Université Cornell avec l exploitation du serveur ArXiv.org (voir ). Concernant l edepot, il convient toutefois de signaler que si un système d archivage standardisé existe pour la conservation et le contrôle des informations numériques, on ne sait pas pendant combien de temps l accès durable aux informations mémorisées pourra être garanti (Oltmans 2003; Steenbakkers 2004) Perte du droit d accès suite à l expiration de la licence A notre avis et d après les expériences faites directement par le Bureau central, la principale menace qui pèse sur l accès à certains contenus présente deux aspects : 1. L alliance consortiale ne peut pas être reconduite. L accès en ligne est perdu pour : a. Le contenu des années parues avant l entrée en vigueur de la licence ou avant une date fixée dans la licence. b. Le contenu des années parues après l expiration de la licence qui n est pas acquis dans le cadre d une licence individuelle Le contenu des années parues pendant la validité de la licence peut être utilisé chez l éditeur. Mais, dans au moins un cas, des taxes d utilisation élevées sont en discussion, si bien que, dans la réalité, ce contenu devient lui aussi inaccessible. Pour les éditeurs qui proposent de telles modalités d utilisation, le risque que les contenus ne soient bientôt plus accessibles est donc très élevé. Naturellement, la comparaison avec le coût d une ou de plusieurs installation(s) locale(s) devrait démontrer si des installations propres seraient vraiment plus avantageuses sur le plan économique. Pour cette simple raison, il est donc important de multiplier, pendant la durée du projet, les expériences pratiques concernant le coût de telles installations. Pour évaluer les risques de perte d accès à certains contenus, plusieurs possibilités doivent être prises en considération. Celles-ci ne s appliquent pas de la même manière à tous les fournisseurs. D autres consortiums ont déjà perdu l accès qu ils possédaient suite à l expiration de leurs licences consortiales, par ex. en Allemagne et aux Etats-Unis. C est un risque qui se profile aussi à l horizon, à plus ou moins long terme, pour les Bibliothèques universitaires suisses, notamment à cause de négociations insatisfaisantes et de coûts surenchéris. C est sans nul doute la plus grande menace qui pèse de nos jours sur l accès continu aux données actuelles. En Suisse, le financement du projet va bientôt toucher à sa fin pour les licences, si 66 edepot, Koninklijke Bibliotheek, La Haye: (accès ) 67 Cas spécial : il existe des offres où l accès en ligne aux contenus figurant dans une fenêtre de temps perpétuelle («Rolling File») est compris dans les abonnements aux versions imprimées. Par ex. il peut être possible d accéder aux articles de 12 derniers mois. Mais ces contenus ne sont pas acquis et sont retirés à l utilisateur une fois que ce laps de temps est écoulé. 95

96 bien que ce risque devrait encore se renforcer. Depuis 2005, nous ne disposons plus que de moyens réduits pour l acquisition de contenus sous licence en vue de leur utilisation en Ensuite, ce financement sera totalement supprimé. Naturellement, il sera toujours possible de conclure des licences individuelles. Mais avec de telles licences, l avantage consortial au niveau du cross access et de l additional access ne peut pas être assuré, et il est peu probable que tous les titres abonnés jusqu à présent puissent encore être proposés. A la fin de la licence, l accès aux contenus proposés dans le cadre de l additional access ou du cross access sera perdu pour tous les partenaires qui n ont pas eux-mêmes fait l acquisition des contenus. Cela n est pas valable pour les contenus électroniques reposant sur un abonnement à la version imprimée ou acquis par d autres voies. La plupart des conventions de licence prévoient, pour ces contenus, qu il soit possible de continuer à utiliser les années en question ou que les données soient reprises sur une installation locale, ce qui soulève de nombreuses questions de détail dans la pratique (voir 3.1.1). Du point de vue des éditeurs, la réservation de l accès aux données électroniques aux utilisatrices et aux utilisateurs autorisés, c est-à-dire aux membres ainsi qu aux clientes et aux clients des établissements qui ont précédemment acheté le contenu, est un point non négociable. Mais on ne soulignera jamais assez que le droit de poursuite de l utilisation se limite normalement aux années parues durant la période de validité de la licence ou qui faisaient l objet de la convention de licence : des années antérieures ne sont comprises que si cela a été explicitement convenu ou si elles ont été achetées en supplément ; quant aux nouvelles parutions, il n est pas possible de les ajouter. En dépit de la garantie formelle, l accès n est absolument pas assuré et le risque de perte existe Perte due à la disparition d un fournisseur ou à un changement de fournisseur Un éditeur ne peut remplir son engagement concernant la mise à disposition de ses données que tant qu il maintient son activité commerciale. Cela n est pas le cas si un éditeur ferme définitivement sa maison d édition. En pareil cas, il faudrait même demander si les bibliothèques recevraient par ex. les données issues de l actif de la faillite ou bien si ces contenus seraient vendus pour satisfaire d autres créanciers. Mais, après les nombreux rachats d entreprises qui ont eu lieu dans le domaine de l édition, on est aussi en droit de se demander qui est appelé à devenir l interlocuteur lorsque de telles fusions d entreprises ont lieu et sous quelle forme les bibliothèques auront encore la possibilité de faire valoir leurs intérêts. Cette question se pose déjà avec une très grande acuité pour certains titres de périodiques : lorsqu un titre change d éditeur, les backfiles de ces périodiques suivent parfois aussi le même chemin. En pareil cas, toutes les données requises pour les droits d accès devraient être remises au nouvel éditeur afin que l accès continue à être assuré. Dans la pratique, c est surtout la situation suivante qui est la règle: certaines années d un périodique restent chez l éditeur A, tandis que l éditeur B propose le titre en question à partir d une certaine date. Cela semble plus avantageux, si bien que les anciennes clientes et les anciens clients devraient faire pression pour que l éditeur A conserve suffisamment de droits sur les années concernées. On ne sait pas encore si l on peut attendre d un éditeur qu il s engage pour ses 96

97 «anciens» périodiques de la même manière qu il le ferait pour le programme en cours. Pour obtenir cet engagement, le plus simple serait que les clientes et les clients parviennent à expliquer que des solutions d accès à long terme dignes de confiance sont aujourd hui un important argument dans les décisions d abonnement et d achat. Le changement d éditeur n est d ailleurs pas un phénomène insolite. C est quelque chose qui se produit avec une certaine régularité. Elsevier, par exemple, a transmis 25 titres à d autres éditeurs 68 en Les problèmes engendrés par un changement d éditeur, qui contribuent à embrouiller la situation, sont réels et cumulatifs. Le risque de perte de données lors de l arrêt d une activité est considéré comme plutôt faible: tant que des contenus pourront être exploités commercialement, il se trouvera toujours d autres éditeurs pour les reprendre et les mettre à disposition. Le problème de l accès se renforce alors: Est-ce que les droits correspondants demeurent et est-il possible de les faire valoir? 8.5 Scénarios pour garantir l accès Accès continu chez le fournisseur d origine Comme nous en avons parlé au point , il est prévu dans de nombreuses conventions de licence que les bibliothèques puissent, à l expiration de la licence concernée, continuer à utiliser les contenus parus durant la période de validité de la licence. L accès se fait alors, comme précédemment, via le serveur de l éditeur concerné, si bien que, pour les utilisateurs, rien ne devrait changer pour les années concernées. Jusqu à présent, des informations détaillées sur les modalités d une telle prolongation de l utilisation ou sur la reprise des données ne figurent dans pratiquement aucun contrat. Compte tenu des progrès de la technique et de l évolution des modèles économiques, il n a de toute évidence pas été jugé utile de fixer d ores et déjà de telles modalités. Aujourd hui, sous la pression du Bureau central du Consortium, les clauses minimales recommandées au plan international pour l accès à long terme ou la reprise de données ont au moins pu être insérées dans d autres contrats (voir annexe IV, chapitre 16). Des informations concrètes sur de possibles modèles de coûts n ont pu être obtenues pratiquement nulle part. Dans la pratique, l accès aux données d un éditeur n est possible que si ce dernier s engage à garantir l accès. On ne sait pas si les éditeurs sont disposés à garantir un accès à long terme s ils ne peuvent plus en retirer un bénéfice commercial direct. Il s agit là d un important sujet de préoccupation. Il est plutôt probable que leur soutien ira en s amenuisant avec le temps et finira par disparaître. L alternative logique qui se profile chez de nombreux fournisseurs est de faire de ce soutien un service payant. A des prix qui seront fixés par le fournisseur dans le cadre d un rapport de dépendance très unilatéral et qui du moins dans un cas connu actuellement laissent pressentir que l objet de la vente ne serait pas ici le service de mise à disposition, mais, une fois de plus, le contenu. C est quelque chose que les bibliothèques ne peuvent pas accepter. En dehors des considérations de principe, les coûts des différentes options doivent être ici froidement comparés. 68 ScienceDirect Journal Coverage List,: (Zugriff am ) 97

98 Si les droits d accès des différentes institutions sont correctement gérés, cela entraînera un surcroît de travail pour les éditeurs, car il y a peu de chances que deux bibliothèques consortiales prennent des abonnements ou des licences pour les mêmes produits et les mêmes années. Un grand nombre de combinaisons différentes devront donc être correctement attribuées. D après l expérience du Bureau central, ce travail ne doit pas être sous-estimé: certains éditeurs ont déjà du mal à harmoniser leurs données avec celles du Consortium pour les abonnements en cours. La situation se complique encore du fait qu il existe aussi des cas où des bibliothèques conservent l accès à un périodique en cours, alors même que cet accès repose sur une base différente: à la fin d une licence consortiale packagée, une seule bibliothèque a la possibilité de prendre une licence individuelle avec acquisition des données pour conserver l accès en ligne. Ce cas ne doit pas être confondu avec celui, assez rare, où les abonnements imprimés à certains titres contiennent un accès plus ou moins limité à la version en ligne, par ex. pour une fenêtre de temps perpétuelle d une année ou similaire («Rolling file»). Il ne faut pas oublier que le problème de la gestion des droits d accès est exactement le même pour les installations locales. Il est seulement atténué du fait que les bibliothèques partenaires sont moins nombreuses dans le Consortium que chez un éditeur. D autres problèmes particuliers sont liés au fait que de nombreux éditeurs ont pour pratique de retirer certains contenus sans avis préalable. De tels retraits sont effectués occasionnellement lorsqu un éditeur redoute que des droits de tiers puissent être violés. Les articles supprimés manquent alors dans l enregistrement durable du discours scientifique. Ce problème touche déjà à la conservation à long terme, qui ne peut comprendre que des données qui n ont pas été préalablement supprimées. Avantages de l accès chez l éditeur aux contenus acquis : Facile à réaliser du point de vue formel, théoriquement avec une coopération limitée de la part des bibliothèques. Possible à court terme. Ne requiert pas d infrastructure propre ou de personnel supplémentaire dans les bibliothèques. L accès à tous les contenus et à toutes les métadonnées acquis auprès du fournisseur est conservé. Pas de changement ni de perte de convivialité pour les utilisateurs finals. Pas de discussion pour savoir si des pôles disciplinaires doivent être constitués ou si des programmes d éditeur doivent être mémorisés et mis à disposition au niveau local. Désavantages: Pas de contrôle de la part des bibliothèques sur les contenus et sur le service. Forte dépendance vis-à-vis de l éditeur. Celle-ci apparaît, par ex. en cas de transfert de périodiques chez un autre éditeur. Pas de véritable possibilité de faire pression sur les éditeurs. 98

99 Les coûts sur une période de temps assez longue (5 ans?) sont assez difficiles à évaluer selon le modèle de coûts. Les modèles de coûts manquent parfois encore de clarté. Les avantages sont donc surtout des avantages pratiques, qui permettent de continuer à utiliser des contenus chez le fournisseur d origine. La pertinence du choix de cette option, c est-à-dire de l accès à long terme chez un éditeur, dépend très fortement des coûts escomptés. Il existe notamment de très grandes différences entre les grands éditeurs purement commerciaux et les éditeurs de sociétés scientifiques. Mais même les éditeurs commerciaux expérimentent différents modèles : Editeur Taxe de base annuelle Taxe d accès annuelle Avis A - Taxe de base ajustée tous les ans, plusieurs francs par titre - Sans cross access - Le nombre des téléchargements au cours de l année précédente est multiplié par le prix unitaire d un téléchargement. Ce prix est ajusté chaque année - Pourrait ou non devenir plus avantageux avec le temps, selon l utilisation et la politique de l éditeur B - Libre pour X années - Ensuite, taxe annuelle par bibliothèque avec renchérissement annuel habituel - Identique pour tous les partenaires, car avec contenu en cross access - Calculable à long terme, ne dépend pas de l utilisation - Problématique pour les petits partenaires, car la taxe est facturée par bibliothèque Tableau 2: Comparaison des principes de fonctionnement des modèles de coûts pour l accès chez l éditeur aux contenus acquis lorsqu une licence a pris fin. Ces deux cas de figure sont actuellement en discussion chez deux éditeurs. Dans cet exemple, l option alternative d une installation locale devrait être examinée pour l éditeur A. Pour comparer les coûts, c est la somme totale que les bibliothèques du Consortium doivent débourser chaque année pour bénéficier de l accès qui doit être prise en compte. Elle doit être comparée aux coûts des autres solutions globales envisageables. Cela est particulièrement important dans la mesure où pratiquement aucune économie d échelle ne peut être réalisée avec l accès chez l éditeur : il est fort possible que certains éditeurs acceptent de faire des concessions si plus d une bibliothèque choisit cette forme d utilisation. Si, inversement, l offre de nombreux éditeurs continue à être utilisée de cette manière, les coûts par éditeur ne seront pas moins élevés que si l utilisation portait uniquement sur les titres d un éditeur. Dans un projet de contrat concret, une variante intéressante assure aux bibliothèques, durant dix ans, un accès en ligne gratuit aux contenus pour lesquels les bibliothèques 99

100 avaient précédemment conclu une licence. L éditeur se réserve le droit, le cas échéant, de permettre l utilisation en ligne des contenus en format archive. Il faut comprendre par là que la garantie n est donnée que pour le format de fichier d origine, la migration vers d autres formats plus récents n étant pas garantie. Au cas où l éditeur ne serait plus en mesure d accorder l accès aux archives, il pourrait alors demander à un prestataire tiers de se charger de la mise à disposition en ligne du contenu, ce prestataire tiers pouvant expressément prélever ses propres taxes, sur lesquelles l éditeur n a aucune influence. Pour être précis, le fournisseur dont il s agit est l OCLC (voir 8.5.3). Les promesses faites ici apparaissent prudentes. Mais elles correspondent à l état des expériences faites dans le domaine de l archivage électronique de contenus utilisés commercialement Installations maison locales ou régionales Les réflexions ci-après concernent uniquement les situations où l accès courant chez l éditeur ne serait plus renouvelé. Il n est absolument pas envisagé de proposer, au niveau local, des contenus de périodiques pour lesquels une convention de licence valide et continue a été conclue avec un éditeur. Le désir de mémoriser et de pouvoir utiliser dans son propre pays les contenus acquis, installés sur des serveurs appartenant à son institution ou à une autre institution étroitement liée comporte plusieurs aspects. D une part, il pérennise ce qui se fait avec les supports traditionnels pour la constitution de fonds de bibliothèques : les contenus sélectionnés et acquis par la bibliothèque arrivent dans cette bibliothèque sous une forme qui permet une conservation et un accès continus. Les bibliothèques ont ainsi pris conscience que les éditions parallèles imprimées ne pouvaient pas remplir une fonction équivalente : même lorsque le contenu est identique, il leur manque les vastes fonctions d une utilisation en ligne. A côté de cela, on se demande avec méfiance si les éditeurs pourront véritablement tenir les promesses très générales qu ils ont faites en ce qui concerne l utilisation ultérieure de contenus sur leurs serveurs. Il convient de remarquer à ce sujet qu un argument semblable s applique aux installations locales : il n est pas certain que l on puisse attendre, à cet égard, un soutien engagé de la part des éditeurs, étant donné que ces derniers toucheront tout au plus une taxe pour la remise effective des données et qu ils ne pourront plus tirer aucun bénéfice commercial de ces données. Si jamais un tel soutien était proposé, il devrait alors être convenu et payé séparément pour que l éditeur y trouve un intérêt. Au final, il s agit du rôle qu une bibliothèque revendique pour elle: si elle se satisfait de servir d intermédiaire pour des contenus dont la mise à disposition est assurée par des tiers en grande partie d après leurs propres règles, alors la garantie de l accès sur site ne doit pas être une priorité. Mais, la plupart des bibliothèques considèrent qu elles ont pour mission d acquérir des contenus, de les mettre à disposition et de les conserver sur le long terme Mise en application C est sur ce modèle que repose les trois variantes suivantes : à l expiration de la licence, l éditeur met le matériel acquis à disposition. Dans le cas minimal, il s agit de ce qui a été publié pendant la période de validité de la licence dans les périodiques auxquels au moins une bibliothèque du Consortium était abonnée. Lorsque la convention est généreuse, cela 100

101 peut aussi concerner tout le matériel publié durant cette période dans des périodiques en cross access. En règle générale, les années antérieures (backfiles) doivent être achetées et font l objet de contrats séparés. Pour des raisons financières, les backfiles n ont pas été acquis via le Consortium jusqu à présent. Plusieurs bibliothèques ont conclu des contrats avec certains éditeurs pour acquérir des backfiles. Toutefois, on ne sait pas actuellement en détail quels sont les bibliothèques et les contenus concernés. Il faut absolument essayer, pour la recherche et pour l accès, à relier les backfiles existants aux contenus qui, comme cela est décrit ici, ont été acquis sur la base d anciennes conventions de licence. A cet égard, il convient une fois de plus de souligner que les backfiles qui ont été achetés sans autre convention ni dédommagement correspondant ne peuvent être utilisés que par les bibliothèques qui ont elles-mêmes acheté ces données. Le matériel en question comprend donc toutes les données relatives au contenu et toutes les métadonnées qui sont requises pour obtenir un accès correspondant à une utilisation continue chez l éditeur du point de vue du contenu et des fonctions. La fourniture des métadonnées, en particulier, n est pas considérée comme une évidence par tous les éditeurs, alors que ça l est pour les bibliothèques : sans métadonnées, l accès doit se faire, de manière laborieuse, via une arborescende de dossiers ou via une procédure tout aussi laborieuse d extraction et de nouvelle saisie des métadonnées. La convivialité des offres des éditeurs dépend beaucoup des fonctions et de la présentation de l interface de recherche et d utilisation. Les bibliothèques ne réalisent pas vraiment que cette interface n est normalement pas comprise dans les conventions portant sur l utilisation ultérieure des contenus et des métadonnées. En règle générale, il n est même pas possible d obtenir l interface en question sous licence, au cas où une bibliothèque le souhaiterait. Pour pouvoir utiliser judicieusement les données fournies, il est nécessaire de doter l installation locale d une interface équipée de fonctions comparables. Dans l idéal, il faudrait aussi que cette interface puisse traiter les contenus et les métadonnées de tous les éditeurs concernés, car, dans le cas contraire, un logiciel séparé serait nécessaire pour chaque éditeur. Si la mise à disposition des contenus de différents éditeurs peut être obtenue avec un seul logiciel, l installation locale peut alors proposer une valeur ajoutée manifeste aux utilisateurs, qui ne devront connaître qu un nombre réduit d interfaces. Indépendamment du logiciel, il est souhaité que toute l offre à disposition en Suisse puisse être accessible depuis un seul point d entrée. Pour parvenir à cela, il faut, au minimum, que toutes les offres soient répertoriées sur une page Internet collective et explicite. Dans l idéal, il s agirait d une page d accueil et de recherche commune, depuis laquelle il serait directement possible d effectuer des recherches dans les diverses offres. Cet objectif devient difficile à atteindre lorsqu une liaison doit être établie avec une offre actuelle continue. Selon nos informations, même les éditeurs concernés ne sont pas toujours parvenus à assurer une telle liaison pour des contenus provenant de sources différentes dans le cadre de l accès à leur propre serveur Point de vue des utilisateurs finals Malheureusement, si une uniformité relativement grande semble possible pour la présentation sur Internet, ce n est pas le cas pour l accessibilité aux contenus: selon l éditeur 101

102 et la durée de la licence préalablement conclue par «leur» bibliothèque, les clientes et les clients accèderont à un nombre d années différents pour les périodiques (voir Tableau 3). Bibliothèque Editeur Backfiles achetés Durée de la licence Rolling File pour l abonnement Print* Texte intégral accessible aux utilisateurs autorisés en nov A A A B C K L M M M aucun aucun mois aucun mois non non mois / et 10/ / et 10/ /2004 *L accès aux Rolling Files se fait via le serveur de l éditeur. Tableau 3: Exemple de constellations possibles pour les droits d accès en fonction de la bibliothèque, de l éditeur, de la durée de la licence et de la disponibilité des Rolling Files pour un abonnement à l édition imprimée qui a été reconduit. Par ailleurs, des lacunes de plus en plus grandes se produisent lorsqu il n existe plus qu un accès au contenu par ex. des douze derniers mois («Rolling file»). En cas de connexion via un portail central, il faut donc se demander si la mise à disposition peut ou doit être limitée aux contenus pour lesquels les utilisateurs ont une autorisation appropriée. Il est vraisemblablement plus intéressant et aussi plus judicieux sur le plan du contenu de permettre aux utilisateurs, comme pour les offres en cours des éditeurs et les bases de données, d effectuer des recherches dans tous les contenus et de ne contrôler l autorisation qu en cas d accès au texte intégral et aux bases de données. Compte tenu des relations complexes que présentent les autorisations, il serait souhaitable d utiliser de puissantes technologies d interconnexion dotées d une fonction comparable à SFX 69. Les conditions d utilisation des contenus devenant encore moins transparentes pour les utilisateurs, ces derniers seront probablement amenés à réagir plus violemment qu aujourd hui, avec incompréhension et irritation, et aucun logiciel ne pourra empêcher cela. Les informations données dans le catalogue en ligne présentent déjà des lacunes, dans la mesure où, en règle générale, la saisie des titres des périodiques électroniques ne donne aucune indications sur les années disponibles. C est pourquoi de trop nombreuses modifications sont apportées à ces informations. Le problème du manque de transparence se pose de la même manière que le contenu soit encore utilisé chez l éditeur ou archivé quelque part ailleurs. Les bibliothèques devraient se 69 Logiciel SFX pour Context Sensitive Linking de la société Ex Libris: (accès le ). 102

103 montrer ouvertes, et d une certaine manière offensive, face aux questions de leurs clientes, de leurs clients et des hautes écoles. Elles ne pourront que très rarement expliquer les relations complexes qui existent. Il leur faut donc au moins essayer de réfuter l impression d arbitraire qu elles donnent et indiquer des alternatives pour l acquisition d informations, même si celles-ci n offrent pas la même convivialité que les offres en ligne. La lacunarité menaçante de l offre en ligne pourrait être atténuée de deux manières: pour les anciens périodiques, il faut chercher à intégrer les backfiles existants. Ces contenus ont paru jusque vers le milieu des années quatre-vingt-dix et ne sont disponibles en ligne que grâce à une numérisation ultérieure. Diverses bibliothèques se sont déjà procuré des backfiles chez des éditeurs, mais des acquisitions complémentaires seraient utiles le cas échéant. L acquisition de backfiles n est normalement pas liée dans le temps à l expiration de la licence concernant l accès en cours et peut donc se faire ultérieurement. Pour autant qu aucune convention particulière n ait été conclue, avec les frais que cela implique, ces backfiles ne peuvent être utilisés que par la bibliothèque qui en a fait l acquisition ainsi que les clientes et les clients de cette bibliothèque. Normalement, ils ne peuvent pas être fournis à d autres bibliothèques. Pour les nouvelles parutions d articles, l accessibilité pourrait être nettement améliorée à long terme si les auteurs utilisaient beaucoup plus qu ils ne l ont fait jusqu à présent les possibilités de publication libre pour leurs travaux. C est le point de départ du mouvement Open Access : il s agit de proposer aussi sous forme électronique et en libre accès les contenus ayant été publiés sous une forme traditionnelle et formelle 70. De nombreux éditeurs autorisent une telle mise à disposition parallèle sous forme de préimpressions (version antérieure au processus d expertise) ou même de postimpressions (version dont le contenu est postérieur au processus d expertise) 71 (voir chapitre 8.8.1). Pour ce concept Open Access, il est préférable de ne pas parler de «publications» Open Access, dans la mesure où l objectif ne consiste pas à supplanter les publications formelles : il s agit seulement de permettre un accès plus large au contenu. A l heure actuelle, les chances de succès d un tel concept ne sont pas plus connues que celles des publications Open Access proprement dites, pour lesquelles aucune taxe d abonnement ou de lecture de devrait être perçue d emblée Coûts Les facteurs de coûts suivants sont à prendre en compte pour une installation locale: 1. Matériel informatique 2. Personnel a. Achat de départ b. Remplacement périodique c. Maintenance externe, le cas échéant a. Pour la mise en place et l installation 70 Etant donné que, selon la conception actuelle des choses, cette forme de publication est considérée comme la méthode d enregistrement et de leg du progrès scientifique, le terme «copy of record» est utilisé en anglais. 71 Liste complète du projet RoMEO: 103

104 3. Logiciels: b. Pour l exploitation courante a. Commerciaux: achat et/ou frais de licence b. Open Source: frais de personnel pour le perfectionnement et la maintenance du logiciel En même temps, il faudrait une nouvelle fois essayer d évaluer ce que coûte globalement l approvisionnement de toutes les bibliothèques du Consortium (voir 8.5.1) et comparer ces coûts à ceux des autres solutions. Les différentes bibliothèques sont d avis que des distorsions se produiraient si des prestations étaient également proposées à d autres établissements. C est justement une telle utilisation des installations par plusieurs partenaires qui donne à la collaboration toute sa valeur. Mais, dans la pratique, elle engendre des problèmes lorsque les établissements qui gèrent un serveur doivent défendre, vis-à-vis des organismes qui les financent, les prestations qu ils fournissent et expliquer pourquoi cette collaboration sert les intérêts de la haute école concernée et de l organisme qui la finance (voir aussi et ). Cela soulève aussi la question de savoir si une bibliothèque doit répercuter les frais occasionnés ou s il est possible de trouver d autres moyens pour la dédommager. Pour effectuer une première évaluation des coûts effectifs, il convient d utiliser les données relatives au serveur ArXiv.org e-print 72, qui ont été communiquées par Anne R. Kenney de la Cornell University Library 73. Il s agit ici du serveur connu sous le nom de «Los Alamos Preprint Serveur» en raison de son emplacement antérieur, serveur qui était surtout utilisé pour des travaux dans certains domaines de la physique et qui est aujourd hui géré par l Université Cornell avec le soutien de la National Science Foundation. Les coûts sont répartis en trois catégories : frais de mise en place, dépenses courantes et dépenses imprévues. Les dépenses courantes ne sont pas faciles à chiffrer et l argent requis pour faire face à ces coûts est comme toujours très difficile à obtenir. Par contre, les dépenses imprévues sont considérées comme plutôt épisodiques et, d après l expérience, l argent requis devrait pouvoir être trouvé à chaque fois. En novembre 2004, le serveur a reçu près de objets, la croissance annuelle étant d environ documents. Type de coût Coûts en $ Somme intermédiaire en $ Remarques Infrastructure serveur, matériel, logiciels Entretien annuel, sauvegardes, frais de réseau, assistance, /5 p.a p.a. Amortissement sur (3 à) 5 ans: $10 600/5 par an Evalués à 20-50% du prix d achat (ici: env. 45%) 72 ArXiv: 73 Anne R. Kenney, Identifying and Securing the Requisite Resources: présentation au séminaire erpatraining Business Models Related to Digital Preservation, Amsterdam, : 104

105 Type de coût Coûts en $ licences, frais de développement Somme intermédiaire en $ 6833 p.a. Remarques Frais de personnel : salaires plus 31% de charges salariales annexes (2 emplois à plein temps de programmeur/ analyste logiciel) x 1,31 x 2 = Point de départ: salaire de $ On calcule un salaire horaire pondéré, où le salaire et les charges salariales (31%) sont uniquement appliqués aux heures productives (sans vacances ; 75% de temps productif par jour). Le salaire horaire pondéré est environ 2,1 fois plus élevé que le salaire horaire normal p.a. Frais de gestion attribués, 10% des frais de personnel Frais liés aux postes de travail (matériel informatique et logiciels, assistance, espace, matériel de bureau, téléphone, frais de déplacement, perfectionnement, etc.) p.a. Dépenses imprévues (correction d erreur, formation supplémentaire) Montant secondaire selon la complexité du serveur, la situation et les expériences faites sur place p.a. Frais généraux («Overhead»), estimés à 57% Sont apparemment répercutés à l interne, par ex. quand les services internes fournissent des prestations Frais annuels p.a. 105

106 Tableau 4: Etude de cas pour identifier les frais d entretien du serveur ArXiv dans le cadre de sa gestion par la Cornell University Library. Il est important de réaliser qu il s agit ici avant tout du coût des activités identifiables liées au stockage, à l entretien du système et à la mise à disposition des données. Aucune mesure active concernant la conservation à long terme n est encore incluse, si bien que les coûts actuels susmentionnés ne peuvent pas servir de référence pour les coûts futurs. Cette évaluation des coûts doit toutefois être prise en compte étant donné qu un stockage consciencieux des données doit dans tous les cas être effectué pour préparer l archivage à long terme. Une séparation nette des différents coûts ne peut pas être effectuée. Des chiffres de comparaison font malheureusement défaut, d autant plus que les bibliothèques ne réalisent pas encore bien que l absence d une base économique stable peut représenter une menace beaucoup plus réelle que les défis techniques attendus. La plus grande partie des frais sont des frais de personnel. Selon une autre analyse de différents systèmes de stockage 74, les frais de personnel représentent de 69% à 82% des coûts globaux ((Lord and Macdonald 2003), p. 23). Comme on pouvait s y attendre, il est souligné ici que l ensemble des coûts occasionnés sont plus ou moins bien pris en compte dans les coûts globaux indiqués. Seule une réduction du personnel pourrait donc permettre de réaliser de substantielles économies. L automatisation de l exploitation doit donc se poursuivre. Avec l augmentation du nombre d objets mémorisés dans le serveur, le coût par objet diminue. Cette réduction devrait être négligeable à de nombreux égards si les coûts sont simplement répartis sur un plus grand nombre d objets sans qu ils soient compensés par des recettes par objet. D autres facteurs jouent aussi un rôle pour le stockage des données des éditeurs comme prévu dans le projet «e-archiving» du Consortium. Alors qu ArXiv est alimenté en documents par un grand nombre d auteurs et peut mettre ces documents librement à disposition dans le monde entier, un serveur de périodiques appartenant au Consortium n a qu un nombre de sources limité qui lui fournissent des contenus avec leurs métadonnées, mais ce matériel peut seulement être mis à la disposition des utilisatrices et des utilisateurs autorisés. Le logiciel d autorisation et d authentification doit de ce fait répondre à des exigences supplémentaires. Le raccordement à un système national, qui est en train d être développé sur la base du middleware Shibboleth dans le cadre du projet SWITCHaai 75, devrait se faire à long terme. Selon le nombre d objets disponibles et de connexions, des exigences supplémentaires peuvent également être posées au matériel informatique, dans la mesure où des opérations supplémentaires sont alors nécessaires. On ne sait pas bien si cela aurait des répercussions sur les coûts et comment. Il n est actuellement pas possible de comparer le nombre de connexions, étant donné que le serveur ArXiv compte les connexions techniques, alors que, chez les éditeurs, les chiffres relatifs à l utilisation correspondent le plus souvent aujourd hui à des téléchargements de textes intégraux. D après les études faites jusqu à maintenant, on estime que le meilleur moyen de réduire le personnel, dans le cas d un serveur de périodiques, serait d utiliser un logiciel développé 74 Dans ce cas, il s agit du stockage de données scientifique au sens large. 75 Authentification and Authorization Interface (AAI): Démonstration sous 106

107 spécifiquement à cet effet, qui serait capable de gérer des schémas de métadonnées diversement complexes et de répondre aux exigences en matière d authentification et d autorisation. A court terme, ce sont les produits commerciaux qui entrent en ligne de compte. Même à moyen terme, il ne faut pas forcément s attendre à ce que la demande pour de telles solutions soit suffisamment élevée pour qu un développement stable sur la base d Open Source soit possible. Type de coût Coûts en $ Somme intermédiaire en $ Remarques Infrastructure serveur, matériel, logiciels Entretien annuel, sauvegardes, frais de réseau, assistance, licences, frais de développement /5 p.a p.a. Amortissement sur (3 à) 5 ans: $ /5 par an Evalués à 20-50% du prix d achat (ici: env. 20%) Frais de personnel : salaires plus 15% de charges salariales annexes (2 emplois à plein temps de programmeur/ analyste logiciel) x 1,15 x 2 Approche momentanée pour un emploi standard à plein temps au Bureau central Frais liés aux postes de travail (administration du personnel, matériel informatique et logiciels, assistance informatique, espace, matériel, téléphone, perfectionnement, etc.) x 2 Approche momentanée pour un emploi standard à plein temps au Bureau central (approche fédérale) Dépenses imprévues (correction d erreur, formation supplémentaire) : 10% des frais d équipement et de personnel Dépend de la complexité du serveur, de la situation et des expériences faites sur place ; montant effectif secondaire 107

108 Type de coût Coûts en $ Somme intermédiaire en $ Remarques Frais annuels Tableau 5: Tentative de report de l évaluation des coûts sur un serveur suisse. A considérer avec précautions du fait que les conditions-cadres sont différentes. Cette évaluation des coûts d un serveur en Suisse s écarte en différents points du calcul effectué pour le serveur ArXiv: Les frais de matériel informatique et de logiciels sont chiffrés à un niveau nettement plus haut dans l estimation suisse. Ce sont surtout les frais de logiciels qui pèsent lourd car il n existe pas de logiciels non commerciaux capables de gérer des périodiques structurés de manière hiérarchique, cette gestion étant relativement complexe. Pour les logiciels commerciaux, il n existe pas de marché de masse qui pourrait faire pression sur les prix. Les frais de matériel informatique sont aussi plus élevés, car il n est pas possible d intégrer des serveurs miroirs internationaux dans le calcul et d alléger ainsi le poids des exigences auxquelles les installations maison des bibliothèques doivent répondre en matière de disponibilité. En raison des exigences de l AAI concernant les contenus qui ne sont pas libres et des volumes de données nettement plus grands, le matériel informatique doit répondre à des exigences supplémentaires. Par contre, les taxes de licence et de maintenance ne sont estimées qu à 20% des frais de matériel et de logiciel. Il s agit là d une estimation empirique, mais qui reste une estimation. Les frais de personnels sont nettement plus élevés. Frais de gestion estimés à 10%: une facturation séparée n est pas courante et n est pas retenue. Les frais généraux de 57% ne sont pas retenus, étant donné que les frais d administration semblent généreux et que les frais liés aux postes de travail sont entièrement compris. Ce poste est supprimé. Cette évaluation ne doit pas donner l impression qu il s agit déjà là des frais d exploitation concrets d un serveur de périodiques. Le personnel requis pour assurer cette exploitation continue n est notamment pas connu. Si des contenus supplémentaires viennent régulièrement s ajouter, cela aura forcément un impact sur le personnel requis. Un chiffre de articles a été donné pour la production d Elsevier/Academic Press en 2002 (Bennett, Conway et al. 2002), ce qui est beaucoup moins élevée que les objets qui sont entrés dans le serveur ArXiv Options Voici les variantes possibles pour l exploitation d un serveur en Suisse: 108

109 1. Mise en place d installations locales dans les bibliothèques qui ne souhaitent pas passer par les serveurs des éditeurs. Toutes les offres des éditeurs sont sur ces serveurs locaux. 2. Installations moins locales, de type régional, dans lesquelles sont conservées certaines offres pour toutes les bibliothèques universitaires suisses autorisées (avec au moins sauvegardes mutuelles). Trois installations sont envisagées. Ce chiffre devrait permettre d éviter les inconvénients des autres modèles, tout en encourageant un échange étroit entre les intervenants: a. Structuré par éditeur: la bibliothèque A gère le serveur sur lequel se trouvent les contenud des éditeurs H, I et J, et la bibliothèque B le serveur pour les éditeurs K et L, etc. b. Structuré par pôle disciplinaire: la bibliothèque A gère le serveur dédié aux titres de tous les éditeurs dans le domaine des sciences sociales, la bibliothèque B, le serveur dédié aux titres dans le domaine de la médecine, etc. Un modèle combiné est aussi envisageable ici : tous les éditeurs spécialisés dans une discipline seraient regroupés dans une bibliothèque spécifique, où leurs titres seraient mémorisés et proposés. Ce modèle ne concernerait qu un petit nombre d éditeurs et un très petit nombre de titres de périodiques au sein du Consortium, étant donné que les éditeurs qui sont très fortement centrés sur une discipline publient beaucoup moins de titres que les éditeurs qui couvrent plusieurs disciplines. A ce stade du projet, cette approche n est donc pas très utile et elle est donc abandonnée. Elle mérite toutefois d être examinée pour la couverture de quelques petits éditeurs pour lesquels il n existe pas de licence consortiale et avec lesquels les bibliothèques passent directement des contrats de licence. En anticipation de l archivage à long terme, la spécialisation de certaines installations dans certains formats de fichier a été discutée. Cependant, dans le cas des périodiques électroniques, une telle spécialisation aboutirait essentiellement à une répartition par éditeur. 3. Avec une installation centrale pour toute la Suisse, tous les contenus concernés seraient à la disposition de tous les établissements autorisés. On suppose qu une telle solution ne pourrait être envisagée que si elle n était pas séparée des bibliothèques : il faudrait au contraire que les bibliothèques engagées la soutiennent par le biais de leur infrastructure. D une manière générale, une solution centrale n est pas souhaitée. 109

110 Variante Avantages 1 - Contrôle complet sur site Inconvénients - Totalité du risque et de la responsabilité sur site - Peu de synergies utilisables 2a 2b 3 - Synergies utilisables - Répartition des charges - Répartition de l expertise - Possibilité de traiter de gros paquets de publications - Protection mutuelle - Synergies utilisables - Répartition des charges - Répartition de l expertise - Attribution claire à une haute école du point de vue de la spécialité : meilleur accueil de la part des organismes assurant le financement - Protection mutuelle - Synergies utilisables dans la bibliothèque - Pas de répartition des charges pour l instant - Seulement un investissement - Support de toutes les charges - Abandon d un certain contrôle - Contenu non concordant avec le profil de la bibliothèque pourvoyeuse: justification nécessaire vis-à-vis de l organisme chargé du financement - Abandon d un certain contrôle - Sélection et traitement des différents titres requis - Chaque serveur doit traiter tous les types de formats -L attribution des spécialités devrait être très difficile - Abandon d un certain contrôle - Expertise uniquement présente au niveau central Peut aussi être un avantage: connaissances plus approfondies? - L acceptation devrait être faible Tableau 6 : Confrontation des avantages et inconvénients des variantes représentées pour le stockage local. La variante 1 ne pourrait être prise en considération que pour les contenus qui ne sont fournis sous licence qu à une seule haute école. Mais, dans ce cas-là aussi, il faudrait se demander si le rattachement à une installation commune ne serait pas plus efficace. Théoriquement, la variante 3 est la plus rectiligne. Elle permet par ailleurs de réaliser certaines économies au niveau de l installation et de l exploitation. La centralisation des connaissances peut être comprise comme la création d un centre de compétences pour la mise à disposition, un centre qui assurerait en même temps les tâches pratiques correspondantes. Une telle solution centralisée ne devrait trouver qu une faible acceptation. Au cours de l étude, des solutions distribuées ont été à plusieurs reprises souhaitées, et les avantages de telles solutions ont déjà été présentés dans le cadre d autres projets. En conséquence, le plus simple serait de faire évoluer un système fédératif d un service 110

111 d archives d une institution participante pour qu il puisse traiter de plus gros volumes de données et aussi pour la gestion du système. En outre, la flexibilité locale et une meilleure sécurité contre les sinistres sont considérés comme des avantages (Cedars 2002). La mise en place de structures centralisées en dehors des bibliothèques n est pas judicieuse, dans la mesure où de telles structures existent en partie déjà dans les bibliothèques. Il semble plus sage, notamment en ce qui concerne l exploitation à long terme via le projet, d utiliser les structures existant dans les bibliothèques ainsi que les points de rattachement entre bibliothèques et, si nécessaire, de les soutenir dans le cadre de leur travail. C est la raison pour laquelle seules les variantes 2a et 2b continueront à être étudiées. En même temps, il est expressément recommandé de travailler avec des partenaires externes pour certaines tâches concrètes afin de pouvoir utiliser des compétences supplémentaires. Figure 6: Représentation schématique du mode de fonctionnement des variantes 2a et 2b pour le stockage et la mise à disposition au niveau local ou régional des contenus acquis: les contenus sont fournis par les éditeurs avec leurs métadonnées et, éventuellement, répartis par spécialités. Concernant l accès, les utilisateurs finals devraient pouvoir, lors d une recherche, consulter tous les serveurs disponibles et recevoir ensuite toutes les informations correspondantes. Il ne faut pas que l utilisateur ait à se demander à quel endroit il doit aller chercher telles ou telles données. Le contrôle de l autorisation d utilisation n est pas représenté ici. Les variantes 2a et 2b soulèvent toutes deux une question qui ne devrait pas être déterminante, mais qui mérite néanmoins qu on s y arrête. Dans les deux cas, les bibliothèques devraient, vraisemblablement, remettre une partie des contenus qu elles ont 111

112 acquis à d autres établissements qui n auraient pas acquis ces mêmes contenus dans leur totalité. Les bibliothèques gérant un serveur sur lequel de tels contenus «étrangers» sont mémorisés devraient alors bloquer l accès à certaines parties du contenu physique à disposition chez elles pour leurs clientes et leurs clients. Il faut espérer que les éditeurs pourraient se contenter d un tel règlement Répartition par éditeur (Variante 2a) L attribution à une bibliothèque des contenus provenant du programme d un seul éditeur offre principalement des avantages pratiques : cette approche permet de traiter un plus grand volume de données qui sont en soi plus ou moins homogènes et suivent la plupart du temps des standards identiques. Un lieu de compétence pour les spécificités d un éditeur peut ainsi être créé, ce lieu étant principalement l établissement qui s occupe activement de fournir les contenus en question. Les autres établissements n ont pas besoin d acquérir les mêmes connaissances et peuvent se concentrer sur d autres éditeurs. Les ressources disponibles se complèteraient ainsi les unes les autres. La plupart du temps, les offres des grands éditeurs couvrent de nombreuses disciplines. Il peut donc arriver qu une bibliothèque propose des contenus d un éditeur auxquels ses clientes et ses clients ne sont guère ou pas du tout intéressés compte tenu des sujets dont ils s occupent. Pour ces contenus, la bibliothèque fournirait surtout un service à d autres établissements ou bien à d autres utilisatrices et utilisateurs. Il s agit là d une forme de collaboration assez traditionnelle entre bibliothèques, mais qui pose problèmes quand l utilisation des ressources doit être justifiée vis-à-vis des organismes qui financent les bibliothèques, ces organismes étant surtout, dans le cas présent, les hautes écoles : on peut leur expliquer que la participation à une mission collective d envergure nationale est aussi dans l intérêt de leur propre bibliothèque? Que les prestations fournies par leur bibliothèque sont compensées par des contreprestations correspondantes de la part des autres établissements? Ou bien faut-il répercuter toutes les prestations fournies sur les utilisateurs effectifs, c est-à-dire ceux qui ne sont pas affiliés à la bibliothèque de la haute école en question? Une réponse complète ne peut pas être apportée à ces questions dans une répartition différente des tâches. C est pourquoi ces questions doivent également être prises en compte dans le cadre des autres solutions Répartition par discipline (variante 2b) Une répartition par discipline des différents titres du contenu devant être mis à disposition permettrait de désamorcer un peu la question abordée au point : lorsque les contenus installés dans une bibliothèque correspondent plus ou moins au profil de l établissement en question, on comprend tout de suite pourquoi ce dernier s implique dans leur mise à disposition. En pareil cas, la co-utilisation avec d autres partenaires peut être plus aisément considérée comme un effet secondaire. Mais la mise en pratique entraîne une augmentation de la charge de travail : si une bibliothèque veut se concentrer sur la mise à disposition de titres dans le domaine des sciences sociales, elle devra, au bout du compte, gérer des contenus de divers éditeurs, avec différents formats et différents standards. Elle devra, pour chaque éditeur, acquérir et tenir à jour les connaissances correspondantes, alors que d autres bibliothèques devront

113 faire de même pour d autres titres du même éditeur. Une éventuelle réduction de cette charge de travail est tributaire de l étroitesse avec laquelle les bibliothèques collaboreraient entre elles malgré la répartition des contenus. De plus, chaque titre doit être sorti du package de l éditeur et attribué en fonction de la matière traitée. Même si cette attribution n est effectuée qu une seule fois, elle augmente la charge de travail. L attribution pourrait se faire en fonction des informations données par les éditeurs ou des listes structurées par spécialités que possèdent la plupart des bibliothèques pour leurs périodiques électroniques. Dans ce contexte, quelques petites questions formelles se posent: Selon l étroitesse de la répartition par spécialités, un titre peut couvrir plus d une spécialité ou même avoir explicitement une orientation interdisciplinaire. Comment faut-il procéder dans ces cas de figure? Alors que des solutions pragmatiques devraient et pourraient être trouvées pour ces questions, il devrait être plus difficile d attribuer à chaque bibliothèque les titres pour lesquels elle se sent investie d une responsabilité particulière. Cela tient au fait que le stockage de certaines données sur site, dans sa propre bibliothèque, est facilement associé à la constitution d un fonds traditionnel: les bibliothèques souhaitent souvent pouvoir mémoriser, et donc contrôler elles-mêmes, tous les contenus qui correspondent à leur profil. Cette idée s oppose naturellement à celle d une collaboration confiante, où, d un point de vue objectif, la question de savoir qui propose quoi ne devrait pas être importante. Le malaise qui apparaît clairement ici ne doit pas être pris à la légère. Il nous semble beaucoup plus fort au niveau de la lutte pour les disciplines que pour la répartition des éditeurs, auxquels ni les bibliothèques, ni les utilisateurs ne s identifient. Un apaisement ne pourra venir que du faible nombre de bibliothèques qui s engageront probablement activement Cas particulier des petits éditeurs Les solutions esquissées ici pour l accès à long terme aux contenus acquis concernent les offres des éditeurs pour lesquelles le Consortium a acquis des licences ces dernières années 76. En novembre 2004, cela s appliquait à 16 fournisseurs qui proposent soit un très grand nombre de titres, soit peu de titres, mais des titres essentiels (Nature, Science). Ces éditeurs publient au total plus de 4000 titres. Avec une solution d accès aux titres de ces éditeurs, on pourrait ainsi garantir aux grandes bibliothèques une grande partie de l offre en cours. En dehors du Consortium, toutes les bibliothèques se procurent d autres titres auprès d un nombre plus ou moins grand d autres éditeurs (voir ). Il s agit souvent de petits éditeurs, la signification de ce terme restant vague : l utilisation du nombre de titres publiés comme référence de taille est souvent juste, mais peut induire occasionnellement en erreur. C est ainsi que les offres concernant les quelques titres de «Nature» et de «Science» sont très élaborées car ces publications ont une importance et une diffusion internationales très grandes, ce qui offre des possibilités à l éditeur. Parmi les fournisseurs qui publient une dizaine de titres chacun, on trouve un nombre relativement grand de sociétés spécialisées qui, en raison de leur taille, ont les moyens 76 Voir en bas sur le site (connexion le ) 113

114 d avoir une puissante infrastructure ou qui confient la diffusion en ligne de leurs produits à des professionnels tels que la société à but non lucratif HighWire Press 77. Les petits et moyens éditeurs cités précédemment ne sont pas explicitement pris en compte dans les réflexions ci-dessus sur la garantie d accès. Leur prise en compte ne pose pas un nouveau problème technique, mais un problème d organisation : les modalités de reprise des données doivent être convenues et mises en application avec chaque éditeur. Pour ce qui est des très petits fournisseurs qui ne produisent que un à trois périodiques, les exigences se renforcent également sur le plan technique, comme l expérience l a montré jusqu ici. Il n est pas rare d observer que les périodiques de petites sociétés scientifiques sont produits et publiés dans le cadre d une Chaire ou dans des instituts de hautes écoles et dépendent de leur infrastructure. Certaines personnes ont déjà émis la crainte que la reprise des données pour les 10% de périodiques publiés par des éditeurs non coopératifs ou mal équipés puisse coûter aussi cher, voire plus cher, de la reprise des données pour des périodiques publiés par les éditeurs, qui représentent les 90% restants (Bennett, Conway et al. 2002). Des arrangements pour l accès à long terme ne seront importants que lorsque les licences correspondantes arriveront à expiration ou que des abonnements donnant un droit d accès ne seront plus reconduits. Il n est donc pas nécessaire de traiter tous les problèmes en même temps, ce qui n empêche pas que le travail requis sera, le cas échéant, important. Il semble donc vain de vouloir adapter une interface d utilisation existante de manière à pouvoir l utiliser pour tous les éditeurs (des centaines à des milliers). En même temps, il ne faut pas oublier que les offres des tout petits éditeurs n ont souvent pas d exigences très élevées: les fonctions qui ne sont pas déjà proposées ou préparées par l éditeur ne seront pas créées ultérieurement pour être intégrées dans un processus de travail simple même si cela était techniquement possible car le travail requis serait trop important. De ce fait, on trouverait ainsi, les uns à côté des autres, des contenus qui ne présenteraient pas tous la même facilité d utilisation. Pour les utilisateurs, cette situation ne serait pas facile à comprendre et à gérer. Les réserves qui ont été faites plus haut pour les éditeurs consortiaux en général sont encore plus valables pour les offres des petits fournisseurs : des solutions maison et dignes de confiance pour l accès à long terme, voire l archivage à long terme, n existent pas toujours et ne devraient pas être élaborées dans l avenir pour cause de manque de moyens. Le risque de turbulences économiques ainsi que de disparition de fournisseurs et de contenus semble plus élevé. Quelques fois, abonnements à des titres de petits éditeurs ont été résilié afin de libérer des ressources pour pouvoir rester abonné aux grands packages de publications et ne pas violer l interdiction de désabonnement les concernant. Ce n est pas une pratique réjouissante, mais, si on ne peut pas l éviter, il faudrait au moins en tenir en compte pour la garantie de l accès. Actuellement, aucune solution convaincante ne peut être proposée. Dans un premier temps, les petits éditeurs ne seront vraisemblablement pas pris en compte lors de la mise en place de serveurs d accès. Cette approche est défendable sur le plan des contenus dans la mesure où la prolongation d une licence consortiale passée avec un grand éditeur apparaît pour la première fois incertaine : il pourrait donc être vraiment nécessaire d agir. Néanmoins, 77 HighWire Press : (connexion le ) 114

115 il faut effectuer des vérifications approfondies auprès des petits et moyens fournisseurs pour avoir une vue exacte de la situation LOCKSS Le LOCKSS 78 (Lots of Copies Keep Stuff Safe) est toujours cité lorsqu il est question de la garantie de l accès aux contenus acquis sous licence. Le logiciel développé dans le cadre de ce projet peut tourner sur un poste de travail normal. Une fois paramétré en conséquence, il mémorise régulièrement dans l ordinateur du poste de travail les nouveaux contenus de périodiques prédéfinis. Mais ce qui est extraordinaire, c est que les ordinateurs distribués à travers le monde qui collectent les mêmes contenus comparent les contenus mémorisés à intervalles réguliers. Cette opération doit, en même temps, permettre de signaler les fichiers qui ne sont plus intacts. Les fichiers en question sont alors repris depuis un autre ordinateur et mémorisés une nouvelle fois, le but étant d avoir toujours une copie à jour et en état de fonctionner. Théoriquement, il serait possible de renoncer à une copie de sauvegarde. Normalement, les clientes et les clients locaux accèdent aux contenus des périodiques chez l éditeur, mais quand il n est pas possible d accéder au serveur en question, et seulement dans ce cas-là, la demande d accès est dirigée vers la copie locale. C est la raison pour laquelle cette fonction est aussi appelée «cache permanent», car cette procédure ressemble à l enregistrement sur un navigateur des pages Internet récemment consultées. Le projet LOCKSS est en partie considéré comme complémentaire au projet JSTOR : ce dernier collecte surtout les contenus anciens, alors que LOCKSS recommande aux éditeurs d exclure ces contenus. Mais il s agit surtout ici de l opposition du dépôt central JSTOR à la solution distribuée LOCKSS. A l heure actuelle, ces deux approches ont leur raison d être dans la mesure où on n a pas encore pu prouver de manière probante laquelle des deux solutions était la meilleure. Derrière l approche distribuée, il y a l idée qu une diffusion aussi large que possible constitue la meilleure protection contre le risque de perte totale, ce raisonnement étant comparable à l attitude des bibliothèques qui conservent leurs fonds physiques en plusieurs endroits. Mais il existe une différence de taille pour la conversion numérique : les différents systèmes de stockage doivent, par moments, communiquer intensivement entre eux et avec les serveurs des éditeurs, ce qui les rend sensibles à des attaques, dans la mesure où cette communication nécessite une certaine ouverture. Mais en raison du nombre élevé de systèmes de stockage, il est peu probable que cela crée des problèmes. Toutefois lorsqu il n existe qu un petit nombre de système pour un certain contenu, on peut imaginer que quelqu un puisse trafiquer le système de comparaison indiquant le contenu correct. Il n existe guère de raisons rationnelles d effectuer de telles manipulations, ce qui ne veut pas dire qu il faut les exclure. Contrairement à certaines déclarations, le projet LOCKSS ne résout pas la problématique de l archivage. De manière assez légitime, il table sur le fait des solutions de remplacement seront trouvées en temps voulu pour les formats (surtout PDF) et les protocoles (http) couramment utilisés. Comme cela a été expliqué dans cette étude, on ne s attend pas non plus à pouvoir résoudre en même temps les questions de l accès et de l archivage. Ce qui est plus problématique, c est que LOCKSS ne peut mémoriser les documents que dans leurs 78 LOCKSS (Lots of Copies Keep Stuff Safe): 115

116 formats de présentation (PDF; HTML). Seuls ces formats seront alors à disposition pour un archivage ultérieur, s il n est pas possible de se procurer d autres données auprès des éditeurs. Dans la plupart des cas, l archivage en format PDF sera de toute façon la seule possibilité. Actuellement, on ne sait pas encore très bien s il est possible de relier les backfiles aux données mémorisées de manière à avoir un seul accès. C est un point qu il va aussi falloir éclaircir pour les autres systèmes, de même que l accès aux contenus mémorisés lorsque les interfaces des différents éditeurs ne seront plus disponibles. Pour bien fonctionner, le système doit être soutenu par les éditeurs des périodiques afin que chaque bibliothèque puisse collecter les contenus et que le logiciel soit techniquement en mesure d effectuer ce travail. Actuellement, 50 éditeurs et 80 bibliothèques participent au projet LOCKSS. La liste des éditeurs n est pas accessible pour l instant: mais parmi les participants au test bêta, on trouve de grands noms tels que Blackwell, BioMed Central, American Chemical Society, British Medical Journal, Institute of Physics et Oxford University Press. Pour la Suisse, c est la bibliothèque du CERN qui participe. Selon ses dires, c est surtout pour des questions de sécurité que le développement traîne en longueur et la collaboration avec les éditeurs n est pas aussi avancée qu on pourrait le croire, même avec ceux figurant sur la liste. De plus, les grands éditeurs, chez lesquels la reconduite des licences packagées n est pas assurée à moyen terme, ne figurent pas sur la liste en question, et on ne s attend pas à ce qu ils fassent preuve d ouverture vis-à-vis de cette initiative. C est pourquoi le projet LOCKSS n aidera, lui aussi, que partiellement à résoudre le problème. La version productive de LOCKSS fonctionne au CERN depuis avril 2004, et les membres du projet aimeraient amener d autres bibliothèques suisses à participer. D après le CERN, en tant qu institut de recherche spécialisé dans le domaine de la physique, il manque des contenus importants dans cette spécialité parce que les éditeurs concernés n ont pas encore donné leur plein accord. Le logiciel est gratuit. Pour pouvoir poursuivre le projet, une alliance LOCKSS sera constituée. Les bibliothèques et les éditeurs apporteront leur contribution en fonction de leur taille. En décembre 2004, les sommes proposées allaient de USD à par an pour les bibliothèques et de USD à pour les éditeurs. L objectif visé est d avoir une équipe d assistance centralisée durant cinq ans pour créer une communauté internationale stable. Du point de vue des membres du projet, LOCKSS devraient être testé par une ou plusieurs bibliothèques du Consortium, notamment pour les petits éditeurs qui ne sont pas couverts par le Consortium. Les coûts et le risque sont, semble-t-il faibles. Même la cotisation (bénévole) qui sera demandée ultérieurement est modérée comparé à d autres taxes. Les limites du système doivent être comprises pour pouvoir prendre des décisions conscientes quant à son utilisation Moment de la reprise des données Les explications données jusqu à présent sont basées sur les contrats de licence en cours, qui se fondent sur des recommandations internationales. Selon ces contrats, la reprise des contenus et des métadonnées n est prévue que si une licence conclut pour les contenus en question n est pas reconduite. Le moment de la reprise des données est ainsi défini, mais il n est pas concrètement connu à l avance, et donc guère planifiable. Si une licence devait 116

117 prendre fin au motif que l éditeur ne pourrait plus maintenir son offre, on peut se demander s il serait en mesure de veiller à ce que la reprise des données se fasse de manière organisée et conformément à la convention. Comme expliqué au point 8.4.2, le risque que des offres d éditeur toute entières disparaissent est considéré comme plus faible qu une fin de licence «normale» pour cause de non-reconduction. Le grand avantage d une reprise ultérieure des données réside dans la possibilité d obtenir des contenus et des métadonnées actualisées, ce qui, dans certains cas isolés, peut signifier qu un article ayant été purement et simplement retiré, manque (voir 7.1.5). Une autre possibilité serait de chercher à obtenir les contenus et les métadonnées le plus tôt possible, sans que cela soit lié à une occasion particulière. Au final, les contenus sous licence seraient ainsi, d une manière générale, hébergés localement pendant la durée de la licence, une solution qui, en règle générale, n est pas admise actuellement par les conventions de licence en vigueur pour les périodiques. Mais le Consortium a depuis longtemps ses propres serveurs pour certains produits de bases de données. Les expériences faites avec ces installations sont mélangées. En cas d exploitation régulière, il est possible, par rapport à l accès chez un éditeur, de réaliser, sur plusieurs années, des économies, en dépit des frais d investissement et d exploitation pour l infrastructure maison. Par ailleurs, il est également possible de réagir rapidement en cas de petit incident. Le débit des transmissions de données, qui a pendant quelque temps été notablement plus élevé en Suisse qu ailleurs, a un peu perdu de son importance. Cette vision positive des choses repose sur le fait que les fournisseurs de bases de données mettent en pareil cas leurs interfaces de recherche et de présentation à la disposition des installations locales : les utilisateurs peuvent ainsi utiliser le contenu et les fonctions d une offre exactement de la même manière que quand ils passent par le serveur du fournisseur. En cas de problèmes plus importants n ayant pas seulement une origine locale, le fournisseur a beaucoup plus de choses à vérifier, et il faut être sûr qu il fera alors tout son possible pour résoudre les problèmes, même si, contrairement à ce qui se passe quand il s agit de son propre serveur, seule une petite partie de sa clientèle est concernée. Dans les cas graves, le travail requis peut annihiler les économies qui seraient normalement possibles de faire. De plus la politique des fournisseurs en matière d installations locale est sujette à variation et on s est rendu compte qu il s agissait là d un problème plus profond. C est pourquoi un hébergement local ne devrait être pris en considération que si le fabricant s engage à long terme à assurer l entretien de la version du produit installée localement, et que cet entretien couvre au moins toutes les fonctions qui seraient disponibles pour l accès au serveur de l éditeur, ces fonctions étant requises par les utilisateurs et les personnel de la bibliothèque. Il existe des bibliothèques et des consortiums qui mettent des contenus de périodiques localement à disposition. Un des plus grands exemples est celui d OhioLINK 79 avec son Electronic Journal Center (EJC). Il existe aussi, pour quelques éditeurs, des installations en Allemagne (par ex. Consortium HeBIS 80 avec ScienceDirect on Site pour Elsevier et Cell Press). L installation Elsevier dans HeBIS est toujours citée comme exemple d accès à long 79 OhioLINK Ohio Library and Information Network: (Zugriff am ) 80 HeBIS Hessisches Bibliotheksinformationssystem: voir sous HeBIS-Konsortium sur ce site (connexion le ). 117

118 terme à des contenus acquis pour d autres associations allemandes de bibliothèques qui ne reconduisent pas leurs licences avec Elsevier. Cette installation contient actuellement 898 titres (situation au ) des éditeurs Elsevier/Academic Press/ Harcourt Health Science, dont 733 étaient sous licence jusqu en Pour les autres, la licence est terminée, mais les années qui étaient sous licences restent cependant utilisables. Dans le cas où la licence compend l accès aux titres en Additional Access, ces titres ne sont naturellement pas disponibles pour une installation locale. Compte tenu de sa considérable diffusion, l offre ScienceDirect on Site constitue une exception : si des offres définies d autres éditeurs existent, elle sont certainement moins souvent représentées. Pour le Consortium suisse, il est proposé de ne pas rechercher un hébergement local et d envisager une installation locale seulement dans les cas où des problèmes d accès seraient autrement susceptibles de se produire. Malheureusement, la solution qui permettrait aux bibliothèques d accéder librement à l éditeur pendant un certain temps après la fin de la licence et de reprendre ultérieurement les contenus préparés de manière adéquate, n est pas réalisable chez certains éditeurs : la taxe unique demandée lors de l entrée en vigueur de cette utilisation ultérieure est relativement élevée et rend cette option inintéressante (voir 8.5.1). Le modèle prévoyant une taxe annuelle modérée est par contre envisageable et intéressant Accès par l intermédiaire de fournisseurs tiers On appelle «fournisseurs tiers» les organismes qui ne sont ni des éditeurs commercialisant leurs propres contenus, ni des bibliothèques acquérant les contenus des éditeurs. Les principaux fournisseurs tiers dont il est question généralement sont JSTOR et OCLC. Ces deux fournisseurs fonctionnant différemment, ils ne répondent pas aussi bien l un que l autre aux questions en suspens concernant l accès à long terme aux contenus acquis. Ces offres de tiers présentent la faiblesse inhérente de constituer une présélection qui non seulement repose sur des critères de contenu, mais en plus dépend fortement des maisons d édition avec lesquelles des accords ont pu être conclus. Tous les contenus souhaités par les bibliothèques n y figurent pas; a contrario, le fonds peut être encombré par des ouvrages ne correspondant pas aux besoins. Faire appel à des fournisseurs tiers implique toujours l abandon d une partie du contrôle que l on exerce sur les contenus et la création de nouvelles dépendances, en ce qui concerne à la fois le service proprement dit et son financement JSTOR A l origine, le projet JSTOR (Journal Storage) de la fondation Andrew W. Mellon avait pour objet principal de numériser des collections complètes de revues, dans un double but : améliorer l accès à ces contenus grâce à des fonctions de recherche conviviales et à leur diffusion en ligne ; permettre aux bibliothèques d entreposer leurs collections sur papier dans des magasins plus économiques, voire s en séparer. Le gain de place ainsi obtenu devait générer des économies à long terme. Ce système devait également résoudre, en totalité ou en partie, les problèmes tenant à la conservation des collections. Le projet est devenu une organisation à but non lucratif en

119 JSTOR a ceci de particulier que les contenus auxquels il donne accès sont soumis à une limite d accès mobile (Moving Wall). Convenue avec chaque éditeur, cette limite indique les années de publication récentes qui sont accessibles uniquement aux institutions ayant pris une licence directement auprès de la maison d édition et qui ne sont donc pas mis à la disposition de la clientèle de JSTOR. Cette limite mobile comprend généralement les trois à cinq dernières années. D autres types d accord sont passés avec les maisons d édition qui sont en train de mettre en place leur propre service d accès en ligne à leurs publications anciennes. Certains éditeurs imposent aussi des limites d accès fixes. Dans ce cas, JSTOR a conclu des accords prévoyant que les contenus non accessibles entrent dans ses archives lorsque la maison d édition concernée cesse de mettre elle-même ce contenu à disposition sous forme électronique. Dans certains cas de limite d accès mobile, un système de recherche parallèle dans JSTOR et dans les données récentes de l éditeur concerné fonctionne déjà. Les résultats de la recherche indiquent le serveur de la maison d édition, qui assure son propre contrôle d accès. Le but déclaré de JSTOR est toutefois de reprendre les contenus récents des maisons d édition. A l heure actuelle (novembre 2004), le fonds de JSTOR comprend 449 titres. Parallèlement à la mise à disposition de contenus, JSTOR souhaite créer des archives à long terme dignes de confiance. L organisation travaille donc sur la mise en place d une infrastructure technique et organisationnelle adéquate pour maîtriser l archivage à long terme. Avantages sur le plan de la sécurité d accès: 1. JSTOR est une institution indépendante qui jouit d un bon capital de confiance. 2. Il est possible d accéder à tous les fichiers (backfiles) d un titre sous licence numérisés a posteriori. 3. Le fonds comprend des titres édités par de petites maisons d'édition, et pas seulement en anglais. 4. L organisation a des accords avec les maisons d édition. 5. Il est possible de réactiver le contrat à l intérieur d un délai déterminé après sa suspension (5 ans). 6. Les sciences humaines et sociales sont fortement représentées, ce qui est plutôt le contraire chez les autres fournisseurs. Inconvénients: 1. Propose une sélection de titres et non pas un ensemble exhaustif, même pour les petites maisons d édition. Pour les grandes maisons d édition, se limite à quelques titres Le tarif prévoit un droit d entrée unique (Archive Capital Fee) pour financer l archivage à long terme puis des redevances annuelles élevées (Annual Access Fee). 81 JSTOR: List of Currently Available Journals by Publisher: ; les petites maisons d édition sont majoritairement des associations, des sociétés et des instituts. Les grandes maisons d édition sont représentées par un faible nombre de titres, p. ex. Blackwell (9 titres), Cambridge Univ. Press (14), Kluwer (3), Oxford Univ. Press (20), Taylor & Francis (8), John Wiley (4). 119

120 3. Les contrats avec JSTOR se rapportent à des collections prédéfinies de titres ou à l offre complète. La sélection de titres individuels n'est pas prévue. 4. Les preneurs de licence ne peuvent que consulter les données, mais pas les reprendre. A l issue du contrat avec JSTOR, les parties au contrat n ont plus de droits. 5. Pour les années les plus récentes, qui sont aussi les plus utilisées, les bibliothèques doivent passer par la maison d'édition concernée. 6. Le système a pour but: a. de mettre à disposition des contenus intéressants qui sont anciens et difficilement accessibles ; b. de mettre en place un archivage à long terme pour les contenus anciens ; c. mais pas d'assurer un accès suivi aux contenus récents. Pour donner une idée des coûts, nous ne pouvons qu indiquer les tarifs publiés pour le marché américain 82. Selon nos informations, les tarifs européens sont en partie inférieurs lorsque les collections contiennent une partie importante de titres spécifiquement américains. Chaque collection pluridisciplinaire (il en existe quatre et un complément) et chaque collection monodisciplinaire (il en existe six) donnent lieu au paiement d un droit d entrée (Archive Capital Fee, ACF) et au paiement d une redevance annuelle (Annual Access Fee, AAF). Le droit d entrée n est dû qu une fois et il ne doit pas être repayé en cas de réactivation d un contrat suspendu tandis que la redevance annuelle est généralement redéfinie chaque année. En théorie, la redevance annuelle peut baisser si la clientèle de JSTOR se développe. Le rapport entre droit d entrée et redevance annuelle varie selon les collections. Le barème prévoit cinq niveaux de droit d entrée et de redevance annuelle, selon la taille et le degré d activité au niveau recherche dans l institution qui conclut la licence. Le barème pour les Etats-Unis est adossé à la classification Carnegie des établissements d études supérieures, elle-même reposant sur le paysage éducatif américain, où le bachelor et le masters, d une part, et les formations postgrades, d autre part, sont proposés dans des établissements distincts. Les barèmes pour les autres pays tiennent compte des systèmes nationaux et, par exemple, calculent le tarif uniquement en fonction du nombre d étudiants ou d employés à plein temps. La classification par taille des universités suisses est effectuée sur la totalité de l échelle. De plus, dans certains cas, les tarifs varient selon que l on a déjà ou non d autres licences. A noter qu un titre peut être contenu dans plusieurs collections. 82 JSTOR U.S. Participation Fees by Collection : 120

121 JSTOR Classification JSTOR Language & Literature Collection de 57 titres Archive Capital Fee Annual Access Fee JSTOR Ars & Sciences II Collection de 122 titres Archive Capital Fee Annual Access Fee Very large $ $ $ $ Large $ $ $ $ Medium $ $ $ $ Small $ $ $ $ Very Small $ $ 700 $ $ Tableau 7: Exemples de tarifs de JSTOR pour le marché américain pour une collection monodisciplinaire et une collection pluridisciplinaire, état en novembre Le barème est différent hors des Etats-Unis, où l on compte p. ex. le nombre d étudiants à plein temps. La classification par taille des universités suisses est effectuée sur la totalité de l échelle, de «very large» à «very small». Il est difficile d évaluer les coûts. Le montant total que les universités suisses déboursent actuellement pour la totalité des collections qu elles acquièrent est considérable. D autre part, le service et la valeur de contenu de JSTOR sont reconnus. Il faut souligner que le droit d entrée et les redevances annuelles demandées par JSTOR financent à la fois l accès aux données et leur conservation à long terme. Il y a cependant un problème: en raison de la limite mobile, les dépenses pour accéder aux contenus de JSTOR s ajoutent aux dépenses pour accéder aux contenus récents. Si l on considère uniquement l objectif d avoir un accès durable à des contenus pris sous licence par le Consortium, force est de constater que JSTOR ne travaille pas sur les «bons» contenus et ne prévoit pas de le faire dans un avenir proche : l offre de cette organisation est intéressante parce que complémentaire des grandes maisons d édition, qui ont les moyens de développer elles-mêmes la numérisation de leurs contenus. Bien que JSTOR souhaite reprendre des contenus numériques réalisés par des éditeurs de toutes tailles, il ne faut pas s attendre actuellement à ce que ceux-ci lui confient la mise à disposition de leurs contenus. Il sera cependant intéressant de revenir sur le cas de JSTOR en ce qui concerne l archivage à long terme (8.6) et la numérisation OCLC OCLC (Online Computer Library Center) est une organisation à but non lucratif fournissant un service aux bibliothèques qui en sont membres. Ses services dans le domaine de l accès aux revues électroniques sont regroupés sous le label OCLC Electronic Collections Online (ECO). Contrairement à JSTOR, OCLC se concentre sur la diffusion de publications 121

122 récentes, qui sont proposées sur la base d'accords avec les éditeurs concernés. OCLC déclare proposer déjà plus de 5000 titres appartenant à plus de 70 éditeurs 83. La particularité d OCLC est de négocier dans ses contrats avec les éditeurs un droit d archivage permanent : les contenus qu OCLC met à disposition restent sa propriété pour toujours. L organisation peut donc proposer aux bibliothèques un accès aux contenus qu elles ont acquis même si elles ne reconduisent pas leur licence auprès de l éditeur. A cet effet, la bibliothèque conclut avec OCLC un contrat indiquant les titres choisis et l autorisation d accès est fonction de l ampleur de la licence que la bibliothèque avait auparavant contractée avec l éditeur. L organisation étudie la possibilité de proposer des services comme une assistance en cas d urgence (Hot Backup), dans lequel OCLC prendrait immédiatement le relais pour fournir les contenus en cas de défaillance temporaire du serveur d une maison d édition. Avantages de l offre OCLC ECO : 1. OCLC, qui existe depuis plusieurs dizaines d années déjà, jouit d un capital de confiance élevé parmi ses nombreux membres. 2. Il est possible de choisir des titres individuellement. 3. Les tarifs sont calculés par titre. L organisation articule des prix de $12 à $20 par titre et par an. 4. Les droits d archivage du fournisseur sont clairs. Des projets d archivage à long terme existent. 5. L offre comprend beaucoup d'éditeurs importants et quelques grosses maisons d édition Il est possible de réactiver le contrat à l intérieur d un délai déterminé après sa suspension (5 ans). Inconvénients: 1. De grandes maisons d édition importantes ne sont pas dans le catalogue. 2. Les preneurs de licence ne peuvent que consulter les données, mais pas les reprendre 85. A l issue du contrat avec OCLC, les parties au contrat n ont plus de droits. 3. Le concept a pour but d offrir un service aux institutions qui accèdent déjà aux titres en ligne par l intermédiaire d OCLC ECO et qui souhaitent pérenniser cet accès. Une question n est pas encore clarifiée actuellement : les institutions qui accèdent aux collections directement auprès de l éditeur doivent-elles ou non attendre la fin de leur licence pour basculer chez OCLC? 4. Les maisons d édition peuvent résilier leur accord avec OCLC pour les nouveaux contenus. Dans ce cas, OCLC ne conserve que les contenus parus antérieurement 83 (visité le ) 84 C est le cas, entre autres, de Academic Press (jusqu en 2002), Blackwell, Karger, Kluwer, Nature Publ. Grp., Taylor & Francis, Oxford Univ. Press et d autres presses universitaires. 85 Il serait possible de reprendre les données uniquement dans le cas où OCLC cesserait son service, sous réserve naturellement de l accord des éditeurs. 122

123 (exemple: Academic Press IDEAL est proposé jusqu en 2002 seulement, jusqu à sa reprise par Elsevier). Le modèle d OCLC répond théoriquement en grande partie au besoin des bibliothèques d'avoir un accès permanent assorti d une perspective d'archivage à long terme et il est particulièrement bien pourvu en titres de petites et moyennes maisons d édition, ce qui est heureux car elles sont souvent sous-représentées dans d autres projets. Ce modèle suppose toutefois que les bibliothèques renoncent à contrôler elles-mêmes les contenus, s exonérant ainsi d une partie de la responsabilité afférente. Il faut accepter une dépendance durable visà-vis du fournisseur et de la possibilité qu il reconduise les contrats. Toutefois, OCLC ECO ne saurait être fournisseur unique ou complet en raison de son offre limitée. Comme le montre la résiliation du contrat par Academic Press IDEAL après son changement de propriétaire, les grandes maisons d édition ne sont pas disposées à abandonner leurs contenus Fourniture de documents Selon une étude portant sur les années , la fréquence de consultation des revues diminue rapidement avec l ancienneté de la publication (Tenopir and King 2000), p. 188 ss). Parmi les articles lus par les scientifiques universitaires, 58,5% avaient un an maximum et 12,3% deux ans. Seuls 15,4% avaient plus de 5 ans, dont 6,1% plus de 10 ans (cf. Tableau 8). Cette étude relève en outre que les articles anciens sont plutôt lus à des fins de recherche (80% pour les articles de plus de 5 ans) tandis que les articles récents sont plutôt lus à des fins pédagogiques (dans les mêmes proportions). Parallèlement, le mode de consultation change : les articles récents sont principalement feuilletés pour s informer alors qu en ce qui concerne les articles anciens, les recherches, les citations ainsi que les mentions de collègues et d autres sources prennent une importance supérieure. 123

124 Age de l article (nombre d années depuis la publication) Scientifiques universitaires Scientifiques non universitaires ,5 66,9 2 12,3 15,1 3 6,2 1, ,7 5, ,3 2, ,5 2,9 >15 4,6 5,2 Total 100,1 99,9 Tableau 8: Pourcentage de consultation par les scientifiques universitaires et non universitaires selon l âge des articles scientifiques de 1993 à 1998 (Tenopir and King 2000), p. 189). Une étude allemande portant sur les commandes d articles tirés de revues médicales en 2002 confirme que 44% des commandes portaient sur l année en cours et les deux années précédentes et 80% portaient sur les dix dernières années; 5% des articles commandés avaient plus de 25 ans (Obst 2004). Ces résultats présentent une certaine distorsion car ils tiennent compte uniquement des commandes, et pas des articles disponibles sur place (en ligne ou physiquement). Il y a tout lieu de penser que si l étude avait inclus l ensemble des titres, le taux de consultation des articles récents aurait été encore plus élevé. En tout état de cause, cette étude confirme les grandes lignes de la pondération. Si le constat de fond découlant de l étude conduite par Tenopir et King reste probablement vrai aujourd hui, il n en va vraisembablement pas de même de l affirmation selon laquelle plus de 90% des articles de plus de 5 ans sont lus en bibliothèque. En effet, les collections de plusieurs revues créées sous forme électronique ont déjà dépassé cet âge et le recours extensif à la numérisation rétroactive a considérablement amélioré l accès en ligne à des publications bien plus anciennes. Cela pose la question de savoir dans quelle mesure le faible taux de consultation des articles anciens est une conséquence de leur difficulté d accès et si ce taux est appelé à évoluer de manière décisive. On peut s attendre à un phénomène de report, mais la quantité de nouvelles publications est telle que cela limite naturellement la consultation d articles anciens. De plus, le contenu des articles anciens est rapidement dépassé. Et comme, en outre, la situation varie fortement d un domaine à l autre, il n y a pas lieu de s attendre à un changement fondamental des comportements de consultation. Il est nécessaire de prendre des mesures pour assurer l accès aux contenus peu de temps après leur publication (un à cinq ans seulement). Ces mesures sont justifiées par une consultation intensive. Au-delà de cette plage de temps, les consultations ne représentent

125 que 15% à 20%. Les bibliothèques qui n ont pas pour mandat exprès de conserver ellesmêmes les publications acquises sont donc tenues d envisager la possibilité de couvrir les besoins restants en faisant appel à des services performants de fourniture de documents. On ne peut nier que cela crée une dépendance : il importe de prendre les dispositions nécessaires pour s assurer non seulement que les possibilités de fourniture externe perdurent, mais aussi que les conditions de livraison et les tarifs soient bien cadrés par des contrats à long terme. Cette préoccupation est illustrée par le service allemand Subito 86, dont la structure des coûts, voire l existence même, est actuellement compromise par les conséquences législatives de la révision du droit d auteur en Allemagne. Le coût des formules de paiement par consultation (Pay-per-View) proposés par les maisons d édition fait obstacle à leur diffusion élargie. Il y a deux raisons à cela : les utilisateurs finaux ne savent généralement pas combien coûte l acquisition de revues scientifiques par abonnement ou sous licence et cette formule ne permet pas aux bibliothèques de maîtriser les coûts. Des perspectives pourraient s ouvrir dans ce domaine si des accords de longue durée étaient conclus au moins entre les bibliothèques universitaires de Suisse, et mieux encore entre les collectivités qui en sont responsables, pour définir le cadre économique du fonctionnement des bibliothèques. Sur cette base, on pourrait alors procéder à des comparaisons de coûts à moyen et à long terme entre les différentes possibilités d accès. La fourniture de documents ne pourra manifestement pas faire concurrence aux offres d accès en ligne à des archives pour quelques francs par an et par titre (cf. OCLC et les premières maisons d édition arrivant sur ce créneau), que ce soit sur le plan des coûts ou sur celui du confort. Toutefois, la comparaison des coûts est bancale car les services de fourniture de documents s adressent non pas aux bibliothèques, mais directement aux utilisateurs finaux, qui passent commande en libre service. Il faut relever qu actuellement le coût de l accès aux archives est à la charge des bibliothèques tandis que celui de la commande de documents est à la charge de la personne ayant passé la commande. La bibliothèque de médecine de la bibliothèque publique et universitaire de Münster (ULB Münster) pratique une autre formule depuis quelques années (Obst 2004): après avoir réduit très fortement le nombre de ses abonnements aux revues sur papier, elle propose à des catégories déterminées d utilisateurs une fourniture électronique gratuite via le service Subito. Cette formule repose sur un pilier important : l'observation permanente et en temps quasi réel des commandes pour lutter contre les abus, d une part, et pour déterminer s il est rentable de s abonner à un titre donné, d autre part. En 2002, 4938 articles tirés de 1827 revues ont été commandés, ce qui représente peu de commandes par titre. De plus, les revues les plus consultées varient fortement d une année à l autre. Ainsi, en 2002, il aurait été plus économique de s abonner à une seule revue très prisée plutôt que d'utiliser la formule des commandes. Ces considérations économiques sont bien entendu l une des raisons pour lesquelles certaines maisons d édition s opposent à Subito. A titre de comparaison, on peut ajouter qu'en articles tirés de 1837 titres ont été consultés en ligne et articles tirés de 214 revues ont été lus sur papier. Mais étant donné les spécificités structurelles du marché des revues médicales, la transposition de ces résultats à d autres domaines exige une prudence certaine. 86 Subito Dokumente aus Bibliotheken e.v.: 125

126 L étude (Obst 2004) mentionne expressément la baisse de confort associée aux commandes sur Subito (avant toute commande, il est obligatoire de contrôler si le titre est disponible localement). Par définition, les services de fourniture de documents ne peuvent pas atteindre la rapidité de l accès en ligne, qui est immédiat. Il appartient à chaque bibliothèque d évaluer si, dans son cas, elle doit offrir ce même niveau de convivialité pour les articles anciens également et combien vaut cette prestation. Le sondage réalisé auprès des bibliothèques du Consortium a confirmé qu une grande importance est attachée à l aspect de la convivialité (cf ). On peut dire aujourd hui que l appel à des services de fourniture de documents n'est envisageable que pour les bibliothèques qui tablent sur une utilisation très faible et fractionnée entre un grand nombre de titres. Il est clair que cela accentue la concentration de collections et d offres déterminées dans un petit nombre de grandes bibliothèques. Cela suppose une dépendance à la fois en ce qui concerne les contenus et sur le plan économique. Car même si ces bibliothèques et les collectivités qui en sont responsables sont disposées à pratiquer des tarifs stables, il y a tout lieu de penser qu elles en seront empêchées par l évolution des conditions politiques ou légales. Les actions judiciaires nationales et internationales en cours contre le service de fourniture de documents électroniques Subito constitue à cet égard un avertissement clair (Müller 2004) La politique des maisons d édition Aucune des solutions esquissées ne répond à toutes les questions et aucune n a le soutien de l ensemble des maisons d édition. Il faudra donc trouver une combinaison entre ces solutions. Le tableau ci-dessous illustre la situation actuelle chez différents éditeurs. 126

127 Maison d édition Clause d accès à l expiration de la licence Reprise des données par le client Contenus accessibles via OCLC ECO Favorable au principe de LOCKSS ACS (American Chemical Society) (+) Elsevier IOP (Institute of Physics) JSTOR Kluwer Academic OUP (Oxford University Press) (+) (via Highwire Press) Springer (Springer LINK) Wiley (Wiley InterScience) Tableau 9: Politique des maisons d édition concernant les différents moyens envisagés pour accéder aux contenus par l intermédiaire d une sélection de fournisseurs. Aucune solution n est adaptée à l ensemble des cas. Comme expliqué dans le corps du texte, les différents moyens d accès ne sont pas équivalents. Il est important de noter que les organismes qui participent actuellement au projet LOCKSS accomplissent un travail de développement et qu au final la participation revêtira une forme différente et élargie. L assurance d accès par l éditeur est soumise à certaines limitations dans le temps et pourra engendrer des coûts immédiatement ou ultérieurement. La reprise des contenus pourra aussi donner lieu à des frais de transfert. Comme les différentes solutions ne peuvent pas être considérées comme équivalentes, il faudra en faire une évaluation comparative en tenant compte à la fois des coûts et des besoins de chaque institution (p. ex. contrôle total ou dépenses locales réduites) Recommandations pour assurer l accès aux revues Pour la suite du projet, il est recommandé de prendre les mesures ci-dessous. Pour assurer leur exécution, il est prévu de renforcer les équipes par des spécialistes en technologies de l information dans le courant du printemps Selon les prévisions, le besoin d un système productif devrait être avéré au plus tard lorsque 127

128 les ressources du projet allouées à l acquisition de produits d information arriveront à terme (les ressources débloquées en 2005 sont utilisées pour acquérir les contenus de 2006). Conception détaillée d un serveur distribué sur trois (ou deux) sites qui soit capable de reprendre et de mettre à disposition les contenus commerciaux de maisons d édition. L architecture prévoit une structure par éditeurs, dont le niveau de priorité est évalué au cours de l année en fonction du déroulement des négociations sur les licences. o o o o o Si cela est possible, les exigences de l archivage à long terme doivent être prises en compte. Cela concerne particulièrement l utilisation de normes et la documentation. Cela permettra de réunir une partie des conditions importantes nécessaires à l archivage, qui pourrait être réalisé dans une version élargie de ce système d accès. Prise en compte de l évolution du système SWITCHaai d authentification et d autorisation d accès. Prise en compte des expériences et des tests du système LOCKSS (voir plus bas). Définition de critères permettant de déterminer dans quelles conditions quelles données doivent être reprises. Cela peut impliquer qu aucune donnée ne soit reprise jusqu à nouvel ordre, ou seulement en nombre très limité. Recherche des partenaires concernés dans les universités (centres de calcul, etc). Indépendamment, installation pilote du système LOCKSS par des partenaires intéressés (2005). Poursuite des échanges avec des institutions faisant des efforts analogues à l étranger (à l heure actuelle, en Allemagne essentiellement). Choix du ou des partenaires du Consortium pour la mise en oeuvre concrète avec désignation expresse d un chef de file. Mise en place d un premier serveur, si possible fin 2005 ou début Etude des possibilités d intégration des fichiers numérisés a posteriori (backfiles). o Déterminer quels fichiers de rétronumérisation achetés se trouvent dans quelles bibliothèques. Sur la base du début de mise en oeuvre concrète, estimation approfondie des dépenses à prévoir pour l exploitation opérationnelle du système dans son ensemble. Si la mise en place du premier serveur a un résultat positif, installation de deux autres serveurs en 2006/2007. Formulation d une stratégie pour la responsabilité institutionnelle du projet à long terme. 128

129 8.6 Archivage à long terme Les travaux sur l archivage électronique (projet «E-Archiving») menés par le Consortium suisse oscillent entre deux pôles : l accès et l archivage. L accès est un vaste domaine, qui touche des questions comme la durabilité de l accès aux contenus acquis, le rôle des serveurs de documents en accès libre (Open Access) ou encore la numérisation des collections imprimées. Cette diversité est en adéquation avec la fonction du Consortium ainsi qu avec les intérêts des clients finaux et des bibliothèques à court et moyen terme. La question de l archivage à long terme a été brièvement évoquée au sujet des fournisseurs tiers sous le point Ceux-ci affirment allier, sous des formes différentes, la sécurité d accès et l archivage à long terme. Toutefois, l appréciation du risque de perte de l accès à des informations sous licence (8.4.2) a montré que la qualité des projets d archivage n est pas forcément un gage de sécurité des accès, et inversement. Contrairement aux apparences, il ne s agit pas là d un paradoxe. L importance relative accordée aux pôles accès et archivage est liée à la notion de temps. Sur une période courte (3 à 5 ans), la question primordiale est celle de savoir selon quelles modalités l institution pourra continuer à exercer les droits qu elle a acquis en cas de changement de situation. Pendant cette période, la certitude de bénéficier d un archivage à long terme fiable présente peu d avantages en termes d'accès. Mais en règle générale, l accessibilité doit pouvoir être maintenue sur le long terme. C est après 5 ans au plus tard qu apparaissent les premières complications portant atteinte à l exploitabilité des contenus, même si ceux-ci sont sous le contrôle des bibliothèques (cf. 3.2). Après un certain temps, l accès peut même ne plus être assuré si des mesures en vue d un archivage ne sont pas prises : l accès devient dépendant de l archivage et l archivage est facilité par le fait que l accès a été organisé dès les premières étapes du processus de sauvegarde et de conservation Aspects juridiques de l archivage Il y a essentiellement trois questions juridiques qui entrent en jeu pour apprécier l intérêt, les possibilités et les méthodes d archivage de données électroniques. 1. L institution qui procède à l archivage a-t-elle le droit de sauvegarder les données concernées? 2. A-t-elle le droit de donner accès à ces données à des utilisateurs autorisés? Cela peut se rapporter aux utilisateurs finaux, mais aussi aux bibliothèques. 3. A-t-elle le droit d appliquer aux données sauvegardées les méthodes techniques jugées nécessaires pour assurer leur conservation à long terme? Cela vise en particulier : a. les mesures qui violent ou contournent les dispositifs de protection contre la copie mis en place par les fabricants ; b. les interventions qui apportent des modifications techniques aux données, mais qui sont nécessaires pour leur conservation ; par exemple, une migration effectuée pour s adapter à un nouveau format modifie toujours la séquence 129

130 d origine des caractères, entraînant à chaque fois des modifications croissantes de la présentation. Les points 1 et 2 sont réglés dans les accords conclus entre éditeurs et bibliothèques. Aujourd hui déjà, un grand nombre de contrats de licence indiquent, au moins dans les grandes lignes, quels sont les droits existants. Ce qui reste ouvert, ce sont surtout les détails techniques et les éventuelles redevances dues pour le transfert de données ainsi que la fiabilité de l accomplissement de ces tâches (sauvegarde et mise à disposition) par des tiers. Le point 3a, lui, est de plus en plus intégré dans les législations nationales sur le droit d auteur, notamment en Suisse 15. Des études sont en cours pour déterminer dans quelle mesure une interdiction de contourner certaines règles de la protection contre les copies ou de la gestion des droits numériques (Digital Rights Management) en général pourrait entraver le fonctionnement à venir des bibliothèques. Cependant, les mesures de ce type sont appliquées principalement à ce jour aux contenus vendus sur des supports électroniques, comme la musique et les jeux vidéos sur CD-ROM, etc. En ce qui concerne le point 3b, les fournisseurs comme les bibliothèques sont pratiquement vierges de toute expérience. Les accords de licence courants sont muets sur le sujet. Le plus approchant est une vague autorisation de réaliser des copies de secours «dans la mesure où cela est raisonnablement nécessaire» ainsi que d effectuer de temps à autre une mise en miroir des données. Le cadre de la législation sur le droit d auteur est loin d être stable. Il serait donc souhaitable d avoir un système d archivage suffisamment flexible pour qu il puisse être adapté aux évolutions qui ne manqueront pas d intervenir dans ce domaine. Malheureusement, il n est pas évident que cette exigence puisse être mise en pratique Concepts de fonctionnement Il est important de relever une nouvelle fois que l ensemble de la réflexion sur la mise en place d un archivage à long terme repose sur la vision actuelle des choses, ce qui est une limitation en soi. C est vrai en particulier pour toutes les questions de conservation logique de contenus dans un état interprétable. Il faut bien faire la distinction avec la conservation pure de séquences de bits sur un support électronique, pour laquelle il existe effectivement des solutions fiable et convaincantes. En ce qui concerne les possibilités de conservation logique, on peut estimer quelles méthodes pourraient être utilisées avec quels effets et quelles mesures de soutien seraient nécessaires (cf. chapitre 5). Mais, quoi qu en disent avec plus ou moins de force les partisans de la migration, de l émulation et d autres procédés techniques, rien n indique clairement quelle est la bonne méthode. On peut à la rigueur faire un choix pour des objets ou des formats uniques spécifiques, mais la plus grande prudence s impose même là. En tout état de cause, il est pratiquement exclu qu une seule et unique méthode permette d arriver au but. Il y a donc une opposition entre le besoin de solutions pratiques utilisables aujourd hui et l exigence de principe de conserver des objets numériques à long terme sous une forme 130

131 cohérente, logique, authentique et financièrement supportable 87. Or, il est difficile de prévoir la durée de vie des technologies, et des recherches supplémentaires seront nécessaires pour diminuer les délais de réaction face aux problèmes d archivage que posent les nouvelles technologies. Le rapport «Trusted Digital Repositories: Attributes and Responsibilities» de RLG et OCLC (Beagrie, Doerr et al. 2002) livre une présentation approfondie des tâches, des questions organisationnelles et des responsabilités impliquées dans l archivage numérique à long terme. Plutôt que d entrer dans les détails de ce rapport, les chiffres et suivants du présent chapitre présentent des concepts fonctionnels plus ou moins concrets et des procédures de travail possibles. Les solutions techniques ne sont pas l aspect principal, mais elles sont très présentes dans toutes ces explications Le rôle des institutions participantes On peut envisager l archivage en répartissant les tâches entre diverses institutions (cf ). Cette formule permet, dans l idéal, de construire un système qui met à profit les atouts de chaque partenaire ; elle suppose aussi que l on détecte les faiblesses pour les compenser. Le présent rapport n aborde pas en détail le sujet de la mise en place de nouvelles structures institutionnelles hors des institutions existantes. Compte tenu de la taille comparativement petite de la Suisse, une structure de service totalement autonome ne se justifierait pas ; elle n est d ailleurs pas souhaitable sur le fond non plus. Mieux vaut unir les forces des institutions existantes afin que celles-ci profitent en retour des expériences découlant des efforts communs et construisent ainsi leur propre savoir-faire. Si l on observe les projets internationaux, on remarque que ceux-ci sont en général étroitement liés aux bibliothèques participantes. Il ne faut cependant pas taire le fait que les projets qui ont une institution clairement désignée comme chef de file progressent plus vite que ceux qui n en ont apparemment pas. Les propositions de structures d organisation pour les activités d archivage électronique devront tenir compte du fait que ces activités se déroulent dans le cadre du projet de la CUS subventionné par la Confédération jusqu en 2007, date au-delà de laquelle il faudra trouver de nouvelles collectivités responsables et un nouveau financement. Il n est pas possible de proposer aujourd hui une structure qui traverse ce changement de situation sans subir d adaptations ; il est donc souhaitable que la structure proposée reste ouverte à ces changements Modèle fonctionnel OAIS (Open Archival Information System) Le modèle fonctionnel OAIS (Open Archival Information System), qui a été mis au point sur la base de recommandations du CCSDS (Consultative Committee for Space Data Systems) (CCSDS 2002) résumées dans (Lavoie 2004), fait figure de référence. Bien que sa conception ait été effectuée dans le contexte de la recherche spatiale, il est considéré 87 Librement adapté de Hedstrom, Margaret, Ross, Seamus, et al. (2003). Invest to Save - Report and Recommendations of the NSF-DELOS Working Group on Digital Archiving and Preservation, National Science Foundation's (NSF) Digital Library Initiative & The European Union under the Fifth Framework Programme by the Network of Excellence for Digital Libraries (DELOS): IX+27., p

132 comme un modèle adapté pour les archives d'informations numériques de toutes sortes. Comme le montre la Figure 7, le concept de l OAIS a pour but d assurer la circulation des données sous une forme interprétable, depuis leur production jusqu à une consultation ultérieure. Figure 7: Positionnement d une archive à la norme OAIS (extrait de (CCSDS 2002)). Comme pour les archives conventionnelles, les producteurs ne peuvent connaître qu une petite partie des besoins des utilisateurs à cause du décalage dans le temps, qui peut se compter en années, entre les travaux des premiers et l activité de consultation des seconds. Le modèle OAIS désigne une communauté, sur les besoins de laquelle est axé l archivage de contenus déterminés. La Figure 8 montre les fonctionnalités du système OAIS. Figure 8: Représentation schématique du modèle OAIS (zone hachurée) tirée de (CCSDS 2002). Les liaisons (traits pleins et pointillés) indiquent les flux d information dans les deux sens. Le concept du paquetage d informations (Information Package, IP) joue un rôle important dans ce modèle. Un paquetage est constitué d informations relatives au contenu (Content Information, c.-à-d. le contenu proprement dit, des métadonnées et des informations sur la représentation du contenu) ainsi que des informations décrivant la conservation (Preservation Description Information). Les métadonnées comprennent des informations sur l origine et l histoire de l objet empaqueté (provenance), son rapport avec d autres objets ne 132

133 faisant pas partie du même paquetage (contexte), une identification non ambiguë (référence) et une protection contre les manipulations non souhaitées du contenu (fixité, p. ex. somme de contrôle des informations relatives au contenu, etc.). Le paquetage d information de soumission (Submission Information Package, SIP) est la forme sous laquelle le producteur d un objet communique cet objet aux archives OAIS. Il contient, selon les accords, seulement une partie des informations relatives au contenu et des informations décrivant la conservation. Pour la conservation, le SIP est transformé en paquetage d information d archive (Archival Information Package, AIP), qui contient la totalité des informations relatives au contenu, à la représentation et à la description de la gestion. Un SIP peut être transformé en plusieurs AIP et les mêmes informations relatives à un contenu peuvent alimenter plusieurs AIP. Lorsqu une personne consulte une information figurant dans les archives, elle la reçoit sous la forme d un paquetage de diffusion (Dissemination Package, DIP). Selon les besoins et les modalités de l accord, le DIP peut contenir différents éléments des informations contenues dans les AIP dont il est issu. Les informations doivent être compréhensibles pour la personne qui les reçoit sans qu elle puisse interroger le producteur. On reproche parfois au modèle OAIS de fonctionner avec des concepts inutilement nouveaux et difficiles à appréhender avec des mots usuels. Nous vous proposons donc une brève description des entités fonctionnelles qui constituent les archives OAIS. Entité d ingestion (Ingest) Cette entité réceptionne les SIP envoyés par le producteur et prépare leur stockage et leur gestion dans les archives. Les opérations sont les suivantes : réception du SIP, contrôle de la qualité, transformation en AIP conformément aux normes de formatage des données et de documentation, extraction des informations descriptives de l AIP pour la banque de données d archivage ainsi que pour la coordination des mises à jour en vue du stockage dans les archives et de la gestion des données Entité de stockage (Archival Storage) Cette entité regroupe les services et les fonctions de sauvegarde, de maintenance et de recherche des AIP. Elle reçoit les AIP de l entité d ingestion et les rajoute à la mémoire permanente. Elle gère la hiérarchie de sauvegarde et rafraîchit régulièrement les séquences de bits sauvegardées sur leurs supports. Elle procède également à des contrôles d erreur réguliers ou spéciaux. Enfin, elle transmet les AIP à l'entité d'accès. Entité de gestion des données (Data Management) Cette entité assure la création, la maintenance et l accessibilité des informations descriptives qui identifient et documentent les archives. Elle gère également les données administratives nécessaires à l exploitation des archives. Cela comprend la mise à jour de la banque de données avec de nouvelles informations descriptives ou données d administration des archives. Entité d administration (Administration) Cette entité regroupe les services et les fonctions qui assurent le fonctionnement global des archives. Cela comprend les accords conclus avec les producteurs sur le 133

134 transfert de données, le contrôle des réceptions et la maintenance des configurations systèmes et logicielles. S y ajoutent des fonctions permettant de suivre et d améliorer le fonctionnement des archives, d en inventorier le contenu et de faire migrer ou de mettre à jour les contenus. Enfin, cette entité assure la définition et la maintenance des normes et des règles d archivage ainsi que l assistance à la clientèle. Entité de conservation prospective (Preservation Planning) Cette entité surveille l environnement du système OAIS et émet des recommandations pour préserver l accessibilité à long terme du contenu des archives lorsque l environnement informatique sera devenu obsolète. A cet effet, le contenu des archives est évalué et des recommandations sont émises concernant les normes et les règles d archivage. Ces évaluations et recommandations reposent sur l observation des évolutions intervenues dans l environnement technique et, au besoin, dans la communauté d utilisateurs désignée et la base de connaissances. Cette entité crée des gabarits qui servent à empaqueter les informations et à transformer ces paquetages en SIP et AIP pour répondre à des exigences particulières. Elle doit également élaborer des plans de migration détaillés ainsi que des prototypes de logiciels et des programmes de test en vue d atteindre les objectifs de la migration. Entité d accès (Access) Cette entité aide les utilisateurs à trouver si des informations déterminées existent dans les archives OAIS, quelle est leur description, où celle-ci se trouve et comment elle est disponible. Les utilisateurs peuvent alors commander et recevoir des produits d information. Pour cela, il faut communiquer avec les utilisateurs finaux, respecter les restrictions d accès aux informations protégées, coordonner l exécution des différentes commandes ainsi que préparer et fournir des réponses aux demandes de consultation. Les réponses peuvent être des DIP, des listes de résultats ou des rapports. Entité des services généraux (Common Services) Il s agit de fonctions supplémentaires qui traversent l ensemble du système et qui ne peuvent donc pas être assurées de manière isolée. Le modèle OAIS reste forcément assez abstrait. En effet, il n a pas été conçu comme un programme de mise sur pied d archives, mais comme un modèle de référence pour comparer différentes stratégies, formules et architectures rencontrées dans des archives existantes ou envisagées pour des archives futures. C est également une référence pour les efforts de normalisation en cours dans le domaine de l archivage à long terme. Il est intéressant de relever que le modèle est également présenté comme pouvant offrir une base de transposition à l archivage non numérique Cedars Distributed Digital Archiving Prototype En s appuyant sur le modèle OAIS, le projet Cedars (CURL Exemplars in Digital Archives, UK) a construit un prototype fonctionnel d archive numérique distribuée, qui met en œuvre à 134

135 la fois des processus pratiques et une architecture pour l infrastructure (Cedars 2002) 88. Le prototype prévoit entre autres cinq niveaux d accès aux AIP à l intérieur du système, selon la taille du paquetage, sa fréquence d utilisation et son statut dans le processus d ingestion. Le prototype se compose des modules fonctionnels suivants: Sélection (Selection) Sélection d objets destinés à l archivage à long terme. Pré-ingestion (Pre-Ingest) Mesures nécessaires pour préparer l ingestion proprement dite conformément au modèle OAIS. Dans le protototype en cours de test, la personne désirant déposer un document adresse au système un courriel contenant des indications déterminées au sujet de l objet. Le système lui attribue alors une identification utilisant une syntaxe URN (cf. chiffre 4.5.1). Parallèlement, il crée un domaine pour le dépôt de l objet, dans lequel des gabarits sont mis à disposition pour fournir les informations nécessaires au sujet de l objet. Ingestion (Ingest) Comme esquissé dans la présentation du modèle OAIS, la procédure d ingestion génère des métadonnées et l objet est enregistré dans les archives. Concrètement, la personne désirant déposer le document reçoit une URL la conduisant au domaine où les métadonnées et l objet peuvent être déposés. Sauvegarde des archives (Archival Storage) Après l ingestion, le système génère un AIP, qui est enregistré dans les archives et pourvu d une identification non ambiguë, complétée par l information de représentation (Representation Information, RI). Accès (Access) Comme dans le modèle OAIS, la diffusion est destinée à un groupe d utilisateurs habilités. Elle comprend la mise à disposition des outils nécessaires pour restituer la ressource ; ces outils constituent le réseau de représentation (Representation Network). Cette dernière fonction n est pas mise en œuvre dans le prototype. Des outils de nature variée peuvent être intégrés sous la forme de nœuds dans le réseau de représentation. Il peut s'agir de définitions de formats de données (Data Format Definitions, DFD) ou d outils de restitution, d analyse et de conversion (Render/Analyse/Convert Engines, RACE) qui soit exécutent une migration à la demande, soit peuvent représenter des objets ainsi que des plate-formes permettant l exécution d outils RACE. Les nœuds du réseau de représentation doivent être des AIP. Les auteurs du prototype ont formulé quelques recommandations expresses. Recommandations d ordre général : 88 Cedars Guide to The Distributed Digital Archiving Prototype : 135

136 136 Les archives doivent être construites de manière qu elles puissent s intégrer facilement dans un groupe d archives distribuées ou, tout au moins, collaborer avec un groupe d archives distribuées. Une norme doit être adoptée pour la désignation non ambiguë des AIP ainsi que pour l attribution et la gestion des noms. Les archives et la surface utilisateurs doivent être testées auprès des utilisateurs finaux potentiels. Recommandations relatives à l ingestion : L indépendance vis-à-vis du support peut toujours être obtenue et doit toujours être recherchée. Les propriétés significatives de l objet doivent être identifiées et comprises avant l ingestion : quelles sont les propriétés de l objet qu il convient de conserver? Il faut travailler avec une version aussi abstraite que possible des objets sans écarter d informations significatives. Il faut utiliser des outils Open Source pour transposer la séquence de bits dans une représentation destinée à la consultation [nous comprenons cette formulation comme excluant les applications propriétaires]. Recommandations relatives à la sauvegarde dans les archives : L archivage à long terme doit être géré séparément de l accès. Il faut s assurer que le fournisseur d archives ou de mémoire offre un service qui garantit et respecte des exigences déterminées. Il faut employer un formalisme qui rende les AIP explicites. Les métadonnées doivent si possible être lisibles pour l utilisateur humain. Les nœuds du réseau de représentation doivent être sauvegardés sous la forme d AIP individuels nommés sans ambiguité. Recommandations relatives à l accès : Les réseaux de représentation offrent une solution praticable au problème de l obsolescence des technologies [à notre avis, cela n est pas encore prouvé]. Il faut s assurer de la pérennité des outils qui donnent accès au contenu intellectuel des AIP. C est pourquoi le réseau de représentation doit être placé sous surveillance [au sens d une veille technologique] et faire l objet d une maintenance. Lorsque l outil de représentation utilisé est un logiciel Open Source ou un autre outil sémantique, il sert également à documenter correctement la description du format [grâce à la traçabilité des interactions entre l objet et le logiciel ouvert] NEDLIB - Networked European Deposit Library Les lignes directrices (Steenbakkers 2000) et les modèles fonctionnels 89 élaborés dans le cadre de ce projet de la Commission européenne réunissant un grand nombre de 89 NEDLIB - Networked European Deposit Library :

137 bibliothèques nationales européennes sont un peu retombés en arrière-plan. D une part, quelques années se sont écoulées depuis leur formulation. D autre part, elles sont mises en pratique par la Bibliothèque royale des Pays-Bas à La Haye : le dépôt électronique de cette institution est plus facile à appréhender, et pourtant, contrairement aux attentes, il n a pas encore fait d émules. Sur le fond, le modèle repose sur les normes OAIS, auxquelles on a ajouté la fonction d archivage à long terme proprement dit (Preservation Management, voir la Figure 8). Le modèle reste intéressant, de même que quelques recommandations et avertissements formulés à son sujet (Steenbakkers 2000) : Les problèmes doivent être définis par les bibliothèques de manière à ce que les prestataires du secteur des TCI puissent y répondre en proposant des projets de solutions pratiques et en les mettant en œuvre. Si l on accorde une importance excessive à la complexité technique de la tâche, on entre dans des débats qui retardent longuement la mise en œuvre de mesures pratiques. A titre d encouragement, les auteurs rappellent qu il n y a pas non plus de solution complète de conservation «éternelle» pour les supports imprimés, mais qu on est tout de même parvenu, en prenant des mesures adéquates, à garder des collections volumineuses pendant de longues durées. Cet esprit pratique doit inciter à agir dans les meilleurs délais pour acquérir de l expérience. Un système d archivage doit être autonome : il doit certes avoir des interfaces adéquats avec le système intégré de chaque bibliothèque, mais il doit en rester indépendant. La capacité d une mémoire d archivage doit pouvoir être étendue en permanence. L authenticité est un aspect important, mais il semble qu elle doive être définie différemment selon la nature des objets numériques et envisagée avec pragmatisme. Les auteurs rappellent que l authenticité du microfilm d une revue n est pas mise en doute alors qu en théorie elle ne peut pas être garantie. Il est nécessaire d anticiper pour sécuriser les données, leur décodage et leur lisibilité. Il faut recourir à des mémoires rapidement. «Keep matters simple» : le système d archivage ne doit pas remplir toutes les fonctions imaginables dans la bibliothèque numérique. Cela augmente inutilement sa complexité, d autant que la plupart des bibliothèques ont déjà des systèmes intégrés. Il est probable que les archives et les systèmes des bibliothèques obéissent à des dynamiques d évolution différentes parce qu ils doivent répondre à des exigences différentes. C est pourquoi il est bon qu ils fonctionnent en parallèle. Il est cependant important que les bibliothèques et les archives soient intégrées dans l environnement CTI, les interfaces jouant un rôle particulièrement important. Seule une automatisation maximale du fonctionnement permettra de faire face à l immensité de la tâche dans les grandes bibliothèques d archivage. 137

138 NDIIPP Preliminary Architecture Proposal Une proposition provisoire d architecture système (Shirky 2002) (mise à jour dans une version 0.2 (2003)) a été faite dans le cadre du programme NDIIPP (National Digital Information Infrastructure and Preservation Program 90, USA). Bien qu elle reste abstraite, elle cherche davantage que le modèle OAIS à produire des lignes directrices utiles pour un développement technique concret. L architecture proposée se veut un prélude à une infrastructure nationale complète si bien que tous ses aspects ne sont pas directement transposables. L architecture NDIIPP repose sur une hypothèse fondamentale : une infrastructure d archivage numérique doit évoluer dans le temps ; elle ne doit jamais être figée car elle doit s adapter à l évolution permanente des technologies et des formats. D autres hypothèses portent sur l environnement du programme : il doit recourir aux prestations de développement existantes ; l infrastructure doit être conçue de telle manière qu il est possible d y intégrer l existant et offrir la flexibilité globale voulue pour s adapter à l évolution du cadre général tel que défini par les normes légales, culturelles et économiques. D autres hypothèses de base ont trait aux exigences techniques: 1. Modularité Une structure modulaire permet de construire et de développer l infrastructure au fur et à mesure, en utilisant les composants de différents fournisseurs qui, à leur tour, peuvent être développés et remplacés au fur et à mesure. Internet est cité en exemple : il existe encore même si aucun ordinateur ayant participé à sa création n y est plus connecté. 2. Définir des exigences minimales pour chaque niveau Comme une construction modulaire peut rapidement atteindre un degré élevé de complexité, on ne peut en exploiter les avantages que si les relations entre les composants sont suffisamment simples pour que des participants de types différents puissent les établir, les tester et assurer leur maintenance. Concrètement, les protocoles qui règlent la communication entre les composants doivent être extrêmement simples. Cela laisse aux participants la possibilité de choisir des solutions plus complexes si nécessaire. 3. Hétérogénité Outre sa modularité, l infrastructure doit être compatible avec une grande variété de matériels et de logiciels. Cela permet d éviter d être dépendant d un fournisseur tout en ayant une certitude raisonnable qu une erreur de programmation non détectée ne compromettra pas l ensemble de la structure. 4. Pas d optimisation dans une configuration donnée L infrastructure est censée évoluer sur le long terme, par ajouts et modifications successifs. Elle est comparée à une ville dont la construction ne serait jamais achevée. Par conséquent, une optimisation de l'infrastructure dans une configuration 90 National Digital Information Infrastructure and Preservation Program (NDIIPP), Library of Congress, USA: (visité le ) 138

139 donnée serait prématurée et pourrait faire obstacle à l étape de développement suivante. 5. Objectif : réussir une première migration L infrastructure doit réussir plusieurs migrations (c.-à-d. un changement complet de tous ses éléments) et continuer de fonctionner. On considère que la capacité à réussir la première migration est un indicateur de la capacité de survie à plusieurs migrations. C est là une autre manière d exprimer l exigence de modularité. Dans la proposition mise à jour après la consultation, une importance nouvelle est accordée à la question de savoir comment les systèmes existants peuvent être transposés dans l architecture de l infrastructure. Pour cela, il faut définir les fonctions minimales nécessaires pour la conservation numérique. Dans ce sens, l architecture NDIIPP ne constitue pas un substitut aux installations existantes, mais un corpus d'exigences minimales permettant d'évaluer et de comparer des solutions concrètes. Les fonctions intéressant uniquement des applications isolées ne font pas l objet de spécifications. Il doit être possible de mettre en place dès le début, avec les initiatives et les projets existants, un système fédératif allégé (Near-Term Federation). Cela requiert l existence d interfaces nouvelles permettant l importation de collections entières et autorisant les institutions à exercer des fonctions différentes. L architecture proprement dite ne se compose plus que de trois niveaux incorporant chacun des fonctions déterminées et possédant des interfaces avec le niveau précédent et le niveau suivant. Cette structure doit offrir la modularité et l hétérogénéité recherchées tout en permettant de traiter séparément la question de la conservation des données numériques et celle de l accès public. 139

140 Figure 9: Représentation schématique de l architecture NDIIPP (2003). Le cadre central regroupe les fonctions assumées par une ou plusieurs institutions chargées de l archivage à long terme. A gauche, des objets sont déposés dans les archives ; à droite, ils sont retransmis à d autres institutions si nécessaire, avec les métadonnées, qui peuvent elles aussi être complétées ultérieurement (symbolisées par le cadre en pointillé). La consultation proprement dite a lieu par l intermédiaire du niveau supérieur, avant d être relayée par les niveaux inférieurs Niveau inférieur (Bottom Layer) Le niveau inférieur de l architecture comprend les fonctions de sauvegarde, de contrôle et de repérage des objets numériques. Il est jugé indispensable que des métadonnées, qui pourront être enrichies au fil du temps, soient adjointes aux objets dès ce niveau, ce qui n était pas le cas dans une version précédente du projet. Chaque objet doit être pourvu d au moins une identification non ambiguë. Lorsque cette identification est appelée depuis le niveau immédiatement supérieur, le dépôt

141 (Repository) doit exécuter l action requise avec l objet concerné. Bien que ce niveau regroupe différentes fonctions, elles ne doivent pas nécessairement constituer une entité technique. Par exemple, des objets et des métadonnées peuvent être sauvegardés à des endroits différents (système distribué). Les références aux identifiants (pointeurs) peuvent ainsi emprunter des chemins variés. Pour des raisons de sécurité, les dépôts doivent être «non intelligents» et ne pas être directement accessibles de l extérieur. A des fins particulières, on peut envisager des dépôts sans connexion réseau. Ils peuvent appartenir à des bibliothèques, des éditeurs ou des tiers. Certaines actions, comme les mises à jour, l attribution des sommes de contrôle, etc., peuvent être réalisées dans le dépôt, mais ce n est pas absolument nécessaire. 2. Niveau moyen (Middle Layer) Ce niveau comprend cinq entités fonctionnelles : Ingestion (Ingest) : cf Gestion des pointeurs (Pointer Management) : création et enregistrement des références aux objets situés au niveau inférieur. Gestion des métadonnées (Metadata Management) : création et gestion de métadonnées relatives aux objets enregistrés. Les métadonnées doivent contenir un nombre aussi grand possible de détails qui pourraient être utiles à la consultation et à l interprétation de l objet (formats de fichier, conditions de création, logiciel de restitution, etc.) ; ces détails peuvent revêtir la forme de références. Gestion de la durée de vie (Life-Cycle Management) : ensemble des mesures servant à la conservation numérique au sens strict, c est-à-dire le rafraîchissement, la migration physique et logique, la documentation de stratégies d émulation pour la restitution, l export d objets (entre autres pour transmettre des métadonnées) et la responsabilité des archives. Consultations (Views) : c est là que l accès aux objets est contrôlé et filtré selon les règles en vigueur. Si nécessaire, les différentes entités fonctionnelles peuvent être couplées à celles de deux autres niveaux dans un même serveur et les institutions sont libres de prévoir des fonctions supplémentaires. Par contre, ces entités sont si étroitement liées les unes aux autres qu'il serait difficile de les séparer. De plus, lorsque l on atteint un niveau de détail élevé, les différences entre les concepts et les schémas viennent au jour. 3. Niveau supérieur (Upper Layer) Ce niveau comprend tout ce qui concerne l accès par des personnes et des institutions aux données et métadonnées au moyen de fonction de consultation du niveau moyen. Cela concerne à la fois l accès interne par les administrateurs du système et l accès externe par les utilisateurs potentiels. 141

142 Dans un système ainsi structuré, les liaisons et les protocoles jouent un rôle important. La proposition attache de l importance à ce que l on utilise des protocoles et non pas des interfaces de programmation d applications (Application Programming Interfaces, API). En effet, les API indiquent des règles pour se connecter à des matériels et à des logiciels déterminés tandis que les protocoles définissent, indépendamment des programmes concrets, comment deux composants logiciels doivent communiquer. Cela permet de mettre en place et d adapter les différents composants sans intervention d une instance centrale et sans concertations intensives entre les participants. Il est impératif d assurer une compatibilité descendante maximale lorsque des modifications sont apportées aux protocoles. L architecture proposée ne prend pas en considération les objets dynamiques, mais seulement les objets numériques dont il existe une forme stable pouvant être archivée (objets statiques). On pourrait avoir l impression que ce concept ne tient pas assez compte de la conservation à long terme. Cela tient au fait qu il ne lui est pas attribué de domaine explicite dans l infrastructure, mais que c est l infrastructure dans son ensemble, avec ses institutions, qui assure la conservation («hardware stores, but institutions preserve», (Shirky 2002), p. 248). C est la raison pour laquelle les institutions sont certifiées. Cela permet de dire que les objets numériques sont considérés comme conservés à long terme lorsqu ils sont sauvegardés dans un dépôt certifié, lorsqu on y accède via une passerelle certifiée et lorsqu ils sont attestés dans une collection certifiée. Au premier abord, cette conception peut paraîre insatisfaisante car elle ne livre actuellement pas de critères relatifs au contenu. Mais elle est cohérente avec le stade de développement du système. Comme cela a été souligné à plusieurs reprises dans le présent travail entre autres, la conservation des données numériques n est pas une tâche qui peut être résolue exclusivement par des moyens techniques. Le coût principal de l archivage électronique ne réside pas dans l'investissement de départ en matériel, mais dans les charges de fonctionnement encourues pour le personnel qui assure la conservation. Cela laisse la porte ouverte à toutes les questions relatives aux fonctions des différentes institutions, etc. Il est recommandé d étudier séparément la question de la conservation et celle de l accès ou de la présentation ((Shirky 2002), p. 247 et 249). Dans le rapport Shirky, on trouve un avertissement à méditer concernant la question des coûts ((Shirky 2002), p. 250): «Storage is cheap ; preservation is expensive ; security is potentially very expensive.» Cette appréciation a de quoi surprendre car il nous semble que les mesures de sécurité (hormis les sommes de contrôle, etc.) se rapportent essentiellement au système pris comme un tout alors que les mesures de conservation portent sur les objets pris individuellement. Mais il est clair que les mesures de sécurité sont appelées à prendre une ampleur bien plus grande que pour l archivage de données analogiques, que les bibliothèques pratiquent de manière routinière : les menaces physiques se doublent de menaces virtuelles dues à la vulnérabilité des objets à la manipulation (cf. 4.3). Il est réaliste de s attendre à ce que la sécurité absolue soit très onéreuse, pour autant qu elle puisse être atteinte. 142

143 University of California Consortium des bibliothèques universitaires suisses Une autre conception intéressante est le modèle de collection distribuée (Distributed Collection Model, DCM) élaboré pour les bibliothèques de l Université de Californie (University of California) (Schottlaender 2004). Nous vous en proposons ici une brève présentation car ce modèle repose sur le principe de l acquisition et de la conservation coordonnées de supports physiques, qui nous intéressent également dans le cadre de la présente étude. L Université de Californie possède depuis des années un programme d acquisition coordonnée de publications sur supports physiques (Shared Collections and Access Program, SCAP), qui a été complété par la suite par des licences conjointes pour accéder à des banques de données. Les publications sur supports imprimés font l objet d un programme de conservation depuis plus de vingt ans. Les objectifs sont notamment l optimisation de la maintenance des collections locales, c està-dire par exemple la cessation de l achat ou l archivage des exemplaires imprimés lorsqu il existe un accès en ligne. Cela suppose l accessibilité des ressources dans l ensemble du système de la bibliothèque ainsi que la planification et la réalisation d un système fiable et économique de conservation des collections imprimées et numériques. Un objectif autonome déclaré est l amélioration des procédures afin que la gestion collective des fonds soit efficace dans un environnement hybride de publications imprimées et de publications numériques. Le modèle DCM prévoit trois niveaux de service, qui se distinguent par l ampleur du contrôle local, les services proposés, l accessibilité et la sécurité de l archivage. Au niveau de service primaire (Primary Service Layer, «bright»), des exemplaires de documents imprimés ou numériques sont présents selon les besoins sur différents sites dans les bibliothèques locales. A ce niveau, tous les services sont assurés, de la sélection au prêt en passant par la fourniture de documents. Au niveau de service secondaire (Secondary Service Layer, «dim»), la redondance des exemplaires est réduite et tous les supports ne sont pas représentés. Concrètement, il s agirait des collections entreposées dans deux dépôts régionaux. A ce niveau, ce sont la conservation et la fourniture de documents qui prédominent. Au niveau de service tertiaire (Tertiary Service Layer, «dark»), il n y a plus qu un seul exemplaire de chaque support. Les seuls services assurés sont l archivage, la conservation et la fourniture de documents. Il s agit là d un modèle théorique. Rien n empêche de mettre à disposition les trois niveaux de service par l intermédiaire d une seule et unique institution Scénarios de répartition des tâches et des responsabilités L étude actuelle ne vise pas à choisir l une des différentes techniques permettant de préserver l utilisation des données numériques (cf. chap. 5), afin qu elle soit mise en œuvre par les bibliothèques universitaires suisses. Cela n est pas encore possible. Il s agit plutôt d esquisser des structures et des procédures appropriées, afin de pouvoir appliquer de manière pertinente les méthodes nécessaires. Ces mesures préparatoires doivent notamment nous faire gagner du temps pour que nous arrivions à mieux comprendre les processus techniques en cours de développement. Ainsi aurons-nous peut-être plus de chance que leur application future nous apporte le succès escompté. L objectif intermédiaire, 143

144 celui de gagner d abord du temps pour les développements futurs, est toujours évoqué dans les projets internationaux d e-archiving, car il est depuis longtemps clair qu aucune des solutions discutées jusqu à présent n est suffisamment au point et qu aucune d elles ne nous conduira seule au succès. En même temps, il faut tout faire pour que l institution chargée de l archivage dispose du potentiel nécessaire ou puisse le développer, pour être en mesure de venir à bout des tâches techniques le moment venu. Les variantes discutées ici pour la sauvegarde à long terme des contenus électroniques présentent de nombreux points communs avec ces concepts que nous avons rencontrés déjà pour la garantie de l accès aux contenus acquis (cf. 8.5). Mais, avec les bibliothèques nationales comme la BN, de nouveaux acteurs et partenaires entrent en scène L archivage sous la responsabilité du fournisseur Il est assez logique que les fournisseurs de contenus commercialisés aient un intérêt existentiel à conserver à long terme les contenus qu ils produisent et mettent à disposition dans un état tel qu il permette leur utilisation et leur exploitation commerciale, mais aussi leur exploitation ultérieure. «A long terme» peut et doit toutefois signifier autre chose pour une entreprise commerciale telle une maison d édition que pour une bibliothèque. Celle-ci doit en effet assumer sa mission de gardienne du savoir scientifique au-delà des intérêts à court terme si elle veut être en mesure de soutenir efficacement à long terme la recherche et l enseignement scientifiques. Avec les médias traditionnels, l expérience a toutefois montré que l intérêt que les éditeurs commerciaux en particulier manifestent pour cette mission d archivage diminue avec le temps, et ce, généralement, lorsque les perspectives de gain sur certains titres restent en dessous de leurs attentes. En ce qui concerne l archivage de contenus électroniques, il faut s attendre du reste à une charge de travail plus importante que ce n était le cas pour les médias analogiques : ils nécessiteront des dépenses plus élevées et un engagement plus soutenu. Il se peut que, dans un premier temps, le rapport coût/bénéfice soit défavorable. Pourtant, les éditeurs ont intérêt à prouver l efficacité de leurs efforts ainsi que ceux de leurs partenaires en matière d archivage : ils utilisent en effet cet argument par rapport à la concurrence, pour apaiser les craintes des auteurs, des scientifiques et des bibliothèques. On peut toutefois douter qu ils attachent autant d importance à l archivage des documents scientifiques (scientific record) que les bibliothèques spécialisées qui assurent cette tâche depuis longtemps et doivent continuer de le faire à l avenir dans l intérêt de la recherche scientifique (Lavoie 2003). Les grandes maisons d édition essaient notamment d y remédier, en cherchant des partenaires, de manière typique la bibliothèque nationale respective, ou en répondant aux bibliothèques nationales qui elles-mêmes sont déjà actives. C est également le cas là où il n existe pas, ou pas encore, d obligation de remise de publications sous forme électronique. Or, même si les éditeurs sont disposés à faire archiver leurs contenus par des tiers, on peut voir la chose de deux manières : d un côté, on peut saluer le fait qu ils acceptent de s impliquer dans de telles solutions qui, en raison de leur envergure, promettent un résultat de très haute qualité, bien accepté et vont permettre de profiter de synergies ; mais, d autre part, on peut supposer que certaines maisons d édition en profitent pour se soustraire à une tâche qui leur déplaît et qu ils confient volontiers aux institutions publiques. Les bibliothèques nationales ne peuvent, quant à elles, guère refuser, même si l on ne sait pas vraiment

145 quelles en seraient les conséquences. La proposition d intégrer déjà les coûts d archivage dans la chaîne de publication (Steenbakkers 2004) est à cet égard intéressante. A une époque où, de toutes façons, les prix des périodiques ont fortement augmenté, une telle mesure est à coup sûr impopulaire, d autant plus que l on ne sait pas vraiment à combien ces coûts vont se monter. L archivage effectué par les seuls éditeurs n offre en tout cas, de notre point de vue, pas de garantie suffisante que les contenus soient préservés et restent utilisables à long terme. Mais il faut espérer que les éditeurs encouragent l archivage par d autres institutions et les soutiennent dans la mesure de leurs possibilités L archivage sous la responsabilité des bibliothèques universitaires Il semble logique, au premier abord, que les bibliothèques universitaires, qui ont su conserver et entretenir depuis très longtemps les publications traditionnelles, souhaitent assumer également une telle fonction pour les données électroniques. Les objets numériques se comportent toutefois différemment des documents analogiques : ils peuvent, sans que l on s en rende compte, perdre de leur importance, et ce, en principe, d un jour à l autre (cf ). La qualité de la mission d archivage s en trouve transformée : au lieu d une conservation passive pendant une longue période, des mesures énergiques sont nécessaires, si l on veut garantir, grâce à des contrôles et des interventions périodiques, que les problèmes qui se présenteront au niveau de la lisibilité et du décryptage des objets numériques (cf ) soient identifiés suffisamment tôt et puissent être contournés ou évités. Cela constitue un défi considérable, tant sur le plan des procédures que de la technique et de la logistique. Les bibliothèques universitaires modernes effectuent chaque jour des tâches d une grande complexité au niveau des techniques de l information, avec des exigences élevées en matière de disponibilité. Il n y a aucune raison a priori pour que les bibliothèques ne puissent pas, elles aussi, gérer un système d archivage, si elles disposent des ressources correspondantes. Les volumes de données pures sont tels qu ils nécessitent en tout cas une collaboration technique avec les centres de calcul des hautes écoles. La question des contenus, qui préoccupe les bibliothèques universitaires, est en passe de devenir un problème avant tout technique. Bien sûr, la prestation technique doit être au service de la tâche fondamentale des bibliothèques. Reste à savoir s il est vraiment judicieux, au fond, mais aussi d un point de vue économique, de mobiliser les ressources considérables que cela implique dans les bibliothèques universitaires. Il va donc falloir examiner des possibilités de partenariats qui laissent aux bibliothèques un contrôle suffisant sur leurs contenus, sans qu elles aient à assumer seules toute la charge liée à l entretien technique. On peut s inquiéter d une telle charge, si l on fait la comparaison avec les frais de temps, d argent et de personnel nécessaires pour le système d archives de la Bibliothèque royale de La Haye. Il offre, lui aussi, jusqu à présent les conditions requises pour une conservation à long terme des données sur la base du modèle OAIS. Des mesures de conservation technique sont encore en développement (Wijngaarden and Oltmans 2004). D après nos informations, à La Haye, on estime qu il va falloir créer six à sept emplois pour le traitement et l exploitation du système et trois autres pour son développement. Il va de soi que les conséquences financières d un tel engagement sont aujourd hui encore difficiles à évaluer, et cela devrait nous inciter à la prudence. On est en droit de supposer 145

146 que seules quelques grandes bibliothèques ou des institutions spécialisées peuvent et veulent s engager de la sorte. Cela leur offrira la possibilité de se profiler dans un domaine qui prend toujours plus d importance. Malgré les dépenses considérables que cela entraîne, se lancer dans cette voie pourrait être intéressant, car cela leur permettra d acquérir de nouvelles compétences avec cette réserve toutefois, déjà faite plus haut, concernant une réalisation technique à grande échelle. L avantage décisif d un archivage sous la responsabilité des bibliothèques universitaires résiderait dans la possibilité de conserver facilement l accès aux données. L objectif de l archivage est, en dernier ressort, que les contenus, en tant que témoignage des connaissances scientifiques, soient préservés, afin d être utilisés ultérieurement. Confier cette tâche à une autre institution compliquerait tout au moins le recensement des droits d utilisation reconnus. Dans les bibliothèques nationales, l aspect de l utilisation serait même plutôt secondaire dans l optique actuelle (cf ). Si une bibliothèque universitaire qui a acquis certains contenus se chargeait elle-même de leur archivage, cela permettrait d éviter les complications formelles qu entraînent le fait que les contenus doivent être retransmis à des fins d archivage à des institutions ne possédant pas elles-mêmes de droit d utilisation. On peut en tout cas espérer que des facteurs de cette sorte ne forceront pas la décision. Car il est possible de limiter l accès aux contenus de manière telle que seuls les collaborateurs chargés de l archivage dans une institution et les utilisateurs autorisés dans d autres institutions puissent y avoir accès. La même question se pose du reste également pour chacune des autres variantes qui prévoient la transmission à une autre institution n ayant pas acquis elle-même les contenus en question. Il va falloir, par ailleurs, vérifier si les bibliothèques ou les institutions partenaires seraient vraiment en mesure de se charger de l archivage des contenus pour lesquels on a préféré recourir à l éditeur moyennant des conditions raisonnables. Dans certains cas, le droit de disposer d un serveur local ne peut être sollicité que comme alternative à la poursuite de l utilisation de celui d une maison d édition. Il y a de bonnes raisons pour lesquelles les bibliothèques universitaires ne devraient peutêtre pas s engager dans l archivage à long terme en se dotant d équipements entièrement autonomes. La conservation à long terme suppose déjà les dépenses citées au point pour l accès local, et il faut s attendre à d autres frais courants très importants. Cela sera également le cas, même si elles n effectuent pas de travaux de développement fondamentaux. Mais de tels développements et adaptations pourraient encore s avérer nécessaires, comme l a montré l exemple du système d archives DIAS 91 de la Bibliothèque royale de La Haye, le plus avancé en la matière, et sur lequel l «edepot» 92 se base. Ce système qui a nécessité des efforts considérables a été conçu de manière monolithique, pour une installation centralisée. Comme nous l avons signalé à plusieurs reprises, les bibliothèques universitaires suisses ne souhaitent pas une telle solution. C est probablement pour des raisons identiques que l Allemagne rechigne également à adopter tel quel ce système. Voilà pourquoi un projet a été lancé, afin de mettre sur pied une solution basée sur le système néerlandais, mais permettant une exploitation partagée. La Deutsche Bibliothek 91 DIAS : Digital Information Archiving System ; élaboré par la Bibliothèque royale de La Haye, en collaboration avec IBM. 92 edepot, Koninklijke Bibliotheek, Den Haag: (accès ) 146

147 (DDB), La Niedersächsische Staats- und Universitätsbibliothek Göttingen (SUB) et la Gesellschaft für wissenschaftliche Datenverarbeitung Göttingen (GWDG) travaillent ensemble avec la société IBM à ce projet baptisé KOPAL 93. En Allemagne, on s est également rendu compte que, pour les ouvrages scientifiques publiés à l échelle internationale, l engagement des bibliothèques universitaires était nécessaire. Des bibliothèques spécialisées comme la Technische Informationsbibliothek (TIB) de Hanovre s activent dans ce sens. Là encore, on constate une différence entre la mise à disposition des fonds de la part de la bibliothèque universitaire, qui doit se poursuivre, et l archivage à long terme selon des concepts élaborés dans le cadre du projet nestor L archivage sous la responsabilité des bibliothèques nationales Partant de la mission traditionnelle des bibliothèques nationales, on supposait, en règle générale, que chacune de ces bibliothèques collectionnait également, dans le cas de publications électroniques, plus ou moins exclusivement les documents correspondant aux critères classiques, à savoir «publié dans le pays, sur le pays, par des compatriotes à l étranger». Or, pour les publications en ligne, ce principe est parfois remis en cause, sans que l on ait invoqué jusqu à présent de raison impérative (voir p.ex. (Steenbakkers 2004)). Le fait que, p.ex. des pages Internet comportant des contenus importants puissent apparaître dans de tout autres domaines de pays, est au fond dans la lignée des expériences faites jusqu ici pour l acquisition de médias traditionnels. S il est difficile de classer certaines pages Internet de manière nationale, il n en demeure pas moins que les publications des éditeurs, qui intéressent au plus haut point les bibliothèques universitaires, peuvent continuer d être clairement attribuées à une bibliothèque nationale responsable. Par conséquent, la plupart des bibliothèques nationales se voient obligées de saisir ces publications électroniques des éditeurs et de les conserver. Les mandats de collection des bibliothèques nationales devraient, plus ou moins rapidement, être adaptés en conséquence. Pour la BN, cela a déjà été le cas avec l Ordonnance du 14 janvier Toutefois, un dépôt légal n est appliqué que dans de rares pays, ou alors dans le cadre d une procédure législative 95. Certains, comme la Suisse ou les Pays-Bas, s appuient sur des accords librement consentis. Bien que cette tâche soit reconnue dans le principe, et qu elle ne soit guère contestée, presque toutes les activités y relatives ne sont encore qu à l état de projet, souvent sous forme de collaboration avec des éditeurs intéressés. A moyen terme, pour ce qui est des données électroniques, il ne faut pas s attendre à ce que les collections englobent des contenus qui, en tant que publications d éditeurs, peuvent être attribués à un autre pays d origine. Les activités de la Bibliothèque royale des Pays-Bas sont considérées comme une exception. En dehors des grands groupes d édition néerlandais Elsevier et Kluwer, des contenus de fournisseurs étrangers, tels que BioMed Central ou Taylor & Francis, sont également sauvegardés. Les bibliothèques nationales qui travaillent avec des éditeurs de périodiques afin d archiver leurs contenus pour la postérité sont, le plus souvent, obligées de faire de larges concessions, qui limitent fortement l utilisation des objets archivés. Derrière cette attitude, il y 93 KOPAL: projet de coopération pour la création d un système d archivage numérique à long terme 94 nestor (réseau de compétence en matière d archivage et de disponibilité à long terme des ressources numériques en Allemagne) : ne cite que six pays en novembre

148 a une philosophie : celle de la conservation complémentaire. Tant que l éditeur accorde luimême l accès à ses contenus, donc tant qu il peut les vendre, la bibliothèque nationale ne peut garantir cet accès que sur place, dans ses bâtiments (Steenbakkers 2004). Ce n est que dans le cas d une perte à plus long terme ou totale de l offre de l éditeur que la bibliothèque se chargera d offrir l accès à ces contenus. De telles réglementations ont déjà été critiquées pour des considérations de principe : les contenus de ces archives destinées à la conservation (dark archive) 96 n étant pas accessibles, il manque ce contrôle régulier de leur intégrité qu exercent, au hasard, des utilisateurs actifs. Or, les tests techniques ne peuvent remplacer que partiellement de tels contrôles. Dans une étude britannique, on fait remarquer qu il existe une différence entre des services visant à garantir aux abonnés payants un accès durable aux licences qu ils ont acquises et le rôle des bibliothèques en charge des exemplaires déposés, qui prennent soin du patrimoine national publié (Jones 2003). En ce qui concerne l utilisation de ces archives de conservation, les bibliothèques universitaires ne doivent pas accepter des réglementations de cette sorte. De tels accords déchargent, d une part, les éditeurs de leur obligation de mettre tout en œuvre pour préserver leurs contenus. D autre part, ils n aident guère les bibliothèques universitaires à remplir leur mission, à savoir mettre à disposition les contenus qu elles ont acquis sous une forme utilisable. C est pourquoi l on reconnaît surtout aux bibliothèques nationales le rôle de «dernier refuge», au cas où une panne d approvisionnement catastrophique se produirait chez les éditeurs (cf. à ce sujet également la question 9.19 du sondage). Cette exigence devrait pouvoir être remplie à moyen terme pour les publications électroniques des éditeurs de nations scientifiques et industrielles importantes. Dans ce cas, il serait souhaitable de pouvoir disposer d un registre qui répertorie de manière transparente quels sont les contenus archivés par telle institution, de quelle manière, et à quelles fins. Si, du point de vue des bibliothèques universitaires suisses, on peut partir du principe que la fonction d archivage est suffisamment couverte par les activités des bibliothèques nationales responsables, on renoncera naturellement à l exigence de conserver les contenus en Suisse Le rôle de la Bibliothèque nationale suisse (BNS) La Bibliothèque nationale suisse a pour mandat de collectionner, de répertorier, de rendre accessible et de conserver des publications imprimées et électroniques ayant un lien avec la Suisse. La constitution de la collection d Helvetica électroniques a lieu dans le cadre du projet «e-helvetica» 97. Dans le projet «e-helvetica», d une part les bases techniques d un système d archivage électronique sont développées (projet sectoriel Archivage) et d autre part la constitution de la collection et les tâches y relatives (projet sectoriel Organisation) sont intégrées. La constitution de la collection est élaborée dans le cadre de projets pilotes servant d exemple. Actuellement, trois projets pilotes sont en marche : 1. POP - projet pilote pour des publications commerciales : Collection exemplaire de publications électroniques des maisons d'édition Karger et Staempfli 96 dark archive : des archives dont le contenu n est pas accessible à un utilisateur final. 97 Projet e-helvetica de la Bibliothèque nationale suisse : 148

149 2. Thèses de doctorat : Collection des thèses de doctorat électroniques suisses en coopération avec la CBU 3. Sites web patrimoniaux: Collection exemplaire des sites web patrimoniaux (gris) en coopération avec les bibliothèques cantonales L'objectif est de développer une collection exemplaire d Helvetica électroniques se composant de différents types de publications. D'autres projets pilotes peuvent être commencés au besoin et en coopération avec des institutions partenaires. Pour la définition des projets pilotes, on a largement renoncé à la collection des Non- Helvetica, puisque ceux-ci n'appartiennent pas au mandat de collection de la Bibliothèque nationale suisse. Une grande partie des bibliothèques universitaires publie déjà des thèses de doctorat électroniques et sera concernée par le projet pilote. Une autre partie des bibliothèques universitaires a aussi la fonction d'une bibliothèque cantonale et fera en cette qualité des expériences avec le projet pilote de la collection de sites web patrimoniaux. Comme on l a exposé, les bibliothèques universitaires ont toutefois d'autres besoins qui vont techniquement et du point de vue du contenu au-delà de la direction actuellement prise par les travaux dans la Bibliothèque nationale. En particulier doivent être mentionnés le besoin d archivage de la littérature scientifique internationale sans liens patrimoniaux et l'exigence élevée quant à l'utilisation de contenus archivés aussi par-delà de plus longues périodes. Celui-ci est à distinguer de l'accès continu conformément à 8.5. Il semble dans ce sens judicieux pour des raisons économiques et techniques de placer d'autres concepts au côté de projets pilotes mentionnés de la Bibliothèque nationale, afin de couvrir les besoins spécifiques des bibliothèques universitaire et de leurs clientes et clients. Le besoins éventuels que les bibliothèques universitaires exprimeront auprès de la bibliothèque nationale devront toutefois être clarifisé relativement bientôt, puisque le démarrage du système d'archivage de la BNS est prévu déjà vers la fin 2007 et que les prestations à fournir par le système d'archivage et la structure de données y relative sont en train de être conçues déjà actuellement. L avenir dira si une connexion technique des différentes solutions s'impose. Elle est le plus probable et la plus logique au niveau du maintien technique à long terme. L'échange et la coordination sont cependant indispensables au niveau des normes techniques. En particulier on voit comme premières étapes l'utilisation renforcée d attribution URN et des conventions sur des métadonnées descriptives et techniques. Le projet allemand KOPAL est d un grand intérêt sous l'aspect d'une coopération distribuée. Ici, p. ex. la vision des «consignes automatiques» d archivage qui doivent être disponibles aux différentes bibliothèques partenaires dans un système d archivage commun apparaît comme prometteuse. Comme déjà mentionné, des clarifications pour une telle solution devraient avoir lieu dès que possible à cause de l'état de projet «e-helvetica». Entre le projet d e-archiving du Consortium des bibliothèques universitaires suisses et le projet «e-helvetica» de la BNS, il y a déjà eu un léger échange. Il va falloir les intensifier, afin d arriver à trouver des solutions qualitativement convaincantes et économiquement supportables pour l archivage des titres qui intéressent les diverses bibliothèques en Suisse. 149

150 Concevoir le passage de la mise à disposition pour l utilisation permanente à l archivage proprement dit, permettant une utilisation judicieuse à l avenir également, est d une importance décisive Archivage par des tiers Il existe entre-temps une quantité d entreprises qui proposent des services d «archivage électronique». Il s agit souvent de solutions garantissant la sauvegarde des données dans leur état d origine. Cela est nécessaire pour un archivage conçu comme une conservation logique, mais cela ne suffit pas. Tout en étant conscient de cette situation, on peut toutefois utiliser de telles offres pour remplir certains objectifs. La quantité de prestations proposées devrait s accroître au cours des années à venir : les bibliothèques et autres institutions ne sont pas les seules à signaler des besoins en la matière ; ce problème étant de plus en plus sensible, un véritable marché proposant des solutions adéquates devrait se développer. Les bibliothèques et les archives considèrent l archivage des données électroniques dans une perspective plus longue et de manière plus approfondie que la plupart des entreprises. La conservation illimitée des documents acquis appartient au noyau même de leur activité, tandis que, pour les entreprises, elle joue tout au plus un rôle secondaire, car elle se dérive des objectifs commerciaux radicalement différents et est souvent limitée dans le temps. Dans toute entreprise, des documents doivent être conservés en toute sécurité pendant une certaine période, mais on ne prévoit pas de les réutiliser. Les attentes en matière d archivage sont donc totalement différentes. Pour ce faire, il existe des produits spécialement destinés aux PME, qui permettent, p.ex., la conversion de documents numériques ou devant être scannés en fichiers TIFF, avec catalogage afférent 98. Les données sont conservées dans ce format d image reconnu comme propice à l archivage. Les textes sont ainsi conservés sous forme d images de pages et peuvent faire, si nécessaire, l objet d une recherche textuelle par reconnaissance optique de caractères (OCR, cf ). A une vaste échelle, JP Morgan, prestataire américain spécialisé dans le secteur financier, propose sous le nom de «i- Vault!» 99 des archives documentaires sous forme d images qui reposent sur le même principe. Dans les deux cas, on constate toutefois une absence de perspective pour un maintien à long terme du décryptage des données qui aille au-delà de la simple conservation des originaux. En outre, une telle approche ne suffit pas pour les tâches dont il est question dans ce rapport, car aucune fonctionnalité ne peut être conservée dans ou avec les données de départ, à commencer par la recherche en texte intégral. Cette solution est uniquement discutée comme dernière issue avant la perte des contenus, et le développement de la Bibliothèque royale de La Haye en un UVC (Universal Virtual Computer) permettant la lecture des fichiers TIFF vise à garantir, au moins, l affichage du document dans un format d image, lorsque toutes les autres méthodes se sont avérées défaillantes (Wijngaarden and Oltmans 2004). En revanche, cette approche se justifie totalement pour la sauvegarde de documents commerciaux au-delà des délais juridiquement requis, dont il a été question plus haut. 98 Archivista GmbH, Zurich : 99 JP Morgan i-vault! : 150

151 Les offres mentionnées au point 8.5.3, qui assurent un accès durable, sont déjà liées à la garantie de l archivage à long terme. Au sein de l OCLC, on discute par ailleurs de concepts qui pourraient permettre de proposer d autres prestations d archivage s appuyant sur ces offres. Ainsi, les éditeurs auraient la possibilité de remettre leurs données à l OCLC à des fins d archivage 100, et ce, au choix, soit sans accès pour les utilisateurs, soit avec accès par le biais des contrats de licence des institutions dotées d OCLC Electronic Collections Online. De plus, des informations complètes sur les abonnements et les licences de chaque titre pourraient être saisies pour chaque bibliothèque, afin de pouvoir garantir aux institutions l accès auquel elles ont droit. En dehors de la sécurité générale de l archivage, les éditeurs pourraient ainsi, avec cet arrangement proposé, orienter leurs anciens clients vers l OCLC, s ils devaient perdre euxmêmes, suite à une vente, le droit de proposer les contenus correspondants. Un autre projet vise à donner aux bibliothèques la possibilité de déposer leurs contenus sous licence dans des archives capables d assurer une disponibilité à long terme (trusted archive) 101, d où l accès aux backfiles et aux données actuelles serait assuré selon l autorisation accordée par l éditeur. L OCLC prendrait ensuite les mesures nécessaires pour la migration ou l émulation. Le lien prévu vers le texte intégral à partir d OCLC et d autres bases de données mises à disposition offre un attrait particulier. Une taxe annuelle échelonnée en fonction de la quantité de périodiques électroniques d une bibliothèque a été proposée comme modèle de prix : Nombre de titres abonnés Taxe annuelle (dépendant du nombre de bibliothèques participantes!) en $ > < Tableau 10: Propositions de l OCLC discutées en interne pour la fixation des prix d une offre possible d «E-Journal Depository Service for Libraries» 101. On ne sait pas encore actuellement si les planifications concernant les prestations en question ont progressé. Il s agit en tout cas d un modèle qui n a pas encore été éprouvé. En revanche, l OCLC exploite depuis 2002 les archives numériques OCLC (OCLC Digital Archive) 102 comme système de serveur et de recherche, sur la base du modèle OAIS (cf ). Les coûts de ce service dépendent de la quantité de données mémorisées. En 2002, les tarifs étaient les suivants (Chapman 2003) : 100 Vorschlag ECO Archive Service for Publishers, vgl. Vorstellung und Diskussion unter (Zugriff ) 101 E-Journal Depository Service for Libraries, ibidem. 102 OCLC Digital Archive : 151

152 Volume global de données du client Prix par giga-octet et par année GB $ GB $ 32 > 1000 GB $ 15 Tableau 11: Coûts de l archivage de données dans l offre OCLC Digital Archive. Etat A titre de comparaison, la capacité mémoire d un CD-Rom est de 0,7 Go, celle d un DVD- Rom de 4,7 Go. Les archives de périodiques de l Institute of Physics, qui comportent plus de 30 titres de 1874 à 1991, sont estimées à 50 Go ; les disques durs des ordinateurs sur les postes de travail atteignent aujourd hui 250 Go et plus (voir autres données comparables au chap. 4.1) Renseignements sur les coûts de l archivage à long terme On ne dispose pas de données fiables concernant les coûts de l archivage à long terme. Les coûts occasionnés par la seule exploitation du serveur, qui ont été discutés au point , fournissent de premiers indices. Comme ils ne constituent toutefois qu une estimation, d autres chiffres disponibles vont être présentés dans les pages qui suivent Prestataires tiers : comparaison entre formes analogique et numérique Les données concernant l OCLC présentées dans le Tableau 11 ont été comparées, dans une étude de cas, aux coûts de l entreposage physique de livres ou de microformes dans un dépôt de la Harvard University qui est également ouvert à des tiers (Harvard Depository) (Chapman 2003). Pour l entreposage physique, le prix est calculé sur la base de la surface d entrepôt nécessaire. Pour établir la comparaison, on s est basé sur une collection existant réellement, celle des American Historical Textbooks. Dans les deux cas, les coûts se rapportent au niveau de performance des services de stockage géré (Managed Storage), qui garantissent un contrôle permanent des conditions d environnement (température et humidité atmosphérique) pour les objets physiques et une sauvegarde continue des données dans leur forme originale pour les objets numériques. Les mesures qui garantiraient une utilisation à long terme et la présentabilité des données dans des environnements informatiques actuels ne sont donc pas incluses. Bien entendu, il ne faut pas s attendre à ce que les tarifs requis par un prestataire à but non lucratif comme l OCLC couvrent les frais. Plus que les données en chiffres absolus, ce qui importe, ce sont les rapports entre les coûts afférents aux différents formats. 152

153 Format Quantité Surface nécessaire Prix à l unité en $ Coût annuel en $ Livre 2202 vol. 176 BSF* 3,91/BSF 688 Microfilm 35mm 596 bobines 43 BSF* 9,85/BSF** 424 ASCII avec cryptage fichiers 2,09 Go 15/Go*** 31 Images de pages à 1 bit 600dpi dito 70 Go (comprimé sans perte) 15/Go Images de pages à 8 bits 300dpi Images de pages à 24 bits 300dpi dito Go 15/G dito Go 15/Go * BSF = billable square foot, surface en m 2 ; 1 square foot = env. 0,929 m 2 ** prix plus élevé en raison d un contrôle supplémentaire de la climatisation *** tarif le plus bas, suppose des volumes de données de 1001 Go au total Tableau 12 : Etude de cas des «American Historical Textbooks» permettant de comparer les coûts occasionnés par un entreposage traditionnel (Harvard Depository) ou un serveur numérique (OCLC Digital Archive) pour le même contenu dans différents formats (Chapman 2003) Comme on peut le constater dans le Tableau 12, les coûts relatifs à l archivage numérique dépendent expressément du format choisi. L utilisation du format nécessitant le moins de mémoire s avère lourde en conséquences, puisque seuls les textes sont conservés, sans qu il soit possible de reconstituer à une date ultérieure leur apparence extérieure ou les fonctionnalités existantes. Les formats d image qui permettent de conserver tout au moins l apparence extérieure nécessitent une mémoire infiniment plus grande. Fixer les prix en fonction de la quantité de données n a de sens qu au niveau de la préservation du flot de bits. Quand il s agit du traitement différencié des formats les plus divers, au sens d une conservation logique, de tels modèles ne peuvent plus fonctionner : dans ce cas, plus on a de formats différents, et plus la tâche devient difficile (Ashley 1999) ; il faut donc là s attendre à d autres modèles de prix edepot de la Bibliothèque royale des Pays-Bas En ce qui concerne l edepot de la Bibliothèque royale, il s agit de l un des rares projets qui, après avoir reçu des moyens substantiels pour la recherche et le développement, dispose d un financement structurel de ses activités permanentes. D après Jones (Jones 2003), il s élèverait à 1,14 millions d euros par an à compter de

154 Coûts du cycle de vie : comparaison entre périodiques imprimés et périodiques en ligne Une comparaison entre les coûts des périodiques imprimés et électroniques ne provenant pas des abonnements ou des licences devrait fournir des informations importantes, qui pourraient inciter à un passage aux modèles de licences E-only, ou au contraire le retarder. Une comparaison soigneuse entre les coûts concrets enregistrés par onze bibliothèques universitaires américaines de taille et d orientation diverses offre des résultats intéressants (Schonfeld, King et al. 2004) quant aux frais qu entraîne l acquisition sur une année d un titre pendant 25 ans. A noter que l étude prend en compte de telles dépenses qui ne surviennent qu une fois (contrôle d entrée, reliure, etc.), aussi bien que celles qui devraient se présenter pendant toute cette période. Pour la Suisse, on dispose de chiffres détaillés provenant d une enquête réalisée en 1993 concernant les coûts des périodiques imprimés achetés par les bibliothèques scientifiques (Schneider, Köstler et al. 1993). Il faut toutefois faire de petites réserves, car, dans cette étude comparative, les coûts relatifs à l infrastructure et au support électronique (à l exception des ordinateurs du personnel) et d autres postes n ont pas pu être pris en compte. D autre part, les dépenses concernant les prêts interbibliothèques n ont pas été prises non plus en considération. On ne peut faire de comparaisons que dans le cadre d une bibliothèque, avec les processus qu elle applique actuellement, car la taille et le type de la collection jouent un rôle essentiel. Ainsi, les grandes bibliothèques devraient-elles profiter en tout cas des économies d échelle et, en cas de passage complet des périodiques imprimés aux périodiques électroniques, pouvoir réaliser des économies relativement restreintes par rapport aux bibliothèques de taille plus modeste. Ces chiffres présentent toutefois de grandes disparités d une bibliothèque à l autre. La question la plus cruciale reste de savoir ce qui va se passer pendant les différentes étapes d une transition qui n a pas encore abouti. Dans ce cas, les coûts par titre imprimé devraient augmenter. Le point le plus critique de cette étude est toutefois qu elle ne prévoit pas de coûts de conservation électronique pendant une période de 25 ans, bien qu elle traite de manière explicite des coûts du cycle de vie. La raison invoquée est qu il n existe aucune solution suffisamment éprouvée à laquelle on pourrait se reférer. Bien entendu, la signification de cette étude comparative en est fortement réduite, car des frais correspondants y sont imputés aux titres imprimés. Mais, précisément, ce détail est considéré de manière conséquente : puisque jusqu à présent, les moyens nécessaires à la préservation des périodiques imprimés auraient, implicitement ou explicitement, dû être mis à disposition, il devrait être possible de consacrer désormais une partie de ces ressources au travail d archivage électronique. Si chaque bibliothèque versait une telle contribution, des solutions communes pourraient être trouvées, et être plus avantageuses pour tout le monde. Bien entendu, la perspective de réaliser certaines économies éveille d autres convoitises, aussi bien à l intérieur des hautes écoles responsables que chez les éditeurs. Cela se produit indépendamment du fait que les bibliothèques ont déjà assumé de nombreuses tâches sans obtenir les moyens réguliers supplémentaires au cours des dernières années. Si l on devait adopter plus ou moins totalement un approvisionnement purement électronique des périodiques et que les économies correspondantes se faisaient sentir, alors il faudrait impérativement que ces moyens financiers soient au moins mis à disposition des

155 bibliothèques pour la conservation des données électroniques à long terme. Il faut toutefois s attendre à ce que les besoins financiers pour l archivage numérique augmentent déjà à un moment où ce changement ne sera pas encore effectué, pour autant qu il soit poursuivi et mis en œuvre. Dans d autres comparaisons de coûts également, les frais d archivage de contenus électroniques ne sont pas pris en compte ou alors très insuffisamment (Montgomery and King 2002) (Connaway and Lawrence 2003), sauf dans des travaux d ordre général, qui ne citent aucun chiffre (Feeney 1999) (Sanett 2003). Les renseignements concernant l entretien du serveur ArXiv ( ) devraient nous donner une idée de la limite inférieure des coûts qu entraînerait un véritable serveur d archivage. Cependant, ces coûts ne devraient pas tellement augmenter en raison de la quantité d objets qui doivent être saisis, mais à cause des mesures supplémentaires d archivage à long terme qu il va s agir d implémenter Archivage à long terme d autres données Données existant uniquement sur un plan local D un point de vue technique, les données qui n ont pas été acquises dans le cadre du Consortium ne posent, en principe, aucune autre exigence que les contenus sous licence commune. D un point de vue organisationnel, c est une autre affaire : ainsi, chaque bibliothèque devrait négocier sous quelle forme et à quelles conditions elle va pouvoir reprendre les contenus afin de procéder à une sauvegarde et un archivage sur place. L accès ne peut en effet être assuré qu aux clients de la bibliothèque qui les détient. Sans négociation particulière, cela vaut également pour les backfiles de périodiques achetés de manière locale, même si les titres actuels ont fait l objet d un contrat de licence par le biais du Consortium Littérature grise Pour les contenus qui ne sont pas publiés de manière formelle, la question d un archivage sous la responsabilité de l éditeur ne se pose pas sous cette forme. Dans ce cas de figure, une bibliothèque est souvent à l origine d une publication (même si elle est en partie informelle), lorsqu elle autorise, p.ex., l utilisation d un document sur un serveur de documents. Ce type de publications et d autres formes apparentées sont considérées avec un grand intérêt et elles devraient, selon le désir manifesté par les bibliothèques, être également utilisées de manière accrue ; pour les contenus ainsi publiés, il va donc notamment falloir proposer une solution plausible d archivage qui obéisse à son tour à d autres conditions. Dans ce cas de figure, les bibliothèques sont souvent libres de définir quels droits elles vont demander à l auteur de leur céder. Elles peuvent ainsi garantir dès le début qu elles-mêmes ou un tiers vont pouvoir prendre certaines mesures qui s imposent pour leur conservation. Dans l accord correspondant, il vaudrait mieux les définir en laissant une certaine marge de manœuvre, si l on veut pouvoir profiter, plus tard, des nouveaux développements techniques. De plus, on peut s imaginer que certaines bibliothèques déploient des efforts sur le plan de la «sauvegarde qualifiée», afin de gagner du temps en vue des développements futurs de 155

156 l archivage. Elles doivent en effet sauvegarder de manière temporaire des contenus n existant pas dans leurs fonds. Une telle activité devrait être liée, d une part à l offre de prestations d une bibliothèque universitaire et de son serveur de documents, d autre part, à l activité d une infrastructure d archives qui enregistre les contenus correspondants. Cette prestation préalable de «sauvegarde privilégiée» correspondrait à la situation décrite au chapitre 8.5.2, avec le scénario d un serveur local ou régional de contenus de périodiques. Les réflexions faites à ce sujet sont également valables ici. Une solution qui, d un côté, table sur la garantie d accès, grâce à une sauvegarde assurée par les hautes écoles, et prévoit par ailleurs l archivage dans un autre endroit, suppose des interfaces clairement définies pour l échange de données et de métadonnées. Or, ces «interfaces» doivent être considérées aussi bien d un point de vue technique qu organisationnel Produits numérisés Comme nous l avons mentionné plus haut, ces produits numérisés sont, en principe, des objets numériques qui posent les mêmes exigences que les autres en matière d archivage. A y regarder de plus près, toutefois, d autres particularités doivent être prises en compte : par exemple, le lien entre les fichiers d images et un texte à l arrière-plan basé sur la reconnaissance de signes optiques. Même si le système qui a fabriqué ce lien dans l offre active était amené à disparaître, il devrait néanmoins encore être possible d en reconstituer l attribution. La situation s avère parfois plus compliquée, une image se trouvant dans le format d archive proprement dit, tandis que, à côté, on a un ou plusieurs formats de présentation de la même image qui, en règle générale, sont d une résolution inférieure. Au moins l un de ces formats doit être relié au texte en arrière-plan, si l on veut que le lien de la recherche en texte intégral et l affichage de l image puissent être reconstitués Modèles de financement Le financement des activités du projet d e-archiving est garanti jusqu à la fin Ses objectifs portant explicitement sur le long terme, il va falloir réfléchir suffisamment tôt à la façon dont le financement des travaux ultérieurs souhaités va pouvoir être assuré. Les discussions en cours sur la poursuite des activités dans le cadre des licences du bureau central ne peuvent encore fournir aucune indication concrète. De plus, il existe des différences structurelles entre les deux parties du projet : les bibliothèques pourraient, au besoin, poursuivre individuellement leurs activités en matière de licences avec le surcroît de charges que cela implique sur le plan local. Pour ce qui est de l archivage, on peut en revanche prévoir qu il y aura des installations et des activités qui ne pourront plus être scindées en différentes composantes opérationnelles. Comme on a pu l observer (Lavoie 2003), les coûts et le financement sont plutôt discutés dans le contexte global des bibliothèques numériques, car la contre-valeur visible n est pas, en règle générale, l archivage, mais l accès à l information. Parmi les rares exceptions, on trouve les explications sur les principaux modèles de financement proposés pour des solutions d archivage, fournies dans un projet de la Yale University Libraries (Bennett, Conway et al. 2002): 156 Versement unique (Up-front payment) : les bibliothèques, les associations spécialisées, le gouvernement ou les institutions culturelles font un versement unique

157 pour la conservation si possible illimitée des (volumes de) données. Un paiement de la part des auteurs a déjà été évoqué. Cet argent doit être versé en grande partie sur un fonds. Les valeurs basées sur l expérience concernant les coûts réels manquant, un paiement au préalable ne semble guère envisageable. Versements continus (Ongoing Archival fees) : les cotisations peuvent être adaptées selon les besoins, ce qui restreint la possibilité de les planifier pour les bibliothèques. Risque de perte en cas de cessation des paiements. La réflexion que de telles cotisations pourraient être prélevées déjà avec les taxes de licence pour les contenus actuels est intéressante. Le modèle de bibliothèque traditionnel : les bibliothèques et les institutions apparentées assument cette tâche et sont financées pour cela par des tiers (l Etat, notamment). Taxes de prestations (Fee for services operation) : ici, manifestement, on veut dire qu une institution d archives prélève (uniquement) des taxes pour des prestations particulières. Forme hybride : selon toute probabilité, une seule solution ne suffira pas. On peut s imaginer notamment que l un des groupes qui participent assume les frais de départ uniques, tandis qu un autre s acquittera de cotisations régulières pour l entretien et l accès potentiel. Les options citées se réfèrent à la sauvegarde et aux mesures d archivage proprement dites. Il n existe toutefois pas d autres possibilités pour l organisation institutionnelle de centres de compétences ou d autres activités. On notera qu il n existe aucune base idéale pour évaluer chacun de ces types de taxe : ni le nombre ni la taille des objets devant être conservés ne constituent un étalon de mesure approprié au vu de la situation actuelle. Dans le cas d une solution consortiale, la situation est encore plus opaque, car on ne sait plus quel contenu est conservé pour quelle institution, les données devant être à disposition pour tous les utilisateurs autorisés. En dehors de ces critères quantitatifs, des aspects qualitatifs devraient être encore mieux pris en considération, comme les formats livrés ou la charge de travail escomptée. Il manque encore les instruments nécessaires pour une telle évaluation. De même, il est difficile de comprendre les besoins des différentes bibliothèques et ce qu elles veulent ou peuvent payer pour des services correspondants, s il devait y avoir une concurrence entre les frais courants d approvisionnement en information et ceux pour l archivage. Si l on fait abstraction du mandat institutionnel, on se rend compte très vite que les chiffres d utilisation baissent rapidement quand il s agit de matériel plus ancien : des enquêtes ont montré que seuls 10 à 15% des articles lus ont plus de cinq ans (King, Tenopir et al. 2003). Il ne suffit pas en tout cas de mettre en concurrence les accès actuels et les accès aux archives. Il est intéressant dans ce contexte de s interroger si, avec un accès en ligne durable, la valeur et l utilisation des années plus anciennes ne s en verraient pas accrue Attrait Une autre question est encore plus fondamentale : qu est-ce qui devrait amener une institution à archiver elle-même ses données numériques? Une question embarrassante, car 157

158 les titulaires des droits, les archives et les utilisateurs peuvent assumer des rôles très différents (Lavoie 2003). Cela signifie qu en archivant des données, une institution poursuit en même temps d autres objectifs, qui peuvent correspondre aux autres rôles. La question se pose alors : quel rôle sera suffisamment attrayant pour qu elle s engage en faveur de la conservation des documents? En ce qui concerne les activités d archivage propres, l intérêt est réduit du fait que, au fond (au niveau de la préservation des données), peu importe quelle institution commence à pratiquer l archivage : certaines peuvent être tentées d attendre jusqu à ce qu une autre institution décide d assumer cette tâche pour un certain contenu, car les copies destinées à toutes les institutions ne devraient pas se distinguer les unes des autres. Les profiteurs nonparticipants seront récompensés. Le fait que, jusqu à présent, le marché ne propose pas de solution s explique de manière évidente : les exigences des clients institutionnels potentiels étant très différentes d un point de vue qualitatif et quantitatif, la taille critique du marché n a pas été atteinte pour chacun des niveaux d exigence Recommandations pour l archivage à long terme Jusqu à nouvel ordre, aucune infrastructure propre comparable au système matériel d archivage de la BN ne sera mise en place pour l archivage à long terme dans les bibliothèques universitaires. Pour la mise en place d un système permettant la garantie d accès (cf ), il faudra tenir compte des exigences fondamentales de l archivage à long terme (normes, formats, documentation, etc.). Cela facilitera le transfert de documents dans les archives ou, au besoin, la transformation ultérieure du système d accès lui-même en archives. Approfondissement des contacts avec la Bibliothèque nationale suisse. Analyse des possibilités de collaboration : o o o pour l élaboration et la diffusion de normes et d outils concrets (p.ex., attribution d un URN, métadonnées) et la planification stratégique de la conservation des objets (Preservation Management) ; pour le développement d un système ou de composantes compatibles OAIS. Les bibliothèques universitaires sont particulièrement intéressées par la possibilité d utilisation rapide et fiable des contenus («accès» dans le modèle OAIS, cf. chap ) ; examen d une participation possible au système d archivage de la BNS. Recherche d autres partenaires performants à l intérieur et à l extérieur des hautes écoles (p.ex. centres de calculs qui doivent déjà archiver de grandes quantités de données primaires). Poursuite des échanges avec des initiatives portant sur les mêmes domaines à l étranger, projets de bibliothèques (KOPAL, edepot, p.ex.) ou d autres prestataires (notamment l OCLC). 158

159 Examen de la possibilité de participer en Suisse et à l étranger à des projets de recherche proprement dite qui analysent les questions clés de la conservation numérique (préservation du décryptage et de l utilisation). Examen de la possibilité de solutions partielles différenciées selon les contenus. Sur la base d expériences nationales et internationales, évaluation approfondie des coûts nécessaires aux différentes options (système propre, participation à des systèmes d autres institutions, de tiers ). Au cas où le besoin d une solution (partielle) propre est confirmé : préparation de la mise en place en 2006, mise en place en Formulation d une stratégie pour l organisation et le financement à long terme. 159

160 8.7 Archivage partagé des périodiques imprimés La publication, en parallèle, de la version imprimée et de la version électronique d une revue peut être considérée comme un phénomène transitoire, avant une parution uniquement en version électronique. Pour autant qu il s agisse effectivement d une phase transitoire, sa durée doit être quand même considérée comme indéterminée. Une seule chose semble sûre : suivant les disciplines, l utilisation des éditions électroniques peut être acceptée de manière très différente (Guthrie 2002). Cela vaut encore plus pour la renonciation définitive à la production et à l achat d une version imprimée. Les personnes n utilisant pas STM, en particulier, aimeraient pouvoir disposer à long terme également d une version papier actuelle (selon les disciplines, de 24 à 63%) ; 35 à 74% aimeraient que les volumes imprimés existants ne soient pas éliminés, même si les archives électroniques fonctionnent de manière efficace. 76% des 7400 chargés de cours qui ont répondu considèrent l archivage de périodiques électroniques comme «crucial». 90% sont d accord avec cet énoncé (70% : «correspond très bien à mon opinion», 20% : «correspond plus ou moins à mon opinion»), à savoir qu un archivage de la version imprimée par certaines bibliothèques sera toujours indispensable 103. On peut donc partir du principe que les éditeurs vont poursuivre encore pendant longtemps la production de revues scientifiques imprimées auxquelles les bibliothèques pourront s abonner. Dans quelle mesure, elles le feront dépendra, d une part, des attentes des usagers, d autre part du développement de ce phénomène connu sous le nom de «crise des périodiques» (Keller 2001). Dans ce contexte, les bibliothèques se voient contraintes, d une part, de continuer à utiliser et à proposer les avantages reconnus des périodiques imprimés, notamment la possibilité d un archivage fiable sur le plan de la forme et du contenu. D autre part, confrontées au manque de ressources, elles doivent s efforcer déjà de tirer parti d autres possibilités d optimisation au niveau de leurs fonds. La question des abonnements multiples est ainsi au centre de l actualité dans les bibliothèques suisses. Jusqu à présent, les suppressions d exemplaires multiples étaient surtout réglées entre les bibliothèques à l intérieur d une haute école. Dans le cadre du projet «e-archiving» du Consortium suisse, des possibilités de coordonner les fonds à l échelle nationale doivent être proposées. Dans la perspective de ce projet, les revues imprimées n offrent plus le format adéquat pour pouvoir être considérées comme un substitut à part entière, si l on considère la valeur d utilisation et la convivialité des périodiques électroniques. Mais elles peuvent très bien compléter l archivage électronique et, jusqu à un certain degré, le garantir. Entre autres raisons de conserver des exemplaires sur papier, on cite ((Peters 2003)) : l accès à des matériaux plus anciens qui n existent pas sous forme numérique ; la nécessité de réaliser des copies de sécurité de matériaux numérisés ; l utilisation pour des numérisations nouvelles ou ultérieures ; des usages nécessitant le support physique de l original. 103 What do faculty think of electronic resources? Présentation de K. Guthrie, R.C. Schonfeld, , CNI Task Force Meeting : 160

161 De plus, en vertu de la situation juridique et contractuelle actuelle, les éditions imprimées constituent la seule source à partir de laquelle des reproductions d articles peuvent être effectuées pour les services de livraison de documents. Il ne faut pas oublier, par ailleurs, qu il y a encore de nombreux périodiques qui ne paraissent pas sous forme de publication en ligne. Il ne faut pas s attendre à ce que les choses changent rapidement à cet égard, et il n est pas sûr que cela soit même un jour le cas. C est aux bibliothèques de juger elles-mêmes sur place si la mise à disposition électronique d un titre couvre suffisamment les besoins courants de leurs usagers. Ensuite seulement, elles pourront prendre la décision de renoncer à un exemplaire imprimé propre ; on n aurait alors besoin d en conserver qu un seul en Suisse, à des fins d archivage Objectifs L archivage coordonné de documents imprimés poursuit deux objectifs distincts : 1. D une part, assurer l archivage de périodiques imprimés en un exemplaire en Suisse. Questions à éclaircir : a. Pour quels titres existe-t-il un besoin d archivage (unicité, importance) du point de vue des usagers et des bibliothécaires? b. Dans quelles bibliothèques se trouve ce titre, sous quelle forme et dans quelle quantité? c. Quelles obligations l archivage implique-t-il (mesures de conservation, fourniture de documents, poursuite de l acquisition)? d. Faut-il opter pour un archivage uniquement décentralisé dans les bibliothèques propriétaires ou prendre en considération un dépôt central? 2. D autre part, grâce à une plus grande transparence en matière d archivage de périodiques, les bibliothèques devraient disposer d un outil qui leur permette de décider de manière plus différenciée de poursuivre ou non un abonnement. Cela pourrait entraîner une réduction de dépenses dans les bibliothèques, suite à la résiliation d abonnements multiples. Cette question prend toujours plus d importance devant des modèles de licence E-only potentiellement attrayants. C est un point qui est avant tout intéressant dans le cas d éditeurs auprès desquels il n est pas possible de continuer à avoir des contrats de licence consortiaux avec interdiction de résiliation. Là où les licences consortiales peuvent être prorogées sans interruption, de telles suppressions de titres ne sont pas possibles, ou alors seulement au moment de passer à un nouveau modèle de licence. Toutes les réglementations qui sont envisagées doivent remplir d autres exigences : 1. il faut des procédures et des processus simples, qui puissent être compatibles avec les structures et les moyens actuels ; 2. les différentes bibliothèques doivent conserver la possibilité de déterminer ellesmêmes le développement de leurs fonds. a. Les bibliothèques doivent pouvoir décider elles-mêmes si elles ont besoin de continuer à s abonner à un titre déjà archivé dans un autre endroit. 161

162 b. Il va donc falloir prendre des mesures qui permettent d atténuer les effets que de telles décisions locales peuvent avoir sur d autres partenaires. En cas de changements, les uns et les autres devront fournir des informations et se consulter suffisamment tôt. 3. Il ne faut surtout pas bloquer les développements futurs. Il n y a notamment aucune raison pour que d autres bibliothèques ne puissent pas participer ultérieurement à une mise en œuvre réussie. Là encore, l extension à d autres titres devrait être possible Exemples Différents modèles sont déjà appliqués pour l archivage coordonné de documents imprimés. Ils se distinguent notamment dans l importance donnée à une centralisation physique des fonds et à l ouverture de l accès aux matériaux archivés. Un article paru aux Etats-Unis présente trois projets (Peters 2003) : Committee on Institutional Cooperation (CIC, 13 bibliothèques, opérationnel depuis 2002) 162 Objectif : mettre sur pied un mécanisme équitable et fiable, qui permette aux bibliothèques de renoncer à l abonnement à des périodiques imprimés disponibles sous forme électronique, et garantir que, à l intérieur du Consortium, un exemplaire imprimé soit conservé à des fins de recherche et d archivage. Certaines bibliothèques ayant procédé à des désabonnements, il s agissait de prendre des mesures pour qu ils s effectuent de manière coordonnée et successivement, pour un éditeur après l autre. Les exemplaires d archive sont conservés de manière décentralisée dans les bibliothèques et sont accessibles aux usagers. Afin de faire face au risque de détérioration ou de vol, les bibliothèques sont obligées de contrôler régulièrement l exhaustivité des titres qu elles archivent. Pour l instant, les deux principales restrictions sont les suivantes : tout d abord, les accords portant sur la conservation ne sont valables que de manière prospective, c est-à-dire à partir de l année en cours et pour l avenir ; d autre part, la durée pour laquelle les bibliothèques s engagent à poursuivre l abonnement et à conserver les volumes n est que de cinq ans. L intention déclarée était de maintenir aussi bas que possible les obstacles à une participation. La répartition des titres s effectuait sur la base de tableaux, sur lesquels les bibliothèques pouvaient signaler leur intérêt à poursuivre un abonnement. Dans une seconde phase, lorsqu un même titre intéressait plusieurs bibliothèques, il était nécessaire de négocier et de procéder à des rééquilibrages, et des titres étaient échangés entre les bibliothèques, afin de répartir équitablement les charges. Les titres orphelins jusqu à ce moment-là étaient de nouveau proposés. Les bibliothèques déclarent uniquement qu elles continueront de s abonner aux titres indiqués et de les conserver pour les cinq années à venir. Les autres bibliothèques sont libres d agir à leur guise. Elles peuvent décider en fonction de leurs propres besoins si elles veulent ou doivent poursuivre leur abonnement. Cela permet une mise en œuvre relativement simple, rapide et avantageuse, qui devrait pouvoir être aisément échelonnée.

163 Center for Research Libraries (CRL, test subventionné pour deux ans à compter de 2002) Le premier objectif du projet est de rassembler l ensemble des fonds figurant dans JSTOR sous forme imprimée. Ce faisant, un exemplaire est conservé de manière centralisée, il n est pas accessible et ne peut être mis à disposition qu en cas d urgence, tandis que plusieurs copies sont localement accessibles. Des enquêtes portant sur un système de répertoire national d archives imprimées et de derniers exemplaires sont par ailleurs prévues. Ce dernier devrait permettre aux bibliothèques de localiser le site de certains titres et, après examen des conditions posées par les archives en question, de décider si elles doivent continuer d acheter et/ou d archiver un exemplaire propre. Dans son Scholarly Journals Program, le CRL cherche en outre à commander de manière centralisée des périodiques rarement utilisés, et de rassembler les archives papier et les archives électroniques ou les archives de microfilms de titres qui n ont pas été acquis de manière centralisée. University of California System La mise en place d une collection centrale commune de périodiques imprimés s oriente en premier lieu sur l offre de certains éditeurs, mais, avec le temps, d autres concepts peuvent être envisagés. Cette collection est conçue pour une utilisation active. Actuellement, tous les périodiques concernés sont traités par une bibliothèque et hébergés dans l une des deux bibliothèques de sauvegarde régionales. Point intéressant : il semble qu on ait l intention de recenser les fonds exploités en commun comme appartenant à chacune des bibliothèques participantes. Five-College Library Depository (Nichols and Smith 2001) Ici, l on a une approche un peu différente : des fonds des bibliothèques participantes sont rassemblés dans une mémoire centrale et accessibles sous forme électronique. Les exemplaires en double sont éliminés et les fonds deviennent, en règle générale, possession du consortium qui exploite le dépôt, en tant qu entreprise autonome. Seuls les fonds d une bibliothèque qui ne se considère pas en mesure de céder la propriété de ses fonds sont rangés de manière séparée dans le dépôt. Autre mesure complémentaire, des lignes directrices ont été mises au point, afin de déterminer quels fonds sont appropriés pour l archivage et avec quelle priorité, ou comment on peut apprendre que la seule bibliothèque abonnée à un titre a décidé de résilier cet abonnement. La restitution de fonds au campus est même traitée comme un scénario possible, au cas où les besoins changeraient au niveau de la recherche. Plan d élimination et de conservation partagées des périodiques (PECPP 104, France) Dans ce programme qui inclut des bibliothèques, des médiathèques et autres établissements apparentés de la région de Franche-Comté, on demande d abord aux institutions qui souhaitent participer quels sont leurs souhaits et l état de leurs collections. Lors du dépouillement qui suit, les disparités existant dans la répartition 104 PECPP auprès d ACCOLAD (Association Comtoise de Coopération pour la lecture, l audiovisuel et la documentation) : Nous remercions M me G. von Roten de ce renseignement. 163

164 164 géographique sont recensées. Des compromis sont par ailleurs nécessaires, car l expérience a montré que de nombreuses bibliothèques conservaient les mêmes titres, tandis que d autres n étaient en revanche même pas cités. Un comité de pilotage regroupant des représentants de chaque institution propose alors ce qui va pouvoir être archivé. Les critères de répartition sont les suivants : géographiques (au moins une collection de référence par grande zone), ancienneté de la collection, nature de la collection, accessibilité à la collection (y compris prêt inter-bibliothèques). Les institutions concernées doivent confirmer qu elles acceptent les propositions du comité. Quand une bibliothèque a la responsabilité d un titre, elle s engage à poursuivre l abonnement. A titre exceptionnel, une bibliothèque peut se désengager de la responsabilité d un titre, à condition de trouver un autre établissement qui endosse la responsabilité du titre concerné. Les établissements qui n archivent pas eux-mêmes un titre, mais qui aimeraient procéder à des éliminations, s engagent à vérifier que le titre du périodique est inscrit dans le plan de conservation partagée et à contacter l association ou les bibliothèques responsables de ce périodique pour, le cas échéant, compléter leurs collections. La promesse de conservation peut se rapporter à l ensemble du fonds à partir d une certaine année («à partir de 1972») ou pour un certain nombre d années précédant l année en cours («les cinq dernières années»). Dans l article de Peters (Peters 2003), on souligne que les modèles d archivage de documents imprimés peuvent laisser une grande liberté aux bibliothèques : savoir qu il existe un exemplaire archivé de manière fiable peut donner lieu à des attitudes très différentes, p.ex. on poursuivra l abonnement du périodique, mais on renoncera à le relier ou on décidera de ne le conserver que pour une période donnée, etc. Voici quelles sont les conditions de base citées pour que le système soit efficace : Il faut des engagements véritablement contraignants (commitments with teeth), réglant clairement les modalités de sortie en cas d urgence, de manière à ce qu il n y ait aucune perte. Il faut des dossiers soigneusement tenus ou des documents justifiant une mémoire institutionnelle : il faut que, dans dix ans, on puisse encore clairement savoir ce qui va être appliqué, pour quel type de revue et pourquoi. Il faut en outre empêcher qu une bibliothèque annule involontairement un titre, tant qu elle a accepté d en poursuivre l abonnement et l archivage. Il faut des informations complètes, qui permettent à tous les participants de prendre des décisions en connaissance de cause concernant la poursuite des abonnements aux périodiques et leur archivage. La confiance réciproque doit régner entre les bibliothèques collaborer dans d autres domaines serait l idéal pour créer ce climat de confiance. Il faut que cette participation ait un caractère bénévole. L acception, pour le moment assez limitée, de la part des usagers semble surtout poser problème lorsqu ils n ont plus accès à certains fonds, contrairement aux habitudes, et donc,

165 en premier lieu, lors du transfert de fonds en libre accès dans un dépôt central. Dans les pays anglo-saxons, où la tradition du libre accès est bien ancrée, ce phénomène est plus fortement ressenti qu en Suisse, où des années plus anciennes de périodiques sont souvent, ou même surtout, conservées dans des magasins fermés Etapes prévues pour une réalisation du projet dans le cadre du Consortium Définition des titres pris en considération Les périodiques scientifiques des bibliothèques universitaires ont servi de point de départ à nos réflexions. Pour les éditions imprimées, un archivage fiable est requis, tandis que la suppression des abonnements multiples n est autorisée que de manière très limitée. Pour une grande partie de ces titres, les bibliothèques ont conclu des contrats de licence portant sur des versions en ligne par le biais du Consortium. Comme les prix des licences consortiales s orientent encore, en règle générale, sur les coûts des abonnements d imprimés existants, le Consortium dispose, malgré quelques réserves, d informations assez précises sur les fonds actuels des bibliothèques, mais pas sur les années antérieures. Souvent, ces informations ne permettent pas de dire si un abonnement se trouve dans la bibliothèque principale ou dans une bibliothèque d institut. A noter qu en raison du contrôle insuffisant sur les fonds des bibliothèques d instituts décentralisées, au sein des hautes écoles, seules les grandes bibliothèques ont été mises à contribution pour un archivage coordonné. Les mesures décidées ne concernent donc que ces dernières. Les bibliothèques principales ou les bureaux de coordination ont toujours la liberté d indiquer d autres fonds dont ils peuvent assurer l archivage. Pour simplifier, dans une première étape, on partira du principe que tous les titres qui n existent qu en un exemplaire dans une bibliothèque suisse sont archivés par la bibliothèque qui les possède. Cela devrait largement correspondre à la réalité : le sondage réalisé auprès des bibliothèques a montré qu elles conservent, pour la plupart, leurs revues imprimées ; et elles se considèrent, en général, formellement ou tout au moins du point de vue du contenu, à savoir «moralement», responsables de leur archivage à long terme. Il serait souhaitable qu à une date ultérieure, on intègre ces titres de manière explicite dans la coordination, afin que des changements de statut (résiliations d abonnement, etc.) soient communiqués. Pendant une première phase, on procédera à une sélection des périodiques imprimés qui correspondent aux critères suivants : titres d éditeurs pour lesquels il existe des licences consortiales suisses ; titres qui existent en plusieurs exemplaires imprimés dans les bibliothèques consortiales ; d après une analyse portant sur l année 2002, cela concernait p.ex. 57% des titres imprimés abonnés auprès d Elsevier/Academic Press au sein du Consortium, 62% de ceux de Wiley et 71% des titres de Springer. titres qui sont contrôlés par une grande bibliothèque partenaire du Consortium. Nous manquons largement d informations à ce sujet. 165

166 Normalement, se limiter à des titres consortiaux exige que l on ne réalise aucune économie directe en procédant à des résiliations d abonnements. Cela n est possible que de manière restreinte et en requérant scrupuleusement l accord des autres partenaires quant au volume des coûts. Des désabonnements ne seraient possibles que si un changement était prévu en faveur d une licence E-only, ou que la licence existante ne pouvait être poursuivie de manière durable ou temporaire. En réalité, il pourrait s avérer judicieux d interrompre quelquefois les contrats consortiaux, si cela devait être l unique possibilité de découpler les fonds propres du recensement des forfaits de licence. Dans une autre étape, il va falloir tenir compte de : 166 tous les autres titres dont on a pu recenser des exemplaires multiples dans les bibliothèques universitaires : pour ceux-là, il faudra tout d abord établir une base de données correspondante ; cela pourrait se faire par le biais du portail de périodiques suisses 105 de la BN, qui couvre tous les fonds des bibliothèques universitaires affiliées à RERO 106 et à l IDS 107 ainsi qu au SBT 108 ; à ce niveau, il serait pertinent d intégrer les instituts de recherche qui sont rattachés au réseau NEBIS ; enfin, de tous les titres de périodiques qui sont achetés par les bibliothèques universitaires, les instituts de recherche et autres : dans ces cas-là, la valeur d une telle mesure réside dans le fait que, lorsque les titres concernés sont intégrés dans un système de recensement de l archivage, des désabonnements ne passent pas inaperçus. Cela permet aux autres bibliothèques intéressées de réfléchir en temps voulu, en cas d urgence, si elle veulent ou peuvent assumer un abonnement qui arrive à échéance. Les titres qui sont déjà en possession de la BN et qu elle continue de collectionner peuvent être considérés, par définition, comme archivés de manière durable. Cela concerne naturellement les périodiques suisses. A cause de son mandat d archivage clairement défini, un modèle d archivage partagé des bibliothèques universitaires ne permettra probablement pas à la BN de se décharger de cette tâche. Il va donc être nécessaire d examiner sous quelle forme la BN souhaite et doit y participer Attribution à des bibliothèques Dans l enquête effectuée auprès des bibliothèques, on a essayé de découvrir si, en matière d archivage de fonds imprimés, les bibliothèques visaient plutôt une répartition des fonds par disciplines, ou si elles préféraient une approche pragmatique, dans laquelle une bibliothèque chargée de l archivage se préoccupe de ses propres fonds. Les participants ont répondu oui aux deux questions (cf ), ce qui, à y regarder de plus près, est logique, car les fonds existants devraient a priori correspondre au profil de la haute école et de la bibliothèque. Mais il convient également de souligner qu il s agit là uniquement d une priorité passive, dans le cadre d une suppression d abonnements. Il n est pas encore possible de dire si, avec une telle mesure, des ressources vont vraiment pouvoir être libérées pour procéder par la suite à une exploitation plus pointue. La concentration passive possible doit donc être jugée différemment de la constitution de points forts actifs, impliquant une extension des fonds, qui 105 Portail suisse de périodiques PSP : RERO Réseau des bibliothèques de Suisse occidentale : IDS Informationsverbund Deutschschweiz : SBT Sistema Bibliotecario Ticinese :

167 a été discutée au début des années 1990 en Suisse ((KUB) 1991; Schneider, Köstler et al. 1993). D un point de vue pratique, nous proposons donc la marche à suivre suivante : Les bibliothèques reçoivent une liste de titres qui tombent sous les critères mentionnés et indiquent pour lesquels elles souhaitent assumer les obligations exposées au point Elles peuvent ainsi fixer elles-mêmes leurs propres priorités. Trouver l équilibre entre les différents souhaits pourrait s avérer un processus fastidieux et délicat. Il va donc falloir essayer de définir au préalable des règles qui permettent de décider de l attribution de titres ligitieux. On peut toutefois douter qu on arrive ainsi à satisfaire tout le monde. Il faut cependant considérer le fait qu en endossant la responsabilité de la poursuite de l abonnement et de l archivage, on peut renforcer le profil d une bibliothèque, mais que cela signifie également une obligation qui ne peut plus être déléguée pour un certain temps. Une fois arrivé à un accord, il faudra qu il soit documenté de manière centralisée. Mais il est encore presque plus important que, dans chaque bibliothèque participante, le contenu de cet accord soit classé dans un lieu approprié. Les titres qui sont concernés doivent être signalés de manière à pouvoir être retrouvés à long terme également. Cela devra se faire en tout cas au moyen d une mention correspondante dans la saisie du titre, indiquant que ce dernier appartient à l archivage commun des bibliothèques universitaires suisses et ne peut donc être décommandé ou supprimé que sous certaines conditions. Cette mention doit être inscrite dans le même champ de saisie du titre à l échelle nationale. Ainsi, le portail des périodiques suisses de la BN pourra-t-il être utilisé comme un outil important pour l information sur la pratique de l archivage. Une autre indication sur le site où se trouve l exemplaire semble, certes, inactuelle, mais pourrait être utile Accords et obligations Les accords nécessaires devraient être conclus par les directions des bibliothèques partenaires, afin de montrer clairement qu il s agit d un engagement institutionnel. Les responsables du projet et les départements concernés doivent naturellement se charger de l organisation du contenu. La négociation devrait porter aussi bien sur les années antérieures que sur celles qui s ajouteront à l avenir. Dans la perspective de la collaboration des écoles universitaires suisses, ne pas intégrer les années plus anciennes reviendrait à rater une occasion unique. Les engagements, d un point de vue actuel, engloberaient les points suivants, ces derniers nécessitant certainement encore une élaboration ultérieure : 1. La bibliothèque qui assume la responsabilité d archivage d une revue s engage à vérifier l intégrité et l état de conservation de toutes les années existantes du titre (de manière idéale, à partir du volume 1) avant l entrée en vigueur de l accord, et à documenter les éventuelles lacunes. Celles qui ne pourront être comblées seront signalées comme d habitude dans le catalogue ; d autres indications devraient également être saisies d une manière qui reste encore à définir. Dans le catalogue, on signalera sous une forme appropriée que ce fonds est soumis à des conditions 167

168 168 particulières. Il faudra pour cela convenir d une utilisation uniforme du champ en question. 2. La bibliothèque s engage aussi bien à relier les années déjà existantes de la revue que celles qui viendront plus tard, à les conserver dans les conditions appropriées et à les mettre à disposition des usagers. Suivant l état de conservation, leur utilisation pourra être restreinte. Il serait pensable, là encore, d ancrer l obligation pour les bibliothèques propriétaires, en cas de détérioration des conditions d utilisation de l original, de prendre les dispositions nécessaires pour une mise à disposition sous une autre forme en remplacement. La participation à un archivage en coopération entraînerait toutefois des risques incalculables pour les bibliothèques et de telles mesures contraignantes ne sont donc pas recommandées. 3. L obligation d archiver des volumes acquis ne devrait normalement pas représenter de charges supplémentaires, puisque l archivage est effectué de toutes façons en règle générale. Une question reste encore à éclaircir, à savoir si les bibliothèques n ayant pas de mandat d archivage formel de la part des instances responsables se considèrent en mesure de remplir une telle obligation pour une durée illimitée. 4. Des fonds ne peuvent être cédés qu à la condition que la bibliothèque qui les reprend assume également les mêmes engagements. Il est clair qu il n y a, en réalité, aucune possibilité d intervenir pour empêcher une bibliothèque d agir autrement. Il est nécessaire ici de faire preuve d une certaine confiance institutionnelle. 5. ll faudra prévoir un examen régulier, p.ex. annuel, de l intégrité et de l état du matériel archivé. Les pertes devront être remplacées. Les points précédents sont applicables sans que la bibliothèque qui possède les titres doive s engager à continuer d acquérir la revue. L archivage devrait donc pouvoir être négocié pour des périodes plus longues, voire de manière illimitée. On considère qu une durée de moins de cinq ans n est pas judicieuse. A la fin de cette période, une confirmation explicite ou un nouvel accord devront être prévus, afin que l engagement des institutions soit assuré. 6. L obligation de continuer de s abonner à une revue restreint la liberté de la bibliothèque concernée pour le développement de son propre fonds. Elle ne pourra donc être que limitée dans le temps, ou illimitée mais avec des modalités de sortie clairement définies. Le fait qu une bibliothèque se sente en état de faire des promesses quelconques dépend notamment de la part que représentent les titres engagés sous cette forme dans le budget global : si de telles promesses mobilisent, p.ex. moins de 3% de son budget d acquisition et que les titres concernés appartiennent d évidence au fonds de base de la bibliothèque, alors on sera plus enclin à accepter un tel engagement pour quelques années que si cette part représente 20% ou plus. La marche à suivre pour un retrait en bonne et due forme de l obligation d acquisition pourrait être conçue de manière à ce que la bibliothèque demande très tôt à ses partenaires, dans le cadre d une procédure définie, si une autre institution souhaite et peut reprendre le titre concerné, et exige des uns et des autres la confirmation explicite que cela n est pas le cas. Malheureusement, une telle procédure ne tient pas compte des besoins existants quant à ce titre : il aura beau être apprécié et important, il ne pourra plus être conservé. Cela représente un véritable dilemme pour les

169 bibliothèques, indépendamment du modèle d archivage partagé. Aucune autre procédure n est malheureusement envisageable à l heure actuelle. Au cas où aucune obligation de poursuivre l abonnement n est dans l ensemble souhaitée, il faudrait toutefois convenir d une procédure qui garantisse que toutes les bibliothèques intéressées soient informées des désabonnements prévus. Ainsi auraient-elles la possibilité de décider de s abonner elles-mêmes ou de reconsidérer un abonnement existant Participation, profiteurs et compensations Les bibliothèques doivent être libres de participer ou non à un programme d archivage partagé. Dans la forme décrite, l archivage coordonné mobilise, certes, uniquement des ressources en personnel limitées (dans la phase initiale : processus de sélection, contrôle ultérieur et actualisations), mais elle restreint dans une certaine mesure la liberté de décision des bibliothèques. La collaboration peut toutefois être ouverte à de nouveaux partenaires sous la forme que nous avons présentée. La question de la participation peut être envisagée sous un autre aspect, si l on tient compte du fait que les bibliothèques ne voulant pas prendre d engagement profitent naturellement de la certitude que le matériel sera archivé de manière fiable dans un autre endroit. Il n est pas imaginable d exclure ces bibliothèques ou leurs usagers de l accès à des fonds existants dans d autres lieux. Pour autant que seul l archivage soit coordonné, ce problème des «profiteurs» 109 ne semble avoir qu une faible incidence d un point de vue financier, car chaque bibliothèque a un intérêt propre à l archivage et l accomplirait de toute façon. Dans le cadre d un calcul de rentabilité global, les choses se présentent différemment : si l archivage du même ensemble de titres provenant de plusieurs institutions peut être réparti, la charge est moins grande pour chaque bibliothèque. Pour compenser de tels effets, on a proposé que la livraison de documents entre les bibliothèques qui s engagent à archiver ou à continuer de s abonner à certains titres soit effectuée à un prix plus avantageux que normal. Pour être équitable, cette réglementation devrait être proportionnelle à l engagement des bibliothèques. Il serait, par exemple, possible d attribuer à chacune d elles un contingent de livraisons gratuites en fonction du nombre de titres qu elles ont archivés. Théoriquement, cela devrait se faire séparément à chaque fois que les livraisons qu une bibliothèque effectue avec d autres institutions sont particulièrement déséquilibrées. Il faudra examiner dans le détail si et comment une compensation peut être accordée sans susciter une trop grande charge de travail Déplacements de fonds Dans la perspective actuelle, les fonds concernés devraient rester dans les bibliothèques qui les possèdent, afin qu elles ne soient pas confrontées à une dépense et à des obstacles trop considérables. Il pourrait être judicieux de rassembler de petites quantités dans un site, si cela permet de reconstituer ainsi une collection de volumes sans lacune sur une période plus longue. A long terme, il va falloir s interroger sur les bibliothèques qui souhaitent se séparer d exemplaires en double, notamment en raison de problèmes de place réels ou prévisibles 109 En anglais, ce problème est connu sous le nom de free rider. 169

170 dans divers sites. Il pourrait alors être intéressant de confier un second exemplaire à un dépôt central ou bien de s en séparer complètement. Suivant les besoins, cela pourrait concerner soit du matériel rarement utilisé, soit, précisément au contraire, du matériel souvent requis pour la livraison de documents. D un côté, les bibliothèques mères pourraient ainsi résoudre leur problème de place, d autre part, des prestations pourraient être proposées et, éventuellement, fournies en commun. Force est de reconnaître que, pour les bibliothèques qui se définissent fortement au travers des fonds qu elles gèrent, cela constitue une démarche lourde de conséquences, voire irréversible. Un dépôt centralisé exploité en commun devrait être installé dans un site en périphérie, bien meilleur marché que dans les bibliothèques universitaires qui se trouvent, sauf rares exceptions, au centre des grandes villes. Des bâtiments industriels reconvertis se sont déjà avérés propices à de tels objectifs. Le siège du British Library Document Supply Centre de Boston Spa, qui comporte périodiques, est hébergé par exemple dans une ancienne fabrique de munitions et la Technische Informationsbibliothek de Hanovre exploite un deuxième site, qui gère notamment les fonds de périodiques ayant plus de cinq ans d âge (actuellement, 3,6 millions de volumes), dans un bâtiment industriel moderne de la banlieue Livraison de documents Le modèle que nous venons de décrire aura des répercussions sur la livraison de documents : Si des bibliothèques en profitent pour renoncer à certains abonnements ou à conserver elles-mêmes ces titres, la livraison de documents devrait, en général, augmenter. Du fait que cela entraîne des taxes pour les clients et exige d autres ressources de la part des bibliothèques, il va falloir en évaluer les répercussions. D après les conditions en vigueur, dans la plupart des cas, des reproductions pour la livraison de documents ne peuvent être réalisées qu à partir d exemplaires imprimés. Les bibliothèques qui les possèdent seront donc, parfois, fortement mises à contribution. L expérience a montré que seules quelques institutions sont en mesure d en retirer des profits appréciables. Les bibliothèques qui ne se sont pas engagées à archiver un titre ne sont pas obligées d en résilier l abonnement. C est pourquoi elles peuvent à tout moment prendre une décision concernant les titres qui sont tellement demandés dans leur institution que l acquisition de l article à l extérieur dépasse les frais de conservation ou même d acquisition. Elles devraient pouvoir continuer de s abonner à ces titres, ou tout au moins à les conserver. De telles considérations sont toutefois basées sur la supposition que les taxes prélevées pour la livraison de documents restent stables à long terme, ou n augmentent que dans les proportions du renchérissement normal du coût de la vie. Or, aucune bibliothèque ne peut garantir une telle stabilité. Etant donné la pratique toujours plus répandue du budget prévisionnel global dans les domaines les plus divers, il est probable que, dans un domaine mobilisant d importantes ressources comme celui de la livraison de documents, d autres normes pourraient avoir cours tôt ou tard. Si l on veut continuer de bénéficier d une sécurité élevée de l approvisionnement à des conditions abordables, des accords plus contraignants devront être conclus entre les organes responsables des bibliothèques, et donc, dans la plupart des cas, entre les hautes écoles : ce sont elles, en effet qui déterminent normalement 170

171 la marge de manœuvre économique des bibliothèques. A ce niveau, des taxes pourraient être fixées, tout au moins entre les bibliothèques qui participent à l archivage. Malheureusement, l évolution sur le plan international laisse penser que les conditions de livraison de documents pourraient se transformer de manière radicale à un autre niveau. L objectif des plaintes en cours contre Subito est précisément de faire cesser l activité de ce canal d approvisionnement, ou de le soumettre à une obligation de rémunération qui devrait conduire à des augmentations non négligeables des taxes (Müller 2004). Cela concernerait en tout cas aussi les livraisons de l étranger vers la Suisse. Des développements semblables ne peuvent être exclus à long terme à l intérieur du pays même. Il n est donc pas de la compétence des bibliothèques ou de leurs responsables de s engager de telle manière. Elles doivent en tout cas suivre attentivement les interventions correspondantes et faire comprendre sans ambiguïté aux décideurs les conséquences menaçantes de leur mise en œuvre pour la place scientifique Recommandations pour l archivage partagé des imprimés Au cours de la deuxième moitié de l année 2005, les premières mesures doivent être entreprises conformément à la procédure décrite au point Il va falloir déterminer quelles sont les bibliothèques intéressées et quels sont leurs intérêts (archivage, désabonnements, définition de priorités). Il faudra également déterminer combien de bibliothèques doivent participer à une telle mise en œuvre et lesquelles. La répartition des titres devant être archivés entre les bibliothèques intéressées doit se faire de manière exemplaire pour un ensemble limité de périodiques imprimés (p.ex. ceux d un éditeur). Ce n est que sur la base des résultats que l on jugera si un mécanisme peut être défini pour compenser les différentes charges (supplémentaires) sur le plan local. Il faudra veiller à ce que les procédures et les accords soient également valables sans une instance centralisée, afin de les conserver une fois le projet arrivé à échéance. Dans ce scénario, d éventuels désabonnements pourraient avoir lieu seulement en 2006 et avec effet en Si, en raison de l archivage coordonné, des désabonnements devaient être déjà possibles en 2006, alors, cette partie du projet devra être privilégiée et traitée en priorité, au détriment d autres travaux. Il faudra prendre une décision à cet égard. 171

172 8.8 Libre accès et serveurs de documents Dans cette étude, la notion «serveur de documents» remplace «Institutional Repository». Malheureusement, l exploitation de serveurs de documents est souvent assimilée à la mise à disposition d une plate-forme pour les publications en libre accès. Ce qui est erroné. Pour être à même de prendre des décisions en toute connaissance de cause dans le domaine du libre accès, il se révèle donc indispensable de comprendre les différents concepts de base débattus en vue de la concrétisation du libre accès aux contenus scientifiques. Ces concepts sont : 1. Le libre accès aux articles déjà parus formellement dans des périodiques («archivage» de prépublications et de postpublications par l auteur). 2. La publication d articles ou de périodiques entiers suivant les principes du libre accès. La mise à disposition de matériel différent (p. ex. tous types de travaux d examen et de thèses) par les hautes écoles ne devrait pas être confondue avec ces deux démarches, comme c est souvent le cas avec raison en Suisse avec la notion de «serveur de documents». Ces offres ont évidemment leur propre légitimation, mais devraient toutefois être considérées indépendamment des deux ébauches de libre accès à proprement parler (cf ). Sous une forme plus appropriée, les serveurs peuvent néanmoins asseoir les bases de ces offres. Dans d autres travaux, six variantes différentes de libre accès ont déjà été discutées ((Okerson 2004), avec référence à une étude prenant même neuf types en considération). Ceci comprend cependant des conditions spéciales pour les pays en développement, un déblocage différé (cf ) et d autres modèles qui ne font qu élargir ou limiter la conception des deux parties citées. Il faut expressément déconseiller de prendre le libre accès pour un instrument d économies à court terme dans les budgets des bibliothèques. La mise en place d offres sérieuses est tout d abord onéreuse en termes de technique et surtout de contenu (Halle 2003) et beaucoup de temps peut s écouler jusqu à ce que les voies de publication alternatives soient reconnues de telle sorte qu un soulagement est perceptible à un autre poste, par exemple dans les budgets alloués aux périodiques. A cela s ajoute le fait que les offres en libre accès doivent rester accessibles en permanence si elles veulent bénéficier de confiance. Il s agit finalement de prévenir la surévaluation de l engagement de la majorité des auteurs. Le sujet est complexe et il sera nécessaire de transmettre des messages clairs susceptibles d être mis en application : il ne faut pas s attendre à ce que chaque auteur s approprie le point de vue des bibliothèques et que, pour cette raison, il agisse en conséquence. Toute modification de son comportement doit être perceptible aussi dans son propre intérêt. Un argument frappant à cet égard devraient être les citations plus fréquentes des articles qui sont soumis au libre accès comme on peut le démontrer (Antelman 2004). Divers intérêts s affrontent au niveau politique. De célèbres institutions internationales de promotion de la recherche se sont prononcées en faveur du libre accès (p. ex. la Déclaration de Berlin 110 ) et des démarches politiques prônent l encouragement au libre accès, voire son 110 Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities : 172

173 obligation. Ce n est que récemment que la recommandation correspondante de la Commission parlementaire britannique pour la science et la technologie a été rejetée par le gouvernement pour ses effets de distorsion (2004) et que quelques problèmes majeurs ont été contestés. Des auditions circonstanciées sur les publications scientifiques avaient précédé la recommandation (2004). Bien qu ils ne concernent que la Grande-Bretagne, les résultats notamment et les recommandations de la Commission ont aussi une portée universelle. Comptent parmi ces revendications : La promotion nationale des archives institutionnelles dans toutes les universités. La distribution, dans ces archives institutionnelles, de copies de publications de recherche ayant reçu une aide d Etat. Une organisation centrale chargée de surveiller l installation, la mise en réseau et le respect des standards techniques en vue d une fonctionnalité maximale des archives institutionnelles. Pour les expériences futures du moins, des moyens pour les taxes versées par l auteur devraient être disponibles pour les revues en libre accès. Toutefois, le modèle des taxes d auteur n est pas encore accepté. Le gouvernement doit développer de toute urgence une stratégie de libre accès durable et plus vaste. Le rôle de la British Library à titre de fournisseur performant de documents et son importance majeure dans l archivage à long terme sont mis en évidence explicitement. Tous deux requièrent des moyens suffisants. Les éléments susceptibles de contribuer au libre accès sont présentés ci-après Libre accès aux articles parus formellement dans des revues («archivage» de prépublications et de postpublications par l auteur). Ce moyen n évoque pas fondamentalement la publication de contenus scientifiques par des éditeurs, mais vise à rendre les contenus ainsi publiés mondialement accessibles, sans frais d accès pour le lecteur. Il s agit de la méthode de l auto-archivage d articles par les auteurs (Author Self-archiving) : Un scientifique qui fait publier un article dans une revue sauvegarde une version de cet article sur un serveur de son institution, où elle devrait idéalement être accessible dans le monde entier. On parle d «archivage» de prépublications lorsque la version sauvegardée de l article correspond à la version du manuscrit remis par l auteur en vue de la procédure d expertise. S agissant de l «archivage» de postpublications, on sauvegarde une version du manuscrit contenant les modifications consécutives à la procédure d expertise. En règle générale, la disposition correspond encore à celle du manuscrit et non à celle de la publication. Dans ce contexte aussi, l emploi du terme «archivage» est ambigu : aux yeux des défenseurs de cette variante du libre accès, l archivage à long terme des contenus ne fait, dans un premier temps, pas partie des priorités des initiatives. Pour cet usage, la version imprimée, qui garantit la transmission scientifique, fera encore et toujours office de «copy of record». 173

174 Dans l intervalle, ce type de sauvegarde est autorisé par un nombre considérable d éditeurs commerciaux et non commerciaux 111. Figure notamment parmi les réflexions le fait que le libre accès à une forme de contenu améliore la perception et la diffusion des résultats, considération qui se justifie entre-temps (voir p. ex. (Harnad and Brody 2004)). Aussi le nombre de citations de la publication originale s accroît-il et avec lui, l incitation à publier soimême dans le périodique correspondant. Ceci encore une fois dans l intérêt de l éditeur. Pour protéger l intérêt direct de l éditeur en matière de vente, des restrictions précises sont effectuées. Ainsi, les maisons d édition Johns Hopkins University Press et Elsevier imposent qu un serveur de documents sur lequel sont déposées des postpublications ne peut pas s orienter vers une spécialité, mais qu il peut rendre compte uniquement de la production d une institution et de ses membres. Comme mentionné précédemment, l utilisation de l article n est autorisée, en règle générale, que pour la présentation du manuscrit dont le contenu a été modifié et non pour la disposition de la publication officielle. Les serveurs des bibliothèques universitaires pourraient servir à la sauvegarde locale. Leur conception concrète ne devrait pas négliger le caractère différent des objets à sauvegarder (cf. p. ex ). Il s agit de ne pas oublier que la mise en application de ce modèle dépend fortement des diverses politiques éditoriales, susceptibles d évoluer avec le temps. En principe, l archivage de postpublications peut être mis en pratique à court terme. Son problème majeur réside dans la notoriété encore et toujours faible du concept fondamental et des possibilités effectives. Le flou total règne, par exemple, autour des droits réels existants (Gadd, Oppenheim et al. 2003) et de l opinion des différents éditeurs. L information et la motivation y relatives doivent intervenir dans les diverses hautes écoles, où elles peuvent reposer idéalement sur les relations existantes entre les scientifiques et les bibliothèques. S il convient, au besoin, de limiter l entretien de ces relations en faveur d autres tâches, il est instamment recommandé de chercher de nouvelles formes pour ces contacts. Plus il devient évident que le renforcement de l offre électronique ne se laisse plus poursuivre comme à l accoutumée, plus il importe d expliquer les possibilités complémentaires et en partie alternatives qu offre, par exemple, l archivage de postpublications. Les bibliothèques sont sollicitées en qualité de partenaires compétents. La remise de postpublications peut aller de pair avec d autres prestations pour les auteurs, comme l offre de listes de publications, les recherches bibliographiques ou les statistiques d utilisation, qui immobiliseraient assurément bien davantage de personnel que la simple mise à disposition d une plate-forme de sauvegarde. Une telle hausse d attractivité s avère nécessaire afin que les documents soient déposés sur un serveur central d une université et non dispersés sur une multitude de serveurs internes à des instituts et sur d autres serveurs. C est la seule manière de garantir une certaine unité dans les métadonnées et l entretien des données. En outre, l augmentation du nombre de documents sauvegardés sur un serveur accentue la probabilité de voir son contenu indexé par les moteurs de recherche correspondants, pour autant que les conditions techniques soient garanties. Dans certaines branches (surtout la physique (des particules élémentaires)), l usage des prépublications jouit d une tradition de longue date, tandis qu il n est pas toléré dans d autres branches (médecine). En physique, le serveur ArXiv 112 (plus de prépublications 111 La liste exhaustive du projet RoMEO : ArXiv (Los Alamos Preprint Server, aujourd hui Univ. Cornell) : 174

175 actuellement), en service depuis 1991, et le Document Server du CERN, à Genève, constituent des serveurs majeurs. Ce dernier présente aussi quelque prépublications, articles publiés et une multitude d autres documents dont près de la moitié sont disponibles en version intégrale (pour un total d env entrées bibliographiques) 113. Dans certains cas, les prépublications se révèlent de toute évidence très attractives pour les chercheurs. Il ne s agit toutefois pas de publications ayant subi une expertise, même si ArXiv, par exemple, prétend que chaque article doit présenter la qualité qui lui permettrait de traverser une procédure d expertise sans être rejeté d emblée 114. Du point de vue des bibliothèques, les postpublications expertisées devraient cependant être proposées en priorité, car leur usage jouit d une bonne acceptation dans toutes les disciplines. Les bibliothèques sont notamment évaluées en fonction de la qualité des contenus qu elles fournissent. Lorsqu il s avère aussi nécessaire de mettre des prépublications à disposition, cette démarche devrait s inscrire dans une catégorie traitée séparément du reste de l offre et identifiée. Le Document Server du CERN dispose d une rubrique «Articles & Preprints», qui comporte des collections séparées pour les «Published Articles», les «Preprints», les «Theses», les «Reports» et autres. L enregistrement et l archivage de postpublications permettent d adopter le libre accès de manière appropriée, car ils demandent relativement peu de conditions préalables. Atteindre rapidement une masse critique des offres qui ne peut plus être ignorée conditionne désormais le succès de toutes les initiatives en faveur du libre accès. Jusqu à nouvel ordre, l effort le plus important est donc à prévoir du côté de l information active des auteurs et des facultés, de même que du côté de l acquisition de postpublications. Il s agit d une expérience confirmée par la quasi-totalité des projets traitant des thèmes de l auto-archivage ou des serveurs de documents dans le monde entier (mot-clé : «Advocacy») : la mise à disposition des infrastructures techniques ne suffit pas, elle doit être enrichie de contenus par le biais d une activité variée et d un contact direct avec les auteurs. Une récente enquête menée en 2004 révèle que 82 % des auteurs scientifiques interrogés considèrent ignorer tout du libre accès ou n être qu insuffisamment informés à ce sujet (Rowlands, Nicholas et al. 2004). Les bibliothèques et leurs représentants doivent à tout prix tenir compte de cette situation : ils ne peuvent pas partir du principe qu ils satisfont un besoin déjà largement établi. Le nombre élevé de textes intégraux (plus de 5 200) internes à la haute école que la E- Collection 115 de la Bibliothèque de l EPFZ peut mettre à disposition illustre l importance de l acquisition. Cette collection comporte encore très peu d articles, mais le flot de documents a été encouragé par une variété d activités propres pratiquées en permanence au sein de la haute école Publication de revues en libre accès Il s agit de véritables produits concurrents pour les périodiques commerciaux. Idéalement, ces revues doivent être à même de survivre économiquement sans que les lecteurs et leurs bibliothèques ne doivent s acquitter d un abonnement ou d un droit de licence. La publication 113 Document Server du CERN : Can Peer Review be better focused? : E-Collection de l EPFZ : 175

176 de revues en libre accès est menée par diverses entreprises et initiatives, dont BioMed Central 116 ou l organisation Public Library of Science (PLoS) 117, mais aussi par des hautes écoles. En décembre 2004, le répertoire des journaux en libre accès (DOAJ, Directory of Open Access Journals) de l Université de Lund a révélé la présence de revues en libre accès 118. Contrairement à certaines assertions, ce nombre est en constante augmentation. De plus, l examen des premiers facteurs d impact des titres en libre accès montre qu ils atteignent des valeurs comparables à celles des revues conventionnelles (Testa and McVeigh 2004). Une étude des citations des articles archivés par l auteur lui-même en libre accès en sus de la publication formelle se révèle encore plus remarquable (cf ). En comparaison avec des articles non disponibles en libre accès et parus dans les mêmes revues, les articles en libre accès ont un impact sensiblement supérieur (Harnad and Brody 2004) Publications mises en libre accès par les maisons d édition Pour satisfaire aux mêmes exigences qualitatives en termes de contenu (peer review!) et de technique malgré la non-perception de taxes d abonnement, il convient de trouver un mode de financement alternatif, même s il n est aucunement question de réaliser un bénéfice. Une taxe versée par les auteurs est le modèle commercial le plus cité. Cette taxe se situe entre USD 500 et USD par article. Elle diminuerait les coûts du côté du lecteur, mais soulèverait évidemment de nouvelles questions, car une certaine pression peut découler de l obligation d accepter de publier un nombre élevé d articles. Dissocier efficacement l appréciation qualitative et les perspectives financières doit permettre de lutter contre ce phénomène. De surcroît, pour les revues existantes, il convient de réussir la transition du modèle commercial de financement par le lecteur à celui de financement par l auteur 119 (Prosser 2003). Il est admis que le modèle de financement par l auteur pourrait constituer une opportunité pour les petites et moyennes maisons d édition, touchées de plein fouet par les résiliations d abonnements. Première grande maison d édition, Springer offre, avec son modèle «Springer Open Choice» 120, la possibilité aux auteurs de mettre leurs articles en libre accès contre un paiement unique s élevant actuellement à USD Seule une infime minorité d auteurs fait preuve de compréhension envers une taxe aussi élevée (Rowlands, Nicholas et al. 2004), ce qui implique toutefois une confusion fondamentale au niveau des objectifs et des moyens du libre accès. Les prix des abonnements doivent être adaptés en fonction de l usage de cette option. En novembre 2004, l American Institute of Physics (AIP) a dévoilé son modèle pour 2005, l «Author Select», considéré dans un premier temps comme un essai pour trois titres 121. Les articles sont accessibles librement contre le versement d une taxe de publication de USD Il est expressément signalé que les experts demeurent cachés, que les auteurs optent ou non pour ce modèle. L essai doit montrer si la nécessité de tels modèles est palpable et si la taxe suffit pour diminuer les droits de licence pour les 116 BioMed Central The Open Access Publisher : Public Library of Science PLoS : Directory of Open Access Journals DOAJ : Open Access Journal Business Guides : Springer Open Choice : 0,00.html 121 Communiqué de presse du : American Institute of Physics announces Author Select, a new open access initiative for 2005 :

177 lecteurs, les supprimer ou en assurer la stabilité. Il est prévu de concrétiser directement la part du libre accès par une réduction des droits de licence en ligne. Pour un pays comme la Suisse, qui déploie une activité intense en matière de publications scientifiques, une estimation s impose eu égard aux coûts totaux pour des taxes d un tel montant. Ainsi, durant la période , la base de données Essential Science Indicators a répertorié, dans les seules revues saisies par l ISI, plus de articles à la rédaction desquels la Suisse a participé (hautes écoles et instituts de recherche) et ce, uniquement pour la branche principale qu est la médecine clinique 122 ; annuellement, cela représente env articles. Pour l ensemble des disciplines représentées à l ISI, ce chiffre passe du simple au quadruple pour une année (env ). Une étude réalisée par le CEST (Centre d Études de la Science et de la Technologie, Berne) confirme cet ordre de grandeur : rien que pour l EPFL, l EPFZ et les universités de Bâle, Berne, Fribourg, Genève, Lausanne, Neuchâtel et Zurich, il a enregistré une moyenne annuelle de articles au cours des années 1998 à Ces chiffres tiennent aussi compte des articles qui n ont pas été rédigés par un premier auteur membre d une institution suisse ; il convient malgré tout de supposer que, dans ce cas aussi, la Suisse participerait à la taxe. Avec le modèle Springer, les montants devraient atteindre nettement la dizaine de millions ou plus et, en fonction du scénario, devraient égaler le montant du budget alloué dans certaines hautes écoles à l acquisition de périodiques. Les hautes écoles ne pourraient faire face à de telles dépenses absolues que si, en contrepartie, elles pouvaient renoncer, dans une large mesure, à payer des abonnements et des licences. Evidemment, de telles estimations de frais diffèrent beaucoup suivant la spécialité principale des institutions. Ainsi, le problème ne réside peut-être pas dans le montant absolu des frais, mais dans la nécessité de résoudre le passage du système d abonnement au système de financement par l auteur. Avec cette taxe toutefois, l éditeur Springer se situe, à notre connaissance, au sommet de l échelle. La possibilité qu une taxe de cette nature puisse entraîner une diminution du nombre de publications n est aucunement prise en compte. Les opposants craignent surtout que les auteurs provenant de pays ou d institutions économiquement moins performants soient contraints de limiter leurs publications. En complément ou en remplacement, certains modèles commerciaux de libre accès proposés par des maisons d édition prévoient l affiliation payante d institutions au grand complet. Leurs membres pourraient ensuite avoir le droit de publier gratuitement des articles. L exemple de BioMed Central, qui regroupe quelque 100 revues en libre accès, n est pas inconnu. 122 ISI Essential Science Indicators, état au CEST : ; les données proviennent des trois bases de données ISI Science Citation Index, Social Science Citation Index et Arts and Humanities Citation Index et considèrent chaque adresse comme une publication de l institution correspondante (méthodologie : 177

178 Taille de l institution* Taxe de membre 2005 en GBP/EUR Très petite (20-500) / Petite ( ) / Moyenne ( ) / Grande ( ) / Très grande ( ) / *Evaluée en fonction du nombre de diplômés, d étudiants postgrades, de maîtres de conférences et du personnel scientifique restant en biologie et en médecine Tableau 13 : Taxe de membre perçue par BioMed Central pour l année 2005 (hausse de 5,5 % par rapport à 2004). En 2004, quatre universités et deux entreprises suisses y étaient affiliées. Pour les entreprises, les sociétés et les groupes, d autres tarifs s appliquent. Les taxes prélevées pour le seul dépôt d un article dépendent de la revue choisie et s élèvent en moyenne à GBP 450 (actuellement env. CHF 1 000). Aussi la question de savoir qui doit payer pour l affiliation ou pour la publication en général dans des conditions de libre accès reste-t-elle en suspens. Les institutions d encouragement scientifique manquent de lignes directrices claires au sujet du possible recours à leurs cotisations pour couvrir les taxes de publication. De leur côté, les bibliothèques doivent faire face aux demandes du même type. Théoriquement, il est clair que les bibliothèques ayant financé jusqu ici l accès à la lecture participeront aux taxes d auteur avec le modèle du libre accès. Néanmoins, ceci n est envisageable pour les bibliothèques qu au prix de l allégement d un autre poste, sans générer de nouvelles dépenses. Cette solution ne s applique toutefois que pour des taxes et des cotisations plus ou moins fixes. Pour des motifs structurels, on peut en revanche se demander si les bibliothèques peuvent participer à des taxes proportionnelles au nombre de publications scientifiques produites par les collaborateurs des hautes écoles : les bibliothèques n ont aucune influence sur ces chiffres et il deviendrait ardu d évaluer leurs budgets. Il semble davantage concevable de percevoir des taxes appropriées lorsqu elles sont «provoquées» et qu il est possible d influer sur le nombre d articles produits. En règle générale, il ne faut pas considérer le libre accès comme un moyen de porter préjudice aux éditeurs ou de nuire à leurs affaires. Les éditeurs sont, de toute façon, en grande partie maîtres du rôle qu ils ont à jouer avec le système du libre accès, qui satisfait de toute évidence aux besoins de la communauté scientifique. Une solution suggérée par les éditeurs consiste à proposer les articles en libre accès après un certain temps (p. ex. six ou douze mois). Ce modèle, adopté entre autres par la Royal Society 124, représente en quelque sorte un canal supplémentaire du libre accès. En cas d intérêt public particulièrement marqué, les articles seront aussi débloqués d emblée. La Royal Society voit donc dans le développement du modèle de publication traditionnel une manière d améliorer l information scientifique. Cela est donc aussi lié au fait que les publications de sociétés spécialisées 124 The Royal Society : 178

179 constituent une activité majeure permettant de financer le travail de ces institutions. De surcroît, le rôle d éditeur des sociétés spécialisées est nettement moins controversé que celui des grandes maisons d édition commerciales. Les scientifiques et les partisans du mouvement du libre accès émettent des jugements divergents au sujet de ce libre accès différé qui vont de la satisfaction à l affirmation qu ici, ce n est pas un système de libre accès qui sera mis en place, mais seulement une sorte d «accès de soutien». Chose remarquable, l Institute of Physics (IoP) 125 emprunte un chemin presque opposé : les articles parus dans ses revues sont accessibles librement durant les 30 jours qui suivent leur publication. Passé ce délai, ils «disparaissent» pour être soumis à abonnement ou à licence. Bien évidemment, il n est aucunement obligatoire d adopter entièrement l une ou l autre solution. Cela montre toutefois que certains éditeurs contribuent aussi activement à trouver des solutions. Une question encore irrésolue se pose au sujet de l avantage considérable que la clientèle commerciale peut tirer des publications en libre accès : d ordinaire, les entreprises et leurs collaborateurs manient les publications avec réserve, de telle sorte qu un scientifique exerçant dans une entreprise industrielle rédige en général beaucoup moins souvent que son collègue spécialisé engagé dans une haute école. Avec un modèle de financement par l auteur, lui ou son employeur contribuera donc bien moins financièrement aussi, mais profitera beaucoup du libre accès. Le modèle traditionnel laisse aussi apparaître un tel déséquilibre sous une autre forme : ce sont principalement les membres d institutions publiques qui, en qualité d auteurs, fournissent gratuitement le contenu aux revues et ce sont ces mêmes institutions qui doivent racheter ces contenus Publications mises en libre accès par les hautes écoles La publication d ouvrages, de collections ou de périodiques par les hautes écoles est surtout de tradition dans les pays anglo-saxons et dans les régions francophones. Certaines presses universitaires jouissent d une grande renommée et comptent parmi les entreprises d envergure affichant une réussite économique (Halle 2004). Dans nombre d autres pays, il existe aussi des maisons d édition universitaires dont la relation avec l université en question n est pas toujours bien définie. Il s agit aussi parfois d entreprises communes regroupant plusieurs universités. Les maisons d édition universitaires européennes recensent, par exemple, outre les University Presses d Oxford 126 et de Cambridge 127, les Presses Universitaires de France 128 (à côté des éditeurs de diverses universités) ou la Scandinavian University Press 129. En Suisse, il existe les Presses polytechniques et universitaires romandes 130, ainsi que des éditeurs locaux. Les éditeurs cités n ont parfois aucun lien direct avec les bibliothèques universitaires. Toutes les maisons d édition universitaires ne publient pas de revues. En plus de beaucoup d autres raisons, ce phénomène pourrait aussi être dû au fait que, avec le modèle traditionnel, la production et la distribution de revues (le lecteur ou la bibliothèque paie pour un produit imprimé) conjuguées au travail rédactionnel constituent une charge logistique considérable. 125 Institute of Physics electronic journals : Oxford University Press : Cambridge University Press : Presses Universitaires de France : Universitetsforlaget (Scandinavian University Press) : Presses polytechniques et universitaires romandes : 179

180 Conjointement avec les nouveaux modèles de publication placés sous le signe du libre accès, de nouvelles initiatives voient aussi le jour dans le but de produire et de fournir des revues électroniques. Elles rencontrent un soutien général grâce aux activités de SPARC 131 (Scholarly Publishing and Academic Resources Coalition) et de SPARC Europe 132. Illustre exemple comparable en Europe, la plate-forme igitur (Utrecht Publishing and Archiving Services) 133, implantée dans la bibliothèque de l Université d Utrecht, propose des revues électroniques, soutient leur production et gère un serveur de documents. Un exemple plus récent en provenance des Etats-Unis : l «Internet-First University Press», qui propose des titres nouveaux et épuisés prêts à être téléchargés en format PDF et permet de commander, contre paiement, ces titres comme exemplaires rélies imprimés à la demande qui peuvent être retirés dans une librairie ou une bibliothèque partenaire 134. Dans les régions germanophones, l offre ProPrint 135, étroitement liée aux activités de publication électronique et de numérisation, est une initiative d impression à la demande. Elle est proposée conjointement par le Computer und Medien Service et la bibliothèque universitaire de l Université Humboldt à Berlin. Les bibliothèques universitaires de Goettingen et de Graz en sont partenaires. Un coup d œil dans le répertoire des journaux en libre accès DOAJ 136 montre que de nombreuses facultés ou institutions comparables à des hautes écoles, ainsi que beaucoup de petites et de grandes associations scientifiques figurent au nombre des éditeurs. Cela prouve que le besoin en moyens de publication alternatifs est manifeste. Evidemment, il serait absurde que chaque association, voire chaque faculté au sein d une université, mette en place ses propres structures pour diffuser des publications scientifiques. Ce morcellement entraînerait non seulement un gaspillage financier considérable, mais aussi une baisse de la perception des activités correspondantes. Il est possible que des bibliothèques offrent leurs services pour la mise à disposition électronique professionnelle de revues et d autres contenus, à l image de la bibliothèque de l Université d Utrecht. La création de propres maisons d édition universitaires en étroite relation avec les activités liées aux serveurs documentaires est aussi dynamisée (Halle 2003). Ceci ne doit pas obligatoirement s opérer suivant les critères du libre accès, même si cet objectif est ardemment souhaité. Pour que la publication par la bibliothèque ou une institution associée soit prise au sérieux, les activités correspondantes devraient s effectuer à un niveau professionnel et ce, aussi bien en termes de garantie de la qualité du contenu (procédure d expertise / revue par pairs) qu en termes de niveau de prestation pour les auteurs et les lecteurs. Pour le résultat et donc pour les hautes écoles et les bibliothèques, il serait néfaste d assumer une telle mission en faisant plus ou moins preuve d improvisation, si d autres institutions peuvent s en charger de manière plus convaincante. D un point de vue technique, la production électronique de revues peut être automatisée à quelques détails près et s inscrire dans la charge rédactionnelle connue des scientifiques publiant des articles. Poursuivre ces activités jusqu à la création de maisons d édition universitaires propres est considéré comme un champ d activité intéressant pour les 131 SPARC (The Scholarly and Academic Resources Coalition) : SPARC Europe : igitur (Utrecht Publishing and Archiving Services) : Internet-First University Press : ProPrint Print-on-Demand Webservice : Directory of Open Access Journals DOAJ : 180

181 bibliothèques universitaires. On part du principe que les maisons d édition universitaires, une fois la phase de création terminée, peuvent mener à bien leurs activités sans incidence sur les coûts du point de vue de la gestion d entreprise et influencent à la baisse les coûts d un point de vue économique. La percée des modèles de base sur le marché dépend de la volonté politique et de l action commune des auteurs, des bibliothèques, des centres de calcul, des directions des universités, des institutions d encouragement et des bailleurs de fonds (cf. (Halle 2004)). A court terme (2 ans), il n est pas escompté que les hautes écoles suisses et leurs bibliothèques puissent intégrer dans une large mesure la publication de leurs propres revues en libre accès, même si les premiers exemples existent. Les deux revues électroniques en libre accès High Energy Physics Libraries Webzine 137 (CERN, depuis 2000)), qui met aussi l accent sur le contenu en libre accès, ainsi que la nouvelle Revue électronique suisse de la science de l information 138 (RESSI, Haute Ecole de Gestion, Genève, depuis 2005) proviennent d institutions du milieu de l information et de la documentation. On dénombre d autres exemples isolés, notamment en informatique 139 et en mathématiques, qui remplissent absolument une fonction pour l instant. Mais leur production est extrêmement tributaire de l engagement de certaines personnes et des possibilités dont elles disposent. Cela s étend de la co-utilisation de matériel informatique disponible au recours à des collaborateurs assumant une autre fonction. Aussi s avère-t-il difficile de déterminer les frais souvent sous-estimés. Un modèle de cette nature ne peut être viable. De telles configurations comportent le risque non négligeable qu au terme de l engagement individuel l accès devienne impossible, au moment où les serveurs ne sont plus alimentés par les contenus appropriés. Dans ce cas, le libre accès prendrait fin sans remplacement. Il va de soi que des mesures adaptées permettent d éviter cette perte d accès. On peut supposer que des institutions sont mieux à même de garantir ces mesures (reprise sur des serveurs miroirs, etc.). A moyen terme, il pourrait se révéler judicieux, du point de vue des bibliothèques, de soutenir la publication de diverses revues existantes rédigées par des associations scientifiques ou des chaires et qui disposent déjà d une base rédactionnelle établie, mais qui hésitent à endosser à elles seules les dépenses techniques. Dans la plupart des cas, cela impliquerait d entrer en concurrence avec les maisons d édition universitaires en activité ou avec d autres prestataires commerciaux. La question de savoir si un tel objectif doit et peut être poursuivi relève de la politique. Quoi qu il en soit, il conviendrait de mettre au point des modèles de coûts transparents laissant apparaître les subventions indirectes cachées et autorisant un jugement. D un point de vue purement formel, on peut donc se demander s il est utile de s attaquer aux activités correspondantes sur le long terme au sein d une bibliothèque ou si, par souci de transparence, cela ne devrait pas plutôt s effectuer un jour ou l autre en collaboration avec des maisons d édition universitaires en activité ou nouvelles. 137 High Energy Physics Libraries Webzine depuis 2000 (ISSN ) : Revue électronique suisse de la science de l information (RESSI) depuis 2005 (ISSN ) : Journal of Object Technology depuis 2002 (ISSN ) : 181

182 La mise à disposition d articles isolés pourvus d une note de qualité est l une des formes de transition entre les serveurs de documents et la publication de revues intégrales en libre accès. Les auteurs pourraient ainsi proposer des articles ou d autres écrits sur le serveur d une haute école. Après un examen qualitatif uniquement, ils reçoivent une attestation certifiant leur qualité. La fonction des revues traditionnelles de renom, dont la réputation repose avant tout sur une sélection qualitative, est donc imitée. Bien élaborée, la remise d un tel certificat peut permettre de composer une revue virtuelle qui superpose une structure qualitative sur le contenu fondamentalement disponible. Aussi parle-t-on d «Overlay- Journals» Serveurs de documents universels des hautes écoles Cette catégorie regroupe toutes les offres qui ne concernent pas principalement les postpublications ou les revues en libre accès. Elles constituent la grande majorité de tous les serveurs actuellement en service dans le monde Thèses électroniques Contrairement aux exigences des publications formelles (8.8.2), les serveurs de documents des hautes écoles sont utilisés et évalués différemment. Dans la quasi-totalité des cas, les thèses des hautes écoles sont le point de départ de la mise en place de serveurs de documents dans les bibliothèques universitaires (cf pour les résultats de l enquête). Certains motifs sont clairs : les thèses sont toujours des travaux soumis à un examen qualitatif et destinés à la publication. Autrement dit, la bibliothèque ne doit procéder à aucune évaluation ni opérer aucune sélection. Selon les dispositions des règlements de promotion, les thèses finissent dans tous les cas dans les bibliothèques universitaires. Même s il s agit d un exemplaire imprimé, les bibliothèques ont tout du moins accès à cette version et peuvent ensuite la numériser pour la mettre à disposition en ligne, pour autant qu elles obtiennent l autorisation requise. Les thèses et leur remise faisant l objet des règlements de promotion, il est aussi possible d influer sur la forme des travaux à remettre. La faculté peut enjoindre l auteur de délivrer une version électronique de sorte qu il n est alors plus nécessaire de le demander aux diplômés. Parfois, la formulation de telles clauses est déléguée aux bibliothèques et les règlements de promotion ne font que renvoyer aux dispositions y relatives. L ampleur des exigences dépend de manière décisive du soutien des facultés et de la direction de la haute école. Dans les hautes écoles suisses, la mise à disposition de thèses électroniques a été transposée de manière très différente dans la pratique quotidienne (cf ). Malgré tout, pour ce type de document, les réflexions de la Bibliothèque nationale suisse au sujet d un archivage central progressent assez bien. Il existe une convention au niveau de la Conférence des bibliothèques universitaires (CBU) 140 qui fixe les modalités générales et notamment le système de métadonnées pour la remise des thèses. Les démarches correspondantes sont actuellement à l essai dans le cadre du projet «e-helvetica» de la Bibliothèque nationale en partenariat avec des hautes écoles Thèses électroniques en Suisse : convention des membres de la Conférence des bibliothèques universitaires suisses (CBU), version définitive, 03 novembre Projet «e-helvetica» de la Bibliothèque nationale : 182

183 Le traitement des thèses électroniques ne peut, par conséquent, pas être appliqué directement aux autres documents qu il serait envisageable ou souhaitable de sauvegarder sur un serveur de documents Autres documents Pour les thèses, l offre en ligne de versions électroniques ne constitue qu une forme supplémentaire de mise à disposition de documents déjà en main des bibliothèques sur support papier. De plus, une grande quantité de documents, jusqu ici indisponibles dans les bibliothèques, sont produits au sein des hautes écoles par les professeurs, les chercheurs et les étudiants. Il s agit souvent de travaux de diplôme, de licence et d études, de rapports, de supports d enseignement, etc. Dans la plupart des cas, les travaux de diplôme sont conservés dans les bibliothèques des instituts, mais parfois ce n est pas le cas. En maints endroits, les travaux de diplôme ne sont assimilés qu à des pièces ayant trait aux examens et ne sont pas considérés comme des publications. Aussi les réponses aux questions qui se posent pour ces travaux varient-elles. Certains professeurs d université souhaitent décider eux-mêmes si les travaux dont ils se sont occupés peuvent être ou non publiés. Les utilisateurs potentiels déplorent dans l ensemble l accès insuffisant aux travaux de diplôme et la perte économique revendiquée se chiffre à plusieurs milliards, car les résultats ne sont pas exploités 142. Des réserves sont toutefois émises quant à une publication en ligne généralisée, notamment pour les travaux réalisés en étroite collaboration avec des entreprises. Dans les HES, tournées vers la pratique, ce type de collaboration est relativement fréquent. La mise à disposition en ligne n interviendrait qu au cas par cas ou moyennant un décalage temporel adéquat par rapport à l élaboration. La possibilité devrait dans tous les cas être donnée. Voici un résumé sommaire de ces points : Tous les documents rédigés dans une haute école ne sont pas obligatoirement destinés à la publication en libre accès, car o la qualité du contenu n est pas garantie, n a pas été évaluée ou ne peut pas être évaluée. o les contenus (éphémères?) ne doivent expressément pas être publiés. o des raisons formelles s y opposent (classification en tant que pièce ayant trait aux examens, etc.). Tous les documents publiés ne sont pas destinés à être conservés durablement. Reste à savoir si la forme électronique y change ou devrait y changer fondamentalement quelque chose. Du point de vue des bibliothèques, certaines de ces réserves sont renforcées par le fait que les objets disponibles sur les serveurs de documents des bibliothèques universitaires figurent aussi, la plupart du temps, dans les catalogues des bibliothèques, ce qui facilite la jonction avec les autres éléments et augmente la valeur du catalogue à titre d instrument de recherche central. Il en résulte que, dans les collections d une bibliothèque, des objets d inégale qualité sont répertoriés côte à côte. Pour l utilisateur final, la transparence à ce 142 Voir p. ex. le communiqué de presse 183

184 sujet n est pas garantie. Il va de soi que la qualité des médias traditionnels varie aussi beaucoup, c est précisément pourquoi les bibliothèques les sélectionnent la plupart du temps par des processus intellectuels. Outre la forme de l indexation, la qualité de celle-ci est aussi un sujet essentiel : l indexation de qualité représente une compétence majeure des bibliothèques. Si une bibliothèque la juge superflue, les fondements qui consistent à confier naturellement certaines tâches aux bibliothèques disparaissent Conclusions en faveur d un serveur de documents Les documents généralement reliés par le biais d un serveur de documents sont donc de nature très différente et remplissent des fonctions distinctes. Aussi se révèle-t-il peu judicieux de mélanger en trop grand nombre les diverses fonctions d un serveur. Dans un premier temps, le serveur de documents ne met à disposition qu une plate-forme technique utilisable pour les offres aux contenus divergents. L usage linguistique est ici source de confusion, car aussi bien la plate-forme que les contenus proposés sont considérés, sur cette base, comme des serveurs de documents. Idéalement, le concept de sauvegarde de la littérature grise rédigée dans les hautes écoles devrait définir quelle solution technique est envisagée. Dans la pratique, les possibilités offertes par les logiciels à disposition fixent des limites plus ou moins étroites à la mise en application (cf ). Par ailleurs, il arrive aussi que diverses plates-formes logicielles soient utilisées côte à côte pour des usages différents. Dans le cadre du projet Daedalus 143 de l Université de Glasgow, les articles publiés et expertisés sont proposés sur une autre plate-forme (Eprints ) que les prépublications, les rapports techniques et les thèses (DSpace 145 ). Il semble que, dans l intervalle, une plate-forme séparée pour les thèses ait été abandonnée. Pour une haute école, un concept de contenu pourrait prévoir les éléments détaillés ci-après sur une plate-forme appropriée. Ces éléments ne sont évidemment pas tous importants pour l ensemble des hautes écoles : Serveur pour les documents de niveau scientifique ayant subi un examen qualitatif. Thèses, postpublications, etc. ; travaux de diplôme, etc. au besoin et avec certaines réserves. Ce serveur peut être structuré par département ou par faculté, par branche, etc. Il est envisageable de n ajouter dans le catalogue que les publications bibliographiquement autonomes et de répertorier les postpublications, etc. uniquement sur le serveur. Il serait recommandé de mettre à disposition durablement les publications citées. Serveur pour les documents n ayant pas subi un examen qualitatif ou pour ceux se situant en deçà du niveau scientifique. Prépublications, travaux de diplôme et de licence?, travaux d études. Au besoin, ces documents peuvent n être mis en évidence que sur le serveur et ne 143 Projet Daedalus de l université de Glasgow : EPrints.org - Self-Archiving and Open Access (OA) Eprint Archives : DSpace : 184

185 pas figurer dans le catalogue. Dans ce cas aussi, l exigence consiste à les mettre à disposition durablement. Serveur pour les documents issus des milieux de l éducation et de la recherche et qui ne revêtent qu une importance passagère comme supports de travail (cours magistraux et présentations, etc.). Leur inscription dans le catalogue n est pas indispensable s il est possible de les rechercher par un autre moyen adapté. Lors de la sauvegarde déjà, il convient de décider la durée d enregistrement de l objet. Il peut s agir d une durée fixe pour tous les documents ou d une durée à définir par l auteur. Plusieurs objections s élèvent contre une telle structure par institution : au début, lorsque les documents se font encore rares, une répartition de cette nature ou similaire éparpille l offre. De surcroît, une répartition n est utile qu aux utilisateurs qui souhaitent parcourir les «documents expertisés de la faculté X de la haute école Y». Cela devrait surtout se révéler intéressant pour les utilisateurs internes. Dans la pratique néanmoins, on table davantage sur un accès permettant à une clientèle interne ou externe de chercher une «postpublication de l article K rédigé par l auteur L». Lors de sa recherche, il importe peu à la clientèle de savoir où se trouve l article et s il côtoie d autres objets de «moindre qualité». Si toutefois la clientèle veut encore effectuer quelques recherches à l endroit d enregistrement, un sentiment mitigé peut à nouveau se faire sentir en raison du mélange des différents niveaux. En termes techniques, ces deux types d accès ne sont pas incompatibles et le genre de répartition nécessaire doit être fonction des besoins sur place. Il est aussi concevable de séparer les objets exigeant une sauvegarde durable de ceux susceptibles d être effacés après un certain temps. L inscription ou non dans le catalogue de la bibliothèque peut aussi être considérée comme un gage de qualité, si seuls les documents faisant partie de la collection permanente de la bibliothèque y sont répertoriés. Mais il convient aussi de garantir, sous une autre forme, à l utilisateur final qui le souhaiterait un accès central à toutes les ressources. Indépendamment de la question de savoir qui gère techniquement un serveur et à quoi cela ressemble, il importe avant tout que les auteurs et les lecteurs parviennent à s en servir de façon naturelle dans l institution et qu une mutation culturelle en découle. A ce moment seulement, il sera possible d éviter que surtout des résultats de deuxième catégorie et des procès-verbaux de séances soient entreposés sur de tels serveurs, alors que les revues continueraient à servir de dépositoire pour les publications importantes (Kohl 2003) Standards et recommandations pour les serveurs de documents Les précédentes explications se rapportaient en principe à un seul serveur de documents, qui peut être conçu assez librement en fonction des besoins de chaque institution. Cette liberté est souhaitable au niveau du contenu ; sur le plan technique néanmoins, elle peut, dans le pire des cas, entraver les échanges entre les différents serveurs. Les échanges et la mise en réseau augmentant considérablement la valeur de l information sur le serveur de documents, certains standards devraient être définis de concert et respectés afin de faciliter cette mise en réseau. 185

186 Des recommandations utiles pour l exploitation de serveurs de documents et de publications ont été établies par l Initiative allemande pour l information en réseau (DINI) 146 dans le contexte de la création d un certificat pour de tels serveurs 147. Il s agit de recommandations minimales pour l obtention du certificat et de recommandations supplémentaires pour tout développement souhaité. La traduction proposée ci-après se base sur la version allemande abrégée des directives et recommandations. 1. Lignes directrices (Policy) : L exploitant du serveur de documents formule les lignes directrices pour les critères en matière de contenu, de même que pour le fonctionnement du serveur et les publie. Les droits et obligations de l exploitant du serveur de documents, ainsi que des auteurs/éditeurs doivent y être consignés. Les lignes directrices 148 doivent englober : Les définitions de la qualité en termes de contenu, de fonction et de technique des documents publiés sur le serveur de documents Une garantie pour certaines périodes d archivage par rapport à la qualité des documents en termes de contenu, de fonction et de technique La procédure de fonctionnement du serveur de documents et la définition de certaines prestations que l exploitant du serveur de documents propose aux auteurs et aux éditeurs La définition des droits et obligations des auteurs et des éditeurs 2. Assistance aux auteurs Standard minimum : Offre de conseil visible à l extérieur (p. ex. pages WWW et adresses , assistance téléphonique et personnalisée aux auteurs) Prise en charge du processus de publication dans son ensemble (y compris les problèmes d ordre juridique et technique) Recommandations : Au moins une offre de cours par semestre sur la publication électronique Offres d écriture structurée pour les auteurs Utilisation de systèmes d assistance 3. Aspects juridiques Standard minimum : L exploitant du serveur doit être habilité à publier les documents remis sur le serveur (droit de sauvegarde électronique, notamment dans des bases de données et droit de mise à disposition en libre accès pour la consultation individuelle, la reproduction à l écran et l impression chez l utilisateur [utilisation en ligne], par extraits aussi), La transmission des documents à un organisme d archivage doit être autorisée. L exploitant doit pouvoir modifier techniquement les documents dans un souci de disponibilité à long terme. L exclusion de la responsabilité doit être formulée dans une clause de non-responsabilité. Recommandations : Il est recommandé de fixer les différents droits dans les métadonnées. 4. Authenticité et intégrité : 146 Initiative allemande pour l information en réseau (DINI) : DINI Zertifikat Dokumenten- und Publikationsserver (état au ) : Cf. lignes directrices du serveur de documents et de publications de l Université Humboldt à Berlin ( 186

187 Le point suivant se rapporte à la sécurité du serveur : Standard minimum : Documentation relative au système technique Le serveur est censé être conçu pour être disponible 365 jours par an Existence d un système de garantie du serveur, des métadonnées et des documents Sauvegarde contrôlée et répertoriée des documents d un point de vue technique Recommandations : Certification SSL Le point suivant se rapporte à la sécurité des documents : Standard minimum : Identificateur permanent (Persistent Identifier) Un document dont le contenu a été modifié doit être traité comme un nouveau document (nouvel identificateur permanent). Archivage des fichiers de l auteur au format de livraison Recommandations : Recours à une procédure de justification de l intégrité des documents (p. ex. valeur hash) Signature numérique avancée au sens du 2 al. 2 SigG 2001 Création de formats d archivage en vue de l exportation vers des systèmes d archivage à long terme (cf. paragraphes 2.7 et 4.7) Représentation des documents sous une forme de présentation courante. Si cela est impossible, un logiciel de visualisation devrait être proposé pour être téléchargé ou une référence internet devrait être indiquée pour ce logiciel. 5. Indexation 5.1 Indexation matières Standard minimum : Des lignes directrices définies doivent être disponibles pour l indexation matières. Indexation matières avec recherche par mot-clé indépendant au minimum ou classification Recommandations : Classification décimale Dewey (DDC) selon l usage à la Bibliothèque nationale allemande comme méthode de classification générale de tous les documents (conformément aux recommandations DINI-OAI). Au moins un autre système standardisé d indexation matières ou de classification (générale ou spécialisée, p. ex. norme d indexation SWD, LoC, CCS, MSC, PACS, etc.) Mots-clés en anglais Bref résumé / Abstracts en allemand et en anglais 5.2 Exportation de métadonnées Standard minimum : Les métadonnées sont accessibles librement Dublin Core Simple (ANSI/NISO Z ) 149 Recommandations : DC qualified ONIX 150 Mise à disposition de métadonnées techniques et/ou d archivage, de données pour l impression à la demande (p. ex. METS 151 ). Exportation vers des systèmes d archivage à long terme

188 Exportation vers des bases de données bibliographiques (p. ex. programmes de gestion bibliographique, réseaux, OPACs) 5.3 Interfaces Standard minimum : Interface serveur internet pour les utilisateurs OAI-PMH Recommandations : Développement du protocole OAI (pour les échanges de schémas de métadonnées plus complexes) Interface de services internet (p. ex. SOAP 153 ) Z Statistique en matière d accès Standard minimum : Chaque serveur de documents doit produire sa propre statistique en matière d accès et assurer son suivi dans le cadre des dispositions juridiques (Webserver-Logs). Recommandations : La statistique devrait être classée dans chaque document à titre de méta-donnée dynamique. 7. Disponibilité à long terme Standard minimum : Liaison permanente des métadonnées avec les documents (p. ex. liaison via un identificateur permanent ou regroupement dans un conteneur) Définition d une durée minimum de disponibilité des documents dans les lignes directrices, durée qui ne doit pas être inférieure à 5 ans [sous-entendu la durée durant laquelle les objets sont disponibles sur le serveur de documents] Recommandations : Garantir éventuellement la disponibilité à long terme en collaborant avec un organisme d archivage Cette liste d exigences et de recommandations semble riche et variée au premier abord. Elle ne doit aucunement constituer un obstacle à la mise en place d un serveur. Assortie des explications 147, elle peut, au contraire, se révéler une aide très utile et devrait être prise en considération aussi souvent que possible. En y regardant de plus près, un assez grand nombre d exigences vont de soi. Pour certains des points cités, il existe un besoin immédiat qui se manifesterait moins concrètement sans cette liste. Le renforcement de l offre implique des aménagements complémentaires en fonction du développement de la mise en réseau. Les exigences, recommandations et standards réunis ne doivent en aucun cas différer la mise en application à une date indéterminée. Les systèmes qui sont conçus de manière suffisamment ouverte pour permettre des retouches rétroactives et par étapes sont idéals. Lorsque les standardisations se révèlent excessives ou non désirées, il convient de trouver des moyens pour traiter les différences restantes

189 Logiciel serveur de documents Consortium des bibliothèques universitaires suisses Au début de l étude, l intention était d arriver à recommander l utilisation d un certain logiciel serveur de documents. Cet objectif s est révélé peu pertinent et difficilement réalisable. Comme constaté au cours d une installation test, les différences entre les divers systèmes ne se font véritablement jour que lors de l application d un système dans un but précis. L Université de Glasgow a même élaboré le projet DAEDALUS 155, qui fait intervenir trois plates-formes, car elles présentent des avantages spécifiques pour les différents usages (publications vs. documents de travail vs. doctorats) (Eprints vs. DSpace vs. ETD-db 156 ) (Nixon 2003; Jones 2004). De plus, les systèmes dont il est question sont en perpétuel développement, de sorte que le rejet d un système pourrait aussi se révéler prématuré. Concrètement, la plate-forme DSpace dans sa version 1.1, par exemple, n a pas convaincu lors d une installation test (cf. annexe II (chapitre 13)), mais le débat au sein de la communauté des usagers et des concepteurs a montré d emblée que les points que nous avions déplorés faisaient déjà l objet d une révision en vue de la nouvelle version. La version 1.2 pallie en partie aux défauts mineurs. Mais s agissant de la suppression des problèmes structurels majeurs, il faudra attendre la version 2.0, dont on ne sait pas quand elle sera opérationnelle. L utilisation de logiciels variés dans les hautes écoles peut servir à mettre en exergue les points forts et les points faibles des différents systèmes lors d échanges d expériences. Quoi qu il en soit, les raisons devraient s avérer essentielles pour justifier le passage des installations actuelles à un autre système. Aussi semble-t-il plus judicieux d indiquer, après avoir testé une installation, quels éléments devraient être pris en considération lors du choix. Le regroupement comparatif des informations relatives au logiciel d archives ouvertes de l Open Society Institute 157 constitue une bonne base. D autres indications figurent dans les deux tableaux en annexe IIIa et IIIb (chap. 14 et 15). Produits Open Source, tous les systèmes disponibles ne se heurtent qu à un petit obstacle économique et technique lors de leur installation. Cette contrainte est aussi levée et, contrairement à d autres applications, les réserves émises au sujet de l utilisation de logiciels Open Source sont rares. Néanmoins, dès qu il se révèle nécessaire de procéder à des adaptations substantielles des éléments sur place, une dépense considérable peut en résulter. Dans le meilleur des cas, il suffit de modifier la configuration ; dans le pire des cas, la programmation doit être revue, opération qui suppose évidemment d autres qualifications. Dans le cadre de la présente étude, une installation test du logiciel DSpace a été effectuée et testée. Les résultats sont retranscrits en annexe II (chapitre 13). Ils servent avant tout à illustrer quels points localement nécessaires doivent être clarifiés dans le détail en fonction des propriétés spécifiques des logiciels. Les propriétés et possibilités recommandées concernent les points qui suivent et qui revêtent une importance variable selon l application retenue : Structure et contenu 155 DAEDALUS (Data Providers for Academic E-content and the Disclosure of Assets for Learning, Understanding and Scholarship) : ETD-db (Electronic Theses and Dissertations Database) : A Guide to Institutional Repository Software (actuellement V 3.0) : 189

190 Possibilité d illustrer les structures hiérarchiques o o au sein d une institution. au sein des documents (p. ex. revues). Classement simultané d un document dans différentes collections. Possibilité d importer facilement un nombre important d objets et de métadonnées. Si l importation n intervient qu à titre exceptionnel, des outils plus modestes conviennent aussi. Haut degré de modularité o o du point de vue de la taille des différents objets. du point de vue de la quantité d objets. o du point de vue du nombre de niveaux de hiérarchie dans une collection ou une institution. o du point de vue du nombre d utilisations simultanées. Métadonnées Possibilité de gérer les métadonnées pour lesquelles aucun objet n est sauvegardé et qui n autorisent qu un lien vers l extérieur. Cette possibilité s avère par exemple indispensable pour le concept d un serveur central de métadonnées. Possibilité d utiliser des schémas de métadonnées détaillés différemment ou radicalement opposés en fonction de la collection. Cette possibilité est avant tout essentielle lorsque des branches très distinctes peuvent être représentées. Aide à l attribution d identificateurs permanents. Fonction et interface Fonctions de recherche o Recherche dans les métadonnées o Recherche dans un texte intégral : très souhaitable, mais superflue selon les cas surtout lorsque seules des métadonnées sont rassemblées. o Recherche par rubrique dans les différents champs de métadonnées, recherche simultanée possible. 190 o Parcourir les indices avec la possibilité de faire établir, au besoin, de nouveaux indices. o Accès multidimensionnels possibles dans les collections, à savoir p. ex. par le biais d une classification en fonction du type de document, du département ou de la discipline? Certains aménagements possibles pour l interface. Tri et illustration corrects des écritures latines courantes tout du moins. Pour les collections spéciales, p. ex. avec caractères cyrilliques ou autres, le recours à Unicode est exigé.

191 Possibilité d intégrer le lexique contrôlé, p. ex. pour l attribution de mots-clés, proposé dans les menus déroulants. Cette possibilité est souhaitable, quelle que soit la priorité inhérente à l application retenue. Gestion Suivant l application, il est recommandé de gérer les utilisateurs au niveau de l installation globale, des instituts ou des collections. Le rattachement à un système d authentification et d autorisation devrait être réalisé au prix d une dépense raisonnable. La priorité dépend des plans de l institution. En Suisse, le projet d infrastructure d authentification et d autorisation AAI de Switch se penche sur une infrastructure d envergure nationale 158. Capacité de gestion des droits d accès. Les exigences peuvent être foncièrement opposées : tandis que, dans le cas le plus banal, tous les objets doivent être accessibles à tous sur un serveur, il existe des situations où il s avère indispensable d attribuer des autorisations détaillées (qui peut quoi) pour des fichiers individuels. Possibilité de définir le déroulement des travaux avec attribution des rôles aux personnes compétentes. Dans ce cas, le besoin dépend à nouveau du mode d exploitation prévu : si les objets doivent subir une procédure d expertise, les fonctions de chaque «rôle» doivent pouvoir être définies précisément. Si seules les métadonnées doivent être adaptées et remaniées, un déroulement moins complexe et aussi moins flexible peut suffire. Répartition flexible des tâches entre les utilisateurs finaux et le personnel de la bibliothèque. Cette répartition peut aller de pair avec l attribution des rôles et est, dans tous les cas, fortement tributaire du concept d un serveur. Statistiques d utilisation au niveau des articles Les possibilités de personnalisation, enregistrement de recherches, etc. compris, peuvent s avérer intéressantes pour certaines applications. Elles ne conditionnent toutefois pas la mise en service judicieuse et flexible d un serveur de documents. La faculté de pouvoir utiliser le protocole OAI pour le transfert de métadonnées n est pas mentionnée. Tous les produits étant ancrés dans le mouvement du libre accès, cette compatibilité va de soi. En cas de développement interne de l application, cette compatibilité doit cependant être compensée. La majeure partie des jugements portés sur les logiciels serveurs de documents et les systèmes eux-mêmes fournissent peu de renseignements sur l archivage à long terme. A une exception près (Wheatley 2004). En règle générale, en ce qui concerne les fonctions de sauvegarde des logiciels serveurs de documents, il convient de privilégier des mises au point aussi modulables, flexibles et extensibles que possibles pour permettre l intégration de nouvelles solutions. L archivage à long terme devrait donc être associé dès le début à toutes les réflexions. 158 Authentification and Authorization Interface (AAI) : ; démonstration sur le site 191

192 Reconnaissance aussi précise que possible du format du fichier et des documents dans les métadonnées. Recours à des sommes de contrôle ou à d autres procédures appropriées pour garantir l authenticité des contenus. Saisie de métadonnées techniques concernant l objet de départ et toutes les manipulations effectuées à son sujet. Contrôle de version avec sauvegarde permanente de l objet original. Une nouvelle initiative sur le modèle de DSpace (DSpace@Cambridge Project Digital Preservation Programme, Cambridge University), qui n en est toutefois qu à ces premiers balbutiements 159, pourrait donner un élan supplémentaire à la question de la sauvegarde. Des réflexions de fond concernent la question de savoir quelle intensité une institution peut et veut déployer en matière d installation. Tout dépend après de l ampleur de la documentation et du soutien escomptés. Pour les projets Open Source, il faut dans tous les cas aussi tenir compte de la possibilité qu aurait une institution de s associer activement au développement de l application et de la manière dont elle pourrait y participer Mise en réseau de serveurs de documents Les serveurs de documents proposent des documents accessibles en ligne et sont donc liés par principe à internet. A ce stade, la mise en réseau équivaut néanmoins à la coexistence de plusieurs serveurs de documents permettant d offrir aux usagers des prestations et des données supplémentaires à un seul endroit. Du point de vue du Consortium, il en va ici principalement du regroupement des métadonnées des documents sauvegardés localement pour éviter de devoir consulter séparément tous les serveurs lors de la recherche d un document d une haute école suisse. Le protocole de collecte de métadonnées (OAI-PMH) 152 de l Open Archives Initiative 160 sert d outil pour l exportation. Il s agit comparativement d un protocole simple qui, indépendamment du logiciel d un serveur de documents, remplit les conditions pour être à même de reprendre les métadonnées d un serveur. Il ne s agit pas d un outil destiné aux utilisateurs finaux. 159 DSpace@Cambridge Project Digital Preservation Workplan : Open Archives Initiative (OAI) : - ne pas confondre avec OAIS! 192

193 Figure 10 : Schéma illustrant le fonctionnement du protocole de collecte de métadonnées de l Open Archives Initiative : un service central souhaitant proposer les métadonnées (Service Provider) collecte de manière périodique et indépendante les requêtes concrètes de métadonnées des serveurs de documents (Data Provider). Les métadonnées sont ensuite sauvegardées sur le serveur central où elles sont mises à disposition pour les requêtes concrètes. En ce qui concerne l accès au texte intégral, l utilisateur est, dans tous les cas, renvoyé sur le serveur de documents local. Il va de soi qu il est toujours possible de chercher directement sur un serveur local. Le mode de fonctionnement est schématisé sur la Figure 10. Le caractère du protocole de collecte de métadonnées OAI-PMH en tant que protocole se révèle décisif pour la reprise asynchrone des métadonnées : elle ne dépend pas des requêtes concrètes formulées par les utilisateurs finaux et peut être réglée de telle sorte qu elle avantage le serveur de documents dans sa fonction de Data Provider. Les métadonnées sont pour ainsi dire stockées et mises à la disposition de l utilisateur final à un seul endroit. Celui-ci ne doit donc plus chercher un document précis à différents endroits. Si un tel souhait est émis, une personne effectuant une requête peut, en tout temps, interpeler directement un serveur local. L accès à un texte intégral intervient dans tous les cas sur le serveur local sur lequel celui-ci est sauvegardé. De cette manière, plusieurs objectifs sont atteints : 1. L offre qui réunit les métadonnées est plus attractive pour les accès externes, car elle permet d accéder à davantage de contenus. La visibilité de chaque objet augmente donc et avec elle, la probabilité que l objet soit aperçu. Le serveur de métadonnées, pour sa part, constitue aussi un objectif plus attractif pour les autres Service Provider, 193

194 car il comporte nettement plus de données que tout autre serveur individuel. Cela contribue aussi à la diffusion des contenus. 2. Il est régulièrement demandé aux métadonnées du serveur local d envoyer leurs nouvelles métadonnées. Ce processus automatisé est toutefois modulable (p. ex. déterminer la quantité d enregistrements livrés en une fois) et réduit, de surcroît, la charge engendrée par les requêtes des utilisateurs finaux : ces requêtes devraient s effectuer de préférence auprès du Service Provider. 3. Le contrôle du contenu et de l accès au contenu demeure entièrement entre les mains de l exploitant du serveur local. 4. La dépense supportée par l exploitant local d un serveur de documents se limite à l aménagement unique en vue de l accès à l OAI. En Suisse, plusieurs serveurs de documents sont déjà équipés du protocole OAI-PMH et il existe un certain intérêt pour une offre commune (cf ). Du point de vue du projet, l objectif consiste à rassembler les métadonnées des serveurs de documents suisses pour permettre de retrouver plus aisément les ressources dispersées. Un serveur commun doit, avec le concours du protocole OAI-PMH, collecter régulièrement les métadonnées des serveurs de documents des hautes écoles et les mettre à disposition. Pour ce faire, aucune condition préalable n est requise de la part des différentes bibliothèques et des exploitants de serveurs, hormis la compatibilité OAI déjà en partie garantie et un certain accord concernant les métadonnées. Cependant, une harmonisation du contenu des exigences est par ailleurs souhaitable. Le projet hollandais DARE 161 (Kuil and Feijen 2004) constitue un exemple d une telle collaboration. Ce projet réunit les 13 universités hollandaises et trois grandes institutions académiques en un réseau de serveurs de documents numériques pour les résultats scientifiques des Pays-Bas. La séparation entre le niveau des données (infrastructure notamment) et le niveau des services, ainsi que l entente fondamentale en début de projet sont intéressantes (Kuil and Feijen 2004) : Recours à des standards importants. Utilisation de systèmes existants comme outils de mise en place de serveurs de documents (Institutional Repositories) conformes à l OAI. Toutes les solutions ne conviennent pas à tous les partenaires. Il faut tirer des enseignements de la pratique. L approche était et demeure pragmatique. L apparence d un modèle théorique complet n est pas un but en soi ; on privilégie les résultats rapides. Comme nous l avons appris au cours d un entretien, le projet n avait démarré, à l origine, qu avec les partenaires ayant manifesté activement leur intérêt depuis le début : d autres ont été convaincus par les premiers résultats positifs et ont rejoint le projet. 161 Digital Academic Repositories (DARE) Demonstrations-Installation : 194

195 Du point de vue de l archivage, il convient de signaler que les contenus des archives locales sont enregistrés automatiquement dans le edepot 162 de la Bibliothèque royale de La Haye. La bibliothèque nationale a participé au projet dès le début et se charge de l archivage central à long terme pour les partenaires. Les institutions locales n ont plus aucun accès au matériel archivé, c est-à-dire également que les suppressions ne sont pas prévues. Au besoin seulement, des données peuvent être exportées pour être restaurées localement. Nous considérons le concept DARE comme un modèle valable de collaboration entre les bibliothèques universitaires suisses. Il permet aux partenaires de bénéficier localement d une grande liberté et de disposer du contrôle absolu de leurs contenus. De plus, il promet une mise en application rapide. Celle-ci dépend cependant fortement de la mesure dans laquelle les bibliothèques sont disposées à s engager et à participer à des groupes de travail, par exemple. Le projet australien ARROW (Australian Research Repositories Online to the World) 163 poursuit des objectifs comparables (2003). Cependant, il englobe aussi expressément les publications électroniques produites et distribuées dans le commerce par «E-presses». Les éditions universitaires publiées numériquement sont concernées. L avancée du projet est moins importante que DARE. Il est possible d utiliser une installation test Sauvegarde centrale des contenus Les bibliothèques universitaires témoignent un intérêt moins prononcé pour la sauvegarde centrale des contenus que pour le regroupement des métadonnées (cf ). L objectif principal consiste à garantir l archivage à long terme des contenus non couverts par la Bibliothèque nationale dans le cadre de son mandat. Il n est de fait aucunement nécessaire de procéder à une sauvegarde centrale des contenus tant que les métadonnées conservées en commun peuvent renvoyer sans problème aux serveurs locaux. Un éventuel léger gain de vitesse d accès ne justifie pas une telle démarche. En revanche, l intérêt se manifeste parfois de centraliser l archivage des contenus pour délester les ressources internes qui, bien souvent, ne se sont pas développées avec l arrivée de nouvelles tâches. En même temps, on s attend à ce qu une offre commune, doublée en conséquence d une présence à l échelon national, attire davantage que le serveur d une haute école. Il n est pas obligatoirement utile de décider d emblée quelle bibliothèque souhaiterait participer à quel processus. Il ne faut toutefois par perdre de vue que chaque offre centrale devrait aussi assurer son existence audelà de la durée du projet et qu elle suppose un financement approprié. Une certaine centralisation permettrait avant tout de décharger les insfrastructures et services techniques locaux. On ne peut pas partir du principe que l on peut céder sans autre des étapes de travail exigeant quantité de personnel comme l acquisition et le traitement, que ce soit pour des raisons matérielles ou des réflexions financières pour le système global. Dans tous les cas, les contenus conservés localement devraient être transférés dans de véritables archives à long terme. Et ce dans le même but que le edepot du projet DARE : la restauration, si besoin est, et la conservation à long terme. Aussi peut-on se demander si des archives «sombres» («dark archives») pour l essentiel remplissent cet objectif. Dans 162 edepot, Koninklijke Bibliotheek, Den Haag : (accès ) 163 ARROW : Australian Research Repositories Online to the World : ARROW-Test : 195

196 la pratique, il s agirait de la même installation que celle qui accueillerait l archivage des contenus des revues (cf. 8.6). Si celle-ci ne devait être mise en application, des mesures alternatives s imposeraient. A côté de cela, l offre de sauvegarde centrale des contenus pourrait se révéler intéressante pour les partenaires du Consortium, qui ne peuvent ou ne veulent exploiter leur propre serveur. Le besoin se fait notamment sentir dans les HES, qui, à titre d associations, n existent que depuis quelques années sous leur forme actuelle et présentent, en conséquence, des structures hétérogènes. Si une telle offre centrale était souhaitée, il serait quoi qu il arrive astucieux d exploiter un serveur commun pour l archivage et l accès, autrement dit un serveur d archives «claires». Une alternative voudrait aussi que des institutions aient la possibilité de déposer réciproquement leurs documents sur les serveurs de documents d institutions plus grandes. L exploitation séparée d un serveur de contenus central deviendrait superflue dans ce cas RERO DOC Dans ce contexte, les activités du RERO 165, qui met un serveur de documents central à la disposition de ses membres, sont suivies avec un certain intérêt 166. Les thèses des universités de Genève, Fribourg, Lausanne et Neuchâtel, ainsi que d autres documents figurent sur ce serveur. Comme dans le projet DARE, il est possible de sélectionner des perspectives locales, de sorte que seuls les contenus d une haute école sont visibles. De plus, les métadonnées d autres thèses sont chargées via le protocole OAI-PMH. Dans ce cas, les textes intégraux correspondants restent sur le serveur source 167. Cette offre dépasse ainsi la saisie des métadonnées et les expériences déjà acquises à ce sujet devraient être prises en compte à tout prix. Du reste, le serveur dispose même d une interface de recherche en quatre langues et va dans la même direction que celle suivie dans le cadre du projet. La tarification du service RERO DOC 168 pour l année 2005 est citée ci-dessous : «La prise en charge des documents: o gratuit pour les types de document standards directement chargés par les institutions [ ]; o pour la diffusion de collections numériques nécessitant une analyse et un travail de la centrale, la personnalisation d'une interface et/ou un chargement de données, la centrale établira une offre personnalisée, basée sur une taxe d ouverture de dossier et une facturation du tout ou partie du travail à effectuer, au tarif de Fr /l'heure. [ ] L'espace occupé par le contenu hébergé : o membres RERO : gratuit (jusqu'à concurrence de 200 Gigabytes); o non-membres : forfait annuel de Fr. 3' jusqu'à concurrence de 100 Gigabytes; 165 RERO Réseau des bibliothèques de Suisse occidentale : RERO DOC (bibliothèque numérique) : Thèses-EN-ligne - Serveur de Thèses Multidisciplinaire : Description du projet RERO DOC et conditions de participation, , 196

197 o l'espace supplémentaire sera facturé par année et par tranche de 100 GB; le coût, décidé par les instances RERO, sera communiqué sur demande. L'espace occupé par les documents avec limitation d'accès, par exemple ceux qui sont accessibles uniquement à l'intranet d'une institution, sera facturé par année et par tranche de 100 GB; le coût, décidé par les instances RERO, sera communiqué sur demande.» Offres d hébergement commercial Les archives institutionnelles et les serveurs de documents constituent aussi des marchés. BioMed Central a récemment lancé son offre d «Open Repository» et ProQuest UMI, le produit «Digital Commons». Ces deux offres fournissent la plate-forme technique nécessaire à un serveur et exploitent cette plate-forme sur mandat de leur clientèle institutionnelle. Transférer l exploitation du serveur présente l avantage de ne pas devoir engager de nouveau personnel, ou beaucoup moins. Cette remarque ne s applique néanmoins que pour l exploitation technique ; avec l expérience, on constate même que les tâches plus astreignantes de l acquisition de documents et de l assistance aux auteurs doivent être effectuées en interne. Dans la pratique, la mise en place de serveurs locaux a généralement du s opérer avec les collaborateurs à disposition. Dans la quasi-totalité des cas, les processus technique et formel sont plus ou moins garantis, mais l approvisionnement en contenus importants ne peut être soutenu activement. En cas d attribution externe, les frais inhérents à l exploitation technique sont définis, même si aucun contrôle ne peut être exercé dans le détail. BioMed Central Open Repository Open Repository propose trois niveaux : «Standard Edition», «Silver Edition» et «Gold Edition» 169. Tous utilisent DSpace 170 comme plate-forme technique. L offre de base comprend l installation du serveur chez BioMed Central, l hébergement et la maintenance, les copies de sauvegarde, le soutien technique. Les différences entre les éditions résident dans diverses fonctions accessoires concernant la conversion de formats (p. ex. en PDF ou pour un code XML), etc. De surcroît, les éditions Standard et Silver ne sont que des communautés (Communities) au sein d une installation commune DSpace de BioMed Central, tandis que la Gold Edition est une installation DSpace à part entière. 169 Open Repository (BioMed Central) : DSpace : 197

198 Standard Edition Silver Edition Gold Edition Taxe d installation unique en GBP Taxe de maintenance annuelle en GBP y compris 5 Go de capacité mémoire y compris 10 Go de capacité mémoire y compris 50 Go de capacité mémoire articles au format XML (sinon 95/article) Capacité mémoire supplémentaire Onduleurs en GBP/an compris Onduleurs en GBP/an non compris 50 Go Go Go To Tableau 14 : Coûts du produit Open Repository de BioMed Central (état au ). BioMed Central compte 5 Go de capacité mémoire pour articles moyens. Si le service n est pas prolongé, les contenus renfermés sont alors remis aux institutions clientes. Les indications de prix donnent des indices révélateurs sur le montant et surtout sur les relations entre les différents facteurs de coûts. La comparaison avec les frais pris en considération pour le serveur ArXiv s impose (cf ). Le montant estimé pour l hébergement des quelque articles que compte le serveur ArXiv s élève à environ USD (actuellement env. CHF ). Suivant l hypothèse de BioMed Central, qui veut que articles scientifiques moyens nécessitent une capacité mémoire de 5 Go, la place requise atteint env. 1,5 To. Selon l édition choisie dans l Open Repository, cela équivaut à une dépense annuelle de GBP à GBP (actuellement CHF à CHF ) en sus des frais uniques d installation. Des rabais étant apparemment accordés en fonction de la quantité de capacité mémoire (cf. Tableau 14), ces frais devraient être moins élevés. Il ne faut évidemment pas oublier que BioMed Central est une entreprise économique. Malgré le calcul très détaillé entrepris pour le serveur ArXiv et les deux postes à plein temps pris en considération, les coûts sont nettement plus bas. Il n est cependant pas impossible que, dans l aperçu du Tableau 5, les frais liés à la mémoire purement technique et aux copies de sauvegarde aient été sous-évalués. Même la facturation interne entre le 198

199 centre de calcul et la bibliothèque d une institution publique pourrait dépasser ce cadre, si la quantité de données devait augmenter en conséquence. ProQuest/UMI Digital Commons 171 Le logiciel «bepress», développé à l Université de Californie à Berkeley 172, sert de base technique à ce service proposé par ProQuest/UMI. Il présente davantage de fonctions que DSpace, mais doit être sous licence de Berkeley. Sa fonction de plate-forme pour les processus de publication est l un des points forts du système. Elle est utilisée à Berkeley et dans d autres lieux notamment pour la production de revues électroniques avec procédure d expertise. Actuellement, l offre de ProQuest, présentée sous la marque Digital Commons, met surtout en valeur les services proposés par les archives institutionnelles «traditionnelles» pour les articles, les documents de travail, etc. Aucune indication de prix n est disponible Recommandations L utilisation commune d un serveur de documents doit être testée en 2005 avec les bibliothèques partenaires intéressées. Recherche d intérêts manifestés pour la sauvegarde des métadonnées et des contenus. Des partenaires assumant activement la mise en place seront sollicités (participation à des groupes de travail, adaptations sur le propre serveur). Il convient de définir quelles données doivent être sauvegardées. Ceci concerne aussi bien les choix en matière de contenu que les questions formelles (quelles métadonnées, etc.). La sauvegarde des métadonnées et des contenus doit s effectuer simultanément ou consécutivement en fonction des intérêts et de la charge de travail. Les expériences du RERO doivent imprégner les deux parties. Il convient d étudier les possibilités de coopérer avec des serveurs en activité, en particulier celui du RERO. L utilité d un service commercial est abandonnée. Les postpublications offrent la meilleure chance de réunir rapidement un nombre substantiel de documents importants. A condition de prévoir, sur place et en parallèle à l installation technique dans les différentes bibliothèques, des mesures précisant comment inciter localement les auteurs à s impliquer dans leur haute école, voire comment les obliger à le faire jusqu à un certain point. Centralisées, de telles mesures se révèlent irréalisables. Une présence commune serait souhaitable, mais ne peut que soutenir la participation locale. L archivage à long terme doit être préparé. La forme de la collaboration devrait être déterminée. Il s agit de ne pas oublier qu il est aussi possible d adapter les procédures et les conventions, si plus aucune institution centrale n existe au terme du projet : 171 ProQuest UMI Digital Commons : Bepress (The Berkeley Electronic Press) : 199

200 Quelles tâches incombent au projet E-Archiving et quelles tâches doivent être réglées sur le plan local? Qui prend quelles décisions pour une bibliothèque ou pour l ensemble du serveur? Dans quelle mesure et sous quelle forme les réunions communes peu fréquentes entre les personnes concernées par le projet facilitent-elles la coordination? 200

201 8.9 Numérisations propres Dans le chapitre 3.4, les faits majeurs de la numérisation ont été exposés. Il s agit ici de la numérisation des revues entamée dans le cadre de cette étude. L étude avait pour mission d accumuler, dans le cadre d un projet pilote, les expériences en matière de numérisation de périodiques imprimés. Tandis que nombre de bibliothèques font leurs propres expériences avec la numérisation d anciens imprimés, de manuscrits ou d illustrations avec une importance patrimoniaux, la numérisation de périodiques intervient jusqu à présent majoritairement dans les grands projets étrangers. A titre d expérience, la BCU Fribourg propose en ligne quelques années de deux journaux d envergure cantonale 173. Des éditeurs scientifiques plus importants ont déjà numérisé les revues produites par leurs soins et disponibles jusqu ici uniquement en version papier pour les proposer, moyennant paiement, en complément de leur offre (Elsevier, Springer, Institute of Physics, American Physical Society, etc.). Il faut s attendre à ce que d autres éditeurs leur emboîtent le pas. La situation est moins limpide pour les éditeurs qui publient des revues sur mandat de sociétés scientifiques ; elle l est encore moins pour la multitude de revues de sociétés spécialisées, produites sans une infrastructure éditoriale complète. Cela concerne plus généralement les publications relevant des sciences humaines et sociales et reflète notamment aussi la différence d importance des articles de périodiques dans les diverses branches (Tenopir and King 2001). Il s agit, il est vrai, d une généralisation maladroite devant les différences observées au sein des sciences humaines et sociales, mais la tendance veut que, dans ce domaine, les publications monographiques revêtent davantage d importance que dans des domaines comme les sciences naturelles, la technique ou la médecine. De nombreux projets d ampleur variable traitent aussi de la numérisation des périodiques. Leur objectif consiste souvent à combler les lacunes laissées par les projets des éditeurs. Ils concentrent donc, par exemple, leur contenu plutôt sur les sciences humaines et sociales et sur les titres non rédigés en anglais. Le projet JSTOR, mentionné déjà à réitérées reprises, sert en partie d exemple au projet allemand DIGIZeitschriften 174. Tous deux sont payants. Le but de DIGIZeitschriften est de proposer en libre accès au moins les contenus dont la durée de protection des droits d auteur a expiré. S agissant des contenus protégés, des accords ont été conclus dans le cadre de ce projet avec les éditeurs et les sociétés de gestion des droits d auteur compétentes, à savoir la VG Wort 175 en Allemagne. Les projets précurseurs du Centre de numérisation de Goettingen (GDZ), qui regroupent aussi bien des monographies que des périodiques, demeurent accessibles 176. L offre gratuite de la Bibliothèque nationale de France Gallica 177 propose des œuvres littéraires, des monographies et des périodiques, dont quelques titres allemands et anglais. 173 La Liberté et les Freiburger Nachrichten, années : DIGIZeitschriften Das digitale Zeitschriften Archiv : VG Wort Verwertungsgesellschaft Wort : Göttinger Digitalisierungszentrum GDZ : Gallica la bibliothèque numérique : 201

202 D autres projets sont plus spécialisés, comme le Compact Memory, un portail d archives pour les périodiques juifs en langue allemande 178, ou le projet EMANI en mathématiques 179. Sur la base d activités internationales et de contacts actuels, trois revues mathématiques suisses ont été pressenties pour la numérisation : L Enseignement Mathématique, dont le siège se situe à Genève, Commentarii Mathematici Helvetici et Elemente der Mathematik. La situation de départ diffère pour ces trois titres : La revue L Enseignement Mathématique est publiée par une fondation du même nom. Il n existe pas de version en ligne courante et, eu égard aux ventes de la version imprimée, une telle offre n est pas prévue. La fondation détient les droits de publication. Jusqu à fin 2004, la revue Commentarii Mathematici Helvetici était publiée par la maison d édition Birkhäuser (comme membre du groupe Springer) sur mandat de la Société Mathématique Suisse (SMS). Une version courante en ligne est proposée via la plate-forme du lien Springer depuis La SMS détient les droits de publication. Elle a, par la suite, approuvé la numérisation déjà effectuée de toutes les anciennes années ( ) et leur mise à disposition par le GDZ, à la condition toutefois que les données soient aussi mises à la disposition du Consortium en vue de son projet. Depuis 2005, la revue Commentarii paraît chez European Mathematical Society Publishing House 180. En ce qui concerne la revue Elemente der Mathematik, la situation de départ est similaire, bien qu aucune numérisation n ait encore été entreprise. Ce titre a aussi été transféré de la SMS, détentrice des droits, à l European Mathematical Society Publishing House début La communauté internationale des mathématiciens actifs dans la recherche est sans doute celle qui, dans l ensemble, s investit le plus dans la numérisation de sa littérature ancienne. Sous le nom Digital Mathematics Library, il existe des activités variées et quelques recommandations pour la réalisation de projets de numérisation (Bouche and Rehmann 2003) 181. La raison réside d un côté dans la méthode de travail de la branche, qui accorde davantage d importance à la littérature ancienne que d autres branches. D une certaine manière, c est le caractère «sciences humaines» des mathématiques qui ressort. Selon une étude de JSTOR consacrée à l exploitation des contenus mathématiques, l intensité de l exploitation n a quasiment aucun rapport avec l âge : ni les articles récents ni ceux cités le plus souvent généralement ne sont utilisés le plus souvent (Guthrie 2002). Il faut toutefois tenir compte du fait que les articles récents peuvent être accessibles par d autres moyens et utilisés. D un autre côté, l exploitation de publications anciennes en mathématiques est assortie d une grande ouverture envers le numérique de telle sorte que, dans l ensemble, les conditions se révèlent favorables en vue d un usage bénéfique des revues numérisées. 178 Compact Memory Internetarchiv jüdischer Periodika : EMANI - Electronic Mathematical Archiving Network Initiative : European Mathematical Society Publishing House : Digital Mathematics Library - Report of the Technical Standards Working Group

203 La revue Commentarii ayant déjà été numérisée et la situation concernant la revue Elemente étant encore incertaine en raison du changement prévu d éditeur, c est la revue L Enseignement Mathématique qui a été traitée en premier Procédure Discussions avec l éditeur L éditeur de la revue s est montré favorable au projet dès le début. Pour préserver ses intérêts s agissant de la distribution de la revue, qui continuera d être disponible uniquement en version papier, une limite d accès mobile (Moving Wall) de cinq ans a été convenue. Les documents rédigés ces cinq dernières années devraient certes être numérisés, mais ne devraient pas encore être mis à disposition. Finalement, les questions d ordre juridique ont été réglées avec pragmatisme. Partant du principe que les auteurs ont tout intérêt à voir leurs travaux diffusés à grande échelle et qu ils ne poursuivent généralement aucun objectif financier avec leurs articles, on renoncera à les contacter. D un point de vue juridique, on peut se demander si cette vision des choses est recevable et si l accord explicite de l auteur ou de sa descendance n est pas requis pour cette forme de publication. Une convention écrite entre l éditeur, le Consortium et la SMS en tant que conseillère définit en particulier les points suivants : Le Consortium obtient le droit non exclusif de proposer les contenus numérisés en ligne à l échelle mondiale. Une limite d accès mobile de cinq ans dès la fin de l année en cours a été convenue. En principe, l accès en ligne doit être gratuit. Au besoin, une taxe minime peut être perçue pour couvrir les frais. Le Consortium peut, aux mêmes conditions, transmettre les données à une autre institution ou à un tiers pour en assurer l accès à long terme. L éditeur reçoit aussi les métadonnées et les contenus pour tout au plus les associer ultérieurement à une offre actuelle. Il n a toutefois pas le droit de vendre les contenus ou de les utiliser à des fins commerciales. Il n y a aucune obligation formelle de poursuivre la numérisation dans le futur Examen des collections Pour des raisons pratiques, il serait souhaitable de recourir aux collections de la Bibliothèque de l EPFZ. En échange, les entrées dans le catalogue ont été standardisées puis complétées et un statut spécial a été convenu pour les prêts. Le passage en revue de la collection a révélé que trois volumes n étaient disponibles que comme réimpressions. Pour pouvoir utiliser l original de tous les volumes, les volumes manquants ont été empruntés à l éditeur. Il s est avéré d emblée que les exemplaires reliés permettraient une manipulation sans risque et meilleure que les volumes non reliés et non rognés proposés également par l éditeur. Un examen des différents volumes a permis de réunir les données suivantes : 203

204 Confirmation du nombre total de pages indiqué Clarification des particularités essentielles liées aux séries 1 et 2 : dans la série 2, par exemple, un élément («Bulletin Bibliographique») fait l objet d une numérotation interne, autrement dit certains numéros de page apparaissent deux fois. Identification des pages nécessitant un traitement spécial : o Reproductions de photographies (numérisation en niveaux de gris) o Annexes surdimensionnées, de même que graphiques et tableaux dépassant le miroir de composition (numérisation avec découpe plus grande) Notamment les indications liées aux particularités des volumes se sont révélées très utiles pour déterminer, conjointement avec le prestataire, comment traiter les originaux. Aussi les dimensions de l image ont-elles été choisies pour permettre la saisie de la majorité des pages sans adaptations supplémentaires et ce, avec une résolution optique réelle de 600 dpi. En même temps, une marge étroite a été préférée Service de numérisation Après des entretiens préalables, des tests et deux offres, la numérisation des originaux a été confiée en externe à une entreprise suisse. Un volume par série a été traité comme prototype puis examiné avec soin ; cette opération faisait partie intégrante du mandat d origine. Selon les recommandations d autres projets, les caractéristiques suivantes ont été retenues : Format TIFF, 600 dpi, noir/blanc, compression sans perte selon TIFF G4 (CCITT). Il s agit d une qualité plutôt élevée qui doit permettre de copier convenablement les nombreux graphiques et formules de l original et, au besoin, de faire des reproductions. L en-tête TIFF : uniquement pour les caractères ASCII des octets pour les informations suivantes : o Tag 270 : ImageDescription «L Enseignement Mathématique», Vol. [n o ], ([année]). «Fondation L Enseignement Mathématique, Genève». o Tag 297 : PageNumber : [numérotation originale] 204 o Tag 315 : Artist (ASCII 0-127) : Konsortium der Schweizer Hochschulbibliotheken / Consortium des bibliothèques universitaires suisses / Consortium of Swiss Academic Libraries Pour optimiser la base de départ en vue de la reconnaissance optique des caractères OCR et de la conversion au format PDF, la netteté et les tons sont corrigés automatiquement. Orientation vers les pages individuelles. Taille originale. Désignation des fichiers images : la désignation des fichiers doit être claire. Pour le traitement ultérieur (voir ci-dessous), il est indispensable de pouvoir trier les pages dans le même ordre que dans l original. La question a été longuement débattue car,

205 au début, on a tenté de tenir compte du nombre de pages de l original dans le nom du fichier. Cette démarche a finalement été abandonnée puisque le nombre de pages de l original figure, au besoin, dans l en-tête TIFF. o Tous les fichiers images sont numérotés dans un ordre croissant du début à la fin, sans tenir compte du nombre de pages de l original, autrement dit «ENSMATH_[année]_[volume logique]_[numéro de fichier]». Exemple : «ENSMATH_1904_6_001». La découpe standard proposée mesure 19,25 cm x 12,75 cm. Marquage des pages vierges «vide leer empty». Numériser les photos en niveaux de gris. Déterminer la procédure quand deux volumes sont reliés ou quand un volume s étend sur plusieurs années (désignation, hiérarchie). Contrôle qualité : quantitativement comparer les numéros de page et ceux des images. Qualitativement découpes correctes? Structure et saisie des métadonnées Dans le chapitre 3.4, il a déjà été mentionné que les images des pages à proprement parler ne constituent un moyen satisfaisant que pour les contenus riches en images. Pour indexer les textes provenant des images des pages, il faut tout d abord procéder à la reconnaissance optique des caractères (OCR, Optical Character Recognition), qui peut recréer le texte à partir de l image d un mot. Elle est indispensable à la recherche dans un texte intégral et peut, en outre, être utilisée pour extraire les méta-donées des différents documents. Il ne faut toutefois pas oublier que la qualité de l OCR dépend fortement de la qualité de l image. Une précision élevée de la reconnaissance des caractères obtenue avec l aide de dictionnaires et d algorithmes de correction est nécessaire, car les corrections manuelles se révèlent beaucoup trop lourdes pour le texte intégral. Le but consiste à obtenir un pourcentage de caractères reconnus nettement supérieur à 99,5 %, car un taux de 99,5 % équivaut toujours à un caractère incorrect toutes les deux à trois lignes de texte. Seules les métadonnées comme les titres, etc. sont en partie corrigées à la main. Durant la phase préparatoire du projet, le logiciel docworks/metae 182 a suscité un regain d attention sur le plan international. Son objectif est de concrétiser la saisie en grande partie automatique des métadonnées pour la littérature imprimée dès les années 1850 sur la base des fichiers images et de procéder ensuite à la reconnaissance optique des caractères. Cette démarche est digne d intérêt, car il ne faut pas oublier que la saisie et l indexation des métadonnées coûtent souvent plus cher que l ensemble du processus de création et de traitement des images. En ce moment, la revue L Enseignement Mathématique est traitée avec le logiciel docworks/metae dans l entreprise CCS. Pour 2005, le Consortium prévoit une installation test dont il informera ses partenaires. Si l intérêt est manifeste, cette installation pourrait se muer en prestation régulière pour les partenaires. Lors de la phase préparatoire, il s agissait notamment de respecter les points suivants : 182 Site du projet de recherche METAe (Metadata engine) : ; Entreprise partenaire CCS GmbH, Hambourg : 205

206 L original comporte beaucoup de formules et de graphiques susceptibles de gêner la reconnaissance optique des caractères. La reconnaissance optique des caractères doit pouvoir s effectuer en quatre langues (français, allemand, anglais, italien). Les caractères spéciaux doivent être affichés correctement dans les titres. Le format d affichage est PDF. Il résulte du traitement avec docworks des textes intégraux au format XML, liés aux images des pages. Outre le contenu textuel, le document XML contient aussi les coordonnées de chaque élément sur la page. Avec une interface adaptée, la recherche d un mot dans un texte intégral mène alors directement à la bonne place sur l image de la page. Les images TIFF et les métadonnées au format XML constituent un résultat qui se défend aussi du point de vue de la conservation à long terme. En tenant compte des restrictions connues, cela s applique aussi pour le format PDF de la présentation. Parallèlement, docworks compare les numéros de page logiques qu il trouve sur les images des pages avec l ordre des fichiers et ajoute de façon autonome les numéros de page manquants. Dans le doute, il interroge l utilisateur. Pour finir, la reconnaissance des métadonnées telles que les titres, les noms d auteur et les chapitres et l identification des éléments comme les notes de bas de page, les formules, les tableaux et les illustrations sont assurées. Les métadonnées peuvent se révéler utiles aussi bien pour la recherche ciblée d un élément précis que pour la navigation. Dans le contexte de l utilisation du logiciel, la question déterminante sera de savoir si les avantages de ce logiciel sont proportionnés aux coûts Présentation : logiciels Les images et leurs métadonnées doivent être mises à disposition de manière fonctionnelle et attractive sur internet. Pour ce faire, il faut une interface appropriée pour la présentation qui s appuie sur une base de données performante. Une offre en ligne pure et simple dotée de fonctions de recherche peut se réaliser de différentes façons. En revanche, il est plus difficile d intégrer une fonction pratique de saisie et de traitement (ultérieur) des métadonnées, de même que d autres fonctions de traitement, qui reposent à leur tour sur les fonctions OCR. C est le cas du logiciel AGORA 183, conçu spécialement par le Centre de numérisation de Goettingen et l entreprise Satz-Rechen-Zentrum (SRZ) pour la saisie de métadonnées, l organisation et la présentation. Ce logiciel est probablement le seul à combiner ces fonctions dans cette forme. Des produits comparables ont été trouvés dans le domaine des fonctions de recherche et l indexation. Une décision définitive est attendue. A Goettingen, le logiciel Agora est aussi testé en association avec docworks. Par conséquent, le projet pilote ne répondra vraisemblablement pas au désir d utiliser des logiciels Open Source. Le scepticisme est entre autres de mise s agissant de trouver suffisamment de partenaires intéressés par des applications aussi spécifiques pour pouvoir débuter et supporter durablement leur conception. Cette option doit être poursuivie à l avenir pour améliorer les possibilités offertes aux institutions de petite taille. Cela implique qu un 183 Agora Content Management System : 206

207 nombre suffisant de grandes institutions s arrangent pour assurer le développement des logiciels pour tous Présentation : liens On constate régulièrement que les ressources dispersées en ligne n apparaissent pas toujours automatiquement dans le champ de vision de l usager potentiel. C est encore plus vrai en ce qui concerne les contenus numérisés rétroactivement, car ils quittent la forme sous laquelle ils étaient habituellement proposés auparavant. Les répertoires de contenus déjà numérisés doivent y remédier (en mathématiques, p. ex., une liste de l Université de Bielefeld 184 ). Dans ce cas, les utilisateurs doivent savoir qu il existe un répertoire assorti. L aménagement de liens utiles facilite la recherche et l utilisation des contenus. Le strict minimum consiste à rendre les éditions numériques accessibles à partir du catalogue de la bibliothèque titulaire du document et à partir de son autre offre électronique. Tant que l éditeur concerné poursuit la publication du titre, un lien est naturellement aussi prévu. Comme dans le cas précité, il s agit de références au niveau du titre de la revue. S il existe des instruments de recherche bibliographique correspondants pour la branche, ceux-ci peuvent être utilisés pour rechercher des liens au niveau des articles. En mathématiques, il s agit de la base de données Zentralblatt MATH 185, y compris l ancien annuaire sur les progrès en mathématiques, ainsi que de MathSciNet / Mathematical Reviews 186. Toutes deux permettent de renvoyer de leurs entrées bibliographiques aux contenus disponibles en ligne et vice versa. Ces liens se révèlent indispensables en cas d utilisation intensive, mais ils ne seront pas disponibles pour l offre dès le début Bilan intermédiaire La numérisation entamée s est révélée plutôt exigeante : la préparation et le contrôle qualité ont nécessité beaucoup de temps en interne, tandis que la numérisation et le traitement en externe n ont pris que quelques semaines. Dans le cadre du projet, les travaux liés à la numérisation doivent être poursuivis avec une priorité moindre. Une fois l installation réalisée et si l intérêt est manifeste, les outils appropriés peuvent être tenus à la disposition des partenaires jusqu à la fin du projet, soit en Cependant, il n est pas prévu d allouer les ressources du projet à d autres travaux que ceux engagés. L intérêt porté aux revues numérisées ne pourra être évalué qu une fois leur mise à disposition en ligne. Sous sa forme actuelle, le projet visait à rendre les contenus accessibles par le biais de les répertoirier en haute qualité, naturellement très coûteuse. Une proposition alternative radicale consiste à renoncer plus ou moins à les répertoirier et, en contrepartie, à tout miser sur la recherche en texte intégral. Les grands projets récents entrepris séparément par Internetarchive 187 et Google 188 vont dans ce sens. En collaboration avec des grandes bibliothèques, tous deux ont l intention de numériser chacun un million de 184 Retrodigitized Mathematics Journals and Monographs : Zentralblatt MATH : MathSciNet Mathematical Reviews on the Web : The Internet Archive Million Book Project : Google Digitization of Books Project : 207

208 livres, soit en réalité des œuvres littéraires et des monographies. L objectif consiste à permettre la recherche en texte intégral. Par mesures d économie, on ne procédera pas à une sélection ciblée des collections en termes de contenu si l on renonce à distinguer les textes protégés des textes dépourvus de droits d auteur. En ce qui concerne le processus de numérisation, Google évalue les coûts à env. USD 10 par volume ; les étapes de travail englobées dans ces coûts ne sont toutefois pas totalement définies. Des frais aussi bas s obtiennent de deux manières. Google semble tabler sur une automatisation étendue de la numérisation. D une part, cela nécessite d importants investissements en appareils et, d autre part, la structure de l original doit être compatible avec une numérisation automatique. L autre possibilité consisterait à traiter les originaux correspondants dans des pays où les coûts salariaux sont très bas. L objectif avoué du projet Google tout du moins est de numériser l ensemble des volumes des bibliothèques partenaires. Pour les œuvres encore protégées, Google se tournera vers les exemplaires empruntables de la bibliothèque et vers les librairies. Cela persuadera sans doute les bibliothèques partenaires, qui, de surcroît, ne supporteront pas les frais de l opération. L influence qu exercent de tels projets est encore difficilement appréciable : s ils ne reprenaient pas les métadonnées déjà disponibles dans les catalogues des bibliothèques, il serait d autant plus difficile de connaître l utilité des différentes méthodes de recherche comme le proposent les bases de données. De plus, ces projets fourniront à la majorité des utilisateurs ce qu ils cherchent. Selon toute vraisemblance, la «tache aveugle» du regard sur tous les documents non disponibles en ligne va donc s étendre. Il ne s agit pas d un reproche formulé à l encontre de ces nouveaux projets, car les bibliothèques doivent déjà s efforcer depuis des années de proposer à leur clientèle une offre active pour l «entraîner en ligne». La question sera donc plutôt de savoir si une telle démarche doit s effectuer par le biais d une saisie de metadonnées rentable mais onéreuse suivant les critères des bibliothèques ou si la priorité doit être accordée à la quantité de contenus à disposition pour permettre, dans le meilleur des cas, aux usagers potentiels d accéder aux collections qu ils ne pourraient pas consulter autrement. La question critique a déjà été posée de savoir si les bibliothèques peuvent proposer gratuitement des contenus qu elles devront racheter par la suite. Le projet de Google prévoit expressément que les bibliothèques partenaires recevront une copie des données complètes et qu elles pourront les utiliser librement. Ce choix coûteux, il est vrai, pourrait à nouveau être la clé : pour ce qui est des documents nécessitant une indexation à l aide de métadonnées fiables, autrement dit les revues scientifiques notamment, ce choix s opérera toujours s il peut être financé. S agissant de l indexation des articles dans les périodiques, les bases de données bibliographiques peuvent servir d auxiliaires, comme cela a été décrit plus haut pour les revues mathématiques. Dans ce cas, la véritable indexation est transférée généralement par les bibliothèques et des liens permettent de mener du résultat de la recherche effectuée dans la base de données au texte intégral et vice versa. Pour les ouvrages tels que les œuvres littéraires et les monographies, les métadonnées proposées dans les catalogues devraient être reprises. La nécessité d élaborer un important projet de numérisation suisse pour les revues scientifiques semble infime. Comme il ressort de l enquête, seuls quelques plans existent ça et là. Cela est sans doute aussi lié au fait que, pour les contenus patrimoniaux, les 208

209 bibliothèques se sentent davantage tenues d améliorer l accessibilité à des exemplaires uniques. En revanche, les revues scientifiques majeures jouissent d une certaine diffusion et la mise à disposition supplémentaire en ligne d éditions plus anciennes de titres courants est considérée, avec raison, comme une responsabilité incombant à l éditeur en question et comme étant dans son intérêt. De surcroît, les associations culturelles entre les différentes régions et trois grands pays de même langue couvrent déjà une bonne partie des besoins. L association entre la maison d édition Birkhäuser et Springer est exemplaire : la maison d édition Springer a entamé un projet de numérisation de ses anciennes éditions qui prend aussi en compte les titres de la maison Birkhäuser, pour autant qu ils aient été publiés entièrement ou partiellement en anglais. Actuellement, la perception d une taxe unique est prévue pour une utilisation permanente de ces fichiers anciens. Les zones d ombre restantes sont donc élucidées : les publications de qualité éditées par de petits éditeurs spécialisés ou de petites sociétés sont avant tout désavantagées si elles n ont pas été publiées en anglais. La question de savoir si d autres projets doivent remédier à ce problème relève notamment de la politique. Néanmoins, le projet en cours ne dispose d aucune capacité à ce sujet Recommandations relatives à la numérisation de revues Achèvement des travaux entamés : L Enseignement Mathématique en ligne de en printemps Intégration de la revue Commentarii Mathematici Helvetici. Mises au point concernant la revue Elemente der Mathematik, si possible, numérisation en Liens issus des et avec les bases de données Zentralblatt MATH et MathSciNet. Pour la présentation permanente des contenus numérisés, il convient de trouver une solution offrant une perspective pour la période après la fin du projet. Analyse des résultats et des expériences pour une utilisation ultérieure dans des projets menés par les bibliothèques partenaires. Analyse des résultats de la production en cours avec docworks (disposition automatique et extraction de métadonnées). Installation test de docworks auprès du Bureau central et, si l intérêt est manifeste, tests avec les bibliothèques associées en été Entretien des logiciels choisis tant que l intérêt subsiste. Autant que possible dans le cadre du projet (au maximum jusqu à son terme en 2007), puis par les partenaires (bibliothèques et éditeurs). En cas d intérêt marqué, poursuite d alternatives Open Source pour l usage ultérieur une fois le projet terminé. Il en résulte une hausse des frais de personnel des partenaires. Globalement, la numérisation gourmande en ressources ne doit pas être poursuivie en priorité dans le projet. 209

210 8.10 Aperçu des projets partiels L'illustration suivante illustre le lien des différentes parties du concept général qui ont été examinées dans ce chapitre. Figure 11 : Lien schématique de projets partiels prévus dans le cadre du projet «e-archiving». 210

Open Access By IOP Publishing. Sarah QUIN Senior Publisher

Open Access By IOP Publishing. Sarah QUIN Senior Publisher Open Access By IOP Publishing Sarah QUIN Senior Publisher UPMC, le 5 février, 2013 L auteur et le chercheur face au libre accès Comment un éditeur STM s y engage depuis 1998 Agenda Introduction à IOP Définitions

Plus en détail

Le droit d auteur dans un environnement numérique : les positions de l IFLA et de l UNESCO 1

Le droit d auteur dans un environnement numérique : les positions de l IFLA et de l UNESCO 1 Le droit d auteur dans un environnement numérique : les positions de l IFLA et de l UNESCO 1 Das Urheberrecht in einer digitalen Umwelt: die Positionen der IFLA und der UNESCO Jean-Philippe Accart Information

Plus en détail

Négociation Elsevier : un accord est signé

Négociation Elsevier : un accord est signé Négociation Elsevier : un accord est signé A la date du 31 janvier 2014, le consortium Couperin en charge de la négociation pour l'abonnement à la Freedom collection, l'agence Bibliographique de l'enseignement

Plus en détail

Mise en place d une politique institutionnelle d archives ouvertes

Mise en place d une politique institutionnelle d archives ouvertes Mise en place d une politique institutionnelle d archives ouvertes Sanaa DOUKKALI Directrice de la Bibliothèque Universitaire Mohamed Sekkat, Université Hassan II -Casablanca Tel: +212 614 00 04 52 e-mail

Plus en détail

Journée Swets. Garantir l accès durable aux revues électroniques et e-books, est-ce possible?

Journée Swets. Garantir l accès durable aux revues électroniques et e-books, est-ce possible? Journée Swets Fribourg, le 23 septembre 2011 Garantir l accès durable aux revues électroniques et e-books, est-ce possible? Susanne Manz Consortium des bibliothèques universitaires suisses Le Consortium

Plus en détail

E-COMMERCE VERS UNE DÉFINITION INTERNATIONALE ET DES INDICATEURS STATISTIQUES COMPARABLES AU NIVEAU INTERNATIONAL

E-COMMERCE VERS UNE DÉFINITION INTERNATIONALE ET DES INDICATEURS STATISTIQUES COMPARABLES AU NIVEAU INTERNATIONAL E-COMMERCE VERS UNE DÉFINITION INTERNATIONALE ET DES INDICATEURS STATISTIQUES COMPARABLES AU NIVEAU INTERNATIONAL Bill Pattinson Division de la politique de l information, de l informatique et de la communication

Plus en détail

Archives ouvertes : les enjeux dans les politiques d établissement et les projets internationaux

Archives ouvertes : les enjeux dans les politiques d établissement et les projets internationaux Archives ouvertes : les enjeux dans les politiques d établissement et les projets internationaux Bruno BOISSAVIT, Anne SLOMOVICI Séminaire MSH : Les archives ouvertes et HAL-SHS 13 Mars 2014 MSH Val de

Plus en détail

2.2 Objet du contrôle Il y a lieu de vérifier les points suivants de manière individuelle ou combinée.

2.2 Objet du contrôle Il y a lieu de vérifier les points suivants de manière individuelle ou combinée. Protection des données; examen périodique des applications informatiques; CONDITIONS GÉNÉRALES (également valables lors de recours à des sociétés d audit) 1 Quiconque souhaite charger une société d audit

Plus en détail

CHAPITRE 4. APPLICATION DE LA NOTION D ETABLISSEMENT STABLE

CHAPITRE 4. APPLICATION DE LA NOTION D ETABLISSEMENT STABLE COMMERCE ELECTRONIQUE ET IMPOTS @ OCDE CLARIFICATION POUR L APPLICATION DE LA DÉFINITION D ÉTABLISSEMENT STABLE DANS LE CADRE DU COMMERCE ÉLECTRONIQUE : MODIFICATIONS DES COMMENTAIRES SUR L ARTICLE 5 22

Plus en détail

Direction des bibliothèques. Sondage Ithaka S+R. Questionnaire français Université de Montréal

Direction des bibliothèques. Sondage Ithaka S+R. Questionnaire français Université de Montréal Direction des bibliothèques Sondage Ithaka S+R Questionnaire français Université de Montréal Décembre 2014 Modules retenus Découverte Activités de recherche numérique Compétences informationnelles des

Plus en détail

Berne, le 29 août 2012

Berne, le 29 août 2012 L'Office fédéral de la communication Consultation concernant la révision partielle de la loi sur la radio et la télévision Zukunftstrasse 44 Case Postale 2051 Bienne Berne, le 29 août 2012 Prise de position

Plus en détail

Enquête 2013-2014 sur les ressources numériques en bibliothèque publique

Enquête 2013-2014 sur les ressources numériques en bibliothèque publique Enquête 2013-2014 sur les ressources numériques en bibliothèque publique Ministère de la Culture et de la Communication Direction générale des médias et des industries culturelles Service du livre et de

Plus en détail

Politique de gestion documentaire

Politique de gestion documentaire Politique de gestion documentaire Responsabilité de gestion : Secrétariat général Date d approbation : 24 avril 1979 C.A. C.E. Direction générale Direction Date d'entrée en vigueur : 24 avril 1995 Date

Plus en détail

Programme-cadre européen pour la recherche et l innovation. Horizon 2020. Lignes directrices pour la gestion des données dans Horizon 2020

Programme-cadre européen pour la recherche et l innovation. Horizon 2020. Lignes directrices pour la gestion des données dans Horizon 2020 Programme-cadre européen pour la recherche et l innovation Horizon 2020 Lignes directrices pour la gestion des données dans Horizon 2020 Version 1.0 11 décembre 2013 Titre original : Guidelines on Data

Plus en détail

Fonds de placement Le modèle adapté à chaque type d investisseur.

Fonds de placement Le modèle adapté à chaque type d investisseur. Fonds de placement Le modèle adapté à chaque type d investisseur. Bienvenue. Des arguments qui comptent Les points forts des fonds de placement du Credit Suisse. De nets avantages Les fonds de placement:

Plus en détail

Université de Lausanne

Université de Lausanne Université de Lausanne Records management et archivage électronique : cadre normatif Page 2 Ce qui se conçoit bien s énonce clairement Nicolas Boileau Page 3 Table des matières Qu est- ce que le «records

Plus en détail

Codes attribués par l'abes pour identifier les bouquets en vue de l'exemplarisation automatique

Codes attribués par l'abes pour identifier les bouquets en vue de l'exemplarisation automatique Codes attribués par l'abes pour identifier les bouquets de ressources électroniques Ressources Fournisseurs Type Bouquets Code attribué ACM DIGITAL LIBRARY ACM - ASSOCIATION FOR COMPUTING MACHINERY / TSP

Plus en détail

Concentration des forces dans l information scientifique

Concentration des forces dans l information scientifique Programme CUS 2013-2016 P-2 "Information scientifique: accès, traitement et sauvegarde" Concentration des forces dans l information scientifique Approuvée par la CUS le 3 avril 2014 Direction du programme:

Plus en détail

Création outil multimédia de restitution du projet «l intergénérationnel : un levier pour un levier pour créer du lien social en milieu rural

Création outil multimédia de restitution du projet «l intergénérationnel : un levier pour un levier pour créer du lien social en milieu rural CAHIER DES CHARGES Création outil multimédia de restitution du projet «l intergénérationnel : un levier pour un levier pour créer du lien social en milieu rural Juillet 2013 Sarah Pecas I - PRESENTATION

Plus en détail

DIFFUSER MES ARTICLES EN LIBRE ACCÈS : UN CHOIX, UN AVANTAGE, UNE OBLIGATION?

DIFFUSER MES ARTICLES EN LIBRE ACCÈS : UN CHOIX, UN AVANTAGE, UNE OBLIGATION? DIFFUSER MES ARTICLES EN LIBRE ACCÈS : UN CHOIX, UN AVANTAGE, UNE OBLIGATION? DIANE SAUVÉ DIRECTION DES BIBLIOTHÈQUES Midi Recherche, 20 mai 2015 Image: Source LIBRE ACCÈS Ce qu est l accès libre à la

Plus en détail

Evaluation du Réseau Santé Psychique Suisse

Evaluation du Réseau Santé Psychique Suisse Universität Zürich Institut für Politikwissenschaft Forschungsbereich Policy-Analyse & Evaluation Evaluation du Réseau Santé Psychique Suisse Sur mandat de l Office fédéral de la santé publique Thomas

Plus en détail

L externalisation des activités bancaires en France et en Europe

L externalisation des activités bancaires en France et en Europe ÉTUDES L externalisation des activités bancaires en France et en Europe Si l externalisation des activités (outsourcing) est un phénomène courant au sein des entreprises non financières en Europe, comme

Plus en détail

ARCHIVES DEPARTEMENTALES DU NORD

ARCHIVES DEPARTEMENTALES DU NORD ARCHIVES DEPARTEMENTALES DU NORD SERVICE DE LA COLLECTE ET DU TRAITEMENT DES ARCHIVES PUBLIQUES PREFECTURE DU NORD ARCHIVAGE DES DOSSIERS DE DEMANDE DE TITRE DE SEJOUR DES ETRANGERS Vincent Doom SOMMAIRE

Plus en détail

Assemblée générale de l OMPI

Assemblée générale de l OMPI F WO/GA/40/10 ORIGINAL : ANGLAIS DATE : 21JUIN 2011 Assemblée générale de l OMPI Quarantième session (20 e session ordinaire) Genève, 26 septembre 5 octobre 2011 COOPÉRATION DANS LE CADRE DES DÉCLARATIONS

Plus en détail

la désignation du titre de «technicien diplômé ES»

la désignation du titre de «technicien diplômé ES» Etat des lieux de la désignation du titre de «technicien diplômé ES» Résumé (Management Summary) Avril 2006 Impressum Herausgeber: Bundesamt für Berufsbildung und Technologie BBT Sprachen: Deutsch, Management

Plus en détail

3 e pilier, prévoyance privée. Assurance vie

3 e pilier, prévoyance privée. Assurance vie 3 e pilier, prévoyance privée Assurance vie La prévoyance privée est facultative. Elle complète les prestations des 1 er et 2 e piliers et comble les lacunes en matière de prévoyance individuelle. Table

Plus en détail

Etapes de création d une revue électronique

Etapes de création d une revue électronique Economique Site web du guide des ressources pour l édition de revues numériques Coordination : Ghislaine Chartron et Jean-Michel Salaun Doctorant en sciences de l'information Cette analyse vise à donner

Plus en détail

Introduction Le phénomène que représentent les Services de Gestion des Documents Managed Document Services (MDS) Une définition du concept

Introduction Le phénomène que représentent les Services de Gestion des Documents Managed Document Services (MDS) Une définition du concept Table des matières I II III IV V VI Introduction Le phénomène que représentent les Services de Gestion des Documents Managed Document Services (MDS) Une définition du concept Le marché des Services de

Plus en détail

CERTIFICATION DES INSTITUTIONS APPLIQUANT LE CASE MANAGEMENT CRITÈRES DE QUALITÉ ET INDICATEURS DE CONTRÔLE

CERTIFICATION DES INSTITUTIONS APPLIQUANT LE CASE MANAGEMENT CRITÈRES DE QUALITÉ ET INDICATEURS DE CONTRÔLE CERTIFICATION DES INSTITUTIONS APPLIQUANT LE CASE MANAGEMENT CRITÈRES DE QUALITÉ ET INDICATEURS DE CONTRÔLE 1 INTRODUCTION Le présent document a été rédigé par le groupe de travail «Certification» du Réseau

Plus en détail

CAHIER DES CLAUSES TECHNIQUES PARTICULIÈRES (CCTP) MISE EN PLACE ET MAINTENANCE D UN MOTEUR DE RECHERCHE

CAHIER DES CLAUSES TECHNIQUES PARTICULIÈRES (CCTP) MISE EN PLACE ET MAINTENANCE D UN MOTEUR DE RECHERCHE PREMIER MINISTRE SECRÉTARIAT GÉNÉRAL DU GOUVERNEMENT CAHIER DES CLAUSES TECHNIQUES PARTICULIÈRES (CCTP) MISE EN PLACE ET MAINTENANCE D UN MOTEUR DE RECHERCHE SUR LES SITES INTERNET GÉRÉS PAR LA DOCUMENTATION

Plus en détail

Lettre d information. Octobre 2014

Lettre d information. Octobre 2014 Octobre 2014 Lettre d information Edito Nouveautés : Sage Génération i7 7.70 A la Une : Dématérialisation de la TVA A la Une : Déclaration Sociale Nominative Focus : Sage CRM Online Fiche pratique : Les

Plus en détail

Atteindre la flexibilité métier grâce au data center agile

Atteindre la flexibilité métier grâce au data center agile Atteindre la flexibilité métier grâce au data center agile Aperçu : Permettre l agilité du data-center La flexibilité métier est votre objectif primordial Dans le monde d aujourd hui, les clients attendent

Plus en détail

Les acteurs de la carte d'achat

Les acteurs de la carte d'achat CHAPITRE 3 Les acteurs de la carte d'achat Pour mettre en œuvre une exécution des marchés publics par carte d achat, l acheteur et le gestionnaire public vont devoir s adresser à un fournisseur de services

Plus en détail

«Les documents référencés ci-dessus étant protégés par les droits d auteur et soumis à la déclaration au Centre Français d exploitation du droit de

«Les documents référencés ci-dessus étant protégés par les droits d auteur et soumis à la déclaration au Centre Français d exploitation du droit de 1 2 «Les documents référencés ci-dessus étant protégés par les droits d auteur et soumis à la déclaration au Centre Français d exploitation du droit de Copie, seules les références bibliographiques peuvent

Plus en détail

Retenir les meilleurs talents

Retenir les meilleurs talents Adecco Finance Focus Retenir les meilleurs talents Lundi matin, 9 h Vous vous réjouissez de commencer une nouvelle semaine de travail productif. Vous êtes en pleine forme. Alors que vous entamez votre

Plus en détail

Contrat de conception, reéalisation et hébergement de site web

Contrat de conception, reéalisation et hébergement de site web infos@droitbelge.net Contrat de conception, reéalisation et hébergement de site web Auteur: Me Frédéric Dechamps, avocat (Bruxelles) E-mail: fd@lex4u.com Tel: + 32 2 340 97 04 Web: www.lex4u.com AVERTISSEMENT

Plus en détail

2. Convention avec le Centre électronique de Gestion de la Ville de Neuchâtel (CEG)

2. Convention avec le Centre électronique de Gestion de la Ville de Neuchâtel (CEG) Rapport du Conseil communal au Conseil général à l appui d un créditcadre de Fr. 295 000.-- pour le financement général de divers travaux informatiques Monsieur le président, Mesdames et Messieurs les

Plus en détail

Tirez plus vite profit du cloud computing avec IBM

Tirez plus vite profit du cloud computing avec IBM Tirez plus vite profit du cloud computing avec IBM Trouvez des solutions de type cloud éprouvées qui répondent à vos priorités principales Points clés Découvrez les avantages de quatre déploiements en

Plus en détail

LES OUTILS DU TRAVAIL COLLABORATIF

LES OUTILS DU TRAVAIL COLLABORATIF LES OUTILS DU TRAVAIL COLLABORATIF Lorraine L expression «travail collaboratif» peut se définir comme «l utilisation de ressources informatiques dans le contexte d un projet réalisé par les membres d un

Plus en détail

Guide d implémentation des ISBN à 13 chiffres

Guide d implémentation des ISBN à 13 chiffres Guide d implémentation des ISBN à 13 chiffres International ISBN Agency Berlin 2004 Première édition 2004 by International ISBN Agency Staatsbibliothek zu Berlin Preussischer Kulturbesitz Permission est

Plus en détail

RÉPARTI EN FONCTION DES BUDGETS $ 9 - $ 2014-15 RAPPORT ANNUEL)

RÉPARTI EN FONCTION DES BUDGETS $ 9 - $ 2014-15 RAPPORT ANNUEL) Faits en bref au sujet du RCDR 2015 Le Réseau canadien de documentation pour la recherche (RCDR) est un partenariat d universités déterminé à élargir le contenu numérique pour les activités de recherche

Plus en détail

L ARCHIVAGE LEGAL : CE QU IL FAUT SAVOIR

L ARCHIVAGE LEGAL : CE QU IL FAUT SAVOIR L ARCHIVAGE LEGAL : CE QU IL FAUT SAVOIR INTRODUCTION A la suite de grands scandales financiers qui ont ébranlés le monde des affaires, les instances législatives et réglementaires des Etats Unis ont remis

Plus en détail

Mensuration officielle Plan de conservation et d archivage de données et de documents (PCA)

Mensuration officielle Plan de conservation et d archivage de données et de documents (PCA) Directive du 23 juin 2014 (état au 29 janvier 2015) Mensuration officielle Plan de conservation et d archivage de données et de documents (PCA) Editeur Groupe de travail «Archivage de données de la MO»

Plus en détail

Contrats et immatériel

Contrats et immatériel Contrats et immatériel Rapporteur général: Professeur Dr. Matthias Lehmann, Université Halle-Wittenberg - Questionnaire pour les rapporteurs nationals - Partie 1 : Le système du droit contractuel face

Plus en détail

ASSURANCE-LITIGE EN MATIÈRE DE BREVETS

ASSURANCE-LITIGE EN MATIÈRE DE BREVETS Étude concernant l assurance-litige en matière de brevets, par CJA Consultants Ltd Janvier 2003 V4a.fin ASSURANCE-LITIGE EN MATIÈRE DE BREVETS Étude réalisée pour la Commission européenne concernant la

Plus en détail

L I V R E B L A N C P r o t ég e r l e s a p p l i c a t i o n s m ét i e r s c r i t i q u e s M a i n f r a m e, un b e s o i n c r u c i a l

L I V R E B L A N C P r o t ég e r l e s a p p l i c a t i o n s m ét i e r s c r i t i q u e s M a i n f r a m e, un b e s o i n c r u c i a l Siège social : 5 Speen Street Framingham, MA 01701, É.-U. T.508.872.8200 F.508.935.4015 www.idc.com L I V R E B L A N C P r o t ég e r l e s a p p l i c a t i o n s m ét i e r s c r i t i q u e s M a i

Plus en détail

Les Ateliers Info Tonic

Les Ateliers Info Tonic Les Ateliers Info Tonic La dématérialisation des processus documentaires Mardi 9 octobre 2012 8h30-10h30 Grand Salon La Gestion Electronique de l Information et des Documents d Entreprise Environnement

Plus en détail

Les archives ouvertes

Les archives ouvertes Les archives ouvertes Christine.Berthaud@ccsd.cnrs.fr Christine Berthaud@ccsd.cnrs.fr 1990 Paul Ginsparg à Los Alamos 2002 Initiative de Budapest pour l Accès ouvert (BOAI) Le libre accès à la recherche,

Plus en détail

NORME INTERNATIONALE D AUDIT 330 REPONSES DE L AUDITEUR AUX RISQUES EVALUES

NORME INTERNATIONALE D AUDIT 330 REPONSES DE L AUDITEUR AUX RISQUES EVALUES NORME INTERNATIONALE D AUDIT 330 REPONSES DE L AUDITEUR AUX RISQUES EVALUES Introduction (Applicable aux audits d états financiers pour les périodes ouvertes à compter du 15 décembre 2009) SOMMAIRE Paragraphe

Plus en détail

ISTEX, vers des services innovants d accès à la connaissance

ISTEX, vers des services innovants d accès à la connaissance ISTEX, vers des services innovants d accès à la connaissance Synthèse rédigée par Raymond Bérard, directeur de l ABES, à partir du dossier de candidature d ISTEX aux Initiatives d excellence et des réunions

Plus en détail

Panorama des contenus

Panorama des contenus journée professionnelle organisée par ABPN Association des Bibliothécaires de la Province Nord Panorama des contenus documentaires numériques Isabelle Gasser IRD Nouméa - Documentation Plan Contexte t

Plus en détail

Jean Sykes Nereus, la collaboration européenne, et le libre accès

Jean Sykes Nereus, la collaboration européenne, et le libre accès Jean Sykes Nereus, la collaboration européenne, et le libre accès Keynote Item Original citation: Originally presented at UNESCO DKN project steering group meeting, 29 June 2006, Paris, France [Name of

Plus en détail

Archivage électronique

Archivage électronique Archivage électronique En raison du développement constant de la numérisation et de l augmentation croissante du nombre d informations auxquelles les entreprises sont confrontées, l accès rapide et contrôlé

Plus en détail

Comité du développement et de la propriété intellectuelle (CDIP)

Comité du développement et de la propriété intellectuelle (CDIP) F CDIP/5/7 REV. ORIGINAL : ANGLAIS DATE : 21 JUILLET 2010 Comité du développement et de la propriété intellectuelle (CDIP) Cinquième session Genève, 26 30 avril 2010 PROJET RELATIF À LA PROPRIÉTÉ INTELLECTUELLE

Plus en détail

EP LOIRE Plateau collaboratif d échange. Intranet / Internet. du plan Loire grandeur nature 2007-2013. Note de cadrage

EP LOIRE Plateau collaboratif d échange. Intranet / Internet. du plan Loire grandeur nature 2007-2013. Note de cadrage EP LOIRE Plateau collaboratif d échange Intranet / Internet du plan Loire grandeur nature 2007-2013 Note de cadrage est une SARL au capital de 15 244,90, N SIRET 410 711 626 00029, APE 721 Z 60, rue Benjamin

Plus en détail

7. Recherche des essais

7. Recherche des essais 7. Recherche des essais Le chapitre précédent a insisté sur la nécessité de réaliser une recherche des essais aussi exhaustive que possible. Seule la conjonction de tous les moyens disponibles peut laisser

Plus en détail

Résumé du projet (french) http://www.univie.ac.at/phc. Karl Krajic Jürgen Pelikan Petra Plunger Ursula Reichenpfader

Résumé du projet (french) http://www.univie.ac.at/phc. Karl Krajic Jürgen Pelikan Petra Plunger Ursula Reichenpfader Résumé du projet (french) http://www.univie.ac.at/phc Karl Krajic Jürgen Pelikan Petra Plunger Ursula Reichenpfader Institut Ludwig Boltzmann de sociologie de la santé et de la médecine Avril 2001 Introduction

Plus en détail

sommaire L organisation et la gestion des archives d entreprise...7

sommaire L organisation et la gestion des archives d entreprise...7 sommaire La formation continue à l EBAD... 3 Niveau i... 4 La chaine de traitement archivistique... 4 Initiation aux techniques documentaires... 5 Organisation et gestion des bibliothèques... 6 Niveau

Plus en détail

Guide de travail pour l auto-évaluation:

Guide de travail pour l auto-évaluation: Guide de travail pour l auto-évaluation: Gouvernance d entreprise comité d audit Mars 2015 This document is also available in English. Conditions d application Le Guide de travail pour l auto-évaluation

Plus en détail

Appel d offres pour la mise en place de cursus intégrés franco-allemands binationaux et trinationaux à compter de l année universitaire 2015-2016

Appel d offres pour la mise en place de cursus intégrés franco-allemands binationaux et trinationaux à compter de l année universitaire 2015-2016 Appel d offres pour la mise en place de cursus intégrés franco-allemands binationaux et trinationaux à compter de l année universitaire 2015-2016 Date limite pour l annonce du dépôt d une demande de soutien

Plus en détail

Nouvelle stratégie européenne d action pour la jeunesse «Investir en faveur de la jeunesse et la mobiliser»

Nouvelle stratégie européenne d action pour la jeunesse «Investir en faveur de la jeunesse et la mobiliser» Nouvelle stratégie européenne d action pour la jeunesse «Investir en faveur de la jeunesse et la mobiliser» Odile Quintin Directrice générale de la DG Education et Culture Commission européenne Bruxelles,

Plus en détail

Livre blanc Compta La dématérialisation en comptabilité

Livre blanc Compta La dématérialisation en comptabilité Livre blanc Compta La dématérialisation en comptabilité Notre expertise en logiciels de gestion et rédaction de livres blancs Compta Audit. Conseils. Cahier des charges. Sélection des solutions. ERP reflex-erp.com

Plus en détail

Protection des renseignements personnels, publicité ciblée et médias sociaux : Ampleur du problème : certaines observations déconcertantes

Protection des renseignements personnels, publicité ciblée et médias sociaux : Ampleur du problème : certaines observations déconcertantes Protection des renseignements personnels, publicité ciblée et médias sociaux : Ampleur du problème : certaines observations déconcertantes Avner Levin * * Professeur agrégé et directeur, Privacy and Cyber

Plus en détail

Good practice: réduction individuelle des primes d assurance-maladie

Good practice: réduction individuelle des primes d assurance-maladie Good practice: réduction individuelle des primes d assurance-maladie Extrait du rapport: Ehrler, Franziska, Caroline Knupfer et Yann Bochsler (2012) Effets de seuil et effets pervers sur l activité. Une

Plus en détail

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte 1Les bases : vos objectifs 2 Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

Plus en détail

Quelles sont les informations légales à faire figurer sur un site Internet?

Quelles sont les informations légales à faire figurer sur un site Internet? > Accueil > Le Droit en pratique > Fiches pratiques Quelles sont les informations légales à faire figurer sur un site Internet? Le site Internet est un vecteur d informations. Mais il en collecte également,

Plus en détail

Conseil économique et social

Conseil économique et social Nations Unies Conseil économique et social Distr. générale 24 janvier 2014 Français Original: anglais ECE/CES/2014/7 Commission économique pour l Europe Conférence des statisticiens européens Soixante-deuxième

Plus en détail

SpringerLink La Connaissance est importante. Choisissez SpringerLink.

SpringerLink La Connaissance est importante. Choisissez SpringerLink. Knowledge Matters. Choose SpringerLink SpringerLink La Connaissance est importante. Choisissez SpringerLink. A la pointe de la Recherche scientifique mondiale La Collection de contenus STM en ligne la

Plus en détail

ComplianceSP TM sur SharePoint 2010 CONTRÔLE CONFORMITÉ PERFORMANCES

ComplianceSP TM sur SharePoint 2010 CONTRÔLE CONFORMITÉ PERFORMANCES TM ComplianceSP TM sur SharePoint 2010 Gestion complète de documents et processus des sciences de la vie sur SharePoint 2010 CONTRÔLE CONFORMITÉ PERFORMANCES Aperçu Consciente de la pression croissante

Plus en détail

Réglementation des jeux de casino

Réglementation des jeux de casino Chapitre 4 Section 4.01 Commission des alcools et des jeux de l Ontario Réglementation des jeux de casino Suivi des vérifications de l optimisation des ressources, section 3.01 du Rapport annuel 2010 Contexte

Plus en détail

quelles sont les spécificités du système de gouvernance des PME - PMI?

quelles sont les spécificités du système de gouvernance des PME - PMI? LA GOUVERNANCE DES PME-PMI Gérard CHARREAUX Professeur de Sciences de Gestion à 1 Université de Bourgogne, Dijon PREAMBULE Il est probable que vous vous interrogez sur l'apport des recherches en matière

Plus en détail

Nouvelles exigences pour les entreprises et les réviseurs

Nouvelles exigences pour les entreprises et les réviseurs Nouvelles exigences pour les entreprises et les réviseurs Modifications du droit des sociétés et introduction d une surveillance de la révision Décembre 2005 Modifications du droit des sociétés En décembre

Plus en détail

Rapport sur la situation financière des institutions de prévoyance et des assureurs vie

Rapport sur la situation financière des institutions de prévoyance et des assureurs vie Rapport sur la situation financière des institutions de prévoyance et des assureurs vie Annexe 4 Enquête auprès des sociétés suisses d assurance sur la vie concernant l assurance collective dans la prévoyance

Plus en détail

EVALUATION DES SERVICES GUIDE A L INTENTION DE LA CHEFFE OU DU CHEF DE SERVICE ET DE SES COLLABORATRICES ET COLLABORATEURS

EVALUATION DES SERVICES GUIDE A L INTENTION DE LA CHEFFE OU DU CHEF DE SERVICE ET DE SES COLLABORATRICES ET COLLABORATEURS EVALUATION DES SERVICES GUIDE A L INTENTION DE LA CHEFFE OU DU CHEF DE SERVICE ET DE SES COLLABORATRICES ET COLLABORATEURS Ce document présente la procédure d évaluation des services centraux de l UNIL

Plus en détail

GROUPE DE CONTACT DES DIRECTEURS

GROUPE DE CONTACT DES DIRECTEURS GROUPE DE CONTACT DES DIRECTEURS PREMIÈRE ÉDITION (4 Juin 2014) LISTE DE CONTROLE POUR ENGAGER UN BON CONSULTANT I. Travaux préparatoires en interne II. Critères personnels concernant le consultant III.

Plus en détail

CONDITIONS GENERALES REGLEMENTANT LE PRET DE MAIN- D ŒUVRE ENTRE ENTREPRISES

CONDITIONS GENERALES REGLEMENTANT LE PRET DE MAIN- D ŒUVRE ENTRE ENTREPRISES CONDITIONS GENERALES REGLEMENTANT LE PRET DE MAIN- D ŒUVRE ENTRE ENTREPRISES Le prêt de main d œuvre est pratiqué de longue date dans le secteur du Bâtiment. Il consiste, de la part d un entrepreneur,

Plus en détail

DOCUMENT DE CONSULTATION

DOCUMENT DE CONSULTATION COMMISSION EUROPÉENNE Bruxelles, le 10.4.2015 C(2015) 2303 final DOCUMENT DE CONSULTATION Première phase de consultation des partenaires sociaux au titre de l article 154 du TFUE concernant une consolidation

Plus en détail

Annexe au document intitulé Communication relative à certaines questions de politique concernant le Bureau de Procureur : renvois et communications

Annexe au document intitulé Communication relative à certaines questions de politique concernant le Bureau de Procureur : renvois et communications Annexe au document intitulé Communication relative à certaines questions de politique concernant le Bureau de Procureur : renvois et communications La présente annexe au document de politique du Procureur

Plus en détail

Conséquence du passage à l administration électronique dans les organisations: l expérience de la Mairie de Gérone

Conséquence du passage à l administration électronique dans les organisations: l expérience de la Mairie de Gérone Conséquence du passage à l administration électronique dans les organisations: l expérience de la Mairie de Gérone Lluís-Esteve Casellas i Serra Joan Boadas i Raset Objectif L objectif de cette présentation,

Plus en détail

Fourniture d un outil de gestion du courrier électronique pour les sites internet de la Documentation Française

Fourniture d un outil de gestion du courrier électronique pour les sites internet de la Documentation Française Fourniture d un outil de gestion du courrier électronique pour les sites internet de la Documentation Française Cahier des Clauses Techniques Particulières 1 Préambule L objet du présent appel d offres

Plus en détail

La gestion des risques en entreprise de nouvelles dimensions

La gestion des risques en entreprise de nouvelles dimensions La gestion des risques en entreprise de nouvelles dimensions Octobre 2006 La pratique de la gestion des risques en entreprise devient plus cruciale et plus complexe de jour en jour. Les entreprises doivent

Plus en détail

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007 L archivage pérenne du document numérique au CINES CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007 Sommaire La mission d archivage du CINES Le contexte, la problématique et les constats Les défis, orientations

Plus en détail

De l interopérabilité des formats du livre numérique

De l interopérabilité des formats du livre numérique De l interopérabilité des formats du livre numérique Prof. Christoph Bläsi Prof. Franz Rothlauf Johannes Gutenberg-Universität Mainz Allemagne Avril 2013 European and International Booksellers Federation

Plus en détail

EVALUATION DU POINT FORT 1 «LANGUE ET FORMATION» : RAPPORT INTERMEDIAIRE

EVALUATION DU POINT FORT 1 «LANGUE ET FORMATION» : RAPPORT INTERMEDIAIRE OFFICE FEDERAL DES MIGRATIONS (ODM) MESURES D ENCOURAGEMENT DE L INTEGRATION PRISES PAR LA CONFEDERATION : PROGRAMME DES POINTS FORTS 2008-2011 EVALUATION DU POINT FORT 1 «LANGUE ET FORMATION» : RAPPORT

Plus en détail

Le logiciel pour le courtier d assurances

Le logiciel pour le courtier d assurances Le logiciel pour le courtier d assurances Introduction - Présentation 2 Intégration totale 3 Paperless Office 3 Traitement Unifié de l information 4 Outils commerciaux 5 Communication 6 Intégration AS/2

Plus en détail

CONDITIONS PARTICULIÈRES

CONDITIONS PARTICULIÈRES 1 CONDITIONS PARTICULIÈRES DE PARTICIPATION AU PROGRAMME BONUS SURPRIZE just for you 2 3 1. Termes est un programme bonus développé par Viseca Card Services SA qui offre de nombreux avantages. Il est ainsi

Plus en détail

Garanties dans le secteur principal de la construction

Garanties dans le secteur principal de la construction Garanties dans le secteur principal de la construction Société Suisse des Entrepreneurs 1 Principes de la Société Suisse des Entrepreneurs Garanties dans le secteur principal de la construction Impressum

Plus en détail

Dernière date de mise à jour : 31 mai 2015 ARTICLE 1 : DEFINITIONS CONDITIONS GENERALES DE VENTE

Dernière date de mise à jour : 31 mai 2015 ARTICLE 1 : DEFINITIONS CONDITIONS GENERALES DE VENTE Dernière date de mise à jour : 31 mai 2015 CONDITIONS GENERALES DE VENTE PREAMBULE : ARTICLE 1 : DEFINITIONS "Abonnement" désigne le Contrat conclu entre l Utilisateur et SchoolMouv en vue de permette

Plus en détail

Archivage électronique et valeur probatoire

Archivage électronique et valeur probatoire Archivage électronique et valeur probatoire Livre blanc Archivage électronique et valeur probatoire Livre blanc 2 Sommaire 1 Introduction 3 2 Archive et archivage 5 2.1 Qu est-ce qu une archive? 5 2.2

Plus en détail

Consultation sur le référencement entre assureurs de dommages et carrossiers. Commentaires présentés à L Autorité des marchés financiers

Consultation sur le référencement entre assureurs de dommages et carrossiers. Commentaires présentés à L Autorité des marchés financiers entre assureurs de dommages et carrossiers Commentaires présentés à L Autorité des marchés financiers Novembre 2006 entre assureurs de dommages et carrossiers 2 PRÉAMBULE Le Groupement des assureurs automobiles

Plus en détail

Bourse de recherche Jeff Thompson. Politique et procédures

Bourse de recherche Jeff Thompson. Politique et procédures Bourse de recherche Jeff Thompson Politique et procédures Table des matières Objet et contexte... 2 Financement... 2 Candidats admissibles... 3 Processus de sélection et d attribution de la bourse... 4

Plus en détail

Formats de fichiers adaptés à l'archivage électronique à moyen et long terme

Formats de fichiers adaptés à l'archivage électronique à moyen et long terme RÉPUBLIQUE ET CANTON DE GENÈVE Archives d'etat Formats de fichiers adaptés à l'archivage électronique à moyen et long terme Version Date Objet de la version 1.0 19.10.2011 Document validé par le Collège

Plus en détail

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Classe de terminale de la série Sciences et Technologie du Management et de la Gestion Préambule Présentation Les technologies de l information

Plus en détail

Les nouveaux sites documentaires de l IRD

Les nouveaux sites documentaires de l IRD Les nouveaux sites documentaires de l IRD Nouvel Horizon, nouvel intranet, nouveaux Netvibes - IRD France Sud - Logo d après Clipart-fr et Freepik.com De quoi allons nous parler? Les sites de la Documentation

Plus en détail

Référencement dans des bases de données

Référencement dans des bases de données Marketing Site web du guide des ressources pour l édition de revues numériques Coordination : Ghislaine Chartron et Jean-Michel Salaun Doctorant en science de l'information La création numérique, ou la

Plus en détail

Garantir une meilleure prestation de services et une expérience utilisateur optimale

Garantir une meilleure prestation de services et une expérience utilisateur optimale LIVRE BLANC Garantir une meilleure prestation de services et une expérience utilisateur optimale Mai 2010 Garantir une meilleure prestation de services et une expérience utilisateur optimale CA Service

Plus en détail

Vers une IT as a service

Vers une IT as a service Vers une IT as a service 1 L évolution du datacenter vers un centre de services P.2 2 La création d une offre de services P.3 3 La transformation en centre de services avec System Center 2012 P.4 L évolution

Plus en détail

Orientations pour la gestion documentaire des courriels au gouvernement du Québec

Orientations pour la gestion documentaire des courriels au gouvernement du Québec Orientations pour la gestion documentaire des courriels au gouvernement du Québec Janvier 2009 Dépôt légal Bibliothèque et Archives nationales du Québec, 2010 ISBN : 978-2-550-59635-6 Table des matières

Plus en détail

Plan de cours Programme de leadership en entreprise pour les conseillers juridiques d entreprise

Plan de cours Programme de leadership en entreprise pour les conseillers juridiques d entreprise Plan de cours Programme de leadership en entreprise pour les conseillers juridiques d entreprise Un juriste typique qui assume un rôle de juriste d entreprise est armé d une solide formation et expérience

Plus en détail