La Documentation électronique



Documents pareils
Plan. Un modèle d organisation. Pour les Archives numériques. Présentation Groupe PIN. Claude HUC (CNES)

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) JRES Novembre 2007

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007

Conservation des données à long terme

J'ai un patrimoine électronique à protéger

Université de Lausanne

Ministère de la Culture et de la Communication

Archivage pérenne : les formats conformes Version :

Glossaire. Arborescence : structure hiérarchisée et logique qui permet d organiser les données dans un système informatique.

Archivage numérique pérenne

L'ILM pour donner une valeur «temps» à la donnée

Distinguer entre «Enregistrer» et «Sauvegarder»

ARCHIVAGE DES BASES DE

I partie : diagnostic et proposition de solutions

Les enjeux du stockage de masse sur bande vidéo

Procédure Création : 04/05/2009 ARCHIVAGE DE LA MESSAGERIE

L archivage pérenne des documents numériques

Conservation des documents numériques

Conférence EDIFICAS. Le document électronique et sa valeur probante

MODE D'EMPLOI. La gestion des versions permettra de compléter et de faire évoluer les fiches dans le temps. NOM DE LA RESSOURCE CONTACT FOURNISSEUR

Archivage intermédiaire de données Scientifiques ISAAC Information Scientifique Archivée Au Cines

Domaine D1 : Travailler dans un environnement numérique évolutif

Les répertoires de formats

Journée Swets. Garantir l accès durable aux revues électroniques et e-books, est-ce possible?

Présentation aux entreprises du numérique

Rencontres ERFA Records Management

Mise en place d une politique institutionnelle d archives ouvertes

Les normes de certification des archives numériques En préparation. C. Huc. La Pérennisation des Informations numériques

La persistance de l'information

APX Solution de Consolidation de Sauvegarde, restauration et Archivage

P2A POLITIQUE ET PRATIQUES D'ARCHIVAGE (SPHÈRE PUBLIQUE)

ILM ou Archivage Une démarche Métier

Comité sectoriel de la sécurité sociale et de la santé Section «Sécurité sociale»

OPEN ACCESS. ouverte INP Toulouse

Vers une convergence. Plateforme en ligne Mathrice

Archivage. des dossiers

Pérennisation des Informations Numériques

PROGRAMME DE FORMATION

EXCHANGE 2010 VS ARCHIVAGE

Table des matières détaillée

WORKSHOP NOUVELLES TECHNOLOGIES ET PATRIMOINES CULTURELS, ENTRE PROJETS REVÉS ET RÉALITÉS DU TERRAIN

Archivage à long terme des données de la recherche scientifique

La gestion des documents administratifs à la Bibliothèque nationale de France

Data Governance et. Optim / FileNet. La synergie entre le structuré et le non structuré IBM Corporation

DEMANDE D INFORMATION RFI (Request for information)

Fiche technique: Archivage Symantec Enterprise Vault for Microsoft Exchange Stocker, gérer et rechercher les informations stratégiques de l'entreprise

Problématiques de stockage d un Data Center

Gérer ses références bibliographiques avec Zotero

Mise à jour de STAR par formulaires (Cycle mise à jour) Version :

Forge. Présentation ( )

Guide du doctorant ( )

La maîtrise du cycle de vie du document numérique

Système d archivage électronique (SAE) des exigences et des spécifications qui tiennent compte d un environnement [GED-SAE(PAE)-PGA]

Les archives de l entreprise à l ère du numérique. Présentée par: HAMMA Mustapha

Formats de fichiers adaptés à l'archivage électronique à moyen et long terme

Enseignement Informatique. Classe de Bac Pro SAPAT

We Generate. You Lead.

TYPO3 et la GED 30/06/2010. TYPO3 Summer University 2010 Annecy. photogl - Fotolia.com

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

How to Login to Career Page

UN RETOUR D EXPERIENCE SUR LA STRATEGIE D EVOLUTION DU SYSTEME D ARCHIVAGE STAF (Service d Archivage et de Transfert de Fichiers).

Concepts et systèmes de stockage

Avantages de l'archivage des s

Présentation du cadre technique de mise en œuvre d un Service d Archivage Electronique

ISTEX, vers des services innovants d accès à la connaissance

La conservation à long terme de contenus numériques

Prise en main. Norton Ghost Pour trouver des informations supplémentaires. A propos de Norton Ghost

PÉRENNITÉ ET CONSERVATION DES ACTES DE L'ÉTAT CIVIL

Nos secteurs d activité :

Dématérialisation et travail collaboratif

Système de Stockage Sécurisé et Distribué

Remerciements. de Nantes et Corvinus University of Budapest (Hongrie), d avoir accepté de rapporter cette thèse

Fiche technique: Archivage Symantec Enterprise Vault Stocker, gérer et rechercher les informations stratégiques de l'entreprise

OFFRES DE SERVICES SDS CONSULTING

La sécurité IT - Une précaution vitale pour votre entreprise

Etapes de création d une revue électronique

CIMAIL SOLUTION: EASYFOLDER SAE

CATALOGUE DE LA GAMME EASYFOLDER OFFRE GESTION DE CONTENUS NUMERIQUES

Le standard d'échange de données pour l'archivage (SEDA)

ATELIERS DE FORMATION TECHNICIEN DE MAINTENANCE INFORMATIQUE

CCSDS Historical Document

Formation «Système de gestion des documents d activité (SGDA)»

La postproduction Pearson France Canon EOS 70D Philippe Garcia

Bonne gouvernance des documents électroniques dans l'administration

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

Pilote plate-forme archivage électronique CCTP version validée CAHIER DES CHARGES

Prestations de conseil en SRM (Storage Ressource Management)

Mendeley, pour gérer sa bibliographie et la partager. Patricia Volland-Nail

Archivage électronique Un nouveau domaine d'expertise au service de la gouvernance des systèmes d'information

CA ARCserve Backup. Avantages. Vue d'ensemble. Pourquoi choisir CA

ACCOMPAGNER - Gestion de projet - Maintenance fonctionnelle - Méthodologie et bonnes pratiques - Reprise du réseau informatique


Guide d'installation rapide TFM-560X YO.13

CONSTRUISEZ VOTRE INFRASTRUCTURE BIG DATA

Guide des Fichiers PST: Pourquoi la Gestion des PST Rapporte a Votre Enterprise

Jean-Marc Rietsch, PCI DSS Roadshow Paris juillet

Les systèmes CDMS. et les logiciels EDC

Entreprises Solutions

Fiche technique: Archivage Symantec Enterprise Vault Stocker, gérer et rechercher les informations stratégiques de l'entreprise

L ARCHIVAGE LEGAL : CE QU IL FAUT SAVOIR

Transcription:

La Documentation électronique Plan -> Plan des cours : = 3 séances Définitions Production Formats La trouver Spécificités Sources Moteurs Bibliothèque numérique Définitions Métadonnées Archivage pérenne -> 1) Documentation électronique Définitions Production Formats de fichier Spécificités mathématiques: LaTeX, mathml La trouver? Sources Moteurs de recherche 2) Bibliothèque numérique Définitions Métadonnées Technique 3) L'archivage pérenne ou conservation numérique 1

La documentation électronique Conservation numérique (Digital preservation) 2

Contexte Des siècles d'expérience dans la conservation des collections sur papier -> Extrême jeunesse des collections numériques Malaise sur l'évolution des rôles Volatilité de l'information en ligne 3

Définition, exemples Collection numérique: -> Ensemble de documents (fichiers) associé à des métadonnées généralement rangées dans une base de données Exemples : Gallica, NUMDAM, ArXiv, HAL JSTOR, Springer Link, etc. Les problèmes de préservation sont les mêmes pour les éditeurs commerciaux que pour les bibliothèques numériques et archives ouvertes. Voir la vidéo de kopal 4

petit rappel utile "Un document numérique n'est pas accessible à un utilisateur humain" [1] De nombreux intermédiaires -> Support Lecteur Système d'exploitation Logiciel applicatif Périphériques Mode d'emploi (réseau) Mais, de fait il est souvent plus accessible à un instant T qu'un document papier 5

Les risques connus Pannes : Panne support (media failure) : -> impossibilité de lire le support physique (disque, CD, DVD ) Panne machine (hardware failure): Panne de la machine sur la quelle réside la collection Panne logicielle (software failure) Bugs potentiels dans le logiciel de consultation de la collection 6

Les risques connus Obsolescences : -> Des supports et matériels (media and hardware) : tout support et tout matériel devient obsolescent. Risque de non communication entre différents composants d'un système (bandes DAT, DLT ) Des logiciels (software) : impossibilité de décoder l'information, formats de fichiers, compatibilité des versions, mise à jour logicielle 7

Les risques connus naturels : -> Incendie, tremblement de terre, inondation Erreurs humaines : sur la collection numérique, sur le système ou les applications sous-jacentes Attaques informatiques 8

Les risques connus Problèmes économiques et organisationnels: -> Impossibilité de maintenir le système: personnels, coûts de fonctionnement.. "restructuration" de l'entreprise ou équipe 9

Les remèdes aux risques Réplication : -> Copie sans perte d'information: Sauvegardes classiques Sauvegardes déportées Miroirs Copies sélectives : LOCKSS (chaque participant archive ce qui l'intéresse) 10

Les remèdes aux risques Migration : -> Des supports : bandes DAT à DLT, de CD à DVD Des formats de fichier: si un format devient obsolète, passer tous les fichiers de ce format à un autre plus récent. Des versions du système et des logiciels 11

Les remèdes aux risques Transparence : -> Il n'existe pas de "format pérenne", mais Formats largement utilisés (open source ou spécifications connues) Il n'existe pas de "logiciel pérenne", mais Logiciels open source et largement utilisés 12

Les remèdes aux risques Diversité : -> Des supports Des formats de fichiers (tiff, pdf, source ) Géographique Des versions (ne pas être trop lié à telle ou telle version du système ou du logiciel) Economique 13

Les remèdes aux risques Audit (vérification que cela marche encore!) : -> Système consulté fréquemment : commentaires des utilisateurs Système de préservation : peu utilisé, doit avoir des procédures de vérification Audit lors de procédures de réplication ou d'ingestion dans d'autres systèmes 14

un remède théorique L'émulation -> Conserver le document "original" et tout ce qui est nécessaire à sa visualisation (support, applicatif, système ) Mais l'émulateur doit lui-même être migré 15

système d'archivage "pérenne" OAIS : un modèle Système différent de la réplication -> Les "objets numériques" sont insérés avec (une partie de) leur contexte Une base théorique pour les ébauches de systèmes actuels. 16

système d'archivage "pérenne" AIP Archival Information Package Paquet d'archivage -> SIP Submission information package Paquet de versement DIP Diffusion Information Package Paquet de diffusion 17

système d'archivage "pérenne" -> 18

Métadonnées pour l'archivage METS :metadata encoding and transmission standard Une implémentation de référence pour OAIS. Un "objet METS" va comprendre la ressource numérique et les métadonnées de structure, administratives et descriptives -> appréhender le contenu, identifier, échanger techniques : conservation, restitution gestion des droits : contrôle de l accès, de l usage fichiers composant le document, relation physique et logique entre ces fichiers Programmes nécessaires 19

Quelques projets et systèmes Distinguons les "archives" destinées à la consultation quotidienne, (JSTOR, NUMDAM ) des systèmes d'archivage à plus long terme. Notons que certains logiciels de gestion d'entrepôt de document sont basés sur le modèle OAIS (D-Space, Fedora) -> 20

Quelques projets et systèmes LOCKSS (lots of copies keep stuff safe) : un super système de réplication. LOCKSS is open source software designed to ensure that important scholarly assets remain available in a distributed, self-repairing, robust, digital preservation system. We work with libraries and electronic publishers to preserve materials published online for long term access. Entre bibliothèques et éditeurs Entre bibliothèques et bibliothèques -> 21

Quelques projets et systèmes LOCKSS - idées de base : -> La menace majeure pour la conservation numérique est économique: personne n'a suffisamment de fonds pour mettre en place l'archive parfaite Archive vivante // archive sombre (dark archive) Le contenu est obtenu par des moteurs de recherche (pull // push). Un système "d'audit" intégré assure la cohérence. Des bibliothèques qui veulent préserver le même contenu peuvent coopérer 22

Quelques projets et systèmes Portico : -> To preserve scholarly literature published in electronic form and to ensure that these materials remain available to future generations of scholars, researchers, and students. Orienté préservation à long terme Editeurs et "non profit organisations" Orienté journaux scientifiques Conservation et conversion de fichiers sources Méthodologie de préservation: migration Format d archive basé sur Journal Archiving and Interchange DTD Contient (Oct 2008) 8,151,142 articles 60 éditeurs participants 7,967 titres 469 bibliothèques participantes 23

Quelques projets et systèmes Kopal (Kooperativer Aufbau eines Langzeitarchivs digitaler Informationen : Constitution Coopérative d'archives d'informations numériques à long terme) : -> Soutenu par le ministère de l éducation et de la recherche. système d'archivage pérenne à long terme pour des données électroniques. basée sur DIAS (Digital Information and Archiving System : Information Numérique et Système d'archivage) développé conjointement par IBM et la Bibliothèque Nationale des Pays-Bas à La Hague. Utilise OAIS et METS Partenaires actuels: Deutsche Bibliothek et SUB Göttingen 24

-> 25

Kopal: chiffres Début en Août 2006 Traitement de 40.000 thèses Tout est correctement entré dans DIAS -> Le logiciel kolibri (kopal Library for Retrieval and Ingest) fonctionne selon les spécifications Collections à venir : Journaux électroniques de Springer Echantillons de CD-ROMs et DVD (image ISO) Echantillons de documents numérisés de la collection DNB La DNB utilise maintenant kopal en phase de production. 26

Quelques projets et systèmes Et en France? Groupes de travail : -> Le groupe de travail PIN (pérennisation de l'information numérique) a été créé en 2000 à l'occasion de la diffusion en France de la norme OAIS. Il regroupe des représentants de grandes institutions publiques (CNES, BnF, CEA, etc.) et d'entreprises qui mettent en commun leurs réflexions et leurs expérimentations concernant l'archivage de données scientifiques, patrimoniales ou opérationnelles. PIN s'efforce de développer une culture commune aux différents acteurs de l'archivage. LE COST (Comité scientifique et technique du Comité stratégique interétablissements pour la plate forme nationale d archives ouvertes ) a formé un groupe de travail sur cette question La plateforme PAC (Plateforme d Archivage au CINES), développé au CINES (Centre Informatique National de l Enseignement Supérieur) SPAR = système de préservation et d archivage réparti (projet de la BnF) Devrait être opérationel en 2010 Page officielle à la BnF http://www.bnf.fr/pages/infopro/numerisation/num_spar.htm 27

Quelques projets et systèmes La plateforme PAC Le système PAC a été conçu comme un ensemble de trois serveurs logiques, s inspirant du modèle proposé par la norme ISO 14721 (OAIS). -> un serveur de versement où le producteur des document pourra transmettre ses archives. un serveur de stockage où sont conservés les documents un serveur d accès où le producteur et les service demandeurs autorisés à consulter ses archives pourront rechercher et obtenir une archive. 28

Quelques projets et systèmes Système PAC -> Prise de contact Établissement d'un protocole de transfert (identification des informations à pérenniser, volumétrie et formats choisis ) Transfert par réseau ou sur support amovible Contrôles Transfert sur serveur de stockage, renvoi d'un identifiant de l'archive La communication (récupération) se fera via le serveur d accès. 29

Quelques projets et systèmes Système PAC Utilisateurs : -> Système STAR (ABES) Bibliothèque numérique PERSEE (sciences sociales) Documentation http://www.cines.fr/spip.php?rubrique152 30

citations en conclusion Chris Rusbridge, directeur du "digital curation centre" (UK) : -> Preservation is expensive, but we are used to it and accept it as part of the cost of cultured and educated life. Make your dispositions on the timescale you can foresee and for which you have funding. Preserve your objects to the best of your ability, and hand them on to your successor in good order after your lap of the relay. Il est difficile de projeter dans le futur la situation technologique actuelle. 31

Références -> 1. Rossi, Christian.- De la diffusion à la conservation des documents numériques. Cahiers GUTenberg (n 49) http://www.gutenberg.eu.org/publications/cahiers/r46- cahiers49/222-rossi.html 2. Rosenthal D.S et al.- Requirements for Digital Preservation Systems : a bottom up approach. http://www.dlib.org/dlib/november05/rosenthal/11rosenthal. html 3. Didacticiel, Gestion des la conservation des collections numériques : stratégies à court terme pour contrer des problèmes à long terme http://www.library.cornell.edu/iris/tutorial/dpmfrench/index.html 4. Rusbridge, Chris.- Excuse Me... Some Digital Preservation Fallacies? http://www.ariadne.ac.uk/issue46/rusbridge/ 32

Références (liens) OAIS : http://vds.cnes.fr/pin/documents/projet_norme_oais_version_franc aise.pdf -> LOCKSS : http://www.lockss.org/lockss/home Portico : http://www.portico.org/ Kopal : http://kopal.langzeitarchivierung.de/index.php.en Vidéo d'explication : http://kopal.langzeitarchivierung.de/downloads/kopal_d emonstrator_en.swf PIN : http://vds.cnes.fr/pin/ COST : http://www.revues.org/cost/index.php?title=gr4_- _Archivage_p%C3%A9renne&redirect=no PAC : http://www.cines.fr/spip.php?rubrique152 SPAR : http://www.bnf.fr/pages/infopro/numerisation/num_spar.htm 33