La conservation du document numérique Pourquoi? Quoi? Comment?

Documents pareils
L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) JRES Novembre 2007

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007

ISTEX, vers des services innovants d accès à la connaissance

MODE D'EMPLOI. La gestion des versions permettra de compléter et de faire évoluer les fiches dans le temps. NOM DE LA RESSOURCE CONTACT FOURNISSEUR

Un serveur d'archivage

PROJET Site Drupal Informationsgeographiques.onema.fr

L archivage pérenne des documents numériques

Présentation du cadre technique de mise en œuvre d un Service d Archivage Electronique

Conférence EDIFICAS. Le document électronique et sa valeur probante

Glossaire. Arborescence : structure hiérarchisée et logique qui permet d organiser les données dans un système informatique.

Atelier 1. Portails documentaires : BioLib et Cemadoc

Maarch V1.4

Panorama des contenus

webmestre : conception de sites et administration de serveurs web 42 crédits Certificat professionnel CP09

Table des matières détaillée

Master Technologies numériques appliquées à l'histoire Deuxième année

Université de Lausanne

Gestion collaborative de documents

Tutoriel Adobe Acrobat Pro (version 9.0.0) Créer les fichiers PDF de la thèse. Service Commun de la Documentation Service des thèses

BTS Assistant de manager(s) LES FINALITES PROFESSIONNELLES

En savoir plus pour bâtir le Système d'information de votre Entreprise

PLATEFORME DE GESTION DE CONGRÈS SCIENTIFIQUES. 12 mars 2015

Ministère de la Culture et de la Communication

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015)

Magento. Magento. Réussir son site e-commerce. Réussir son site e-commerce BLANCHARD. Préface de Sébastien L e p e r s

Systèmes d Information (SI) Zohra Zelfani

Conservation des données à long terme

Archivage intermédiaire de données Scientifiques ISAAC Information Scientifique Archivée Au Cines

Présentation générale du projet data.bnf.fr

La mise en œuvre d'une gestion électronique des documents

Mise à jour de STAR par formulaires (Cycle mise à jour) Version :

FORUM DES USAGES COOPERATIFS PATRIMOINE, HISTOIRE ET MEMOIRE EN LIGNE

Sage CRM. 7.2 Guide de Portail Client

PLATEFORME DE GESTION DE CONGRÈS SCIENTIFIQUES. h tt p : / / w w w. s c i e n c e s c o n f. o rg

Archivage pérenne : les formats conformes Version :

PloneLabs un gestionnaire de contenu pour les laboratoires

Formats de fichiers adaptés à l'archivage électronique à moyen et long terme

PLATEFORME DE GESTION DE CONGRÈS SCIENTIFIQUES

RECOMMANDATION UIT-R SM (Question UIT-R 68/1)

Plan. Un modèle d organisation. Pour les Archives numériques. Présentation Groupe PIN. Claude HUC (CNES)

HAL, archives ouvertes. Christine Berthaud, CNRS/CCSD - Directrice

Alfresco et TYPO3 Présenté par Yannick Pavard dans le cadre des rencontres WebEducation Février 2008

Présentation des CMS au CIFOM-EAA

Rencontres ERFA Records Management

POLITIQUE ET PROCÉDURES DE GESTION DOCUMENTAIRE

L. Granjon, E. Le Goff, A. Millereux, L. Saligny MSH Dijon

Guide du doctorant ( )

PHP 5.4 Développez un site web dynamique et interactif

Infrastructure / réseau / sécurité /support utilisateur

GESTION DES BONS DE COMMANDE

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

Concepts et définitions

PROGRAMME DE FORMATION

Réseaux sociaux de chercheurs : quels enjeux et quelle politique pour une institution publique de recherche

Projet Gestion des Formats de Fichier

Alfresco Guide Utilisateur

Présentation aux entreprises du numérique

Présentation. Référenciel : textes officiels

Rédiger : le numérique dans la préparation de la thèse

E-book, aspects techniques

CATALOGUE DE LA GAMME EASYFOLDER OFFRE GESTION DE CONTENUS NUMERIQUES

Utilisation d'outils de WebMapping OpenSource dans une collectivité territoriale Communauté de Communes de l'agglomération Saint-Loise (CCASL)

FORMATION / CREATION DE SITE WEB / 4 JOURNEES Sessions Octobre 2006

4. Personnalisation du site web de la conférence

et Groupe Eyrolles, 2006, ISBN :

Pérennisation des Informations Numériques

Solution ing dédiée aux professionnels du marketing et de la communication

Bibliothèque numérique de l enssib

LemonLDAP::NG / SAML2. Xavier GUIMARD (Gendarmerie Nationale) Clément OUDOT (Groupe LINAGORA)

FORMULAIRE DE SOUMISSION DU PROJET PORTÉ DANS LE CADRE DU SYSTÈME D'ARCHIVAGE ÉLECTRONIQUE MUTUALISÉ (SAEM)

Extensions, Documentation, Tutoriels, Astuces

Sommaire. -1-Computer en bref. Web en bref. Le web 3.0,...la mobilité. Evolution du Web web1.0, web2.0, web2.b, web3.0...

Prix de l'innovation financière 2013

CAHIER DES CLAUSES TECHNIQUES PARTICULIERES

La documentation, l archivage et la dissémination des micros-données au Sénégal NIANG Mamadou OBJECTIFS

Enseignement Informatique. Classe de Bac Pro SAPAT

Archivage numérique pérenne

Domaine 1 : S approprier un environnement informatique de travail. Domaine 3 : Créer, produire, traiter et exploiter des données.

Cadre National d'acceptation de la Dématérialisation dans le Secteur Public Local

Pelleas : Le projet XML pour le systeme d information documentaire du polytechnicum de Marne- la Vallée

Les items explicités. Pistes de justifications de demandes en cours de français-histoire-géographie. Guillaume HAINAUT

BREVE PRESENTATION DU SERVICE «EDITEURS ACADEMIQUES ENLIGNE» ELISABETH DE PABLO (MSH- ESCOM, 1997)

ContactOffice. Le Bureau Virtuel des ENT

Septembre 2012 Document rédigé avec epsilonwriter

La conservation à long terme de contenus numériques

OpenERP, un progiciel de gestion intégré pour entreprise, distribué sous licence libre (GPL), qui répond de manière efficace à la complexité et aux

Gestion de contenu d un site web avec TYPO3 Manuel de l administrateur

EXCHANGE 2010 VS ARCHIVAGE

Plan de formation Personnel de l UCE

Présentation des licences exclusives

Qlik Sense Cloud. Qlik Sense Copyright QlikTech International AB. Tous droits réservés.

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

Webinaires Recette de cuisine : transmission en direct des séminaires Aristote et autres événements

Une organisation internationale au cœur des enjeux de contenus et d accès à l information scientifique: L IFLA

Formation Administrateur de Données Localisées (Prodige V3.2) Recherche et consultation des métadonnées

Technologies du Web. Créer et héberger un site Web. Pierre Senellart. Page 1 / 26 Licence de droits d usage

«Vous éditez, nous archivons!»

Guide utilisateur Archivage intermédiaire Messagerie. Enterprise Connect pour Outlook 2010 EC V 1.0

Transcription:

La conservation du document numérique Pourquoi? Quoi? Comment? L'exemple du centre de ressources numériques TELMA 10 mai 2006 Réunion du groupe PIN, gpoupeau@enc.sorbonne.fr

Comment en est-on arrivé à la question de la conservation du document numérique?

Une politique d'édition électronique THELEME, techniques pour l'historien en ligne, Etudes, Manuels et exercices. Manuel en ligne de sciences auxliaires de l'histoire, http://theleme.enc.sorbonne.fr 3

Une politique d'édition électronique ELEC,Éditions en ligne de l'école des chartes, http://elec.enc.sorbonne.fr 8

Intérêt de l'édition électronique sur le Web Faire connaître et partager les compétences de l'établissement Vecteur de diffusion sans précédent Moyens logistiques limités par rapport à la publication papier Souplesse éditoriale Accès libre et gratuit aux données de la recherche 13

Trois points fondamentaux Utilisation des logiciels libres Coût économique indépendance par rapport à un éditeur Utilisation formats ouverts et libres Accessibilité au sens large Interface graphique privilégiant l'adaptation de l'information historique existante URL pérenne, visible, courte et significative Respect des normes WAI Utilisation des standards ouverts et libres 14

Appel à projet de la DIS du CNRS Appel à projet lancé en 2005 par la direction de l'information scientifique du CNRS Identification de pôles de compétence dans la mise en ligne de l'information scientifique Mise en place de centres de ressources numériques : Fédérer et accompagner les initiatives dans le domaine de la création, gestion et diffusion de l'information scientifique Harmonisation des standards et des moyens Valorisation de la mise en place de bases de données ou d'outils pour la carrière d'un chercheur Plusieurs domaines des SHS concernés. Projet commun ENC et IRHT pour les sources historiques non imprimées : TELMA 15

Missions de TELMA Mettre en place une plate-forme technique pour accueillir, gérer, conserver et diffuser les données accueillies par le centre. Devenir un relais d'information et de soutien technique pour la communauté des chercheurs en histoire dans le domaine du traitement numérique de l'information scientifique Devenir un intermédiaire entre la communauté des chercheurs et les institutions de conservation, en particulier leurs tutelles pour mener des actions de numérisation partagées Assurer une veille technologique et représenter la communauté des chercheurs en histoire dans les organismes de normalisation comme le TEI consortium 16

Le modèle OAIS : une solution pour le centre OAIS : un modèle pour la conservation du document numérique OAIS : un modèle pour la gestion de l'information numérique «la conservation de l'information sous forme numérique est beaucoup plus complexe que la conservation de l'information sur supports papier ou film. Ceci n est pas seulement un problème pour les Archives traditionnelles, mais également pour de nombreux organismes qui, jusque-là, n avaient jamais eu conscience d'assurer une fonction d'archivage». p. 13 de la traduction française de la norme OAIS 17

Que doit-on conserver? 18

Caractéristiques de l'édition scientifique sur le Web Support unique de l'information sur le serveur de l'éditeur Données doivent pouvoir être encore exploitées dans 50 ou 100 ans Les données doivent être citables dans une bibliographie Les références doivent rester accessibles 19

La mission de l'éditeur scientifique Garantir l'accès à long terme aux ressources qu'il produit et met à disposition en ligne Pérennisation des fichiers à l'origine de la ressource en ligne QUESTION : Existe-t-il une différence entre le but poursuivi par un éditeur et par un bibliothécaire ou un archiviste? 20

Un exemple dans le contexte de l'édition papier La France au Moyen Âge, du Ve au XVe siècle Claude Gauvard Presses universitaires de France 21

Quatre éditions 22

Deux chartes graphiques différentes Édition de 1997 Dernière édition : 2004 23

L'évolution d'un document numérique Le contenu La charte graphique Le format de description des données A garder en tête, le support n'existe qu'à un seul endroit : le serveur 24

Évolution du contenu de la ressource Pour le papier : nouvelle édition Avantage de l'électronique : souplesse éditoriale, changement immédiat et à n'importe quel moment Question : Doit-on conserver les deux versions du fichier XML? 25

Modification de la charte graphique Pour le papier : nouvelle édition Évolution de la charte graphique Question : Dois-je donner un moyen de visualiser les deux versions? Est-ce-que cela entre dans le cadre de mes missions d'éditeur électronique? 26

Changement du format Migration des fichiers pour des raisons de cohérence éditoriale ou technique Les deux fichiers sont encore lisibles car ils sont tous les deux en XML mais ils n'utilisent pas la même grammaire Question : Doit-on conserver les deux versions du fichier XML? 27

Quelques réponses Question 1 : les différentes versions mais on donne accès à la dernière en indiquant la date de modification Question 2 : Le dépôt légal du Web Question 3 : il faudrait le conserver, mais pas l'éditeur. Qui? l'imec? les Archives nationales? 28

Comment allons-nous mettre en place notre archive OAIS? 29

Un inventaire à la Prévert PREMIS LOCKSS OAIS XFDU MPEG 21 SCORM DIDL METS «Que diable allait-il faire dans cette galère?», Géronte, dans les Fourberies de Scapin, Molière. 30

Des solutions intégrées LOCKSS ADORE DSpace Aucune solution ne répond parfaitement à l'ensemble des besoins et à leurs spécificités. 31

La stratégie de déploiement Mise en place de l'application pour permettre aux utilisateurs d'accéder aux données. OAIS ---> Entité «Accès» et gestion du DIP Définition du paquet de versement OAIS ---> Entités «Entrée» «Stockage» et gestion du SIP Mise en place de l'application de gestion des données OAIS ---> Entités «Gestion des données» et gestion de l'aio De façon continue, veille et documentation OAIS ---> Entité «Administration» «Planification de la pérennisation» 32

Le paquet de versement SIP Politique drastique dans les formats acceptés Migration en amont si besoin plutôt que gestion d'un format non maîtrisé dans l'archive XML pour les données XSL, XSL-FO, Xquery pour le traitement CSS pour la mise en page HTML TIFF et JPG pour les images numérisées PNG ou JPG, éventuellement GIF pour les images du graphisme Un fichier de métadonnées au format METS incluant des métadonnées descriptives au format Dublin Core et ONIX et des métadonnées administratives au format PREMIS 33

Dépôt des paquets de versement Support physique Serveur FTP sécurisé Entrepôt OAI avec norme OLAC pour compléter les métadonnées Dublin Core 34

Du SIP à l'aip Conformité avec procédure vérifiée Métadonnées complétées Migration des données si besoin 35

Le paquet d'archivage - AIP Virtualisation du stockage Attribution d'un identifiant pérenne à chaque fichier Stockage des données en interne dans un premier temps Volonté d'externaliser. IN2P3? CINES? Nous étudierons toutes les propositions! Toutes les données stockées sur des serveurs de stockage sauf le fichier METS indexé dans une base de données XML 36

Le paquet de diffusion - DIP Le paquet diffère selon la nature de la requête un fichier XML conservé + un fichier XSL ou XSL-FO + images Dans le cas d'une requête sur la base de données XML : un fichier XML généré dynamiquement correspondant à la réponse + XSL + images Les ressources générées ne sont pas conservées Indépendance du contenu de la mise en forme finale 37

L'entité «Accès». Requête 1 Demande d'un utilisateur pour afficher tout ou partie d'un corpus dans les formats HTML, texte ou PDF Deux arguments obligatoires Le nom du corpus le nom de la division de l'information demandée ou unité structurelle Deux arguments optionnels le nom de l'ouvrage si plusieurs ouvrages dans un corpus L'identifiant de l'unité structurelle si plusieurs unités du même type dans l'ouvrage/corpus 38

Exemple Demande de l'utilisateur : afficher en HTML l'acte 105 du tome premier du Cartulaire des Vaux de Cernay faisant partie des cartulaires numérisés d'ile-de-france corpus : cartulaires ouvrage : vauxcernay1 unité structurelle : acte identifiant : 105 http://elec.enc.sorbonne.fr/cartulaires/vauxcernay1/acte105/ 39

L'entité «Accès» Requête 2 Interrogation de la base de données XML indexant l'ensemble des données conservées Interrogation par formulaire sur le site du centre Interrogation par Web services Deux types de requêtes Interrogation en texte intégral Interrogation sur critères 40

L'entité «Accès». Architecture logicielle Serveur Tomcat Framework Cocoon Maintenus par la fondation Apache Base de données XML : exist L'application n'est pas pérennisée et peut être changée à tout moment. 41

Gérer l'archive et les données sur le long terme Développement d'une application autour de la base de données XML Deux tâches principales Interrogation et mise à jour de la base de données Répondre aux requêtes Lister les fichiers et les modifications Mise à jour des informations Notification des modifications et génération des rapports Système de migration 42

État d'avancement actuel La définition des métadonnées de préservation en cours d'achèvement et de documentation ---> mise en place d'un METS Profile Système d'interrogation de la base de données XML par les utilisateurs terminé pour le texte intégral Système de d'affichage des unités structurelles à partir des informations du METS en cours 43

A bientôt sur nos sites Web Merci pour votre attention. 44