Les répertoires de formats



Documents pareils
L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) JRES Novembre 2007

Conférence EDIFICAS. Le document électronique et sa valeur probante

Université de Lausanne

Formats de fichiers adaptés à l'archivage électronique à moyen et long terme

Un outil open source de gestion de bibliographies

Description de Produit Logiciel. AMI News Monitor v2.0. SPD-AMINM-10 v1.0

Pré-requis techniques. Yourcegid Secteur Public On Demand Channel

Présentation générale du projet data.bnf.fr

LIVRE BLANC «LA GESTION, CONVERSION, IMPRESSION, PUBLICATION ET DISTRIBUTION DOCUMENTAIRE SAP» SAP DMS SAP PLM

Informatique. Les réponses doivent être données en cochant les cases sur la dernière feuille du sujet, intitulée feuille de réponse

Manuel Utilisateur Version 1.6 Décembre 2001

WORKSHOP NOUVELLES TECHNOLOGIES ET PATRIMOINES CULTURELS, ENTRE PROJETS REVÉS ET RÉALITÉS DU TERRAIN

Logiciel de Gestion Electronique de Dossiers

Adobe Acrobat & le format PDF

Créer un fichier PDF/A DÉPÔT ÉLECTRONIQUE

Pré-requis techniques

TP Sauvegarde et restauration avec le logiciel Cobian Backup. Etape 1 :

ELO Office / Pro Les avantages : Archivage et gestion documentaire

Système global d Output Management

Cahier des charges. «Application Internet pour le portail web i2n» Direction du Développement numérique du Territoire

Vos outils CNED COPIES EN LIGNE GUIDE DE PRISE EN MAIN DU CORRECTEUR. 8 CODA GA WB 01 13

Plateforme de capture et d analyse de sites Web AspirWeb

LA SAUVEGARDE DES DONNEES SUR LES ORDINATEURS PERSONNELS

Guide d utilisation WEBPORTAL CPEM Portail d Applications Web CPEM

Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License,

UTILISATION DU LIVRE NUMÉRIQUE

Cette solution s adresse aussi bien aux PME/PMI qu aux grands groupes, qu ils disposent ou non d une structure de veille dédiée.

PaPyRuS. Le nouveau reporting bancaire électronique

La conservation à long terme de contenus numériques

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype

OUTILS DE TRANSFERT DE FICHIER VERS LISEUSES ET IPAD

Le fonctionnement d un service d archives en entreprise. Le Service national des archives

Votre solution professionnelle Open Source pour archiver, trouver, gérer, partager... tous vos fichiers multimédia!

SnapMusic Studio 715 Guide d Installation

Gestion des s par ELO

Mode d emploi pour lire des livres numériques

Constituer et gérer une bibliographie avec le logiciel zotero. Support de cours et liens utiles

Vademecum. Solutions numériques

L externalisation de vos logiciels entreprises : une solution aux problèmes de coûts, de sécurités et de réactivités

Ces logiciels sont essentiels pour vous

Générer un PDF avec polices incorporées

Jean-Marc Rietsch, PCI DSS Roadshow Paris juillet

Un serveur d'archivage

QUI SOMMES-NOUS? Cette solution s adresse aussi bien aux PME/PMI qu aux grands groupes, disposant ou non d une structure de veille dédiée.

Optimisez la gestion de l information dans votre entreprise

Présentation du service «photothèque-and-co» annuaire professionnel. base de données

MANUEL D INSTALLATION DES PRE REQUIS TECHNIQUES SALLE DES MARCHES V.7

Extensions, Documentation, Tutoriels, Astuces

PrintShop Mail Logiciel de mailing professionnel pour Macintosh et Windows

Logiciels libres de Bibliothèques numériques : présentation. Castore & Greenstone. Les autres : CDS Invenio, EPRINTS, Dspace.

SIMPLIFIEZ-VOUS LE FAX GRÂCE AU CLOUD

MODE D'EMPLOI. La gestion des versions permettra de compléter et de faire évoluer les fiches dans le temps. NOM DE LA RESSOURCE CONTACT FOURNISSEUR

Table des matières détaillée

Les solutions mobiles et Cloud au service de votre productivité

Bibliothèque numérique

Les types de fichiers

Tutoriel : Ecrire un article sur le site de la TEAM GSAS

ZOTERO. (Outil de gestion de références bibliographiques) Guide d'utilisation

Sage 50 Version Gestion commerciale

Gérez efficacement vos mails avec Outlook 2013

AssetCenter Notes de version

Tutoriel Adobe Acrobat Pro (version 9.0.0) Créer les fichiers PDF de la thèse. Service Commun de la Documentation Service des thèses

Évaluation des logiciels et autres réalisations

Manuel d Utilisation Nouvelle Plateforme CYBERLIBRIS : ScholarVox Management

VOLUME I ETUDES DE CAS RELATIFS A DES PROJETS DE PASSATION ELECTRONIQUE DE MARCHES PUBLICS

ORDINATEUR DOSSIERS FICHIERS

Logiciel et format de fichiers

LOGICIELS DE RÉFÉRENCES BIBLIOGRAPHIQUES CHOISIR LE BON OUTIL

Le génie logiciel. maintenance de logiciels.

Authentification à deux facteurs Cryptage portable gratuit des lecteurs USB Cryptage du disque dur

Liseuses et tablettes électroniques

Foire aux questions sur Christie Brio

Cours: Administration d'une Base de Données

Sessions en ligne - QuestionPoint

CATALOGUE DE LA GAMME EASYFOLDER OFFRE GESTION DE CONTENUS NUMERIQUES

Travaux pratiques. avec. WordPress. Karine Warbesson

Premiers pas avec VMware Fusion. VMware Fusion pour Mac OS X

Annexe : La Programmation Informatique

Service de lettre électronique sécurisée de bpost. Spécificités techniques

TP sauvegarde et restauration avec le logiciel Cobian Backup

SMARTPHONES ET VIE PRIVÉE

ITIL V2 Processus : La Gestion des Configurations

MailStore Server 7 Caractéristiques techniques

Win UR Archive. Manuel de l utilisateur. Version 3.0, mars 2009

LECTURE DES FICHIERS DE FACTURES

2. Pour accéder au Prêt numérique, écrivez dans la barre d adresse de votre navigateur Web.

Constat ERP 20% ECM 80% ERP (Enterprise Resource Planning) = PGI (Progiciel de Gestion Intégré)

L art de la différence!

Domaine D1 : Travailler dans un environnement numérique évolutif

Les enjeux du stockage de masse sur bande vidéo

Bibliothèque Numérique de l INSA de Toulouse Mode d emploi des livres électroniques NUMILOG

Cours Informatique 1. Monsieur SADOUNI Salheddine

Optimisez vos échanges avec vos clients. RF-CLOUD, l espace d échanges et de stockage sécurisés de vos documents professionnels!

Transcription:

Les répertoires de formats Etat de l art Réunion du groupe PIN 25/01/2006 Emmanuelle Bermès - emmanuelle.bermes@bnf.fr Bibliothèque nationale de France Département de la bibliothèque numérique PLAN Introduction questions sur les formats caractéristiques des répertoires de formats Le répertoire des MIME media types Divers répertoires existants OCLC Inform methodology L initiative de la Library of Congress GDFR Pronom Conclusion comparatif actions? 1

Questions sur les formats PRODUCTION Sélection j ai un contenu, dans quel format le représenter? Identification j ai un objet numérique, dans quel format est-il? Validation J ai un objet numérique censé être en format X, est-ce exact? Caractérisation J ai un objet au format X, quelles sont ses propriétés? Evaluation J ai un objet au format X avec des propriétés Y, quel est le risque d obsolescence? Traitement j ai un objet au format X avec des propriétés Y, comment réaliser l opération Z sur ce format? INGEST PRESERVATION Caractéristiques d un répertoire de formats Etre ouvert, accessible, interopérable (gestion de droits pour les spécifications devant rester secrètes) Savoir gérer les niveaux de granularité de description de format (format + version + caractéristiques) et les relations (format dépendant, format associé) Inclusive ou self-descriptive c est à dire contenir toutes les données nécessaires pour fonctionner indépendamment d autres ressources 2

Caractéristiques d un répertoire de formats Actionnable par machine : disposer d outils qui l interrogent de manière automatisée Digne de confiance : être sous la responsabilité d un organisme neutre et reconnu être respectueux des informations propriétaires Objectivité : ne pas mêler des évaluations de pérennité aux informations factuelles et aux spécifications Caractéristiques d un répertoire de formats Informations à rassembler concernant un format : Noms canoniques et variantes PDF, Adobe PDF, Portable Document Format Signatures internes et externes.pdf, magic number spécifications http://partners.adobe.com/public/developer/en/pdf/pdfreference16.pdf Auteurs, titulaires de droits, maintenance Société Adobe classifications et relations PDF <has subtype> PDF 1.4, PDF/A, PDF/X systèmes, services et outils Adobe Acrobat Reader... 3

Le répertoire des MIMETYPE Maintenu par l IANA (http://www.iana.org/assignments/mediatypes/) Insuffisant pour la préservation se contente d énoncer des types de format image/tiff et non TIFF V.6 ne donne pas de moyen d énoncer les caractéristiques image/tiff et non TIFF V.6 non compressé profondeur 24 bits ne donne pas toujours les spécifications des formats pas d outils de validation ni d évaluation Divers répertoires existants NSRL/NIST Reference Data Set (http://www.nsrl.nist.gov/) par le département de la justice américain (objectif = lutte contre le piratage ) base de données de référence pour l identification des formats (signature) mais pas de spécifications diffusion sous forme de CD à 90$ par an Wotsit (http://www.wotsit.org/) à destination des programmeurs classement par types (texte, image etc.) spécifications disponibles en lien ou en téléchargement 918 formats décrits 4

OCLC Inform methodology Le but est de donner des indicateurs pour évaluer la «préservabilité» d un format. gestion des risques propriétés du format fonctionnalités du format utilisation de notes de 1 à 5 combinant probabilité et impact méthodologie de notation et politique d action Cf : Assessing the Durability of Formats in a Digital Preservation Environment, The INFORM Methodology par Andreas Stanescu, Dlib Magazine, novembre 2004 : http://www.dlib.org/dlib/november04/stanescu/11stanescu.html L initiative Library of Congress Un site web à but informatif : http://www.digitalpreservation.gov/formats Informations, publications, ressources Facteurs de longévité pour évaluer les formats Description de formats classées par type (texte, image, audio, video) 5

L initiative Library of Congress Les facteurs d évaluation : ouverture (disponibilité des specs) adoption (étendue de l utilisation par des acteurs diversifiés) transparence (simplicité du codage, sens de lecture, absence de cryptage ou de compression, éventuellement lecture humaine) formats auto-documentés (inclusion de métadonnées) indépendance technique (hardware, software, inclut par ex. des périphériques spécifiques) impact des brevets logiciels présence ou possibilité de mettre en œuvre des mesures de protection techniques (profil d application du format) L initiative Library of Congress Le contenu des descriptions de formats identification du format et ses émanations, relations «local use» usage à la LoC fiche descriptive reprenant les critères d évaluation précités éléments d identification (signature) liens vers les spécifications du format 6

GDFR Global Digital Format Registry (http://hul.harvard.edu/gdfr/) Une initiative internationale pour créer une fédération de répertoires de formats Objectifs : fournir des identifiants uniques pour identifier les formats fournir la documentation utile sur ces formats Mise en place d un modèle de données et d un modèle de service Les points forts : GDFR un ou plusieurs identifiants dont l un est déterminé comme «canonique» relations entre les formats liens externes permettant de fédérer plusieurs répertoires copie locale des spécifications organisme de gouvernance Vient de recevoir un financement de 2 ans de la Mellon Foundation 7

GDFR, JHOVE et FRED Un outil développé par Harvard et Jstor : JHOVE http://hul.harvard.edu/jhove/ est une application des principes de GDFR notamment identification validation caractérisation ajouts de formats sous forme de modules plug-in (pas relié à un répertoire) logiciel libre GNU GPL Et un prototype de démonstration : FRED Pronom Archives nationales UK (http://www.nationalarchives.gov.uk/pronom) Une base de données environ 550 formats modèle de données aligné avec GDFR informations sur les formats : description et relations documentation (référence) information d identification (signatures) compression, encodage de caractères droits identifiant unique PUID invitation à soumettre de nouveaux formats 8

Pronom Un outil : DROID http://www.nationalarchives.gov.uk/aboutapps/pronom/droid.htm identification automatique des formats utilise les signatures internes et externes référencées dans la base Pronom Mais beaucoup de formats sont justes signalés et pas décrits les spécifications sont externes (= problème pour la préservation) Comparatif des initiatives Sélection Identification Validation Caractérisation Evaluation Traitement IANA Non Oui Non Non Non non RDS Non Oui Oui Oui Non Non Wotsit Non Non Non Oui Non Oui OCLC Non Non Non Non Oui Non LOC Oui Oui Non Oui Oui Non GDFR Non Oui Oui Oui Non Oui Pronom Non Oui Oui Oui Non Non Phase de production Phase d ingest Phase de préservation 9

Que faire? Entrer dans Pronom? Dans GDFR? Utiliser les modèles fournis par GDFR pour créer un répertoire? De sélection? D identification? D évaluation? Plusieurs répertoires? Qui? Utiliser et adapter des outils «partiels» comme JHOVE?... Références complémentaires Stephen Abrams, conférence IPRES (sept. 2005), digital formats and preservation http://rdd.sub.uni-goettingen.de/conferences/ipres/programme Page concernant les formats sur le site de la BnF : http://bibnum.bnf.fr/conservation/formats.html GDFR, détail de la proposition d action http://hul.harvard.edu/gdfr/documents/proposal-2005-09-29.doc 10