Référentiel de format de fichier image V1



Documents pareils
Sur trois couches, on obtient donc 2563 = de couleurs, soit 24bpp (Bit Per Pixel).

Chapitre 22 Optimisation pour diffusion à l'écran, pour le web

Cours de numérisation sur Epson Perfection

Analyse d images. Edmond.Boyer@imag.fr. Edmond Boyer UFRIMA 1

Traitement numérique de l'image. Raphaël Isdant

Hiver 2013 IMN 259. Introduction à l analyse d images. Par Pierre-Marc Jodoin

Projet Gestion des Formats de Fichier

Formats de fichiers adaptés à l'archivage électronique à moyen et long terme

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

Projet Matlab : un logiciel de cryptage

Cours d introduction à l informatique. Partie 2 : Comment écrire un algorithme? Qu est-ce qu une variable? Expressions et instructions

Usage des photos pour Internet et pour la presse

Plan d études. Traitement visuel 2D. Techniques d intégration multimédia HU. legault/2d/ 1-2-2

HMTL. Exemple de fichier HTML. Structure d un document HTML. Exemple de fichier HTML. Balises HTML. IFT1147 Programmation Serveur Web avec PHP

Gestion de la couleur dans l impression grand format

TD : Codage des images

Optimisation et formats d images standards pour le Web Par Thierry Goulet Web Designer, ministère de la Sécurité publique. Plan de conférence

JPEG, PNG, PDF, CMJN, HTML, Préparez-vous à communiquer!

Scanner laser HDS7000 Ultra rapide, à portée étendue

Comme chaque ligne de cache a 1024 bits. Le nombre de lignes de cache contenu dans chaque ensemble est:

ESPACE MULTIMEDIA DU CANTON DE ROCHESERVIERE

Formats d images. 1 Introduction

Scanner de film numérique

Avertissement. La Gestion Electronique de Documents

INFO 2 : Traitement des images

Outils permettant la diffusion de l information. Un point sur le droit numérique

Transfert de notices bibliographiques et d autorité en ligne depuis BnF catalogue général Mode d emploi complet

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) JRES Novembre 2007

Les répertoires de formats

Données documentaires Généralités : structure des données documentaires dans BCDI et règles de saisie à adopter

L espace de travail de Photoshop

Structure du format BMP, sa lecture, sa construction et son écriture

Comment optimiser dans ImageReady?

Les types de fichiers

Scanner de microfilms i7300. Des archives de

ARCHIVES DEPARTEMENTALES DU NORD

ES Enterprise Solutions

formats mytamedia.ch Maxi Skyscraper Dimensions en pixels 245 x 600 Poids max. en Ko 70 CPM CHF 85 CPM ROS CHF 75

GEDEXPERT. La Gestion Electronique de Documents spécialement conçue pour les Experts Comptables VOTRE NOUVEL ASSISTANT POUR

La Jubilothèque Du magasin à la Jubilothèque documents en ligne soit + de pages budget /an 0.7 ETP Pôle associé BnF

as Architecture des Systèmes d Information

ISO/IEC TR Première édition Numéro de référence ISO/IEC TR 90006:2013(F) ISO/IEC 2013

Présentation BAI -CITC

Formats 3D Critères d utilisation dans les échanges Frédéric CHAMBOLLE PSA Peugeot Citroën Direction des Systèmes d Information

Chapitre 3 : outil «Documents»

Notice de fonctionnement DVR H Méthode de Visionnage ESEENET

du marketing client Grand Prix stratégies Présentez vos meilleures réalisations Date limite de remise des dossiers : le 21 février e édition

GMG, des solutions pour la Gestion de la Couleur et l épreuvage

Formulaire de mise en candidature Éloizes 2016

Microscope numérique portable Celestron (HDM) Modèle nº Informations, spécifications et instructions

Dans l Unité 3, nous avons parlé de la

COPY. Picture Style Editor Ver. 1.4 MODE D EMPLOI. Logiciel de création de fichiers de style d image. Contenu de ce mode d emploi

A LA DÉCOUVERTE DE ZOTERO 4.0

Codage d information. Codage d information : -Définition-

TP Codage numérique des caractères. Un ordinateur ne manipule que des 0 et des 1 : Comment alors code-t-il du texte?

WORKSHOP NOUVELLES TECHNOLOGIES ET PATRIMOINES CULTURELS, ENTRE PROJETS REVÉS ET RÉALITÉS DU TERRAIN

PROGRAMME DES NATIONS UNIES POUR LE DEVELOPPEMENT

Environnement numérique : Données EXIF Stockage Archivage Partage Flux de production

ESPACE MULTIMEDIA DU CANTON DE ROCHESERVIERE

LUT QU EST-CE QUE C EST? Version 1.0 Mars 2010

Button Manager V2 Guide de l utilisateur

4D v12. Mise à jour Windows /Mac OS. 4D D SAS. Tous droits réservés.

TP SIN Traitement d image

Bibliothèque numérique de l enssib

Console de supervision en temps réel du réseau de capteurs sans fil Beanair

WinReporter Guide de démarrage rapide. Version 4

La postproduction Pearson France Canon EOS 70D Philippe Garcia

Utiliser le logiciel Photofiltre Sommaire

CONSERVATOIRE NATIONAL DES ARTS ET METIERS INSTITUT NATIONAL DES TECHNIQUES DE LA DOCUMENTATION

Installation de CPA STUDIO :

PRESENTATION DE LA PLATEFORME NUMERIQUE AGORASSAS Préparation en ligne au concours d accès à l ENM. IEJ «Pierre RAYNAUD» Université Panthéon-Assas

1S9 Balances des blancs

Présentation générale du projet data.bnf.fr

Algorithmique et Programmation, IMA

Préparation d un post (article) pour idweblogs

Audit SEO. I / Les Tranquilles d Oléron

CONTRAINTES TECHNIQUES

Rapport de certification

Mini projet n 1 DOSSIER DE CONCEPTION Clef USB

Informatique. Les réponses doivent être données en cochant les cases sur la dernière feuille du sujet, intitulée feuille de réponse

GEDEXPERT. La Gestion Electronique de Documents des PME PMI. VOTRE NOUVEL ASSISTANT pour. Pour partager l information au sein de l entreprise

I.R.I.S. et Sage Bob Software annoncent un accord de coopération stratégique et la disponibilité immédiate d IRISCapture for Line BOB

Partie 1. Professeur : Haouati Abdelali. CPGE Lycée Omar Ibn Lkhattab - Meknès haouaticpge@gmail.com

Aficio MP2001SP MP2501SP

CAHIER DES CHARGES ETIQUETTES MP06-EU (FORMAT ODETTE)

Dossier Technique. Détail des modifications apportées à GRR. Détail des modifications apportées à GRR Le 17/07/2008. Page 1/10

Introduction 2 Environnement de travail... 2 Rappels : les Fichiers «texte»... 2 Les Fichiers «binaire»... 2 Les métadonnées... 3

nom : Collège Ste Clotilde

كر اس الشروط الفني ة اخلاص ة

La gestion des documents administratifs à la Bibliothèque nationale de France

Documentation RBS Change E-Commerce Core

Tutoriel de FastStone Image Viewer

Dossier 03 Périphériques d acquisition

du marketing digital

1 Introduction au codage

Une passion, une formation, un métier... pour votre avenir

TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES

Aperture Premiers contacts

Transcription:

Référentiel de format de fichier image V1 Bibliothèque nationale de France direction des Services et des réseaux département de la Conservation service Numérisation Date :le mardi 2 décembre 2014 Version :1 Référence BnF :BnF-ADM-2014-071949-01

TABLE DES MATIERES 1. INTRODUCTION 3 1.1 CONTEXTE ET OBJECTIF 3 1.2 GESTION DE VERSION 3 2. DESCRIPTION DU FORMAT 4 2.1 FORMAT DE FICHIER 4 2.2 COMPRESSION 4 2.3 PROFIL COLORIMETRIQUE 4 2.4 RESOLUTION 4 2.5 NIVEAU DE QUALITE 5 2.6 ORDRE DE PROGRESSION 5 2.7 ROBUSTESSE DU CODE JPEG2000 5 3. OUTILS DE REFERENCE ET QUALIFICATION DU PROCEDE DE PRODUCTION 6 4. METADONNEES 7 4.1 METADONNEES DESCRIPTIVES 7 4.2 METADONNEES DE CREATION D IMAGE 8 4.3 METADONNEES D HISTORIQUE DE TRAITEMENT 8 Référentiel Livraison Page 2 sur 9

1. INTRODUCTION 1.1 Contexte et objectif Ce référentiel s inscrit dans les opérations de numérisation réalisées pour le compte de la BnF. Le présent référentiel définit les consignes à respecter pour création ou génération de fichier image issue de la numérisation de documents physiques ou d objet. Depuis les premiers programmes de numérisation en 1993, la BnF a fait le choix d utiliser le format TIFF V6. D abord utiliser en multipages (plusieurs images dans un même fichier image), ce format fut, à partir de 1996, utilisé dans une version monopage (une image par fichier image). Depuis 2009, la BnF étudie l opportunité de passer au format JPEG2000. La complexité du format, le faible nombre d outil fiable et le nombre restreint d utilisateur étaient jusqu à présent considérés comme autant de risques et de freins à l adoption de ce format. A ce jour, ces freins demeurent, notamment quant à la faiblesse de l offre logicielle capable de traiter correctement ce type de format d image. Néanmoins, le nombre d utilisateurs a largement augmenté ; nombre de bibliothèques ont adopté ce format : Library of Congress, British Library, Koninklijke Bibliotheek, etc. De plus, la parution de la ISO/IEC 15444-1:2004/Amd 6:2013, permet de clarifier d une part, l utilisation des profils ICC avec la possibilité d utiliser des profils de type DISPLAY et, d autre part, l utilisation des champs : «capture resolution» et «default display resolution». Pour la BnF, les avantages offerts par ce format sont indéniables : Capacité de compression sans perte visuelle importante ; Nombreuses fonctionnalités pour la diffusion : capacité d extraire rapidement un niveau de résolution sans nécessité de générer des images de résolutions intermédiaires ; Forte expressivité des métadonnées. 1.2 Gestion de version Le présent document est la version 0 du référentiel. A ce stade de l étude sur l adoption du format JPEG2000 par la BnF, l ensemble des consignes n est pas totalement fixé. Cette version du référentiel présente les éléments techniques nécessaires à la compréhension des attentes de la BnF quant à la création et au traitement des images au format JPEG2000. Référentiel Livraison Page 3 sur 9

2. DESCRIPTION DU FORMAT 2.1 Format de fichier Le format de fichier retenu est JPEG2000 issu des normes ISO 15444-1 et 15444-2 et leurs correctifs et compléments. 2.2 Compression Le type de compression retenu est une compression irréversible (lossy). Il s agit de la transformation en ondelette 9-7 flottant et ICT («irreversible component transform»). Le niveau de compression dépend du type de collection. Il est exprimé par un ratio par rapport à la taille de l image originale dans le tableau suivant : Type Collection Documents «spécialisé», estampes, photographie, plaque de verre, etc. numérisés en couleur (24 bits par pixel). Documents «exceptionnel», imprimés ou manuscrit comportant des enluminures, des illustrations ou des dépliants particuliers numérisés en couleur (24 bits par pixel). Ratio de compression 1:4 1:4 Documents «imprimé» numérisés en couleur (24 bits par pixel). 1:6 Documents de la «presse» grand format numérisés en niveau de gris (8 bits par pixel). nc 1 2.3 Profil colorimétrique Le profil colorimétrique tel que décrit dans les référentiels images doit être présent dans le fichier. Il est inscrit dans la «Colour Specification» Box de l en-tête JP2 en utilisant une description «Restricted ICC» de classe «Display Device Profile». 2.4 Résolution La résolution de capture telle que décrite dans les référentiels images 2 doit être présente dans le fichier. Elle est inscrite dans une «Capture resolution box» de l en-tête JP2 et exprimée en «pixel per meter». Le nombre de niveau de résolution requis est 10. 1 La BnF n a pas déterminé le ratio de compression pour ce type de collection. 2 cf. Référentiel de numérisation des documents opaques et Référentiel de numérisation des documents transparents Référentiel Livraison Page 4 sur 9

2.5 Niveau de qualité Le nombre de niveau de qualité requis est 10. 2.6 Ordre de progression L ordre de progression requis est RPCL. 2.7 Robustesse du code JPEG2000 Afin d obtenir un code JPEG2000 robuste, il est demandé d intégrer les marqueurs suivants : - SOP (Start Of Packet) - EPH (End of packet header) - PLT (packet length, tile-part header) Référentiel Livraison Page 5 sur 9

3. OUTILS DE REFERENCE ET QUALIFICATION DU PROCEDE DE PRODUCTION L outil de référence pour vérifier la conformité des fichiers JPEG2000 est jpylyzer dans sa version 1.10.1 ou supérieure : http://www.openplanetsfoundation.org/software/jpylyzer L outil de référence pour la production de fichier JPEG2000 est kakadu dans sa version 7.2.1 ou supérieure. http://www.kakadusoftware.com/ La BnF doit valider le paramétrage utilisé pour générer les images au format JPEG2000. Les images brutes issues de la numérisation ne doivent pas avoir été compressées avant la transformation au format JPEG2000. Si le matériel de capture (scanner ou camera) le permet, les images peuvent être directement produites au format JPEG2000. Dans ce cas, la validité des images produites par ce procédé sera qualifiée par la BnF à partir d images de test et charte de couleur standard en comparaison avec la chaine de production suivante : Image brute de scan au format TIFF non compressé transformation au format JPEG2000 avec «kdu_compress» (kakadu). Exemple de ligne de commande avec kdu_compress en demandant un ratio de compression de 1:4 3 pour un fichier TIFF couleur 24 bits non compressé : kdu_compress \ -i <fichierentree.tif> -o <fichiersortie.jp2> \ -rate 6.0 Clayers=10 \ Creversible=no Clevels=10 \ Stiles={1024,1024} Cblk={64,64} \ Corder=RPCL \ ORGtparts=R \ Cprecincts={256,256},{256,256},{128,128} \ Cuse_sop=yes Cuse_eph=yes ORGgen_plt=yes \ -jp2_box <fichieruuidbox> \ -precise où fichieruuidbox est un fichier binaire commençant par la ligne «uuid» et contenant l information nécessaire pour produire les métadonnées définies cidessous 3 Pour atteindre un ratio de compression de 1:4, il est nécessaire d imposer un débit de 6.0 bits/échantillon dans le cas d un fichier codé sur 24 bits. Référentiel Livraison Page 6 sur 9

4. METADONNEES Le format de métadonnées conteneur utilisé est XMP tel que décrit dans la norme ISO 16684-1:2012 et son extension disponible sur : http://www.adobe.com/content/dam/adobe/en/devnet/xmp/pdfs/xmpspecific ationpart2.pdf. Conformément à la spécification XMP Part 3 4, cette description XMP est inscrite dans le fichier JP2 sous forme d une box UUID d identité : 0xBE7ACFCB97A942E89C71999491E3AFAC. Les métadonnées doivent respecter ces normes. En outre, les règles de nommage et gestion des préfixes des namespaces doivent être appliquées. On veillera à encapsuler la description XMP par une directive <?xpacket?> précisant, dans l attribut begin, l encodage UTF-8 de cette description pour éviter notamment une mauvaise interprétation des caractères accentués. De manière générale, les métadonnées générées par le matériel de capture 5 et, le cas échéant, l outil de génération du fichier doivent être conservées. De plus, il convient d enregistrer des informations descriptives de base, ainsi que des informations d historique sur la création du fichier image décrites dans les chapitres suivants. Ces métadonnées sont obligatoires. Le format XMP fonctionne comme un format conteneur réutilisant des vocabulaires pré-existants. Aussi, les vocabulaires à utiliser pour chaque type de métadonnées sont précisés. 4.1 Métadonnées descriptives Des informations minimales sur le document numérique doivent être exprimées dans chaque fichier JPEG2000. L objectif est d avoir une information la plus stable possible. Ces informations utiliseront le vocabulaire Dublin Core simple (préfixe "dc:") et le vocabulaire Dublin Core qualifié (préfixe "dcterms:"). Il convient de se référer au «référentiel d enrichissement des métadonnées» qui donne plus de précision sur ces métadonnées. Les éléments à renseigner sont : - L identifiant de production du document numérique, exprimé sous la forme «NUM» ou «IFN», underscore («_»), puis un numéro d ordre à l intérieur d une plage de valeurs clairement identifiée. Cette information est exprimée dans un champ dcterms:ispartof. - Le propriétaire du document numérique. Il s agit a minima de «Bibliothèque nationale de France». Cette information est exprimée dans un champ dcterms:provenance. Elle peut être complétée par un second champ dcterms:provenance portant la mention du partenaire dont le document numérique est issu. - L identifiant ARK de la notice bibliographique du document. Cette information est exprimée dans un champ dc:relation. 4 http://www.adobe.com/content/dam/adobe/en/devnet/xmp/pdfs/xmpspecification Part3.pdf 5 Caméra ou scanner Référentiel Livraison Page 7 sur 9

- La cote de l original reproduit (il s agit de la cote de la Partie exemplaire correspondante). Cette information est exprimée dans un champ dc:source. 4.2 Métadonnées de création d image Ces métadonnées utilisent les vocabulaires XMP (qui correspondent au noyau de métadonnées XMP tel qu exprimé dans la partie 1 de la norme, préfixe : "xmp:") et les métadonnées spécialisés TIFF (documentées dans la partie 2 de la norme, préfixe : "tiff:"), EXIF (documentées dans la partie 2 de la norme, préfixe : "exif:") et AUX (documentées dans la partie 2 de la norme, préfixe : "aux:") Les éléments à renseigner sont : - La date de création du fichier numérique 6. Cette date doit être exprimée au format ISO-8601 dans la propriété xmp:createdate. - La date de dernière modification du fichier numérique 7. Il s agit de la date de la dernière manipulation ayant modifié le fichier avant envoi à la BnF. Cette date doit être exprimée au format ISO-8601 dans la propriété xmp:modifydate. - L outil matériel (scanner ou appareil photo) utilisé pour la numérisation ou prise de vue, correspondant au nom du modèle. Cette information est exprimée dans la propriété tiff:model. - Le constructeur du matériel décrit en tiff:model, exprimé dans une propriété tiff:make. - Le numéro de série du matériel décrit en tiff:model, exprimé dans une propriété aux:serialnumber - Le constructeur, le nom et la version du logiciel de numérisation ou de création du fichier, exprimé dans une propriété xmp:creatortool. - Le nom du prestataire de numérisation effectuant l opération, exprimé dans la propriété tiff:artist. Les dates sont exprimées avec une précision ne dépassant pas la seconde. Ces métadonnées sont les seules obligatoires. D autres champs, notamment les champs EXIF, peuvent être renseignés dans l image sans que cela soit imposé. 4.3 Métadonnées d historique de traitement Ces métadonnées concernant le post-traitement des images, sont à exprimer dans les métadonnées extérieures aux fichiers JPEG2000, au format refnum et METS/PREMIS, telles que exprimées dans le «référentiel d enrichissement des métadonnées». 6 Il s agit donc de la date de création initiale du fichier au format JPEG2000. Elle ne doit pas évoluer même en cas de modification. 7 Il s agit donc de la date de la dernière modification du fichier au format JPEG2000. Référentiel Livraison Page 8 sur 9

Dans cet exemple : l identifiant de production du document est NUM_6127578 la notice bibliographique correspondante est ark:/12148/cb328608203 l exemplaire original ayant servi à la numérisation est FOL-Z-219 le fichier image a été initialisé le 28 juin 2010 à 9h36 et modifié pour la dernière fois le 29 juin 2010 à 17h35 le scanner utilisé est un Scanstation Rollfilm de la société Wicks and Wilson, dont le numéro de série est 952840341659 le logiciel de traitement d image utilisé est SpiFactory 3.2.12 de la société SPIGRAPH le prestataire de numérisation est PRESTATAIRE_NUM. L attribut begin contient le caractère Unicode U+FEFF encodé en UTF-8 (soit la séquence 0xEF 0xB 0xBF) <?xpacket begin="" id="w5m0mpcehihzreszntczkc9d"?> <x:xmpmeta xmlns:x="adobe:ns:meta/"> <rdf:rdf xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"> <rdf:description xmlns:xmp="http://ns.adobe.com/xap/1.0/" xmlns:tiff="http://ns.adobe.com/tiff/1.0/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:exif="http://ns.adobe.com/exif/1.0/" xmlns:aux="http://ns.adobe.com/exif/1.0/aux/" rdf:about="" tiff:model="scanstation Rollfilm" tiff:make="wicks and Wilson" tiff:artist="prestataire_num" aux:serialnumber="952840341659" xmp:creatortool="spigraph SpiFactory 3.2.12" xmp:createdate="2010-06-28t09:36:00z" xmp:modifydate="2010-06-29t17:35:00z"> <dcterms:ispartof> <rdf:bag> <rdf:li>num_6127578</rdf:li> </rdf:bag> </dcterms:ispartof> <dcterms:provenance> <rdf:bag> <rdf:li>bibliothèque nationale de France</rdf:li> </rdf:bag> </dcterms:provenance> <dc:relation> <rdf:bag> <rdf:li>ark:/12148/cb328608203</rdf:li> </rdf:bag> </dc:relation> <dc:source> <rdf:bag> <rdf:li>fol-z-219</rdf:li> </rdf:bag> </dc:source> </rdf:description> </rdf:rdf> </x:xmpmeta> <?xpacket end="r"?> Commentaire [LD1]: Est-ce qu'il faut mettre la date du cliché original? (au fait il s'agit plutot de la date de génération du fichier TIFF qui servira à générer le fichier JPEG2000) ou est-ce la date de dernière conversion du fichier JPEG2000? Commentaire [LD2]: A quoi doit correspondre cette date exactement? Référentiel Livraison Page 9 sur 9