Archivage pérenne : les formats conformes
Table des matières 1. L outil PAC du Cines...1 2. Objectif de l archivage pérenne...2 3. Liste des formats acceptés pour l'archivage PAC...3 4. Structure d un document à archiver...4 4.1. La description de l archive...4 4.2. Le dossier contenant les documents électroniques à archiver...4 ii
Chapitre 1. L outil PAC du Cines Il s agit d une plate-forme et d un service d archivage numérique pérenne http://www.cines.fr/spip.php?rubrique219 Archivage pérenne : les formats conformes 1
Chapitre 2. Objectif de l archivage pérenne L archivage pérenne des documents électroniques consiste à conserver le document et l information qu il contient : dans son aspect physique comme dans son aspect intellectuel ; de manière à pouvoir le rendre accessible et compréhensible à long terme ; de manière à pouvoir demander une remontée d archive. Une archive présente une valeur patrimoniale scientifique ou technique. Propriétés d une archive pérenne: de préférence des objets dits «primaires» (documents originaux) ; objets issus d archives définitives ; objets dans un format identifié et vérifiable : format publié, format largement utilisé (ou promis à l être), format normalisé. 2
Chapitre 3. Liste des formats acceptés pour l'archivage PAC La liste des formats de fichiers acceptés par la plateforme d'archivage du Cines est disponible à cette adresse : http://www.cines.fr/spip.php?rubrique256 [http://www.cines.fr/spip.php?rubrique256%20] d autres formats pourront être ajoutés à la demande des établissements. Le Cines met également à disposition sur un serveur Web, un outil de vérification de conformité des fichiers : l outil FACILE (validation du Format d Archivage du CInes par analyse et Expertise) : http://facile.cines.fr/ [http://facile.cines.fr/] Pour pouvoir être archivé au CINES, un document doit être à fois VALIDE et BIEN-FORME. Ces deux notions recouvrent des sens différents selon le format auxquelles elles s'appliquent : ainsi, un fichier XML est bien-formé s'il a autant de balises ouvrantes que de balises fermantes, et est réputé valide s'il est conforme à la DTD ou au schéma qui le définit ; dans le cas d'un fichier PDF, il sera bien-formé s'il possède une entête sous la forme "%PDF-m.n" (m.n étant la version du format) et valide s'il se conforme à la spécification PDF : pour plus d'information voir http://jhove.sourceforge.net/pdf-hul.html). Les fichiers mals nommés ou contenant des caractères spéciaux interdits seront systématiquement refusés par Star Il n y a pas de limite à proprement parler sur la taille des fichiers déposés au Cines. Cependant, si vous choisissez d effectuer un dépôt via la plate-forme TEL, la taille de chaque fichier est dès lors limitée à 80Mo. Tout fichier dont la taille est supérieure sera refusé et reviendra en erreur sur le tableau de bord. Le nom de chaque fichier ne doit pas contenir de caractères spéciaux (et notamment de caractères blancs). En cas d annexes en format PDF, il faut construire le nom du fichier sous la forme : «nom_du_fichier_annexes.pdf». S il y a plusieurs fichiers annexes, on les numérotera ainsi : «nom_du_fichier_1_annexes.pdf, nom_du_fichier_2_annexes.pdf, nom_du_fichier_3_annexes.pdf, etc». Les fichiers dans les autres formats (son, images ) sont automatiquement considérés comme des annexes. Les formats PDF inférieur au 1.4 ne sont plus acceptés pour archivage par le Cines à partir de juillet 2012 3
Chapitre 4. Structure d un document à archiver Un document à archiver est composé de deux pièces : 4.1. La description de l archive un fichier sip.xml de 3 sections décrivant : Le document dans son projet d archives ; Le document proprement dit ; Les fichiers du document. 4.2. Le dossier contenant les documents électroniques à archiver Répertoire «DEPOT» Sous-arborescence autorisée Tout fichier présent doit être décrit dans le fichier sip.xml 4