Département fédéral de l intérieur DFI Archives fédérales suisses AFS Unité Innovation et Préservation - Service de l archivage numérique Solutions pour l archivage de bases de données relationnelles Le cas de SIARD Paris - 07.10.2010 Groupe PIN Jérémie Leuthold Chef du service de l archivage numérique
Agenda Courte introduction Historique & développements SIARD: c est quoi? Format SIARD SIARD Suite 1.0 Distribution & Perspectives L intégration de SIARD dans l archivage numérique SIARD dans l Administration fédérale suisse Questions & discussions 2
Les archives fédérales suisses 3
Historique & développement (2001-2004: 1. Phase ARELDA): Prototype SIARD (2005-2009: 2. Phase ARELDA): 2005 Review de SIARD 2005-2006: Projet pilote DAp (Datenbank Archivierungsprozess) 2006 2007 2008 2009 2010 2007-2008: Spécifications & nouveaux développements de SIARD Suite 2009: distribution SIARD Suite 2008: Publication SIARD Format Utilisation SIARD Suite au sein de l AF 4
SIARD: c est quoi? Software Independent Archiving of Relational Databases 4 3 2 1 1. Type de données base de données 2. Type de base de données base de données relationnelles 3. Type d action archivage dans un format adapté à l archivage 4. Solution séparée du type de données 5
Plus concrètement Une solution d archivage pour systèmes de gestion de bases de données relationnelles (SGBDR) Le développement d un format permettant l archivage depuis un SGBDR sur le long terme Un logiciel permettant l archivage au format SIARD Une solution agissant sur des systèmes en service Les systèmes de bases de données principales doivent rester opérationnelles 6
Le format SIARD 1 base de données 1 fichier (archive) SIARD Un fichier SIARD est un container ZIP64 (sans compression) contenant des fichiers XML Un unique fichier XML décrit toutes les métadonnées de la base de données (SQL:1999) L ensemble du contenu de la BD est converti en fichiers XML Le format SIARD est basé sur des standards reconnus: SQL:1999, XML, ZIP64,UNICODE 7
Le principe (Télé)chargement des données 2 Collecte des métadonnées 1 Archive SIARD BD à archiver Ajout de métadonnées descriptives étapes 3 Enregistrement au format SIARD 4 8
SIARD Suite 1.0 Système de BD à archiver Download SIARD SUITE (JAVA) Accès & ajouts de métadonnées dans l archive SIARD Upload Système de BD plus actuel Fichier SIARD 9
SIARD Suite 1.0 10
Modèle de licence Format SIARD libre (documentation du format sur www.bar.admin.ch) SIARD Suite 1.0 freeware Téléchargeable gratuitement sur www.bar.admin.ch 11
Distribution Solution développée tout d abord pour l administration fédérale suisse Tout office fédéral qui doit effectuer un versement de bases de données aux Archives fédérales SIP ID SIP ID header header content content Dossier Dossier Dossier Format Dossier SIARD Dossier Dossier Archives 12
Distribution 118 Licences déjà enregistrées 28 Pays 13
Distribution par type d organisation Unternehmer Firmes (Software) TI Entreprises TI? N/A Entreprises Unternehmer Archives Archiv Universités Universität Chercheurs / Etudiants Forscher / Student Privés Privat Bibliothek Stiftung / ONG Öffentlicher ONG Dienst Autres services publiques Bibliothèques 14
Freeware vs Open source Dans le cas de SIARD Standard imposé AFS pérennité du format garantie Qualité des développements futurs garantie Mise à disposition possible pour la communauté archivistique pas d interactions avec l AFS Création de partenariats principe du «win-win» (Archives fédérales allemandes, Danemark) Premiers pas dans le domaine Projet commun 15
Feedbacks Teilnehmer nach Organisation Ont pris Teilnehmer part au nach sondage Organisation(33%) (par type d organisations hors admin. fédérale) Staats- / Nationalarchiv Staats- / Nationalarchiv 15% Privatw irtschaft / 15% Privatw irtschaft / Industrie Industrie 22% Archiv (anders) 22% Archiv (anders) 22% 22% Tests Formation Öffentliche Organisation Öffentliche Organisation (z.b. NGO) (z.b. NGO) 7% 7% Öffentlicher Dienst Öffentlicher Dienst 15% 15% Akademisches Institut Akademisches Institut 19% 19% 16 16 14 14 12 12 Anzahl der archivierten Datenbanken nach Datenbanktyp SGBDR Anzahl der archivierten archivés Datenbanken avec nach Datenbanktyp SIARD MS Access, 14 MS Access, 14 MS SQL, 12 MS SQL, 12 Aucun bug annoncé 10 10 8 8 6 6 4 4 Oracle, 8 Oracle, 8 2 2 0 0 Oracle MS SQL MS Access Oracle MS SQL MS Access 16
Perspectives Welche Datenbanktypen möchten Sie mit SIARD Suite künftig archivieren können? Antworten 11 10 9 8 7 6 5 4 3 2 1 0 sofort archivieren mittelfrisitiges Interesse langfristiges Interesse MySQL DB2 (IBM) BASE (OpenOffice) Ingres SyBase Informix SQLite FileMaker Andere Datenbank Datenbanktyp 17
L archivage numérique aux AFS Agencies Relational Database Records Management System File Repository SI P ❶ SI P SI P Submission Interface Packag e Handler ❷ SI P ❸ SFA s E-Archive Archival Informatio n System (AIS) ❺ Digital Information Repository (DIR) ❹ AI P Infrastructure basée sur le modèle OAIS ❻ ❼ Infrastructure of Digital Archiving (IDA) Acces s DI P ❽ 18
L archivage numérique aux AFS ID header métadonnées content Données primaires edocuments (GEVER) Bases de données (SIARD) Collections de fichiers Format adaptés à l archivage uniquement! 19
Versement contenant une BDR archivée ID header SIP content DOK Archive SIARD 20
Utilisation (expérience) Nouvelle BD à archiver Evaluation prospective Valeur archivistique? oui Préparation de la sélection Préparation du versement Tests de qualité Ablieferung abschliessen AFS 21
Toutes les informations sur internet www.bar.admin.ch 22
Questions & discussion Merci de votre attention! Jeremie.Leuthold@bar.admin.ch 23