Plan. Contexte technologique. Introduction. Environnement réseauté. Documents structurés. L écrit électronique. Introduction.

Documents pareils
Bibliothèque numérique de l enssib

Présentation générale du projet data.bnf.fr

Université de Lausanne

Table des matières détaillée

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) JRES Novembre 2007

Une organisation internationale au cœur des enjeux de contenus et d accès à l information scientifique: L IFLA

Stages en archives pendant l apprentissage d agent-e en information documentaire liste de contrôle

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

SII Stage d informatique pour l ingénieur

Activité : Élaboration, mise en forme et renseignement de documents

Ministère de la Culture et de la Communication

Infrastructure / réseau / sécurité /support utilisateur

XML pour la mise en valeur des informations

Adobe PDF, norme d archivage

Archiviste - Documentaliste / Gestionnaire de l information / Consultant en archives et documentation

PLATEFORME DE GESTION DE CONGRÈS SCIENTIFIQUES. 12 mars 2015

PLATEFORME DE GESTION DE CONGRÈS SCIENTIFIQUES

Le standard d'échange de données pour l'archivage (SEDA)

Logiciels libres de Bibliothèques numériques : présentation. Castore & Greenstone. Les autres : CDS Invenio, EPRINTS, Dspace.

Rédiger : le numérique dans la préparation de la thèse

Groupe de travail «TECHNOLOGIES DE L INFORMATION ET DE LA COMMUNICATION» Réunion du 26 janvier L archivage électronique

PLAN DE CLASSIFICATION UNIFORME DES DOCUMENTS DU MSSS

La gestion globale des contenus d entreprise

PLATEFORME DE GESTION DE CONGRÈS SCIENTIFIQUES. h tt p : / / w w w. s c i e n c e s c o n f. o rg

Présentation du cadre technique de mise en œuvre d un Service d Archivage Electronique

RECUEIL POLITIQUE DES

SECTION 5 BANQUE DE PROJETS

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype

Référentiel des métiers et des fonctions de l information-documentation

CIMAIL SOLUTION: EASYFOLDER SAE

8 DN 8/2004. Archivage et pérennisation

MESDAMES ET MESSIEURS LES DIRECTEURS ET CHEFS DE SERVICE

Evolution des catalogues et des métiers: comment se préparer aux changements? Quelques échos de la BnF. CRFCB Université de Toulouse 29 mars 2013

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

XML, PMML, SOAP. Rapport. EPITA SCIA Promo janvier Julien Lemoine Alexandre Thibault Nicolas Wiest-Million

Archivage à long terme des données de la recherche scientifique

La maîtrise du cycle de vie du document numérique

FORMULAIRE DE SOUMISSION DU PROJET PORTÉ DANS LE CADRE DU SYSTÈME D'ARCHIVAGE ÉLECTRONIQUE MUTUALISÉ (SAEM)

Les archives de l entreprise à l ère du numérique. Présentée par: HAMMA Mustapha

FICHE DE POSTE. Gestionnaire des données du Portail des savoirs (H/F)

DOCSaaS Cloud Computing Solutions

Learning Object Metadata

CATALOGUE DE LA GAMME EASYFOLDER OFFRE GESTION DE CONTENUS NUMERIQUES

Master Technologies numériques appliquées à l'histoire Deuxième année

Jean-Marc Rietsch, PCI DSS Roadshow Paris juillet

Les documents primaires / Les documents secondaires

Pelleas : Le projet XML pour le systeme d information documentaire du polytechnicum de Marne- la Vallée

10èmes Rencontres Mondiales du Logiciel Libre. NANTES, Le 7 Juillet 2009

Dématique et archivage

ARCHIVES DEPARTEMENTALES DU NORD

Métadonnées, ontologies et documents numériques

Programme national de numérisation. Ministère de la Culture et de la Communication. Appel à projets de numérisation 2010

SCI6052 Information documentaire numérique École de bibliothéconomie et des sciences de l information

Compte-rendu re union Campus AAR 3 mars 2015

XML par la pratique Bases indispensables, concepts et cas pratiques (3ième édition)

Pierre Racine Professionnel de recherche Centre d étude de la forêt Département des sciences du bois et de la forêt, Université Laval, Québec

Chef de file dans le développement de solutions de gestion de contenu

PROGRAMME DE FORMATION

Outils d archivage de l UNIL: du papier à l électronique

CONSERVATOIRE NATIONAL DES ARTS ET METIERS INSTITUT NATIONAL DES TECHNIQUES DE LA DOCUMENTATION

Politique de gestion documentaire

MEMOIRE pour obtenir le Titre professionnel "Chef de projet en ingénierie documentaire" INTD niveau I. présenté et soutenu par Stéphane Héroult

Dématérialisation du courrier: à éviter

Atelier 1. Portails documentaires : BioLib et Cemadoc

sommaire L organisation et la gestion des archives d entreprise...7

Solution universelle de Gestion Electronique de Documents et d Archives Numériques

Magento. Magento. Réussir son site e-commerce. Réussir son site e-commerce BLANCHARD. Préface de Sébastien L e p e r s

RÉFÉRENTIEL DE CERTIFICATION

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Enterprise Content Management Introduction à la GED dans l entreprise (30 min)

SYSTEME INTEGRE DE GESTION DES BIBLIOTHEQUES

Présentation aux entreprises du numérique

Quels apprentissages info-documentaires au collège?

Université de Lausanne

INFORMATIQUE & WEB. PARCOURS CERTIFICAT PROFESSIONNEL Programmation de sites Web. 1 an 7 MODULES. Code du diplôme : CP09

Autour du web. Une introduction technique Première partie : HTML. Georges-André SILBER Centre de recherche en informatique MINES ParisTech

Du livre enrichi et de l EPUB 3

Politique de gestion documentaire

La démarche MDA. Auteur : Projet ACCORD (Assemblage de composants par contrats en environnement ouvert et réparti)*

Système de gestion de contenu

RIHANE Abdelhamid Maitre de conférences Université de Constantine (ALGERIE)

Gestion collaborative de documents

SYNTHESE SUR LA BIBLIOTHEQUE VIRTUELLE

Langage HTML (2 partie) <HyperText Markup Language> <tv>lt La Salle Avignon BTS IRIS</tv>

Formation «Système de gestion des documents d activité (SGDA)»

Présentation du Modèle de Référence pour les Bibliothèques FRBR

Description archivistique : nouvelles technologies, nouvelles compétences?

WEB & DÉVELOPPEMENT LES BASES DU WEB LE LANGAGE HTML FEUILLES DE STYLES CSS HISTORIQUE D INTERNET ET DU WEB LES DIFFÉRENTS LANGAGES

Avantic Software Présentation de solutions GED pour mobiles (Gestion Electronique de Documents)

Recherche bibliographique


Anne Tasso. Java. Le livre de. premier langage. 10 e édition. Avec 109 exercices corrigés. Groupe Eyrolles, , ISBN :

Créer une base de données vidéo sans programmation (avec Drupal)

4. SERVICES WEB REST 46

LA RÉFÉRENCE VIRTUELLE. de nouveaux outils, une nouvelle approche, des compétences à développer. Patrice Viau

La conservation à long terme de contenus numériques

Numérisation et valorisation des fonds patrimoniaux dans les collectivités

UE 8 Systèmes d information de gestion Le programme

Transcription:

L écrit électronique : les règles de l art L écrit électronique Vendredi 1 er juin 2012 @ BRUXELLES : les Fondation règles universitaire, de Rue d Egmont l art 11 Vendredi 1 er juin 2012 L écrit @ électronique BRUXELLES fait tellement Fondation partie du universitaire, quotidien qu il en Rue est presque d Egmont devenu 11 banal. Mais dès qu il s agit de garantir sa préservation en vue de son exploitation future, le juriste et l archiviste éprouvent une certaine L écrit électronique appréhension. fait tellement Et partie la technicité du quotidien du problème qu il en n est est pas presque pour les devenu apaiser : banal. il est obscurément Mais dès qu il question s agit d authenticité, de métadonnées, de migration, au milieu d une guerre des supports et des formats, sans de garantir sa préservation oublier la question en vue du de tri son qui requiert exploitation parfois des future, talents le divinatoires juriste et l archiviste Découragé par éprouvent l apparente une complexité certaine appréhension. Et la technicité du problème n est pas pour les apaiser : il est obscurément question de la tâche, l archiviste se demande s il ne serait pas plus simple de conserver en vrac tous les documents d authenticité, de métadonnées, électroniques sur de un CD, migration, et le juriste au croise milieu les doigts d une pour guerre que le des juge supports accorde une et valeur des probante formats, à son sans oublier la question du document tri qui électronique, requiert parfois en espérant des qu il talents soit encore divinatoires lisible. Découragé par l apparente complexité de la tâche, l archiviste De la Le défi se de demande cette matière journée s il d étude ne serait pas de décrypter plus simple l univers de première de conserver l écrit électronique, en vrac de tous sa préservation les documents et de électroniques sur un son CD, exploitation. et le juriste Il s agira croise de cerner les les doigts enjeux pour juridiques, le techniques juge accorde et organisationnels, une valeur clarifier probante les notions, à son document électronique, présenter espérant les bonnes qu il pratiques, soit encore distinguer lisible. le possible de l incertain, bref donner les clés nécessaires pour comprendre l état de l art en la matière. L objectif est de rencontrer les préoccupations communes des juristes, des archivistes, des informaticiens, des chercheurs, des concepteurs de solutions techniques et de Le défi de cette journée d étude sera de décrypter l univers de l écrit électronique, de sa préservation et de toute personne impliquée dans un projet d archivage électronique du secteur privé ou du secteur public. bien son exploitation. raffinée Il s agira de cerner les enjeux juridiques, : techniques métadonnées et organisationnels, clarifier les notions, présenter les bonnes pratiques, distinguer le possible de l incertain, bref donner les clés nécessaires pour comprendre l état de Programme l art en la matière. du colloque L objectif sous est la présidence rencontrer du Dr Rolande les préoccupations DEPOORTERE (Archives communes de l État) des juristes, des archivistes, des informaticiens, des chercheurs, concepteurs solutions techniques et de 9h30 Exposé introductif toute personne pour impliquée dans un projet Dr Rolande la d archivage description électronique du secteur privé ou du secteur public. DEPOORTERE (Archives de l État) 9h45 Keeping Trustworthy Digital Records Over Time: An Increasingly Cloudy Issue Prof. Luciana DURANTI (University of British Columbia, Vancouver InterPARES Project) Programme du colloque sous la présidence du Dr Rolande DEPOORTERE (Archives de l État) 10h15 L écrit électronique face au droit ou l art du patchwork de l écrit Marie DEMOULIN (Université de électronique Namur CRIDS FedISA Belgium) 9h30 Exposé introductif 11h00 Pause café Dr Rolande DEPOORTERE (Archives de l État) 11h15 De la matière première bien raffinée : métadonnées pour la description de l'écrit électronique 9h45 Keeping Trustworthy Prof. James Digital TURNER Records (Université Over de Time: Montréal) An Increasingly Cloudy Issue Prof. Luciana 11h45 DURANTI Entre (University intégrité et lisibilité M of British Turner, : supports, Columbia, formats Vancouver professeur et procédures InterPARES Project) Laurent DUPLOUY (Bibliothèque Nationale de France) 10h15 L écrit électronique face au droit ou l art du patchwork Marie DEMOULIN 12h15 (Université Questions de Réponses Namur CRIDS FedISA Belgium) 12h30 Lunch 11h00 Pause café 14h00 Aspects techniques d une dématérialisation au quotidien 11h15 De la matière première Patrick PERROT bien raffinée (Université: de métadonnées Haute-Alsace CRESAT) pour la description de l'écrit électronique Faculté des arts et des sciences Prof. James 14h30 TURNER Le tri (Université électronique École de de ou Montréal) bibliothéconomie la recherche du carat informationnel Sébastien SOYEZ et des (Archives sciences de de l État) l information 11h45 Entre intégrité et lisibilité : supports, formats et procédures 15h10 Questions Réponses Laurent DUPLOUY (Bibliothèque Nationale de France) 15h30 Pause café 12h15 Questions 15h45 Réponses Le dilemme de l'écrit signé : traces contre traces 12h30 Lunch Prof. Jean-François BLANCHETTE (University of California, Los Angeles) 16h15 Comment s'assurer de l'authenticité de l'écrit numérique? 14h00 Aspects techniques Françoise d une dématérialisation BANAT-BERGER (Ecole nationale au quotidien des chartes à Paris Archives de France) Patrick PERROT (Université de Haute-Alsace CRESAT) 16h45 Questions Réponses 14h30 Le tri électronique 17h00 Fin ou des la travaux recherche du carat informationnel Sébastien SOYEZ (Archives de l État) (Programme détaillé au verso) 15h10 Questions Réponses Renseignements et inscriptions : www.crids.eu Centre de Recherche Information, Droit et Société 15h30 Pause café Rempart de la Vierge, 5-5000 Namur, Belgique Tarif : 150 (repas et documentation compris) T +32 81 72 52 04 - F +32 81 72 52 02 15h45 Le dilemme de l'écrit signé : traces contre traces www.crids.be www.juritic.be Prof. Jean-François BLANCHETTE (University of California, Los Angeles) 1 Conclusions Plan 2 16h15 Comment s'assurer de l'authenticité de l'écrit numérique? Françoise BANAT-BERGER (Ecole nationale des chartes à Paris Archives de France) 16h45 Questions Réponses 17h00 Fin des travaux (Programme détaillé au verso) Renseignements et inscriptions : www.crids.eu Tarif : 150 (repas et documentation compris) Centre de Recherche Information, Droit et Société Rempart de la Vierge, 5-5000 Namur, Belgique T +32 81 72 52 04 - F +32 81 72 52 02 www.crids.be www.juritic.be Contexte technologique Contexte technologique Environnement réseauté Prolifération Haut degré de structure Machine à écrire électrique (~1961) Machine à écrire électronique (~1989) Texteur dédié (années 1970, 1980) Micro-ordinateur, logiciels texteurs (~1980) 3 4 Environnement réseauté Suite à la 2e Guerre mondiale, l écrit électronique s installe peu à peu Suite au début de l internet avec la normalisation du protocole TCP/IP (~1982), un essor L arrivée du WWW (~1994) change la donne Depuis, rien n est comme avant Quoi, pourquoi, comment Trois composants Points de repère 5 6

Quoi, pourquoi, comment Trois composants Spécificité : la structure du document est rendue explicite Structure, déclarée en entête (DTD, puis schéma) Présentation, traitée par feuilles de style (style sheets) But : permettre aux machines d effectuer l analyse grammaticale des documents Données, entourées de balises (métadonnées) Moyen : balises, par exemple : <nom de ville>bruxelles</nom de ville> <restaurant>bruxelles</restaurant> ou encore orchestre, légume, chanson... 7 8 Un même fichier interprété par 3 feuilles de style Échantillon de texte balisé Le même texte 9 10 Points de repère SGML (ISO 8879:1986) Vers la normalisation HTML (~1991), exprès pour le web, indiscipliné Les sciences de l information XML (~1998), simplifier et faciliter la mise en oeuvre de SGML sur le web, favoriser l intéropérabilité Ensembles de métadonnées XHTML > HTML5 (~2000-2008), permet syntaxes XML et HTML XML est devenu la lingua franca des métadonnées 11 12

Vers la normalisation Évolution des langages de marquage Encodage de texte (ASCII > Unicode) Grands projets (Gutenberg, Text Encoding Initiative, W3C) Les sciences de l information Traditionnellement, bibliothèques et archives Développement de codes de catalogage, de classification vers le début du 20e siècle Aujourd hui, sauf exception, tous les travaux focalisés sur le web Ainsi, les métadonnées deviennent la matière première et l ordinateur l outil principal de travail 13 14 Ensembles de métadonnées Prolifération Une communauté qui a développé beaucoup d ensembles de métadonnées Exemples : MAchine Readable Cataloging (MARC) Metadata Authority Description Schema (MADS) Metadata Object Description Schema (MODS) Metadata Encoding and Transmission Standard (METS) Encoded Archival Description (EAD) Plus que jamais, il y a prolifération et convergence de technologies, chaque instance exigeant la gestion de ses contenus : téléphones, téléviseurs, ipod, ipad, jeux... Ainsi, une course constante pour organiser tout cela 15 16 Haut degré de structure Cette réalité se solde par de l information de plus en plus structurée Dans ce nouveau monde et cette mer de données, le besoin de décrire l écrit aux fins de découverte, préservation et accès Tout cela passe par des métadonnées Le Dublin Core, texte libre 17 18

Très bref historique Très bref historique Registres en format de livres et indexation Fiches en carton Description de l objet Le format MARC (années 1960) et l automatisation Livres, manuscrits, images, vidéo, son Les OPACs Le web, la norme Z39.50 19 20 et indexation Autre opération : la classification Strictement parlant, description de l objet Plus large : description et indexation («catalogage par matières») Strictement parlant, l indexation est l analyse intellectuelle du contenu Explication : l utilisation de fiches de bibliothèque Classification LC Classification Dewey Notice disponible en format MARC 21 22 Description de l objet Description de l objet Divers objets Petite anecdote OCLC/BNC, indexation, classification : les trois exprimés sous forme de métadonnées maintenant Les notions demeurent distinctes : catalogage = description indexation = analyse, piste qui pointe classification = éléments ordonnés, ontologie Les normes de catalogage couvrent tout ce qu on peut cataloguer Les normes bibliothéconomiques et archivistiques ont des chapitres pour images fixes, images animées, enregistrements sonores, fichiers informatiques En muséologie, normes pour la description de toutes sortes d objets 23 24

Description de l objet Ensembles de métadonnées Le Dublin Core Tout cela s organise aujourd hui sous forme d ensembles de métadonnées Divers intervenants en élaborent pour répondre aux besoins de leur communauté, par ex. Categories for the description of works of art (CDWA) VRA Core (Visual Resources Association) Encoded Archival Description (EAD) MPEG7 (images animées) Media Art Notation System (MANS) Darwin Core (sciences naturelles) Un ensemble de métadonnées «passe-partout» 15 éléments, dont créateur, titre, langue, format Peut être utilisé en toute situation, pour tout objet Peu de formation nécessaire pour utiliser S intègre aux grandes normes, dont le RDF Un noyau seulement, facilite découverte et accès 25 26 (tagging) Évolution Évolution Participation Rigueur Résultat Propagation automatique L étiquetage représente une évolution du traitement documentaire en environnement web Les gens ajoutent des mots-clés, leurs amis aussi Sujet de recherche fertile en sciences de l information 27 28 Participation Rigueur Participation d internautes au catalogage, indexation, classification Projets pilotes dans musées, autres sites, maintenant assez courants Diverses formules, par ex. ajouts à l indexation professionnelle, jeux d étiquetage Amélioration de l accès Peu rigoureux mais marche quand même assez bien Marche très bien, même, pour certains types d informations : objets images de tous les jours images documentaires 29 30

Propagation automatique Résultat En combinant des approches, on peut propager automatiquement des étiquettes, par ex. St Denis de Paris, Portail de la Vierge Reconnaissance automatique d une image semblable, ajout des étiquettes Via traducteurs automatiques, propager l étiquette en plusieurs langues Changement fondamental dans le traitement documentaire, exigé par la masse disponible L ajout de métadonnées autrement omises Favoriser la découverte, l accès Information accessible à une population beaucoup plus importante qu avant 31 32 Atomiser, recombiner Où s arrêter? Interopérabilité 33 34 Interopérabilité La croissance du web complexifie la découverte et l accès Ainsi, les travaux focalisés sur le développement du web sémantique (rigueur, structure) Outils particuliers à chaque domaine, discipline, communauté Une difficulté importante : tout bouge, constamment On cherche à favoriser l échange de fichiers entre usagers, systèmes Automatiquement, dans la mesure du possible Une certaine stabilité, postcompatibilité nécessaires Pour y arriver, harmonisation 35 36

Noyaux On a tout intérêt à harmoniser les pratiques, méthodes Toutefois, cela n est pas toujours faisable On le fait dans la mesure du possible, puis par la suite, on se fie à de multiples couches de métadonnées, filtres, traducteurs, passerelles Quelques outils : noyaux (cores), espaces de nommage (namespaces), grands contenants Ensembles de métadonnées critiques pour différentes communautés Quelques exemples : Dublin Core (général, toute documentation) IPTC Core (International Press Telecommunications Council, agences de presse, de photo) Darwin Core (informatique en biodiversité) VRA Core (Visual Resources Association, histoire de l art) 37 38 Noyaux vs ensembles Espaces de nommage Un noyau comprend les éléments essentiels seulement Un ensemble de métadonnées est plus élaboré, peut comprendre des milliers d éléments Les critiques des noyaux oublient souvent cette distinction La confusion provient en partie du fait qu un noyau peut constituer l ensemble au complet dans certaines situations But : désambiguïsation d identificateurs homonymes Un contenant qui sert de registre des espaces de nommage Espaces de noms XML (XML namespaces) permettent d identifier outils précis lors de la description de ressources 39 40 Exemples de l utilité Grands contenants Indiquer que le terme d indexation «verre» provient de tel dictionnaire de matériaux de construction Indiquer que le «Montréal» en question est celui au Québec (il y en a en France, aux États-Unis, ailleurs) Désambiguïser auteurs avec un même nom Outils comme le Resource Description Framework (RDF) et Material exchange Format (MXF) permettent de ramasser bien des couches de métadonnées Comme un oignon ou une poupée russe, métadonnées gigognes 41 42

Atomiser, recombiner Où s arrêter? Avec les documents structurés et toutes ces balises, les documents peuvent être atomisés La musique et la vidéo aussi, pour les mêmes raisons Ainsi, on peut cibler des éléments intéressants, les extraire d un document, les recombiner pour faire d autres documents La redocumentarisation : «retraiter un document ou un ensemble de documents numérisés de façon à les enrichir de métadonnées nouvelles et à réarranger et relier leurs contenus» (Salaün) Pour le traitement documentaire, comment faire maintenant, voilà la question! Édition, redocumentarisation, remix, mashup, etc. 43 44 Conclusion Références Le changement constant nous oblige à veiller constamment, être flexibles Suite à 15 ans d expérimentation et recherches, il y a quand même une certaine stabilité maintenant Toujours vers le web sémantique, mais peut-on y arriver un jour? Jacquet, Christophe. 2010. Métadonnées et Dublin Core. OpenWeb Group, pour les standards du web. <http://openweb.eu.org/articles/dublin_core>. Jardin Zen CSS : la beauté de la conception CSS. 2012. <http:// www.csszengarden.com/tr/francais/> Salaün, Jean-Michel. 2008.03. Web, texte, conversation et redocumentarisation. Actes des 9èmes journées internationales d analyse statistique des données textuelles, Lyon, 12-14 mars 2008. Presses universitaires de Lyon. <https:// papyrus.bib.umontreal.ca/jspui/handle/1866/2226> 45 46 Merci james.turner@umontreal.ca http://mapageweb.umontreal.ca/turner/ 47