A la rencontre de MEET lou.burnard@tge-adonis.fr
A la rencontre de l'action MEET MEET c'est une action transversale pour la... Mutualisation d' Experiences sur l' Encodage TEI Avec financement du TGE ADONIS dec 2010-2011
T E quoi? Partout on parle de XML, comme standard essentiel pour la representation des ressources numerisées, textuelles et autres. Pour se servir de toute les possibilités de l'xml, il faut un schéma, adéquat à son projet...... Comment choisir son schéma?.
Schémas standardisés Il existe plusieurs schémas XML «standardisés», ressortant des communautés spécifiques. On peut citer: SVG (standardised vector graphics) MathML (pour le math) XHTML (pour les pages web) EAD (Encoded Archival Description) pour les fonds documentaires Topic Maps (standard ISO) pour l'encodage des topos DocBook pour les editeurs scientifiques CML (Chemical Markup Language) pour l'encodage des structures chimiques DCMES (Dublin Core Metadata Element Set) : vocabulaire très simples de 15 éléments pour les metadonnées... et puis, il y a la TEI
Les enjeux de la TEI «Text Encoding for Interchange» faciliter la création, l échange, et l intégration des ressources informatisées toute sorte de texte toutes les langues toute origine temporelle ou culturelle La TEI s'adresse également... aux débutants, cherchant des solutions bien connues et consensuelles aux experts, cherchant à créer de nouvelles solutions
Les méthodes de la TEI faire des recommandations qui se basent sur un consensus existant préférer les solutions générales à celles spécifiques à une discipline en même temps permettant la spécialisation et l'extension
Il n'y a pas un seul TEI DTD TEI est un système modulaire. On s'en sert pour créer un système d'encodage selon ses propres besoins, en sélectionnant les éléments desirés en plus, on peut proposer de restrictions sur (par ex.) les valeurs des attributs, changer la sélection des attributs disponibles, etc. on peut y mélanger des éléments nouveaux, ou bien natifs ou bien ressortant d'autres standards (par ex. SVG, MathML...)
L'envergure TEI Structuration basique des textes continus Transcription diplomatique, images, multimédia, annotations... Données formelles : dates, noms de lieux ou de personnes... Données paratextuelles et «meta» Analyses linguistiques à tout niveau Documentation de balisage Et cetera: voir http://www.tei-c.org/p5/guidelines/... un encyclopédie du balisage
Envergures sociales La TEI interesse plusieurs disciplines... Linguistique de corpus Traitement automatique du langage Archives et manuscrits Edition, moderne et génétique Histoire Bibliothécaires... et plusieurs structures: Laboratoires Universités et écoles Associations et Entreprises Personnes privées
Interet de la TEI pour le TGE Adonis l'édition de corpus et d'autres ressources numerises la création d'outils, la formation, la mutualisation d'expertise. L'application des bonnes pratiques de numérisation contribue. énormement aux enjeux d'adonis ex. les métadonnées riches sont moissonables, les documents XML ont une perennité....
Activités du MEET Six grandes lignes d'activités sont proposées : développement de la communauté formation documentation développement d'outils création de ressources développement de la TEI
Développement de la communauté On (re)commence à parler d'une communauté «digital humanities» en France... des manifestes comme celui du THATcamp Paris intégration des ressources numériques de toute sorte dans la recherche et dans l'édition des initiatives antérieures (TEI-RES, Mutec..) indiquent l'existence d'une expertise considérable française mais trop souvent isolée et sans moyens de mutualisation. On propose, pour le premier an, des actions spécifiques: un site web pour complémenter la liste de discussion TEI-FR une conférence (au moins) initiation d'un dialogue avec les agence de moyens françaises et européennes formulation d'un projet de démonstrateur sur la réutilisation et intégration des ressources numériques à travers la TEI
Formation Objectif: assurer l'avènement d'une nouvelle génération d'experts pluridisciplinaires Méthodes: Le recensement des expériences de formation: une journée d'études formateurs La collecte et la diffusion des supports de formation ; La collaboration avec le projet «TEI-by-example» en vue d en produire une version française L offre de services de conseil aux projets ; L'assistance aux concepteurs des formations générales en DH
Documentation Objet: assurer une documentation profonde des méthodes TEI en langue française. Méthodes: soutenir et élargir les efforts de traduction du systeme TEI par la groupe G8 de l'afnor ; avec collaboration des projets TEI existants, proposer un ensemble de manuels d'encodage au format ODD standard ; produire un jeu restreint de guides scientifiques de «bonnes pratiques» TEI ; en collaboration avec les agences idoines (INIST, ABES) produire une base bibliographique des références autour de la TEI en langue française.
Développement d'outils Objet: agir comme un centre de référence pour le développement d'outils et les activités de déploiement. Méthodes: proposer, en collaboration avec le groupe d'intérêt sur les outils (Tools SIG), un panorama encyclopédique et objectif des différents logiciels TEI disponibles centré sur les solutions les plus utilisées en France ; collaborer avec les développeurs souhaitant rendre des outils existants conformes avec la TEI, ou intégrer une interface TEI à leurs produits ; mettre en place un service de validation pour les développeurs qu'ils utiliseraient pour établir la compatibilité de leurs produits avec la TEI ; repérer et rendre compte de manques fonctionnels majeurs dans l'offre logicielle et assister à la mise en place d'appels d'offres visant à rectifier de tels manques.
Création de ressources Objet: développer des services d aide et d expertise intéressant tout à la fois ceux qui financent la creation des ressources, et ceux qui reçoivent de tels financements Méthodes: la collecte et le déploiement de corpus représentatifs de disciplines précises, qui peuvent être diffusés largement ; la rétro-conversion et l'harmonisation de corpus existants, en particulier ceux qui sont soit déjà fréquemment réutilisés mais reposent sur des interfaces logicielles ésotériques, soit ont un bon potentiel de réutilisation mais posent des difficultés d'intégration de par leur format ou leur inaccessibilité.
Développement de la TEI Objet: être bon citoyen en participant et en mutualisant les expertises françaises parmi les utilisateurs TEI au niveau européen et mondiale Méthodes: assurer la réception des nouvelles propositions techniques soumises au TEI Council sur les sujets où il y a une expertise française significative, par exemple l'édition génétique, l'édition numérique, l'encodage de corpus oraux et autres ; proposer le TGE-ADONIS comme «partner» au Consortium TEI pour augmenter l'influence française dans la gestion du consortium TEI ; augmenter le nombre d'institutions françaises membres actifs du consortium.
On est là pour vous écouter! Vos propositions?