Francesco Beretta (CNRS UMR5190 LARHRA Université de Lyon)



Documents pareils
Un SIG collaboratif pour la recherche historique Partie. Partie 1 : Naissance et conception d un système d information géo-historique collaboratif.

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Infrastructure / réseau / sécurité /support utilisateur

Catalogue des formations Edition 2015

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Mercredi 15 Janvier 2014

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

Présentation générale du projet data.bnf.fr

Par Daniel FAIVRE WebMapper ... Publication de cartes pour Internet avec ArcGis

Bases de données pour la recherche : quels enjeux et quel rôle pour les patients?

ISTEX, vers des services innovants d accès à la connaissance

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

Master Technologies numériques appliquées à l'histoire Deuxième année

Datalift. + + Architecture Modularité Déploiements. d j = 09/04/2015 Laurent BIHANIC

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015)

TYPO3, le CMS de référence

JDev Atelier Datalift

FORMULAIRE DE SOUMISSION DU PROJET PORTÉ DANS LE CADRE DU SYSTÈME D'ARCHIVAGE ÉLECTRONIQUE MUTUALISÉ (SAEM)

Le Web de Données Dan VODISLAV Université de Cergy-Pontoise Master Informatique M2 Plan

De l OpenData aux citoyens : potentiel et limites des plateformes collaboratives

Réseaux sociaux de chercheurs : quels enjeux et quelle politique pour une institution publique de recherche

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e :

Résumé CONCEPTEUR, INTEGRATEUR, OPERATEUR DE SYSTEMES CRITIQUES

Qu est ce qu une offre de Cloud?

Information utiles. webpage : Google+ : digiusto/

Charte de fonctionnement de GéoNormandie

Sauvegarder la base de données de Drupal avec le module Backup and Migrate

Documents et Applications : CMS nouvelle génération

Bases de Données. Le cas des BD relationnelles ouverture sur les BD relationnelles spatiales Séance 2 : Mise en oeuvre

Introduction: 1. définition d un ETL 2. importance et diversité des données spatiales utilitédes ETL géographiques

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

Evolution des catalogues et des métiers: comment se préparer aux changements? Quelques échos de la BnF. CRFCB Université de Toulouse 29 mars 2013

Thomas Loubrieu (Ifremer) Small to Big Data Novembre 2013, Ifremer, Brest

Bibliothèque numérique de l enssib

La démarche SOA et l interopérabilité applicative

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé

Big Data et Graphes : Quelques pistes de recherche

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Nos webmasters, web designers et ingénieurs de développement vous accompagnent dans vos projets afin de vous apporter entière satisfaction.

Problématiques de recherche. Figure Research Agenda for service-oriented computing

Plan. Un modèle d organisation. Pour les Archives numériques. Présentation Groupe PIN. Claude HUC (CNES)

DIRAC : cadre et composants pour créer des systèmes de calcul distribués

Les concepts de base des SIG nomades

ANTICIPEZ ET PRENEZ LES BONNES DÉCISIONS POUR VOTRE ENTREPRISE

WMS On Demand. Facilité d accès et flexibilité

Rencontre avec les correspondants-formation des services communs de la documentation. Jeudi 27 septembre 2012 URFIST de Paris

25 % EXPERTS PAR AN. + de de 35. près de 50 DE CROISSANCE DE L OPEN SOURCE ANNÉES D EXPERIENCE AU SERVICE DE L OPEN SOURCE

Cartographie libre du monde OpenStreetMap

Big Data et Graphes : Quelques pistes de recherche

Cloud Computing, discours marketing ou solution à vos problèmes?

Dans la série Les tutoriels libres présentés par le site FRAMASOFT. AGORA-Projet. système de partage d'information et de travail collaboratif

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

Parcours DIWEB : (Données, Interaction et Web)

Le cloud computing au service des applications cartographiques à haute disponibilité

Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé

6 ème Orientation INFORMATION ET SENSIBILISATION THEMATIQUE 4: CREER UN SITE INTERNET. Fiche action n Créer un Site Internet Grenelle Web 2.

Évaluation d une architecture de stockage RDF distribuée

La place de la Géomatique Décisionnelle dans le processus de décision

Urbanisation des Systèmes d Information Architecture d Entreprise. 04 Architecture du SI : identifier et décrire les services, structurer le SI

Intégration de données complexes pour une vision 360 du client. Chloé Clavel EDF R&D Département ICAME

Utilisation d'outils de WebMapping OpenSource dans une collectivité territoriale Communauté de Communes de l'agglomération Saint-Loise (CCASL)

La fédération des infrastructures cloud

Villa Cavrois 3D, application de visite sur tablette tactile mobile

La gestion des documents administratifs à la Bibliothèque nationale de France

Sybase PowerAMC 16. Guide des nouvelles fonctionnalités générales. DOCUMENTATION

Gestion des documents associés

D'AGROVOC à l'agricultural Ontology Service / Concept Server. Un modèle OWL pour la création d'ontologies dans le domaine de l'agriculture

Environnement collaboratif multimodal pour Communauté Virtuelle à la puissance GRID

Architecture d'entreprise : Guide Pratique de l'architecture Logique

Jean-Luc Archimbaud. Sensibilisation à la sécurité informatique.

UN TRAVAIL A PLUSIEURS VOIX... 3 LICENCE... 3 TRAÇABILITE... 5 CONTENU DE LA CHARTE... 3 COMMENT UTILISER CETTE E CHARTE?... LES DONNEES...

Notre Catalogue des Formations IT / 2015

Architectures informatiques dans les nuages

Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes

Conduite de projets informatiques Développement, analyse et pilotage (2ième édition)

OASIS Date de publication

Choisir un CMS... Oui mais lequel? 11/07/11

Jean-Christophe BECQUET

La directive INSPIRE en Wallonie: le géoportail et l infrastructure de diffusion des géodonnées en Région wallonne (InfraSIG(

CALENDRIER DE FORMATION 2015

Pelleas : Le projet XML pour le systeme d information documentaire du polytechnicum de Marne- la Vallée

Business Intelligence avec SQL Server 2012

Concevoir une base de données

Urbanisation des systèmes d information

Métadonnées, ontologies et documents numériques

Cognit Ive Cas d utilisation

La fédération d identités, pourquoi et comment? Olivier Salaün, RENATER ANF Mathrice 2014

Les logiciels OpenSource pour l'entreprise

Référentiel C2i niveau 1 Version 2 :

Conception, architecture et urbanisation des systèmes d information

Ingénierie et gestion des connaissances

La gestion électronique de l information et des documents entreprise. Présentation

Courriel, mon ami. Le courriel collaboratif pour décider (Interopérabilité des échanges entre acteurs) Etude de faisabilité

Transcription:

Labex 'Les passés dans le présent' Atelier n 4 Quels enjeux numériques pour les médiations scientifiques et culturelle du passé? 10 avril 2014 Francesco Beretta (CNRS UMR5190 LARHRA Université de Lyon) Le projet SyMoGIH et le web sémantique : vers une ontologie pour la recherche en histoire?

Le projet SyMoGIH : Système modulaire de gestion de l'information historique * Un projet du Pôle Histoire Numérique du LARHRA (CNRS - UMR 5190) une équipe d'une douzaine de chercheurs, enseignants-chercheurs et ingénieurs des compétences partagées : modélisation, gestion de bases de données, développement web, utilisation de CMS (Drupal), extraction et traitement des données, systèmes d'information géographique, encodage en XML (TEI), web sémantique * Une méthode de modélisation de l'information historique * Une plate-forme hébergeant données et textes d'une dizaine de projets et d'une cinquantaine d'utilisateurs individuels

Le point de départ Une pratique de l'histoire numérique, à partir d'un double questionnement : 1. comment intégrer les technologies et les pratiques de la révolution numérique, le digital turn, dans la méthode de l'historien? 2. comment connecter la recherche individuelle avec les données produites par d'autres chercheurs comment rendre interopérables ces données avec celles du web des données (semantic web)?

Plan de l'exposé 1. Une plate-forme au service de la recherche en histoire 2. Un projet de mutualisation des données : la question du modèle 3. L'interopérabilité avec le web des données : la question de l'ontologie et de l'open data

1. Une plate-forme au service de la recherche en histoire * Utilisation de technologies libres et open source : PostgreSQL, PHP, AJAX, DRUPAL, PostGIS, OpenLayers, TinyOWS, exist, basex, D2RQ, Virtuoso, * Virtualisation des serveurs sur la plate-forme de l'institut des sciences de l'homme (ISH) de Lyon, sauvegardes sur la grille de la TGIR Huma-Num

Trois sites web http://patronsdefrance.fr/

Trois sites web http://geo-larhra.org

Trois sites web http://symogih.org

Un outil au service de la recherche individuelle Reconstitution fine de la chronologie d'un procès d'inquisition

Distribution des lettres reçues et envoyées par correspondant (extrait)

Visualisation avec Visone d'un réseau de participants à des entretiens, nœuds de dimension proportionnelle à la valeurs de centralité d'intermédiarité de chaque acteur

Un outil au service d'un projet collaboratif http://scholasticon.fr

Le modèle de chaque type d'information documente la structure du codage adoptée par le chercheur pour produire les données

Les données produites à partir des notices du site web scholasticon.fr permettent d'explorer cette population et de mettre en évidence sa physionomie et les lacunes de l'information 2500 2128 2000 1472 1500 1062 959 1000 500 0 0 Tous Effectif Lieu nais. precis Ordre religieux L. nais. precis date 0 Membres d'un ordre religieux Info naiss. datée Statut Lieu naiss. Lieu enseign. Enseignants Lieu dat naiss. Avec matiere Distributions des effectifs de trois populations : tous les acteurs, membres d'ordres religieux, enseignants (acteurs ayant une information de type enseignement)

Population incomplète : 1062 enseignants avec date et lieu de naissance

160 140 120 100 80 60 40 20 0 14_1 14_2 14_3 14_4 15_1 15_2 15_3 15_4 16_1 16_2 16_3 16_4 17_1 17_2 17_4 Distribution des années de naissance regroupées par 'générations'

Waldeck Stettin Saxe-Eisenach Mecklenburg-Schwerin Connaught (Sedan-Bouillon) (Cossacks) Nassau (Transylvania) Swiss Cantons Netherlands Bavaria Savoy Salzburg Venice England Papal States Spain L'Europe en 1600 Euratlas 2009 500 400 300 200 100 0 Effectifs de la population regroupée par appartenance à des territoires politiques : la prépondérance des sujets du roi d'espagne

700 600 500 400 300 200 100 Nouveaux ordres Ordres monastiques Mendiants Dominicains Combiner les informations relatives à la période de naissance et à l'appartenance à un ordre religieux Franciscains Jésuites 0

Les parcours des enseignants entant que liens entre les institutions et les lieux

Fonction heuristique de la visualisation

La mobilité des enseignants (couleurs : centralité d'intermédiarité)

L'ensemble des déplacements et les résultats de l'analyse structurale : SIG et analyse de réseaux

2. Un projet de mutualisation des données : la question du modèle

2. Un projet de mutualisation des données : la question du modèle Objectifs : * * * * * * réutilisation et mutualisation généricité (indépendance de la problématique de recherche) évolutivité et adaptabilité (pas de modèle préconçu) interopérabilité et pérennité traçabilité (sources de l'information) incertitude (temps et espace)

Du texte aux données : des unités de connaissance atomisées... «Lettre de Piero Dini à Galileo Galilei, 7 mars 1615, Rome» [Opere di Galileo, vol. 12, l. 1090] «Entretien de Piero Dini avec le cardinal Bellarmin, [3] mars 1615, Rome» [rapporté par la lettre du 7 mars à Galilée] «Galilée enseigne les mathématiques à l'univesité de Padoue entre 1592 et 1610» [Dizionario biografico degli italiani, vol. 51]

...qui parlent d'objets... «Lettre de Piero Dini à Galileo Galilei, 7 mars 1615, Rome» [Opere di Galileo, vol. 12, l. 1090] «Entretien de Piero Dini avec le cardinal Bellarmin, [3] mars 1615, Rome» [rapporté par la lettre du 7 mars à Galilée] «Galilée enseigne les mathématiques à l'université de Padoue entre 1592 et 1610» [Dizionario biografico degli italiani, vol. 51]

qui relèvent d'une typologie... «Lettre de Piero Dini à Galileo Galilei, 7 mars 1615, Rome» [Opere di Galileo, vol. 12, l. 1090] «Entretien de Piero Dini avec le cardinal Bellarmin, [3] mars 1615, Rome» [rapporté par la lettre du 7 mars à Galilée] «Galilée enseigne les mathématiques à l'université de Padoue entre 1592 et 1610» [Dizionario biografico degli italiani, vol. 51]

qui sont datées «Lettre de Piero Dini à Galileo Galilei, 7 mars 1615, Rome» [Opere di Galileo, vol. 12, l. 1090] «Entretien de Piero Dini avec le cardinal Bellarmin, [3] mars 1615, Rome» [rapporté par la lettre du 7 mars à Galilée] «Galilée enseigne les mathématiques à l'université de Padoue entre 1592 et 1610» [Dizionario biografico degli italiani, vol. 51]

et sourcées. «Lettre de Piero Dini à Galileo Galilei, 7 mars 1615, Rome» [Opere di Galileo, vol. 12, l. 1090] «Entretien de Piero Dini avec le cardinal Bellarmin, [3] mars 1615, Rome» [rapporté par la lettre du 7 mars à Galilée] «Galilée enseigne les mathématiques à l'université de Padoue entre 1592 et 1610» [Dizionario biografico degli italiani, vol. 51]

Le modèle générique de SyMoGIH

Un modèle relationnel générique... Francesco Beretta / Pierre Vernus, "Le projet SyMoGIH et la modélisation de l'information : une opération scientifique au service de l'histoire", Les Carnets du LARHRA 1(2012), 81-107 http://symogih.org

dont les instances sont crées progressivement. Type d'unité de connaissance : lettre Instance du modèle générique

Les rôles de chaque objet Types de rôles : auteur, destinataire, lieu d'expédition

Datation Datation Datation La datation comme opération qui définit une date avec tous ses paramètres : instant ou période, incertitude, etc.

Sourçage Sourçage Garantit la traçabilité de la donnée Sourçage

Information : Galilée enseigne les mathématiques à l'université de Padoue entre 1592 et 1610 Actr : Galilei, Galileo AbOb: Mathématiques Source : Dizionario biografico degli italiani, vol. 51 CoAc: Université de Padoue

Publication de la définition des instances du modèle générique http://symogih.org

3. L'interopérabilité avec le web des données : la question de l'ontologie

Objectifs : * déréférencement et interlinking des objets (notices d'autorité) * publication au format RDF des données de la plate-forme SyMoGIH * utilisation des données du web sémantique pour la recherche : données patrimoniales ; données issues de la recherche ; DBPedia & Co Questions : * quelle ontologie adopter pour publier les données de la plate-forme? * sous quelle licence rendre accessibles les données?

Disposer d'une URI SyMoGIH : http://symogih.org/resource/actr195 L'objet Actr195 : Johannes Kepler

Présupposé pour l'encodage sémantique collaboratif de textes en XML, en conformité avec le modèle de la Text encoding initiative, en utilisant les attributs @ref et @corresp

Documentation, interlinking

Publication des informations concernant Kepler «Kepler enseigne les mathématiques à l'ecole luthérienne de Graz entre 1594 et 1600»

Le projet DBPedia : données extraites des Infobox, SPARQL endpoint

Utilisation du web des données pour la recherche : un exemple qui croise web sémantique et SIG http://geo-larhra.org

SPARQL endpoint B3Kat Bayerische Staatsbibliothek, Bibliotheksverbund Bayern, Kooperative Bibliotheksverbund Berlin-Brandenburg http://lod.b3kat.de/sparql

Francesco Beretta / Charlotte Butez, "Partie 2. Exemple d application : con ception de l atlas historique numérique et analyses de données attributaires de l Italie du Risorgimento", Géomatique Expert, n 92, Mai-Juin 2013, pp. 48-54.

Un SPARQL endpoint également pour le projet SyMoGIH?

La solution technologique est en place depuis mai 2013 * La plate-forme D2RQ permet de transformer les données de la base de données postgresql en triplets RDF * Pour améliorer la performance lors de requêtes SPARQL complexes, un dump périodique de la base est effectué avec D2RQ et versé dans un serveur Virtuoso * La structure générique des données et l'application dans D2RQ du principe R2RML (qui applique aux données relationnelles un mapping spécifique) permet de choisir l'ontologie de publication des données * Reste la question essentielle : quelle ontologie utiliser?

Le modèle de DBpedia http://fr.wikipedia.org/wiki/giovanni_garzia_millini "1606-09-11" prop-fr:création Millini, Giovanni Garzia prop-fr:création prop-fr:titre "par le pape Paul V" "cardinal" Sourçage (traçabilité)? Lien entre ces propriétés? Entités nommées?

Le modèle générique de SyMoGIH : unités de connaissance, rôles, objets

La recherche d'une ontologie adaptée Gian Garsia Mellini symogih:actr255 "1606-09-11" symogih:datation symogih:etre_nomme Nomination symogih:info93265 symogih:nommer symogih:destination symogih:actr288 Paul V symogih:soch370 Cardinal symogih:sourçage symogih:bibl1968 DBI, vol. 73 (2009),...

CIDOC Conceptual Reference Model (CRM) http://cidoc-crm.org/

BIO: A vocabulary for biographical information http://vocab.org/bio/0.1/.html

Simple Event Model (SEM) Design and use of the Simple Event Model (SEM) Willem Robert van Hage, Véronique Malaisé, Roxane Segers, Laura Hollink, Guus Schreiber (http://www.websemanticsjournal.org/index.php/ps/article/view/190/188) http://semanticweb.cs.vu.nl/2009/11/sem/

Factoïd ontology KCL s Department of Digital Humanities (DDH : Prosopographies of the Byzantine World (PBE and PBW), Anglo-Saxon England (PASE), Medieval Scotland (PoMS), Anglo-Scottish cross-border society ( Breaking of Britain : BoB) Michele Pasin and John Bradley, Factoid-based prosopography and computer ontologies: Towards an integrated approach, Literary and Linguistic Computing Advance Access published June 29, 2013

Une ontologie pour la plate-forme SyMoGIH :

Une ontologie pour la plate-forme SyMoGIH : * trois classes principales : objets, unités de connaissance, rôles

Une ontologie pour la plate-forme SyMoGIH : * trois classes principales : objets, unités de connaissance, rôles * un traitement détaillé de la datation (incertitude)

Une ontologie pour la plate-forme SyMoGIH : * trois classes principales : objets, unités de connaissance, rôles * un traitement détaillé de la datation (incertitude) * le sourçage : garantie de traçabilité de l'information

Questions ouvertes : * quelle ontologie pour une interopérabilité des données historiques? modèle générique et évolutif datation (incertitude, normalisation) sourçage détaillé : traçabilité de l'information * sous quelle licence rendre accessibles les données de symogih.org ou, plus largement, les données produites par la recherche en histoire? la Charte de SyMoGIH : visibilité sur le web? creative commons avec mention de l'auteur et usage non-commercial? open data avec possibilité d'utilisation commerciale de l'ensemble des données de la plate-forme? * quelle articulation entre les données de la recherche et les solutions mises en place par les producteurs des données patrimoniales?