Vers une meilleure interopérabilité des données géographiques françaises sur le Web de données. Ghislain Atemezing Raphaël Troncy

Documents pareils
Intégration de données complexes pour une vision 360 du client. Chloé Clavel EDF R&D Département ICAME

Présentation générale du projet data.bnf.fr

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Le Web de Données Dan VODISLAV Université de Cergy-Pontoise Master Informatique M2 Plan

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

JDev Atelier Datalift

LabCom SMILK. Social Media Intelligence and Linked Knowledge. ISTE 2013 Keynote thumb wrestling

RDF Schema pour les ontologies légères

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

Semantic Web Inside Guillaume Érétéo Directeur R&D

Perspectives en matière de portails géographiques et de 3D

Datalift day 9 avril 2015

Catalogue des formations Edition 2015

De la modélisation sémantique des événements vers l enrichissement et la recommandation

Compte-rendu re union Campus AAR 3 mars 2015

Rapport de TN10 : Développement D application Sémantique

Taxonomies, ontologies et folksonomies...

Datalift. + + Architecture Modularité Déploiements. d j = 09/04/2015 Laurent BIHANIC

Le Web : d une métaphore documentaire à une architecture de données

Adaptabilité d un MOOC aux styles d apprentissage. Hubert Kadima Directeur de Recherche LARIS/EISTI hubert.kadima@eisti.fr

Évaluation d une architecture de stockage RDF distribuée

La directive INSPIRE en Wallonie: le géoportail et l infrastructure de diffusion des géodonnées en Région wallonne (InfraSIG(

Linked Data et description du produit automobile SemWeb Pro, Paris, 2 mai 2012

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé

Nouveautés ArcGIS 10.2

Web sémantique et pratiques documentaires

Web Sémantique. Examen

Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes

Problématiques de recherche. Figure Research Agenda for service-oriented computing

Vues d ensembles de documents RDF

Applications des technologies sémantiques à la gestion des connaissances

Knowledge Enabled Real-Time Recommendation System

Dis moi, ça apporte quoi Géolys? Tu sais, Géolys, c est avant tout une réponse à ces questions-là

opentaxepub Documentation

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

D'AGROVOC à l'agricultural Ontology Service / Concept Server. Un modèle OWL pour la création d'ontologies dans le domaine de l'agriculture

Université de Toulouse-Le Mirail janvier 2012 Département de Géographie-Aménagement-Environnement Laurent Jégou

Cycle de vie du logiciel. Unified Modeling Language UML. UML: définition. Développement Logiciel. Salima Hassas. Unified Modeling Language

JOURNÉE D ÉTUDE AFNOR/BNF

Evolution des catalogues et des métiers: comment se préparer aux changements? Quelques échos de la BnF. CRFCB Université de Toulouse 29 mars 2013

Linked Enterprise Data. Principes, usages et bénéfices

GKR. Geological Knowledge Representation Base de connaissances métallogéniques

Synthèse... 1 Introduction Contexte de la création multimédia et surgissement du web sémantique 6

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

Conseil de développement durable (C2D) Plénière d ouverture 17 décembre 2014

Trait de côte Histolitt v1.0 Descriptif technique Version du document 1.0 *** Sommaire

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

KONTRAST : création d un glossaire contrastif à partir d un corpus de normes internationales

Glossaire. base de données géographiques Voir géodatabase (GDB).

ArcGIS for INSPIRE SIG RAIL 2011

Le projet PALETTE et les CoPs L exemple de la CoP eprep

DU PATRIMOINE AU TERRITOIRE

De l OpenData aux citoyens : potentiel et limites des plateformes collaboratives

MÉMOIRE DE STAGE DE MASTER 2. Une application Smartphone pour un système de recommandations alimentaires personnalisées

L outil 3D «Grand Territoire» de l Agglomération de Montpellier- De la communication à la participation?

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015)

Infrastructure de Données Spatiales

Commission Animation territoriale - CNIG 25 juin ign.fr

Sujet de thèse CIFRE RESULIS / LGI2P

SparkInData. Place de Marché des applications Spatiales

Les Géodatabases en 9.2

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype

Une application sur tablette tactile pour la saisie de données naturalistes sur le terrain Linhota

Ecole Nationale Supérieure de Mécanique et d Aérotechnique Laboratoire d Informatique et d Automatique pour les Systèmes THESE

Les ontologies pour l intégration sémantique : enjeux et défis

Outil de saisie et de gestion de données d observation naturaliste

AMELIORATIONS DES FONCTIONNALITES DISPONIBLES

Le Géoportail de la Wallonie

Les nouveautés de FME 2014

ArcGIS 10 Christophe Tourret Gaëtan Lavenu

Conférence SIG 2011 Versailles 5-6 Octobre 2011 Atelier Technique ArcGIS for Server en 10.1

UML (Paquetage) Unified Modeling Language

Infrastructures de géodonnées. L expérience belge au niveau des régions: la Wallonie

Découvrir Drupal, le CMS Open Source de référence. Michel-Marie MAUDET Linagora /

Le Guide Pratique des Processus Métiers

Open Data. François Bancilhon twitter.com/fbancilhon Printemps de la recherche EDF R&D 28/9/12

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

CAHIER DES CLAUSES TECHNIQUES PARTICULIERES

Open Data. Enjeux et perspectives dans les télécommunications

Dafoe Présentation de la plate-forme UIMA

openarchitectureware & transformation de modèle Yannick Lizzi Architecte Logiciel itemis France Mail: lizzi@itemis.de

Protection de la vie privée basée sur des ontologies dans un système Android

Mise en place d'une chaîne de production raster multi-échelles

Intégration des connaissances en neurosciences dans un environnement multi-centrique

Innovations Majeures de la Version 4

Développer des Applications Internet Riches (RIA) avec les API d ArcGIS Server. Sébastien Boutard Thomas David


Exploration des technologies web pour créer une interaction entre Mahara et les plateformes professionnelles et sociales

Architecture d'entreprise : Guide Pratique de l'architecture Logique

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

Chapitre VII : Principes des réseaux. Structure des réseaux Types de réseaux La communication Les protocoles de communication

Nouveautés ArcGIS 10.1 for Server

Gordon Dunsire Consultant indépendant Edimbourg, GB Mél. : gordon@gordondunsire.com

Chapitre I : le langage UML et le processus unifié

Réplication E-maj Foreign Data Wrapper PostGIS PostgreSQL-f

Cartographie libre du monde OpenStreetMap

Service de VPN de niveau 3 sur RENATER (L3VPN MPLS)

Une approche langage pour la gestion de données dans les systèmes de méta-modélisation

Trends. Médias sociaux et SEO - la force du contenu

Transcription:

Vers une meilleure interopérabilité des données géographiques françaises sur le Web de données Ghislain Atemezing Raphaël Troncy

Plan Où sont les données géographiques? Le mobile et l utilisation de la géo-localisation Données géographiques sur le web sémantique Modélisation des objets géographiques Modélisation des entités géographiques Modélisation de la géométrie Illustration avec des scénarios Aligner les représentations Formuler quelques recommandations Conclusion et travaux futurs IC2012, Paris - 2

Où sont les données géographiques? Foursquare: POI.. GeoPortail Opengeocoder: Bounding Box.. CIA Factbook GeoNames: Codes des pays IC2012, Paris - 3

Où sont les données géographiques liées? DBpedia, GeoNames LinkedGeodata (OpenStreetMap), Freebase (Google) Ordnance Survey (UK), GeoLinkedData (ES) GADM-RDF NUTS-RDF data.ign.fr (FR) Fournisseur #Donnée disponible DBpedia 727 232 triplets GeoNames 5 240 032 («entités») LinkedGeoData 60 356 364 triplets Ordnance Survey 6 295 triplets Freebase GeoLinkedData.es Projet GADM Projet NUTS 8,5 MB (tsv fichiers) 101 018 triplets 682 605 triplets 316 238 triplets IC2012, Paris - 4

Données géographiques liées et LOD 31 jeux de données 19.43% triplets http://lod-cloud.net/state Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/ 5 IC2012, Paris

Les vocabulaires utilisés IC2012, Paris - 6

Quels sont les modèles IC utilisés? Des listes d autorité de termes (Foursquare) Peu structurée Représente les catégories des Points d Intérêt Typiquement, un type réponse d une API Nécessite d expliciter la sémantique Des catégories SKOS (GeoNames) Les classes sont des skos:conceptscheme Les codes sont des skos:concept Peu de classes, de nombreux codes IC2012, Paris - 7

Quels sont les modèles IC utilisés? Des ontologies spécifiques au domaine Les ontologies par sous-domaine (transport, unité administrative, hydrographie, etc.) Ontologies interconnectées (owl:imports) UK (OS) ES (GeoLinkedData) Des ontologies riches construites par des outils automatiques / TAL Les classes de haut-niveau pour structurer LinkedGeoData (16 classes de haut-niveau; 1294 classes au total) GeOnto (2 classes de haut-niveau; 783 classes au total) IC2012, Paris - 8

Modélisation de la geométrie Point (lat/long) Vocabulaire WGS 84 décrit au W3C Rectangle ( bounding box ) Vocabulaire géopolitique (FAO) Points dans une liste («Nodes», «waynodes») Séquence de points (LinkedGeoData) Points dans un groupe de ressources RDF Un objet est formedby ListOfPoints(GeoLinkedData.es) Littéraux (représentation GML incluse en RDF) Ordnance Survey(UK) Représentation complètement structurée Le vocabulaire NeoGeo (GeoVocamp) IC2012, Paris - 9

Scénario: Tour Eiffel / Paris 7ème IC2012, Paris - 10

La Tour Eiffel sur DBpedia (un Building ) dbpedia:eiffel_tower a dbpedia-owl:building ; a <http://schema.org/place> ; (16 types différent) rdfs:label "Tour Eiffel"@fr ; geo:lat "48.858299"^^xsd:float ; (WGS84 ) geo:long "2.294500"^^xsd:float ; geo:geometry "POINT(2.2945 48.8583)" ; dbpprop:buildingtype "Observation tower"@en ; dbpprop:elevatorcount "9"^^xsd:int ; dbpprop:location dbpedia:paris ; dbpprop:isofregion "FR-75" ; dbpprop:architect dbpedia:stephen_sauvestre. IC2012, Paris - 11

La Tour Eiffel sur Freebase (un skyscraper ) fb:en.eiffel_tower a fb:architecture.building ; a fb:architecture.skyscraper ; (12 rdf:type in total) fb:architecture.skyscraper.height_with_antenna_spire_meter s "324.0"^^xsd:float ; fb:location.geocode [ fb:location.geocode.longitude "2.2946"^^xsd:float ; fb:location.geocode.latitude "48.85839"^^xsd:float. ] ; IC2012, Paris - 12

La Tour Eiffel sur GeoNames (un S.MMT ) gnr:6254976 a gn:feature ; gn:name "Eiffel Tower" ; gn:alternatename "에펠 탑"@ko ; (en 45 langues différentes) gn:featureclass gn:s [ a skos:conceptscheme ; rdfs:comment "spot, building, farm,..."@en. ] ; gn:featurecode gn:s.mmt [ a skos:concept ; rdfs:comment "a commemorative structure or statue"@en. ] ; gn:countrycode "FR" ; geo:lat "48.8583" ; geo:long "2.29452". IC2012, Paris - 13

La Tour Eiffel sur LGD (un chemin de 45 points) lgd:way5013364 a lgdo:building, lgdo:manmadetower, lgdo:attraction ; rdfs:label "Wieża Eiffel'a"@pl ; (en 13 langues.) lgdo:layer "2"; lgdp:building:height "301"; lgdp:importance "international"; lgdo:hasnodes <http://linkedgeodata.org/triplify/way5013364/nodes>. rdf:_1 lgd:node33388356; ; rdf:_10 lgd:node33388333 ; (tous les 45 points du polygone) IC2012, Paris - 14

7ème Arrondissement in DBpedia (a gml_feature) dbpedia:7th_arrondissement_of_paris a gml:_feature ; (gml n est pas en OWL ) a <http://dbpedia.org/class/yago/1900summerolympicvenues> (Yago Class) rdfs:label " 巴 黎 第 七 區 "@zh; (14 different languages) dbpprop:commune "Paris" ; dbpprop:département dbpedia:paris ; dbpprop:région dbpedia:île-de-france_(region) ; grs:point "48.85916666666667 2.312777777777778" ; geo:geometry "POINT(2.31278 48.8592)" ; (fake property?!) geo:lat "48.859165"^^xsd:float; geo:long "2.312778"^^xsd:float. IC2012, Paris - 15

7ème Arrondissement in GeoNames (a A.ADM4) gnr:6618613 a gn:feature ; gn:name "Paris 07"; gn:alternatename "7ème arrondissement"; gn:featureclass gn:a [ a skos:conceptscheme ; rdfs:comment "country, state, region..."@en. ] ; gn:featurecolde gn:a.adm4 [ a skos:concept ; rdfs:comment "a subdivision of a third-order administrative division"@en. ]; gn:countrycode "FR"; gn:population "57410"; geo:lat "48.8565"; geo:long "2.321". IC2012, Paris - 16

7ème Arrondissement in LGD (a Suburb ) lgd:node248177663 a lgdo:suburb ; rdfs:label "7th Arrondissement"@en, "7e Arrondissement" ; lgdo:contributor lgd:user13442 ; <http://linkedgeodata.org/ontology/ref%3ainsee> 75107 ; lgdp:alt_name "VIIe Arrondissement" ; georss:point "48.8570281 2.3201953" ; geo:lat 48.8570281 ; geo:long 2.3201953. IC2012, Paris - 17

Vocabulaire GeOnto Ontologie des objets géographiques (PI) Résultat d un projet ANR Obtenue par des outils de TAL Recouvre la partie BDTopo (IGN) Classes en français rdfs:labels en FR & EN Pas de rdfs:comments Peu de relations 783 classes IC2012, Paris - 18

Méthodologie d alignement Alignement de GeOnto avec 4 vocabulaires et 2 taxonomies LGD, DBpedia, Schema.org, GeoNames Foursquare, Google Places Recherche des owl:equivalentclass Outil : Silk Métriques : LevenshteinDistance, Jaro Labels : @en des classes Fonction d agrégation : moyenne Validation manuelle Pour les «rdfs:subclassof» Alignement spécifique avec GeoNames IC2012, Paris - 19

Procédé d alignement avec GeoNames geonto:ageoconcept a owl:class; rdfs:label a laben @en; rdfs:subclassof gn:feature; owl:equivalentclass [a owl:restriction; owl:onproperty gn:featurecode; owl:hasvalue gn:code. ] Silk Entrepôt de triplets Rechercher les skos codes des classes de GeOnto Vérifier les links <70% Générer les liens «sameas» Construire un nouveau graphe avec des requêtes SPARQL «Construct» Fichier d alignement exporter le fichier rdf IC2012, Paris - 20

Résultats/Evaluation Vocab/taxonomies #Classes #Classes alignées LGD owl:class: 1294 178 DBpedia owl:class:366 42 Schema.org owl:class: 296 52 GeoNames skos:concept:699 287 Foursquare 359 46 Google Place 126 41 Precisions généralement > 80% Sauf P(Schema.org) = 50%. Raison possible: les entités GeOnto plus spécifiques à la France Niveau trop détaillé des entités sur Schema.org IC2012, Paris - 21

Recommendations Séparation des objets de leur géométrie Bien distinguer dans les espaces de nommage Exemple: spatial:feature vs geom:geometry Usage du vocabulaire WGS84 pour représenter les points Réutiliser les propriétés natives (long; lat; alt) Géométrie complexe (polygone, courbe, etc.) Utiliser les représentations plus structurées Eviter au maximum les nœuds anonymes dans les données Proposer des transformations aux formats SIG (KML, GML, etc.) Extension de GeOnto Un bon candidat: NeoGeo Publier selon les Bonnes Pratiques (data.ign.fr) IC2012, Paris - 22

Perspectives Publier GeOnto++ Selon les Bonnes Pratiques du web de données liées «Lifter» les données de l IGN En utilisant le vocabulaire Poursuivre les Alignements Schema.org, Foursquare, Google Place (évolutif) GeoSPARQL Procéder à des alignements au niveau des donnés IC2012, Paris - 23

Merci pour votre attention! Questions?