Partage de sémantique pour la mise en oeuvre de la directive INSPIRE : le thésaurus COVADIS Journée Interopérabilité et Innovation 2014 Benoît DAVID Mission de l'information géographique MEDDE/CGDD/DRI 1
Plan de la présentation Inspire et données liées Thésaurus Covadis Un vocabulaire contrôlé pour Inspire Perspectives 2
Inspire et données liées (1/2) La mise en œuvre de la directive Inspire n est pas fondée sur les technologies des données liées Cependant, plusieurs actions sont menées dans le domaine des données liées : Mise en œuvre d un registre Inspire (http://inspire.ec.europa.eu/registry/) et mise à disposition du logiciel Re3gistry de mise en œuvre de registres (https://joinup.ec.europa.eu/software/re3gistry/) Harmonisation de la publication des métadonnées Inspire dans les portails données ouvertes conformément à «Data Catalog Vocabulary (DCAT)» (W3C) 3
Inspire et données liées (2/2) Suite : Étude «RDF and PIDs for Location» dans le cadre du programme ARE3NA «A Reusable INSPIRE Reference Platform» (https://joinup.ec.europa.eu/community/are3na/) «Core Location Vocabulary (CLV)» développé dans le cadre du programme ISA https://joinup.ec.europa.eu/asset/core_location/asset_relea se/core-location-vocabulary-100 4
Thésaurus COVADIS Besoin (1/2) Pour respecter la directive Inspire, les autorités publiques doivent créer et publier des métadonnées de leurs séries de données Chaque fiche de métadonnées doit indiquer le thème Inspire auquel la série est affectée Cette affectation soulève des difficultés car : La définition des thèmes n est pas toujours suffisamment explicite En France les données géographiques produites par les autorités locales et les services déconcentrés sont peu standardisées 5
Thésaurus COVADIS Besoin (2/2) La COVADIS (Commission de Validation des Données pour l Information Spatialisée) commission interministérielle mise en place par le MEDDE et le MAAF pour standardiser leurs données géographiques les plus fréquemment utilisées dans leurs métiers. Les services MEDDE/MAAF lui ont demandé une assistance pour déterminer le thème correspondant à leurs données 6
Thésaurus COVADIS Démarche (1/4) La solution retenue consiste à établir à partir des séries de données les plus fréquemment rencontrées un ensemble de concepts d entités (feature concept) et de leur associer le thème Inspire pertinent Certains concepts sont bien définis soit par des textes juridiques soit par des services statistiques. Les termes sont spécifiquement français et la correspondance avec les concepts définis par Inspire n est pas toujours évidente. Il est donc utile de recenser ces concepts en indiquant l origine de la définition et d indiquer pour chacun la correspondance avec les concepts définis par Inspire. Ex : réserve naturelle, plan local d urbanisme, petite région agricole Ces concepts constituent un premier vocabulaire appelé vocabulaire des concepts juridiques et statistiques 7
Thésaurus COVADIS Démarche (2/4) Pour les autres concepts relevant d Inspire, le nom donné dans Inspire soulève moins de difficultés et peut être conservé. Il s agit notamment des concepts topographiques. Ex : Unité de couverture du sol, Courbe de niveau Ces concepts constituent un second vocabulaire appelé vocabulaire Inspire Enfin, il existe une grande diversité de séries de données ne relevant pas des 2 cas précédents, et la solution retenue consiste définir dans le thésaurus COVADIS un ensemble de politiques publiques et à rattacher les séries de données aux politiques publiques auxquelles les séries de données concourent Ex : La série de données «Poste de guet d'intérêt DFCI» sera indexée par le terme «défense de la forêt contre les incendies» Ces politiques publiques sont structurées dans un vocabulaire des politiques publiques 8
Thésaurus COVADIS Démarche (3/4) La démarche pour identifier le bon terme dans le thésaurus COVADIS est la suivante : 1. Si les données sont définies juridiquement alors le terme doit être appartenir au vocabulaire des concepts juridiques et statistiques 2. Sinon, si les données relèvent d Inspire alors le terme doit être un concept d entité du vocabulaire Inspire 3. Sinon, le terme est une politique publique du vocabulaire des politiques publiques Dans les 2 premiers cas, le thème Inspire peut être déduit du terme choisi. 9
Thésaurus COVADIS Démarche (4/4) La COVADIS a demandé de plus que ces concepts d entités puissent être alignés avec des vocabulaires existants notamment AGROVOC, GEMET et EUROVOC Les concepts d entités ont été structurés sous la forme d un vocabulaire contrôlé (ou thésaurus) conforme au standard SKOS du W3C Le standard SKOS offre des notions standardisées pour définir des concepts, les hiérarchiser et définir des alignements entre vocabulaires L outil utilisé (GéoSource) pour saisir les métadonnées ne permettant pas de gérer un thésaurus ainsi structuré, le thésaurus est publié sous la forme d une page HTML (http://www.geocatalogue.fr/www/affectthemes.html) utilisée comme aide à la détermination du thème Inspire Une évolution de GéoSource est en cours de réalisation afin de prendre en compte ce type de thésaurus 10
Vocabulaire contrôlé VocInspire (1/3) Les concepts d entités Inspire sont définis par le règlement interopérabilité Certains concepts d entité peuvent être détaillés en exploitant certaines listes de codes définissant des sous-types Exemple : «Zone de gestion, de restriction ou de réglementation». zonetype = «zone vulnérable aux nitrates» Le vocabulaire Inspire peut être étendu avec ces valeurs de listes de codes 11
Vocabulaire contrôlé VocInspire (2/3) Pour constituer le vocabulaire Inspire : Un registre des concepts du règlement «interopérabilité» Inspire a été créé à partir du règlement avec notamment les libellés et les définitions en français (http://docinspire.eu/) Un vocabulaire a été élaboré fondé selon les principes suivants: Le premier niveau est constitué par les thèmes Si nécessaire les paquets sont définis dans les thèmes Les concepts d entité (feature concepts) sont définis dans les paquets lorsqu ils existent ou sinon dans les thèmes Enfin, il est utile d intégrer dans le vocabulaire certaines valeurs de listes de codes qui précisent le sens. Ainsi lorsqu un attribut définit des sous-concepts affinant le sens (comme dans l exemple ci-dessus) alors les valeurs de listes de codes sont ajoutées dans le vocabulaire comme termes spécifiques au concept d entité 12
Vocabulaire contrôlé VocInspire (3/3) Ce nouveau vocabulaire (appelé VocInspire) : Est quasiment défini par le règlement interopérabilité Inspire avec des définitions pour chaque terme Est un outil de communication intéressant du contenu sémantique d Inspire Est disponible dans toutes les langues de l UE sur http://docinspire.eu/cvoc/ Au niveau européen, l utilisation de ce vocabulaire est une voie pour améliorer les capacités de recherche dans les catalogues de données 13
Synthèse et perspectives Le thésaurus Covadis est constitué de 3 vocabulaires : 1. Le vocabulaire des concepts juridiques et statistiques, à chacun de ces concepts est associé un thème inspire 2. Le vocabulaire des concepts Inspire issu du règlement interopérabilité Inspire 3. Le vocabulaire des politiques publiques Une première version du thésaurus a été publiée sur le Géocatalogue pour aider à l affectation des thèmes Une première version du vocabulaire des concepts Inspire a été publié dans les langues de l UE GeoNetwork/GéoSource est en cours d extension pour prendre en compte ce type de thésaurus structuré L utilisation de ce thésaurus facilitera la recherche de données dans les catalogues Il est envisagé d étendre cette démarche pour traiter l ensemble des données produites dans le cadre d Inspire 14