Publication et intégration de données ouvertes

Documents pareils
Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Présentation générale du projet data.bnf.fr

Le Web de Données Dan VODISLAV Université de Cergy-Pontoise Master Informatique M2 Plan

JDev Atelier Datalift

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Datalift. + + Architecture Modularité Déploiements. d j = 09/04/2015 Laurent BIHANIC

Exploration des technologies web pour créer une interaction entre Mahara et les plateformes professionnelles et sociales

Evolution des catalogues et des métiers: comment se préparer aux changements? Quelques échos de la BnF. CRFCB Université de Toulouse 29 mars 2013

Intégration de données complexes pour une vision 360 du client. Chloé Clavel EDF R&D Département ICAME

Conseil de développement durable (C2D) Plénière d ouverture 17 décembre 2014

Catalogue des formations Edition 2015

Open Data. François Bancilhon twitter.com/fbancilhon Printemps de la recherche EDF R&D 28/9/12

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

Perspectives en matière de portails géographiques et de 3D

Compte-rendu re union Campus AAR 3 mars 2015

Linked Data et description du produit automobile SemWeb Pro, Paris, 2 mai 2012

Développement d applications Internet et réseaux avec LabVIEW. Alexandre STANURSKI National Instruments France

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype

Semantic Web Inside Guillaume Érétéo Directeur R&D

De l OpenData aux citoyens : potentiel et limites des plateformes collaboratives

Formation : WEbMaster

Architecture N-Tier. Ces données peuvent être saisies interactivement via l interface ou lues depuis un disque. Application

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

Web Sémantique. Examen

L importance des choix juridiques pour la médiation dans l environnement numérique

Journal de l OSGeo Le journal de la Fondation Open Source Geospatial Volume 3 / Décembre 2007

EXTENSION de Microsoft Dynamics CRM Réf FR 80452

OFFRE MDB Service & Architecture Technique. MyDataBall Saas (Software as a Service) MyDataBall On Premise

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015)

Bibliothèque numérique de l enssib

Datalift day 9 avril 2015

INDUSTRIALISATION ET RATIONALISATION

DataStudio. Solution d intégration des données et de diffusion de l information

Royaume-Uni data.gov.uk, l ouverture des données publiques au Royaume-Uni

Les Architectures Orientées Services (SOA)

Rapport de TN10 : Développement D application Sémantique

Présentation aux entreprises du numérique

Regards Citoyens L'Open Data par et pour les citoyens

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

Utiliser SQL Server 2008 R2 Reporting Services comme source de donne es pour Microsoft Excel

Pierre Racine Professionnel de recherche Centre d étude de la forêt Département des sciences du bois et de la forêt, Université Laval, Québec

Architecture Orientée Service, JSON et API REST

Une organisation internationale au cœur des enjeux de contenus et d accès à l information scientifique: L IFLA

Business Intelligence, Etat de l art et perspectives. ICAM JP Gouigoux 10/2012

Extensions, Documentation, Tutoriels, Astuces

Introduction à Microsoft InfoPath 2010

Drupal un CMS orienté mé2er. Romain JARRAUD Mathieu GROS

Table des matières La gestion de musée en toute simplicité Atouts fonctionnels Atouts techniques > > > > > > > > > > > > > >

Mercredi 05/10/2011. Forges logicielles. Olivier Berger, Telecom SudParis. Introduction Avant-propos À propos de COCLICO. Panorama des forges

armasuisse Office fédéral de topographie swisstopo Cours geocat.ch 28 avril 2014

Oracle Fusion Middleware Concepts Guide 11g Release 1 (11.1.1) Figure 1-1 Architecture Middleware

21 mars Simulations et Méthodes de Monte Carlo. DADI Charles-Abner. Objectifs et intérêt de ce T.E.R. Générer l'aléatoire.

Module BD et sites WEB

ANTICIPEZ ET PRENEZ LES BONNES DÉCISIONS POUR VOTRE ENTREPRISE

Comment optimiser votre. utilisation de POM? 23 avril 2015

Rendez-vous la liberté avec Rational Quality Manager

Des solutions d affaires, performantes et évolutives

Développer des Applications Internet Riches (RIA) avec les API d ArcGIS Server. Sébastien Boutard Thomas David

Constat ERP 20% ECM 80% ERP (Enterprise Resource Planning) = PGI (Progiciel de Gestion Intégré)

Interaction entre réseaux sociaux et sites web

Open Data. Enjeux et perspectives dans les télécommunications

Un serveur d'archivage

Java et les bases de données

Adaptabilité d un MOOC aux styles d apprentissage. Hubert Kadima Directeur de Recherche LARIS/EISTI hubert.kadima@eisti.fr

BIRT (Business Intelligence and Reporting Tools)

Cours Plugin Eclipse. Université Paris VI / Parcours STL / Master I Pierre-Arnaud Marcelot - Iktek - pamarcelot@iktek.com

L archivage pérenne du document numérique au CINES. CINES (O.Rouchon) Rencontres RNBM 3 Octobre 2007

Développement d'un logiciel VoIP BlackBerry

Jean-Philippe VIOLET Solutions Architect

Learning Object Metadata

LIBERTY Portfolio Management System

Nicolas ANGENIEUX GISMARTWARE

IBM Tivoli Compliance Insight Manager

XML pour la mise en valeur des informations

FileMaker Server 11. Publication Web personnalisée avec XML et XSLT

L art d ordonnancer. avec JobScheduler. François BAYART

Glossaire. ( themanualpage.org) soumises à la licence GNU FDL.

Solutions Microsoft Identity and Access

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

Analyse comparative entre différents outils de BI (Business Intelligence) :

Diagrammes de Package, de déploiement et de composants UML

Entreprises Solutions

Vérifier la qualité de vos applications logicielle de manière continue

CommentWatcher. plateforme Web open-source pour analyser les discussions sur des forums en ligne. Marian-Andrei RIZOIU

La mémorisation des mots de passe dans les navigateurs web modernes

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

Formation SharePoint Server 2013

Intégration de systèmes

XML par la pratique Bases indispensables, concepts et cas pratiques (3ième édition)

Open data : les données libérées doivent-elles être gratuites?

GKR. Geological Knowledge Representation Base de connaissances métallogéniques

e-science : perspectives et opportunités pour de nouvelles pratiques de la recherche en informatique et mathématiques appliquées

Architectures d'intégration de données

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

jeudi 19 septembre 2013, Bournezeau Services et Solutions en Carrière

Gestion et sécurisation des échanges XcMon, PMPI 03.31/2004 PDB. Global Data Exchange System

La géomatique en Nouvelle-Calédonie usages professionnels et potentiels économiques

Cursus Sage ERP X3 Outils & Développement. Le parcours pédagogique Sage ERP X3 Outils et Développement

Master Technologies numériques appliquées à l'histoire Deuxième année

Transcription:

Publication et intégration de données ouvertes François Scharffe LIRMM, UM2 Gazouillez #lechatpito #datalift 1

Qu est-ce qu une donnée ouverte? Une donnée accessible sur le web sous une licence ouverte. Notre contexte est plus large: Données accessibles sous condition Licences de différents types 2

Données Ouvertes Un sujet très à la mode Motion du G8 pour l ouverture et la transparence des données Directives de l UE (Open Data, Inspire) Etalab et data.gouv.fr Open Data France qui amène de nouvelles problématiques Sous quel(s) format(s) publier les données? De quelle façon y accéder? Différents niveaux d ouverture? respect de la vie privée, etc 3

Partons en voyage... 4

Problème de planning 5

Problème de planning 6

Une situation insuffisamment satisfaisante pour la valorisation de vos données Oblige les développeurs à : Ø Analyser à chaque fois la sémantique de vos données : qu'est-ce que veut dire ce champ nom? signifie-t-il la même chose que dans cet autre jeu de données? Ø Découvrir par eux-mêmes les relations entre vos données et d'autres données Ø Gérer des formats hétérogènes pour croiser des données : CSV pour tel jeu de données, XLS pour tel autre, SHP pour ce dernier Ø Gérer des méthodes d'accès hétérogènes pour accéder aux données : APIs propriétaires différentes De votre côté : Ø Temps passé à développer des APIs Ø Difficulté à faire adapter des applications existantes à vos données 7

Le Web sémantique comme solution Ø Un système d'identifiants global : les URIs chaque donnée ou métadonnée est identifiée de manière non ambigue : http://dbpedia.org/resource/paris est la ville de Paris en France ; pas de risque de confusion avec Paris au Texas ou avec les paris sportifs Ø Un format unique, RDF : un modèle de données simple pour décrire vos données, extensif à l'infini Ø La standardisation de la sémantique de vos données, à travers des propriétés et des vocabulaires réutilisables : par ex. vous n'avez pas à réinventer pas la propriété auteur qui est déjà définie ailleurs Ø Un protocole d'acccès uniforme : HTTP, SPARQL SPARQL est l'api unique, normalisée, du web sémantique (ressemble à SQL) 8

Datalif De données brutes ouvertes à des données sémantiques interconnectées 9

Datalift Plateforme logicielle pour assister la publication de données Publication de jeux de données R&D pour automatiser le processus de publication Formations, tutoriels, camps de publication de données 10

Le processus d'élévation 11

Le processus de publication DBPedia IGN INSEE Accès HTTP Interrogation en SPARQL Ontologie du service public Ontologie géographique Conversion RDF RDF Conversion XML RDF 12

sélection Ø Qu est-ce qu un (bon) vocabulaire pour des données liées? Critères d utilisabilité Simplicité, visibilité, pérennité, intégration, cohérence Ø Différents types de vocabulaires De métadonnées, de référence, de domaine, généraliste Les piliers du Linked Data : Dublin Core, FOAF, SKOS Ø Bonnes et moins bonnes pratiques Ex : Programmes BBC vs legislation.gov.uk Vocabulary of a Friend : les vocabulaires en réseau Ø Problèmes linguistiques Les vocabulaires existants sont en anglais à 99% Approche terminologique : quels vocabulaires pour «Evénement» «Organisation» 13

conversion Ø Guide des bonnes pratiques pour les données liées: La ressource: http://id.insee.fr/geo/commune/75056 Le document: http://www.insee.fr/geo/commune/75056 Les données: http://rdf.insee.fr/geo/commune/75056 14

conversion Ø Guide des bonnes pratiques pour les données liées: La ressource: http://id.insee.fr/geo/commune/75056 Le document: http://www.insee.fr/geo/commune/75056 Les données: http://rdf.insee.fr/geo/commune/75056 15

Managing licenses and access rights on published data 16

publication Utiliser le format RDF Utiliser des URI pour nommer les choses Utiliser des URI HTTP (URL) pour pouvoir leur demander des informations Donner des informations (HTML, RDF) quand les liens sont dé-référencés Inclure dans ces infos les URIs pointant vers d'autres données pour permettre la découverte Tim Berners Lee, SemWebPro 18/01/2011 17 http://www.w3.org/designissues/linkeddata.html

Interconnexion Dépasser l'hétérogénéité des données Comment identifier les jeux de données à lier? Comment trouver les resources équivalentes? SemWebPro 18/01/2011 18

Et plus... Gestion des droits d'accès aux données à échelle variable Gestion des licences, licences composites Une API web de données pour Androïd Des patrons configuration pour visualiser les données... 19

La plateforme Datalift Architecture modulaire Supporte le processus de publication Documentée : installation, utilisation, développement Sécurisée Open-source Exécutables pour Windows, OSX, Linux 20

La plateforme Datalift 21

Quelques jeux de données 22

Datalift Platform 23

24

25

26

DATALIFT En route vers le web de données 27