LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

Documents pareils
Présentation générale du projet data.bnf.fr

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Intégration de données complexes pour une vision 360 du client. Chloé Clavel EDF R&D Département ICAME

Le Web de Données Dan VODISLAV Université de Cergy-Pontoise Master Informatique M2 Plan

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

Catalogue des formations Edition 2015

L importance des choix juridiques pour la médiation dans l environnement numérique

Linked Enterprise Data. Principes, usages et bénéfices

JDev Atelier Datalift

Datalift. + + Architecture Modularité Déploiements. d j = 09/04/2015 Laurent BIHANIC

Evolution des catalogues et des métiers: comment se préparer aux changements? Quelques échos de la BnF. CRFCB Université de Toulouse 29 mars 2013

PloneLabs un gestionnaire de contenu pour les laboratoires

Open Data. Enjeux et perspectives dans les télécommunications

Business Intelligence, Etat de l art et perspectives. ICAM JP Gouigoux 10/2012

Linked Data et description du produit automobile SemWeb Pro, Paris, 2 mai 2012

Conseil de développement durable (C2D) Plénière d ouverture 17 décembre 2014

La stratégie de Radio France dans la production et la gestion de données musicales

21 mars Simulations et Méthodes de Monte Carlo. DADI Charles-Abner. Objectifs et intérêt de ce T.E.R. Générer l'aléatoire.

Compte-rendu re union Campus AAR 3 mars 2015

Culture Sector. United Nations Educational, Scientific and Cultural Organization

JOURNÉE D ÉTUDE AFNOR/BNF

Mercredi 05/10/2011. Forges logicielles. Olivier Berger, Telecom SudParis. Introduction Avant-propos À propos de COCLICO. Panorama des forges

Datalift day 9 avril 2015

Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype

Le WEB 2.0. ITCE NFE102 Année ! Le!web 2.0. Le web 2.0. Le web 2.0

Semantic Web Inside Guillaume Érétéo Directeur R&D

Infrastructure / réseau / sécurité /support utilisateur

Taxonomies, ontologies et folksonomies...

Table des matières détaillée

Bigdata et Web sémantique. les données + l intelligence= la solution

VOS INFORMATIONS ONT UNE VIE. Nous sommes là pour vous accompagner à chaque étape

Open Data. François Bancilhon twitter.com/fbancilhon Printemps de la recherche EDF R&D 28/9/12

Royaume-Uni data.gov.uk, l ouverture des données publiques au Royaume-Uni

BIENVENUE AU CENTRE POMPIDOU

Urbanisation des SI. Des composants technologiques disponibles. Urbanisation des Systèmes d'information Henry Boccon Gibod 1

Perspectives en matière de portails géographiques et de 3D

La gestion des documents administratifs à la Bibliothèque nationale de France

Une organisation internationale au cœur des enjeux de contenus et d accès à l information scientifique: L IFLA

INTERNET, C'EST QUOI?

Adaptabilité d un MOOC aux styles d apprentissage. Hubert Kadima Directeur de Recherche LARIS/EISTI hubert.kadima@eisti.fr

Exercices Active Directory (Correction)

Rapport de TN10 : Développement D application Sémantique

De l OpenData aux citoyens : potentiel et limites des plateformes collaboratives

FACEBOOK MARKETING Comment mieux tirer profit du ROI des médias sociaux

Protection des données personnelles : Vers un Web personnel sécurisé

Exploration des technologies web pour créer une interaction entre Mahara et les plateformes professionnelles et sociales

Phase ERP : Usages et effets. Problématiques technique et organisationnelle de la phase d'exploitation de l'erp

BI = Business Intelligence Master Data-ScienceCours 2 - ETL

Rédiger : le numérique dans la préparation de la thèse

DIRECTION DE LA COMMUNICATION ET DES PARTENARIATS DOSSIER DE PRESSE E-GUIDEZ VOUS! LA NOUVELLE APPLICATION DU CENTRE POMPIDOU

Exploiter les fonctionnalités de son compte Google

Regards Citoyens L'Open Data par et pour les citoyens

Les moyens de la communication parlementaire

Messagerie & Groupeware. augmentez l expertise de votre capital humain

Comment enfin réussir à gérer son courrier électronique! Jean-Michel Mermet - juin 2015

Le Web : d une métaphore documentaire à une architecture de données

Exemples de reque tes dans data.bnf.fr

Questionnaire sur le patrimoine des congrégations religieuses

Knowledge Enabled Real-Time Recommendation System


Métadonnées, ontologies et documents numériques

Un outil de communication et de Formation Agricole au service des jeunes ruraux

ASSOCIATION DDAY-OVERLORD

Programme national de numérisation. Ministère de la Culture et de la Communication. Appel à projets de numérisation 2010

CONSERVATOIRE NATIONAL DES ARTS ET METIERS INSTITUT NATIONAL DES TECHNIQUES DE LA DOCUMENTATION

EMC Forum EMC ViPR et ECS : présentation des services software-defined

Défi n 3 : Développer l attractivité de la destination

Référentiel des métiers et des fonctions de l information-documentation

Web Sémantique. Examen

Gestion de données avec les bibliothèques Final Cut Pro X. Livre blanc Juin 2014

Créer une base de données vidéo sans programmation (avec Drupal)

Petite définition : Présentation :

RÉSEAUX SOCIAUX & BTOB

L état de la virtualisation

Documents et Applications : CMS nouvelle génération

Présentation aux entreprises du numérique

Urbanisation des Systèmes d'information

pas à pas prise en main du service sur le web Le Cloud

Solution de stockage et archivage de grands volumes de données fichiers.

Les données massives de Copernicus : vers un nouveau paradigme. Hervé Jeanjean Cnes

TMS THE MUSEUM SYSTEM

Jeudi 16 octobre 2014

Master Information et communication spécialité Produits et services multimédia

Objectifs. Synthétiser. Moyens

+ = OpenStack Presentation. Raphaël Ferreira - enovance. Credits : Thanks to the OpenStack Guys 1

Travail collaboratif et à distance. DFGSM 2 Pr. F. Kohler 2012/2013

Concevoir sa stratégie de recherche d information

Digital DNA Server. Serveur d authentification multi-facteurs par ADN du Numérique. L authentification de confiance

PRÉPARER UN EDIT-A-THON

FICHE METIER. «Documentaliste» Documentaliste en radiodiffusion APPELLATION(S) DU METIER DEFINITION DU METIER

OUTLOOK GÉRER EFFICACEMENT SON BUSINESS D INGÉNIERIE OU DE CONSEIL AVEC OUTLOOK

Magento. Pratique du e-commerce avec Magento. Christophe Le Bot avec la contribution technique de Bruno Sebarte

Introduction aux «Services Web»

MDM Multicanal. - Tous Droits Réservés

Veeam Backup & Replication v6

Transcription:

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES 2e partie : relier, réutiliser, partager L'apport du Web de données Gautier Poupeau Antidot http://www.lespetitescases.net Twitter @lespetitescases Emmanuelle Bermès Centre Pompidou http://www.figoblog.org Twitter @figoblog Séminaire INRIA 1-5 octobre 2012

SOMMAIRE 1. Une interopérabilité basée sur les liens 2. Les différents types de données du Linked Data 3. Exemple de réutilisation des données du LOD 4. Exemple de réutilisation des technologies du LOD dans le contexte de l'organisation

D'un Web de documents... Principes du Web 1.0» Les documents (HTML) contiennent des liens entre eux» Le contenu n'est pas structuré» On ne peut pas faire de requêtes» On ne sait pas l'exploiter avec des machines

...à un Web d'applications... Principes du Web 2.0» Les APIs permettent d'exposer les données structurées»... donc de créer de nouvelles applications» Mais chaque API est propriétaire» Chaque API n'est valable que pour un «silo» de données» On ne peut pas faire de liens entre les données d'un silo à l'autre

... à un Web de données Principes du Linked Data» Comme le Web, le Linked Data est un espace documentaire unifié, global, commun» On peut faire des liens d'une donnée à une autre» Les données ne sont plus isolées dans des silos» Les APIs propriétaires sont remplacées par des standards ouverts (RDF, SPARQL, HTTP...)

Le problème de la diversité des modèles Bibliothèques Archives Musées Objets multiples Catalogage partagé Description hiérarchique Contexte Respect des fonds Objets uniques Description orientée événement

Comment mélanger les données tout en préservant la saveur unique de chaque domaine?

Construire l'interopérabilité Interopérabilité par conversion et copie Le plus petit dénominateur commun MARC Z. 39 50 SRU/SRW... OAI-PMH Dublin Core Simple

Construire l'interopérabilité Modèle hub and spoke Plusieurs bases de données partagent le même référentiel

Construire l'interopérabilité follow your nose Interopérabilité basée sur les liens

LES 4 PRINCIPES DU WEB DE DONNÉES http://dbpedia.org/resource/smoking_pipe_%28tobacco%29 (1) Utiliser des URIs 11

LES 4 PRINCIPES DU WEB DE DONNÉES http://dbpedia.org/resource/ Smoking_pipe_%28tobacco%29 (1) Utiliser des URIs (2) Utiliser des URIs accessibles via HTTP 12

LES 4 PRINCIPES DU WEB DE DONNÉES (2) Utiliser des URIs accessibles via HTTP (1) Utiliser des URIs (3) Donner l accès aux données utiles en utilisant les standards SPARQL et RDF 13

LES 4 PRINCIPES DU WEB DE DONNÉES http://dbpedia.org/resource/ Smoking_pipe_%28tobacco%29 (1) Utiliser des URIs (2) Utiliser des URIs accessibles via HTTP (3) Donner l accès aux données utiles en utilisant les standards SPARQL et RDF (4) Exprimer l URI des objets liés 14

2007 Le «Linked Data» ou Web de données

2008 Le «Linked Data» ou Web de données

2009 Le «Linked Data» ou Web de données

Le «Linked Data» ou Web de données 2011

SOMMAIRE 1. Une interopérabilité basée sur les liens 2. Les différents types de données du Linked Data 3. Exemple de réutilisation des données du LOD 4. Exemple de réutilisation des technologies du LOD dans le contexte de l'organisation

Linked data cloud en détail : ressources d intérêt général 20

Le projet DBPedia DBpedia est une initiative visant à extraire de l information structurée à partir de Wikipedia et à rendre cette information disponible sur le Web. DBPedia permet de faire des requêtes complexes sur les données de Wikipedia, et de relier d autres ensembles de données du Web à Wikipedia. 3,64 millions de chose dont : 416,000 personnes, 526,000 lieux, 106,000 albums musicaux, 60,000 films, etc. http://dbpedia.org 1 milliard de triplets RDF Mis au point et maintenu par Universität Leipzig, Freie Universität Berlin et la société OpenLink Software dans le cadre du projet 21

Linked data cloud en détail : ressources «sociales» 22

Linked data cloud en détail : ressources géographiques 23

Geonames et LinkedGeoData Geonames est un système d information géographique dont les informations sont libres (CC BY). 8 millions d emplacements géographiques (villes, monuments, montagnes ) dans le monde sont référencés et géotaggués ce qui en fait un des référentiels géographiques les plus complets. En complément de Web services, les données sont accessibles selon les principes du Linked Data. RDF pour les machines http://sws.geonames.org/6487834/ HTML pour les humains LinkedGeoData est à OpenStreetMap ce que Dbpedia est à Wikipedia http://linkedgeodata.org 320 millions de points géoréférencés 25 millions d itinéraires 24

Linked data cloud en détail : Les données gouvernementales 25

Data.gov et Data.gov.uk A la suite de l annonce de Barack Obama de mettre à disposition les données publiques américaines, les initiatives dans le domaine se multiplient. Les principes du Linked Data sont au cœur de la réflexion, mais pas forcément utilisés. Data.gov.uk Sous la direction de Nigel Shadbolt et Tim Berners-Lee 7 500 ensembles de données Utilisation des technos du Web sémantique Data.gov Initiative de Barack Obama 3500 ensembles de données Utilisation des technos du Web sémantique 26

Linked data cloud en détail : ressources multimédia 27

Linked data cloud en détail : ressources biologiques et médicales 28

Linked data cloud en détail : ressources bibliographiques 29

Data.bnf.fr http://data.bnf.fr/11919216/charles_perrault/ Fédérer les données des différentes bases pour faciliter l accès aux ressources 30

SOMMAIRE 1. Une interopérabilité basée sur les liens 2. Les différents types de données du Linked Data 3. Exemple de réutilisation des données du LOD 4. Exemple de réutilisation des technologies du LOD dans le contexte de l'organisation

Réutiliser les données du LOD un exemple : Monuments (Antidot) http://labs.antidot.net/demo/monuments/

L'exemple de Monuments Travail sur des données publiques Consolider des données éparses, individuellement faibles, pour créer une application riche. La base : la source des monuments historiques français (fichier CSV contenant 43 720 lignes sur data.gouv.fr)

L'exemple de Monuments Maillage et enrichissement avec 6 sources complémentaires : stations de métro, de trains, bases de photos et description de Wikipedia

L'exemple de Monuments Mailler les données

L'exemple de Monuments Le moteur de recherche sémantique pour créer simplement des applications riches et faciles d accès

L'exemple de Monuments

SOMMAIRE 1. Une interopérabilité basée sur les liens 2. Les différents types de données du Linked Data 3. Exemple de réutilisation des données du LOD 4. Exemple de réutilisation des technologies du LOD dans le contexte de l'organisation

Réutiliser les technologies du LOD un exemple : le Centre Pompidou Virtuel http://beta2.centrepompidou.fr Et à partir du 4/10/12 : http://www.centrepompidou.fr

Le Centre Pompidou Virtuel La production des ressources (numérisation, indexation, libération des droits) alimente des bases sources, ou bases métier. Les ressources sont ensuites transformées pour publication dans le Centre Pompidou Virtuel. Libération des droits Transformation des ressources Ressources numériques Indexation Bases sources Publication dans le Centre Pompidou Virtuel 40

Le Centre Pompidou Virtuel Le Centre Pompidou Virtuel est une interface de publication, qui agrège les contenus produits par différentes sources. Celles-ci sont alimentées en fonction de l activité de chaque secteur. Musée (reproductions des œuvres) Bibliothèque Kandinsky (documents numérisés) Archives (documents numérisés) Dpu (dossiers pédagogiques) Ircam (bases de données, archives sonores) Agenda (événements) SAV (films DACA, captations) Boutique (produits) Bpi (archives Sonores, ouvrages) Service Multimédia, DSIT : Analyse des besoins au regard des contenus nouveaux, mise en place de nouveaux outils. 41

Le Centre Pompidou Virtuel Modèle de données Œuvre A été présentée à l occasion de A créé Principalement, œuvres du musée Mais aussi : œuvre musicale (Ircam) Evénement Est reproduction de Conférence, exposition A pour sujet Ressource Is about Quelque chose qui existe sous forme numérique (image, audio, vidéo, texte) Est enregistrement de Est reproduction de / Est enregistrement de Personne concerne Artistes, auteurs, collectifs d artistes Document Collection Livres, Archives e.g. Cabinet des Arts graphiques, Donation Nina Kandinsky Lieu E.g. «Centre Pompidou» concerne 42

Le Centre Pompidou Virtuel Modèle de données A été présentée à l occasion de A créé Œuvre Evénement Est reproduction de A pour sujet Ressource Is about Is recording of Is reproduction of / Is recording of Personne Is about Fait partie de Document Est localisé dans Is about Collection Lieu 43

Le Centre Pompidou Virtuel Modèle de données A été présentée à l occasion de created Œuvre Evénement Is reproduction of Is about A pour sujet Ressource Concerne Est enregistrement de Is reproduction of / Is recording of Personne Is about Document Collection Lieu Is about Se déroule à 44

LE LED LINKED ENTERPRISE DATA Le LED correspond à l application des principes et technologies du Web sémantique à l entreprise

Le LED d'antidot

Le LED d'antidot

Principes du LED Faire émerger l implicite

Le LED d'antidot Pas de macro ontologie Réutiliser les vocabulaires existants Foaf, Organization, Dublin Core, ORE, Beatle (pour les issues)

Le LED d'antidot Utilisation des référentiels et vocabulaires Exploitation des données structurées Pour les documents : text mining pour repérer les personnes, produits, projets

Le LED d'antidot

Principes du LED Des applications métier

CONCLUSION (POUR VOUS METTRE EN APPÉTIT) Data Usages