Découverte de services Web sémantiques. Sana Sellami

Documents pareils
Problématiques de recherche. Figure Research Agenda for service-oriented computing

4. SERVICES WEB REST 46

Une architecture pour la découverte et l orchestration de services Web sémantiques

Approche Contract First

XML par la pratique Bases indispensables, concepts et cas pratiques (3ième édition)

Cycle de vie du logiciel. Unified Modeling Language UML. UML: définition. Développement Logiciel. Salima Hassas. Unified Modeling Language

Architecture Orientée Service, JSON et API REST

Exploration des technologies web pour créer une interaction entre Mahara et les plateformes professionnelles et sociales

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

OASIS Date de publication

Cours Master Recherche RI 7 Extraction et Intégration d'information du Web «Services Web»

GRIDKIT: Pluggable Overlay Networks for Grid Computing

Évaluation d une architecture de stockage RDF distribuée

Programmation Web Avancée Introduction aux services Web

République Algérienne Démocratique et Populaire Université Abou Bakr Belkaid Tlemcen Faculté des Sciences Département d Informatique

Le cadre des Web Services Partie 1 : Introduction

Introduction aux «Services Web»

TEXT MINING Tour d Horizon

Mineure Architectures Orientées Services SOA Business Process Modeling (BPM) Mineure SOA. Business Process Modeling (BPM)

Ingénierie Dirigée par les Modèles. Editeurs de modèles. (Eclipse Modeling Tools) Jean-Philippe Babau

Business Process Execution Language

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e :

Le Web de Données Dan VODISLAV Université de Cergy-Pontoise Master Informatique M2 Plan

Sommaire. Introduction La technologie ebxml EDI conventionnels versus ebxml Web Services et ebxml Acteurs de l ebxml Conclusion

Les Architectures Orientées Services (SOA)

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

Manuel d intégration API SOAP SMS ALLMYSMS.COM

IFIPS 5 / Nouvelles Architectures Logicielles Projet : Bus de web services avec «moteur» BPEL

Vers une Interopérabilité Multi-Niveaux des Métadonnées

Alimenter un entrepôt de données par des données issues de services web. Une approche médiation pour le prototype DaWeS

Sécurité des Web Services (SOAP vs REST)

BIRT (Business Intelligence and Reporting Tools)

Cours Bases de données

CRÉER, ROUTER ET GÉRER UNE NEWSLETTER, UN ING

Intégration d'applications à "gros grain" Unité d'intégration : le "service" (interface + contrat)

Business Process Modeling (BPM)

3W Academy Programme de Formation Développeur Intégrateur web Total : 400 heures

DSL. Domain Specific Language. À l'aide des technologies Eclipse Modeling. Goulwen Le Fur Le 23 novembre 2012

Dafoe Présentation de la plate-forme UIMA

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

OCL - Object Constraint Language

TEXT MINING von 7

données en connaissance et en actions?

Formula Negator, Outil de négation de formule.

Catalogue des formations Edition 2015

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

FileMaker Server 11. Publication Web personnalisée avec XML et XSLT

Compte-rendu re union Campus AAR 3 mars 2015

On Feature Interaction among Web Services Michael Weiss et Babak Esfandiari

Une plateforme de développement d espaces webs sémantiques communautaires dédiés au partage de ressources multimédia

Apprentissage Automatique

IBM System i. DB2 Web Query for System i : le successeur de Query/400? Oui, mais bien plus!!!

Langage SQL : créer et interroger une base

Principes. 2A-SI 3 Prog. réseau et systèmes distribués 3. 3 Programmation en CORBA. Programmation en Corba. Stéphane Vialle

Web des services : REST

Information utiles. webpage : Google+ : digiusto/

C est quoi le SWAT? Les équipes décrites par James Martin s appellent SWAT : Skilled With Advanced Tools.

Urbanisation des SI. Des composants technologiques disponibles. Urbanisation des Systèmes d'information Henry Boccon Gibod 1

Urbanisation des Systèmes d'information

Appui SIE :Développement de services web ADES/SIE

XML et travail collaboratif : vers un Web sémantique

La directive INSPIRE en Wallonie: le géoportail et l infrastructure de diffusion des géodonnées en Région wallonne (InfraSIG(

FOURNIR UN SERVICE DE BASE DE DONNÉES FLEXIBLE. Database as a Service (DBaaS)

! Text Encoding Initiative

Adaptabilité d un MOOC aux styles d apprentissage. Hubert Kadima Directeur de Recherche LARIS/EISTI hubert.kadima@eisti.fr

Architectures Web Services RESTful

Web Application Models

openarchitectureware & transformation de modèle Yannick Lizzi Architecte Logiciel itemis France Mail: lizzi@itemis.de

Livre Blanc WebSphere Transcoding Publisher

Utilisation des tableaux sémantiques dans les logiques de description

Programming Server-Side Web Applications with Object-Oriented PHP NC Group Syllabus. Duration: 75 hours 1-2-2

Evaluation des performances de programmes parallèles haut niveau à base de squelettes

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

Responsable du cours : Héla Hachicha. Année Universitaire :

Introduction aux. services web 2 / 2

Une méthode d apprentissage pour la composition de services web

Cours en ligne Développement Java pour le web

RTDS G3. Emmanuel Gaudin

TP n 2 Concepts de la programmation Objets Master 1 mention IL, semestre 2 Le type Abstrait Pile

Devenez un véritable développeur web en 3 mois!

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

Composition et interopération des services web sémantiques

FORMATION CN01a CITRIX NETSCALER

SQL Parser XML Xquery : Approche de détection des injections SQL

Anticiper et prédire les sinistres avec une approche Big Data

MEMOIRE DE STAGE. Amélioration de l'outillage support à une méthodologie de "Cartographie Sémantique"

L offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence

Bigdata et Web sémantique. les données + l intelligence= la solution

CORBA. (Common Request Broker Architecture)

Parcours DIWEB : (Données, Interaction et Web)

Évaluation et implémentation des langages

Plateforme PAYZEN. Définition de Web-services

ECLIPSE ET PDT (Php development tools)

Intégration des connaissances en neurosciences dans un environnement multi-centrique

Chapitre I : le langage UML et le processus unifié

Iyad Alshabani SysCom - CReSTIC Université de Reims 17/02/2011 1

Transcription:

Découverte de services Web sémantiques Sana Sellami sana.sellami@univ-amu.fr

Découverte de Services Web La découverte est un processus de recherche des services web implémentant la fonctionnalité souhaitée. Déterminer les services les plus pertinents qui correspondent à une requête donnée Les registres UDDI sont des entités qui servent d appui à la découverte de services web pour les applications client. De cette façon une application interroge un registre UDDI pour les fournisseurs d un service web. 2

Découverte de Services Web Approche classique (syntaxique): La recherche de service confronte deux acteurs : le fournisseur ou producteur de service ; qui cherche à annoncer du mieux possible ses services et l utilisateur ; qui ne sait pas où chercher le service de ses rêves. Rechercher un service Annuaire de services Publication de la Description de service Client: demandeur de service Établir une liaison avec un service Serveur Web Fournisseur 3

Limites Registre UDDI Pointe sur la description WSDL Syntaxique Rechercher Décrit le service un service Pointe sur le service Client: demandeur de service SOAP Web Service 4

Limites Manque d expressivité: les méthodes de recherche actuelles sont syntaxiques se basant sur une simple recherché par mots clés. Manque de sémantique dans la description (WSDL) des WS L utilisation et l intégration de services est réalisée manuellement Passage à l échelle: un grand nombre de services et d annuaires 5

Solution? Mécanismes nécessaires pour Annoter et concevoir des services Déterminer et comparer les fournisseurs de services Composer des servcices Résoudre le problème d hétérogéniété des formats de données, protocoles et processus (e.g médiation) Besoin de modèles conceptuels, langages formels et environnements d exécution Approches web sémantique : Description sémantique des services web Utilisation des ontologies comme modèle 6

LES SERVICES WEB SÉMANTIQUES 7

Langages de description des SWS Approches basées sur des langages sémantiques OWL-S (Ontology Web Language for Services) [9] WSMO (Web Service Modelling Ontology) [10]+ WSML (Web Service Modelling Language) SWSL (Semantic Web Service Language) Approches de description à base d annotations SAWSDL (Semantic Annotation for WSDL) [2] USDL (Universal Service-Semantics Description Language) SAREST (Semantic Annotation of Web Resources) 8

Approches à base d annotation Qu est ce qu une Annotation? Définition du dictionnaire Oxford: «The word «annotation» is defined as «a note by way of explanation or comment added to a text or diagram»» Une annotation désigne à la fois une métadonnée associée à une partie du document et le processus de génération de cette métadonnée. Exemple : Annotations de Java 9

Approches à base d annotation Qu est ce qu une Annotation Sémantique? Une annotation est sémantique lorsqu elle se réfère à une ontologie, qui décrit, dans une logique de descriptions, les concepts et les relations entre les concepts d un domaine. Dans le domaine des SW: L annotation sémantique est une solution pour enrichir cette description afin d'automatiser les tâches de découverte et de composition. 10

Approches à base d annotation Processus d annotation sémantique: Extraction Module Concept Matching Annotation 11

Approches à base d annotation SAWSDL (Semantic Annotation for WSDL) [2] USDL (Universal Service-Semantics Description Language) [8] SAREST [12] (Semantic Annotation of Web Resources) HREST (HTML for Restful Services) 12

Approches à base d annotation: SAWSDL SAWSDL(Semantic Annotation for WSDL) Fournit un mécanisme permettant d annoter sémantiquement les types de données, les opérations, les entrées et les sorties. Semantic Template ontologie Operation Input Output Operation model reference Input model reference Output model reference 13

Approches à base d annotation: SAWSDL Mécanisme d annotation grâce à l attribut «sawsdl» 3 extensions: ModelReference: associer un composant WSDL ou XML schema à un concept d une ontologie liftingschemamapping et loweringschemamapping: spécifier une correspondance entre les données sémantiques et les éléments XML. 14

Approches à base d annotation: SAWSDL 15

Approches à base d annotation: SAWSDL Exemple 16 SampleOntology

Approches à base d annotation: hrest hrest(html for Restful Services) est un micro-format qui permet la description des Web API en se basant sur le langage HTML. L annotation sémantique est déterminée grâce au microformat MicroWSMO. 17

Approches à base d annotation: hrest Exemple de description de service d hôtel avec hrest 18

Approches à base d annotation: hrest Exemple de description de service de réservation d hôtels annoté avec MicroWSMO 19

Outils d annotation Outils d annotation manuels, semi-automatiques et automatiques: Meteor-S [3] RadiantWeb [4] : WSDL-S/SAWSDL Annotation tool Servface [5] AWSA [6] ASSAM [7] Iridescent (http://lpis.csd.auth.gr/people/thanosgstavr/development.html#iridesc ent) SWEET (Semantic Web services Editing Tool) [13]: Outil développé pour la création de services RESTful en structurant les descriptions de services et leur associant des annotations sémantiques. (http://sweet.kmi.open.ac.uk/) SOWER ou WSMO-Lite editor (Sweet is not a Wsdl EditoR) [19] Etc, 20

DÉCOUVERTE DE SWS 1. Problématique 2. Techniques de Matchmaking pour la découverte de SWS 3. Outils de Matchmaking 4. Evaluation des matchmakers 5. Challenges 21

Problématique: Découverte de services web sémantiques Déterminer les services les plus pertinents qui correspondent à une requête donnée Les implémentations courantes sont basées sur une représentation ontologique des opérations, inputs et outputs. Retourne une liste de services classés 22

Matchmaking pour la découverte de services Web Processus de découverte de services web sémantiques (ou Matchmaking) en basant sur des matchers: logiques, non logiques ou hybrides. Se base sur une comparaison des opérations input advertisement output input request output 23

Matchmaking Le matchmaking correspondance utilisation des techniques de matching Le matching c est quoi exactement? Quelles techniques ont été proposées dans le domaine? 24

Matching: Problématique Schema1 Porder DeliverTo Address City Post Representation Semantic Schema2 PurchaseOrder CAddress code City DeliverTo Contact? Contact Name firstname fastidieux lastname Erreurs coûteux Comment déterminer les correspondances entre les éléments de deux schémas? 25

Classification Cité 3807fois 26 Erhard Rahm and Philip A. Bernstein A survey of approaches to automatic schema matching VLDB journal, 2001.

Matching dimensions Schema-based matching techniques Granularity layer Technique layer Input type layer Schema-based matching techniques 27 P. Shvaiko, J. Euzenat: A Survey of Schema-based Matching Approaches Journal on Data Semantics, 2005.

Techniques niveau éléments: String based Description: souvent utilisées pour le matching des noms et des descriptions des éléments des schémas/ontologies. Techniques: Préfixe: prend en entrée deux chaînes de caractères et vérifie si la première chaîne est incluse au début de la deuxième chaîne de caractères (e.g net network) Suffixe: prend en entrée deux chaînes de caractères et vérifie si la première chaîne est incluse à la fin de la deuxième chaîne e.g phone telephone Edit-distance: nombre minimal de caractères qu il faut supprimer, insérer ou remplacer pour passer d une chaîne à l autre, e.g EditDistance (NKN, Nikon)=2/5=0,4 N-grammes: calcule le nombre de séquences n caractères communs entre deux chaînes de caractères 28

P. Shvaiko, J. Euzenat: A Survey of Schema-based Matching Approaches Journal on Data Semantic 2005. Matching dimensions 29 29

Techniques niveau éléments: Language based Description: Basées sur les techniques de traitement du langage naturel (NLP) en exploitant les propriétés morphologiques des termes en entrée. Techniques: L analyse lexicale (ou tokenization) : qui consiste à transformer un flot de caractères en un flot de jetons par un analyseur (tokenizer) qui reconnait les ponctuations, les caractères blancs, les chiffres, etc. e.g Hands-Free_Kits= (Hands, Free, Kits) Lemmatisation: analyse lexicale du contenu d'un texte regroupant les mots d'une même famille. Chacun des mots d'un contenu se trouve ainsi réduit en une entité appelée lemme (forme canonique). La lemmatisation regroupe les différentes formes que peut revêtir un mot, soit : le nom, le pluriel, le verbe à l'infinitif, etc. (e.g Kits Kit) Ces techniques sont souvent appliquées aux noms des entités avant d avoir exécuté les techniques string-based or lexicon techniques-based afin d améliorer les résultats. 30

P. Shvaiko, J. Euzenat: A Survey of Schema-based Matching Approaches Journal on Data Semantic 2005. Matching dimensions 31 31

Techniques niveau éléments Techniques basées contraintes: Comparaison des types de données, e.g varchar et text domaine des valeurs Ressources linguistiques: Égalité des synonymes, e.g: car automobile Égalité des hyperonymes, e.g book publication ou article publication Etc.. 32

P. Shvaiko, J. Euzenat: A Survey of Schema-based Matching Approaches Journal on Data Semantic 2005. Matching dimensions 33 33

Techniques niveau structure: Graph based Similarité des nœuds fils Similarité des feuilles car vehicle price model price model 34

P. Shvaiko, J. Euzenat: A Survey of Schema-based Matching Approaches Journal on Data Semantic 2005. Matching dimensions 35 35

Strategies de Matching Séquentielle (Hybrid Matcher) Parallèle (composite Matcher) S1 paramètres Matcher 1 M1 Matcher 1 M Matcher 2 Matcher 2 M2 Agrégation S2 ressources M' Matcher 3 M3 M' Matcher 4 M4 36

COMA++ [DO, SIGMOD 2005] [Massmann et al., OM 2011] 37

Techniques de matchmaking Matchmaking Linguistic matchers Constraint based matchers Structure based matchers Semantic matchers IR techniques Data-type matching Graph matching DL Reasoner Name matching Information content OLS Linguistic ressources 38

Matchmaking pour la découverte de services Web Logic- based Non logic-based: basé sur des mesures textuelles utilisées habituellement pour une comparaison purement textuelle dans le contexte de recherche d information ainsi que les comparaisons structurelles Hybride: une combinaison des 2 39

Matchmaking logic-based Raisonnement sur l ontologie Définition de filtres (DoM) Considérons S comme le Service et R requête utilisateur Exact (one to one maping) Input (R) Input (S) Ouput (R) Output (S) Ou S immediatesubclassof R Plugin: S plug into R Input (S) Input (R ) Output (S) direct child concept of Output (R) Subsume: S subsume R Input (S) Input (R ) Output (R) Output (S) Subsumed-by : S est subsumed by R Input (S) Input (R ) Output (R) Output (S) and Output (S) direct parent of Output (R) Fail 40 Exact > Plug-in > Subsume > Subsumed-by > Fail

Matchmaking logic-based: Exercice Requête R Input: Patient, Hospital Output: Hospital-Physician Service S Input: Person, Hospital Output: Surgeon Filtre plug-in Person Patient Surgeon direct child Hospital-Physician 41

Matchmaking Non logic-based Matching Textuel (similarité entre 0 et 1) Token based text similarity : Loss of information Cosine : cos(r,s)= R.S R S Indice de Jaccard: J(R,S)= R S R S Jaccard étendu (Extended jaccard) : SimEJ R, S = Etc, Similarité des noms: edit distance, Coefficient de dice: dice coefficient (R,S) = jaro coefficient, etc Ressources auxiliaires: WordNet Matching Structurel 2.R.S R 2 + S 2 R.S R 2 + S 2 R.S Le plus court chemin entre les concepts dans l ontologie+ profondeur de leur subsumer commun 42

Ontologie T Matchmaking Non logic-based: Exercice LOI(R,S)=? Requête R Input: Patient, Hospital Output: Hospital -Physician Service S Input: Person, Hospital Output:, Emergency -Physician atthias Klusch, Benedikt Fries, Katia P. Sycara: OWLS-MX: A hybrid Semantic Web service atchmaker for OWL-S services. J. Web Sem. 7(2): 121-133 (2009) Sim LOI (S,R)=1 - LOI R,S +LOI (R,S) in out 2 Avec LOI x (R,S)= PC PC PC PC R x S, x R x S x,,, PC + PC R, x S x, x in, out, PC R, x et PC S, x set of primitive components in unfolded logical input/output concept expression of request R and services S Unfolded(Patient,T)= Patient Person Unfolded (Hospital, T) = Hospital Medical Organisation Organisation 43

Exercice Input Requête CheckIn CheckOut HotelName Luxury Service 1 Booking LuxuryHotel HotelName Room Service 2 DeluxeHotel CheckIn CheckOut Deluxe Output checkavailability checkavailability HotelName 1. Déterminez la relation logique (en vous basant sur les filtres DoM) entre la requête et les différents services. 2. En vous basant sur la métrique LOI (Loss Of Information), vous allez déterminer la similarité entre la requête et le Service 1. 44