CONCEPTION D UN FRAMEWORK POUR LE TRAITEMENT COOPERATIF DES REQUETES SEMANTIQUES



Documents pareils
Évaluation d une architecture de stockage RDF distribuée

Une approche langage pour la gestion de données dans les systèmes de méta-modélisation

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Etude Comparative des Systèmes de Bases de Données à base Ontologiques

Approche de couplage de BD et d ontologie pour l aide à la décision sémantique : contribution pour la satisfaction des requêtes SQL et SPARQL.

Hervé Couturier EVP, SAP Technology Development

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

Vues d ensembles de documents RDF

JDev Atelier Datalift

Alimenter un entrepôt de données par des données issues de services web. Une approche médiation pour le prototype DaWeS

Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses

Langage SQL (1) 4 septembre IUT Orléans. Introduction Le langage SQL : données Le langage SQL : requêtes

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

Adaptation du modèle de langue pour le tri des réponses dans les BD

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Une méthode d apprentissage pour la composition de services web

Propriétés du Document EMA. Résumé

Comment rendre un site d e-commerce intelligent

Le Web de Données Dan VODISLAV Université de Cergy-Pontoise Master Informatique M2 Plan

PHP. Bertrand Estellon. 26 avril Aix-Marseille Université. Bertrand Estellon (AMU) PHP 26 avril / 214

Un processus dirigé par les modèles pour la création de bases de connaissance ontologiques

Raja Bases de données distribuées A Lire - Tutoriel

Présentation du sujet de thèse Schémas temporels hybrides fondés sur les SVMs pour l analyse du comportement du conducteur

Protection de la vie privée basée sur des ontologies dans un système Android

Intégration des connaissances en neurosciences dans un environnement multi-centrique

Information utiles. webpage : Google+ : digiusto/

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Intégration de données complexes pour une vision 360 du client. Chloé Clavel EDF R&D Département ICAME

Catalogue des formations Edition 2015

Efficient Object Versioning for Object- Oriented Languages From Model to Language Integration

Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires

Analyses croisées de sites Web pour détecter les sites de contrefaçon. Prof. Dr. Olivier Biberstein

Application de K-means à la définition du nombre de VM optimal dans un cloud

sont appliquées à des fonds documentaires, sont destinées à fournir des informations pertinentes sur la structure globale plutôt que sur le contenu.

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes

Bigdata et Web sémantique. les données + l intelligence= la solution

Exemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions

Découverte des dépendances fonctionnelles conditionnelles fréquentes

RSA ADVANCED SECURITY OPERATIONS CENTER SOLUTION

Le traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.

Bases de données relationnelles

Problèmes d additivité dus à la présence de hiérarchies

Systèmes d informations nouvelles générations. Répartition, Parallèlisation, hétérogénéité dans les SGBD. Exemple d application d un futur proche

Completed Projects / Projets terminés

Bases de Données OLAP

Bases de données et sites WEB

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Introduction aux SGBDR

Learning Object Metadata

Les bases de données

LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES

Editing and managing Systems engineering processes at Snecma

Concepts clés associés aux outils logiciels, exemples

COMMANDES SQL... 2 COMMANDES DE DEFINITION DE DONNEES... 2

BIG DATA APPLIQUÉES À LA SÉCURITÉ. Emmanuel MACÉ Akamai Technologies

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

Big Data et Graphes : Quelques pistes de recherche

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Bases de données - Modèle relationnel

Business Process Management

Bases de Données Réparties Concepts et Techniques. Matthieu Exbrayat ULP Strasbourg - Décembre 2007

L offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence

Laboratoire d Automatique et Productique Université de Batna, Algérie

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Web Sémantique. Examen

Bases de données et sites WEB Licence d informatique LI345

Encryptions, compression et partitionnement des données

A GRASPxELS approach for the Job Shop with generic time-lags and new statistical determination of the parameters

BD réparties. Bases de Données Réparties. SGBD réparti. Paramètres à considérer

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Module BDR Master d Informatique (SAR)

Contrôle stochastique d allocation de ressources dans le «cloud computing»

Whitepaper. Méthodologie de création de rapports personnalisés SQL Server Reporting Services

Installation de SCCM 2012 (v2)

Les ontologies pour l intégration sémantique : enjeux et défis

Bases de données cours 4 Construction de requêtes en SQL. Catalin Dima

PHP 5. La base de données MySql. A. Belaïd 1

2011 Hakim Benameurlaine 1

TP Bases de données réparties

<Insert Picture Here> Exadata Storage Server et DB Machine V2

Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes

Big Data et Graphes : Quelques pistes de recherche

4. SERVICES WEB REST 46

Module BD et sites WEB

Equilibrage de charge (Load

Change the game with smart innovation

Bases de données Outils de gestion

Datalift. + + Architecture Modularité Déploiements. d j = 09/04/2015 Laurent BIHANIC

Approche hybride pour le diagnostic industriel basée sur le RàPC et le Datamining : Utilisation de la plateforme JCOLIBRI 2.1

Differential Synchronization

Élasticité des applications à base de services dans le Cloud

Transcription:

CONCEPTION D UN FRAMEWORK POUR LE TRAITEMENT COOPERATIF DES REQUETES SEMANTIQUES Présenté par : Sous l encadrement de : Géraud FOKOU Pr. Allel HADJALI Dr. Stéphane JEAN le 10 /04/2014

Bases de Données Sémantiques (BDSs) CONTEXTE Stockage des données sémantiques (RDFS, OWL, ) Représentation Verticale (Triplets), ex: Jena Name Student PropertyOf SubClassOf Duration PropertyOf Horizontale (Classes, Attributs), ex: OntoDB Binaire (Propriétés-valeurs) Graduate Student SubClassOf PhD Student Interrogation Master I Master II TypeOf SPARQL, (?X, Years, 1 st ) SQL, (Select From ) 6 URI_Years R1 URI_Name Hybride (OntoQL) Géraud 2

CONTEXTE Bases de Données Sémantiques (BDSs) Représentation Verticale Name Student Graduate Student SubClassOf PropertyOf SubClassOf Duration PropertyOf PhD Student Subject Predicat Object Student RDF_TypeOf RDF_Class PhDStudent RDF_SubClassOf Student GraduateStudent RDF_SubClassOf Student Name RDF_PropertyOf Student Years RDF_PropertyOf PhDStudent R 1 RDF_TypeOf PhDStudent R 1 URI_name Géraud R 1 URI_Duration 6 Master I Master II TypeOf Représentation Horizontale MASTER I MASTER II 6 URI_Duration R1 ID Name Student ID Name Graduate Student URI_Name ID Name ID Name Géraud PhD Student ID Name Years R1 Geraud 6 3

CONTEXTE Relaxation/Approximation Objectif: Proposer des solutions aux requêtes à réponses vides Approximation BDR: Estimation à l aide d une relation d ordre BDS: Définition des mesures de similarité Mesure de similarité 1,2 1 0,8 0,6 0,4 0,2 0 Satisfiability 0 0.5 1 2.0 3 Years Evaluation de la distance (pertinence): Distance (PhD Student, Student), Distance (PhD Student,Master I) Distance: Hiérarchique (chemins du graphe), Information (instances ou valeur), Utilisateur Relaxation de requête Approximation des résultats d une requête: Select Name From PhD Student Where duration = 12 BDR utilisation de la clause «where» et la logique floue sur les ensembles de valeur Evolution des BDR vers les BDS Relaxation dans les BDS?? 4

PLAN I. ETAT DE L ART II. PROBLEMATIQUES ET OBJECTIFS III. FORMALISATION D OPERATEURS DE RELAXATION IV. VERS DES PROCESSUS DE RELAXATION GUIDES ET OPTIMISES 5

ETAT DE L ART Techniques de Relaxation Automatique : logique floue et Raisonnement Ex: Select Name From PhD Student Where duration = 12 Select Name From Student Where duration = 12 Select Name From PhD Student Where duration IN [6,18] Orientées Utilisateurs Etudes des feedbacks utilisateurs Modélisation des Profils utilisateurs Invariants Réécriture de la requête initiale Q en requête Q Processus itératif, si Q est une réécriture de Q alors :,," 6

ETAT DE L ART Mesures de similarités Approximation s évalue via la similarité entre les requêtes,,! "! (Distand-Based) [Huang08], Les Processus de Relaxation #,! # "#! $#,! (Content-Based) [Jean13] où % dans relaxe % & dans, '% est la quantité d information dans une classe et (% est le plus proche ancêtre commun entre % & et % (Less common Ancestor) ) * + donne la satisfiabilité d une instance * +. [Jean13] Processus automatique et itératif [Hurtado08 ] Processus de substitution par des préférences utilisateurs [Dolog09] Processus avec Feedback utilisateurs [Islam12] 7

PROBLEMATIQUES ET OBJECTIFS Synthèse Problématiques Operateurs Ranking Contrôle Implémentation et intégration Dolog et al. n/a Based on users preferences Trigger rules Sesame Hurtado et al. Relax Clause Distance-Based Top-k n/a Huang et al. n/a Distance-Based Content-Based Top-k Jena (LUBM) Elbassuoni et al. n/a Content-Based Domain Target Tests on real data set Hogan et al. n/a Content-Based Domain Target Generic Framework for EADS Objectifs O 1 : Définition d opérateurs de relaxation: combinaison et paramétrage O 2 : Fonction de Ranking des résultats O 3 : Contrôle et guide des processus de relaxation O 4 : Implémentation et intégration de la relaxation dans les BDSs 8

FORMALISATION D OPERATEURS DE RELAXATION Définition des opérateurs de relaxation dans les BDS Définition des opérateurs : Clause de Relaxation: APPROX(OP, TopK) Relaxation de prédicat : PRED(Q, Prop, epsilon) Généralisation: GEN(Q, C, level) Substitution: SIB(Q,C,[C 1, C 2,, C n ]) Agrégation des opérateurs : AND EX: Select Name From PhD Student Where duration = 12 APPROX (GEN (PhD Student, 1) AND (PRED (duration, 6)) Mesure de similarité : PRED : Distance de Hausdorff GEN: Sim(C,C ) entre deux classes SIB: Sim(C,C ) entre deux classes AND: min pour l agrégation entre similarité de deux opérateurs Sat(h i ) : évaluation de l incidence de la relaxation sur chaque instance 9

FORMALISATION D OPERATEURS DE RELAXATION Intégration et expérimentation des opérateurs de relaxation dans les BDS Intégration dans OntoDB/OntoQL Expérimentation: Relaxation de 11 requêtes par chaque opérateur Résultats La répartition des données impact les performances de la relaxation Processus itératif coûteux 10

Minimal Failing Subqueries (MFS) Requête formalisée sous forme de conjonction de conditions (CC) : % & % % / Recherche de la plus petite sous liste de conditions qui annule la requête Utilisation de SPARQL pour la représentation de requête sous formes de (CC) Select?name where {(?x, typeof, PhD Student)(?x, uri_duration, 12 )(?x,uri_name, Geraud )} Techniques de recherche de MFS MEL et ISHMAEL JANNACH VERS DES PROCESSUS DE RELAXATION GUIDES ET OPTIMISES Proposition d algorithme de recherche de MFS Processus de relaxation avec utilisation des MFS Détection des MFS Application des operateurs de relaxation adéquat : Généralisation ou Substitution: (?x, typeof, Graduate Student) Relâchement de prédicat : (?x, uri_years, 2st ) 11

VERS DES PROCESSUS DE RELAXATION GUIDES ET OPTIMISES Optimisation Relaxation Processus itératif Utilisation des invariants du processus,," Estimation du pas de relaxation nécessaire pour avoir le Top-K des résultats Utilisation de la sélectivité des requêtes Construction d un graphe de relaxation étiquette par la similarité et la sélectivité Profils Utilisateurs Formalisation des profils utilisateurs pour guider la relaxation Utilisation des Profils utilisateurs des systèmes de recommandation Définition d un modèle de profil utilisateurs Possibilité d adapter les Quadri-concepts (<Produits, Tag, User, Profil>) 12

REFERENCES Corby O., Dieng-Kuntz R., Faron-Zucker C., Gandon F. L., Searching the Semantic Web : Approximate Query Processing Based on Ontologies, IEEE Intelligent Systems, 2006. Dolog P., Stuckenschmidt H., Wache H., Diederich J., Relaxing RDF queries based on user and domain preferences, Journal of Intelligent Information System, 2009. Godfrey P., Minimization in cooperative response to failing database queries, IJCIS, 1997. Hogan A., Mellotte M., Powell G., Stampouli D., Towards Fuzzy Query-Relaxation for RDF, ESWC 12, 2012. Huang H., Liu C., Zhou X., Approximating query answering on RDF databases, Journal of World Wide Web, 2012. Hurtado C. A., Poulovassilis A., Wood P. T., Query Relaxation in RDF, JODS, 2008. Poulovassilis A., Wood P. T., Combining Approximation and Relaxation in Semantic Web Path Queries, Proceedings of the 9th International Semantic Web Conference (ISWC 10), 2010. Hai Huang, Chengfei Liu, and Xiaofang Zhou. Approximating query answering on rdf databases. World Wide Web, January 2012. Islam M. S., Liu C., Zhou R., On Modeling Query Refinement by Capturing User Intent Through Feedback, Proceedings of the Twenty-Third Australasian Database Conference - Volume 124, ADC 12, Australian Computer Society, Inc., Darlinghurst, Australia, Australia, 2012. Jannach D., (( Finding Preferred Query Relaxations in Content-Based Recommenders )), Intelligent Techniques and Tools for Novel System Architectures, vol. 109, Springer Berlin, Heidelberg, p. 81-97, September. Stéphane J., Allel H., Ammar M., Towards a Cooperative Query Language for Semantic Web Database Queries,On the Move to Meaningful Internet Systems : OTM 2013 Conferences, Springer Berlin Heidelberg, September 13