Accès personnalisé multicritères à de multiples sources d informations.



Documents pareils
Une méthode d apprentissage pour la composition de services web

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Expansion de requêtes par apprentissage dans un assistant pour la recherche d information

Mécanisme de prédiction pour une plateforme de filtrage collaboratif*

Entreposage de données complexes pour la médecine d anticipation personnalisée

Proposition des cadres d évaluation adaptés à un système de RI personnalisé

Forthcoming Database

Classification Automatique de messages : une approche hybride

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

CURRICULUM VITAE. Informations Personnelles

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

Recherche d Information Collaborative

RI sociale : intégration de propriétés sociales dans un modèle de recherche

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques

L'agilité appliquée à nous-mêmes. Philippe Krief, PhD Development Manager IBM France Lab

AGROBASE : un système de gestion de données expérimentales

RAPID Prenez le contrôle sur vos données

État de l art sur les Systèmes de Recommandation

Offre de thèse. Co-encadrant de thèse : HENRY Sébastien Coordonnées électroniques : Sébastien.Henry@univ-lyon1.fr Laboratoire : DISP (

Introduction aux bases de données

Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes

Plan de cours ADM 992C Page 1. École des sciences de la gestion Département de management et technologie Université du Québec à Montréal

Représentation et analyse des systèmes linéaires

Estimated SMB instances PC (Physical and Virtual) 125,000 Total instances: SMB 1-24 PC. 392,000 Total instances: SMB PC

AGATHE : une architecture générique à base d agents et d ontologies pour la collecte d information sur domaines restreints du Web

An Ontology-Based Approach for Closed-Loop Product Lifecycle Management

Contrôle stochastique d allocation de ressources dans le «cloud computing»

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

Analyse des logiciels d application spécialisée pour le courtage en épargne collective

Editing and managing Systems engineering processes at Snecma

sont appliquées à des fonds documentaires, sont destinées à fournir des informations pertinentes sur la structure globale plutôt que sur le contenu.

LISTE DES PUBLICATIONS

ÉVALUATION PRIMAIRE D UN SYSTÈME D AIDE AU CONTRÔLE AÉRIEN EN ROUTE

Modèles et politiques de sécurité pour les infrastructures critiques

Architecture à base de composants pour le déploiement adaptatif des applications multicomposants

Notice biographique Repères biographiques communs. Nom : NURCAN Prénom : SELMIN Section : 27. Centre de Recherche en Informatique (CRI)

Adaptation du modèle de langue pour le tri des réponses dans les BD

Un environnement de déploiement automatique pour les applications à base de composants

Application de K-means à la définition du nombre de VM optimal dans un cloud

DEA ès Sciences de Gestion. DES en Sciences Economiques. Ingénieur diplômé de l'ecole Polytechnique de Paris.

L Architecture Logicielle UMR pour les Interactions Multicanaux et Multimodales avec les e-services

Modélisation multi-agent d allocation des ressources : application à la maintenance

Brève introduction à la recherche d!information sur le Web à base d!agents logiciels

Object Oriented Parallel Discrete Event Simulation: The PROSIT Approach

Laboratoire 4 Développement d un système intelligent

Must Today s Risk Be Tomorrow s Disaster? The Use of Knowledge in Disaster Risk Reduction

Ne cherchez plus, soyez informés! Robert van Kommer

Differential Synchronization

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

Développements algorithmiques au LIAMA et àamap en vue de l'analyse d'une scène forestière

Mon Service Public - Case study and Mapping to SAML/Liberty specifications. Gaël Gourmelen - France Telecom 23/04/2007

Distinguer les requêtes pour améliorer la recherche d information XML

Modélisation du comportement habituel de la personne en smarthome

Oracle Fusion Middleware Concepts Guide 11g Release 1 (11.1.1) Figure 1-1 Architecture Middleware

Basware Invoice Automation, aujourd hui et demain

MELTING POTES, LA SECTION INTERNATIONALE DU BELLASSO (Association étudiante de lʼensaparis-belleville) PRESENTE :

Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus

Guide de formation EndNote Web Interface EndNote Web

Tier 1 / Tier 2 relations: Are the roles changing?

VISUALISATION DE NUAGES DE POINTS

Curriculum Vitae 1 er février 2008

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

Hervé Couturier EVP, SAP Technology Development

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Une architecture hybride Client/Serveur et Pair-à-Pair pour le streaming vidéo sur l Internet

SQL Parser XML Xquery : Approche de détection des injections SQL

Ingénierie et gestion des connaissances

L hypertexte, le multimédia, c est quoi?

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

Une dérivation du paradigme de réécriture de multiensembles pour l'architecture de processeur graphique GPU

Du e-commerce au m-commerce : vers une recommandation incrémentale

Jean-Philippe DANGLADE

Services à la recherche: Data Management et HPC *

Extensions à la formation. Laurent Pérochon, avril 2008, RMT Modelia, modélisation conceptuelle, formation UML, INRA Castanet Tolosan

ORDONNANCEMENT DES RÉSULTATS SUR LES MOTEURS DE RECHERCHE : PRINCIPES, LIMITES ET APPLICATIONS AU GÉORÉFÉRENCEMENT

Viser une démarche de recherche organisée

Une Architecture Basée Agents Mobiles Pour la Recherche D'information dans des Sources Hétérogènes et Réparties

Visualizing Start-up Firm Trajectories on Kohonen Maps

recommandation Domaine : Informatique, Intelligence Artificielle, Modélisation de préférences

Business Process Management

Intégration de données hétérogènes et réparties. Anne Doucet

La rencontre du Big Data et du Cloud

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Cours Bases de données

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Évaluation d une architecture de stockage RDF distribuée

First Nations Assessment Inspection Regulations. Règlement sur l inspection aux fins d évaluation foncière des premières nations CONSOLIDATION

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

Exploitation de hiérarchies sémantiques construites à partir du Trésor de la Langue Française informatisé (TLFi) pour la recherche d images

ED STIC - Proposition de Sujets de Thèse. pour la campagne d'allocation de thèses 2013

Transcription:

Lyon - France Accès personnalisé multicritères à de multiples sources d informations. Samir kechid Université des Sciences et de la Technologie Houari Boumediene. USTHB BP 32 El Alia Bab Ezzouar Alger Algérie. kechidsam@yahoo.fr RÉSUMÉ. Cet article décrit une approche de la recherche d information permettant l accès personnalisé à plusieurs sources d informations. L accès à des sources d informations distribuées est souvent effectué en trois étapes, la première consiste à sélectionner les sources pertinentes pour la requête, puis soumettre la requête à ces sources sélectionnées et finalement fusionner les résultats retournés par ces sources. L objectif de cet article est d intégrer l utilisateur via son profil dans les processus de sélection et de fusion des résultats des sources. ABSTRACT. This article describes an approach for information retrieval giving access personalized to several sources of information. The access to distributed sources of information is often carried out in three stages, the first consists in selecting the relevant sources for the query, then to subject the query to these selected sources and finally to merging the results turned over by these sources. The objective of this article is to integrate the user via his profile in the sources selecting and results merging process. MOTS-CLÉS: recherche information distribuée, agents intelligents, profil source, profil utilisateur, sélection de sources, fusion de résultats. KEYWORDS: distributed information retrieval, source profile, user profile, server selecting, result merging. 401

Actes des 1ères Rencontres Jeunes Chercheurs en Recherche d Information 1. Introduction Avec le développement des réseaux de communications, nous observons ces dernières années une multiplication des sources (serveurs) d information hétérogènes. L accès à ces sources inclus trois sous problèmes : 1) acquisition des informations sur le contenu de la source «description de la source» (Callan 2000) (Nottelmann et Fuhr 2003) (Si et Callan 2005), 2) sélection d un nombre minimum des sources pour une requête donnée (sélection de sources) (Xu et al 1998) (Callan 2000) (Gravano et al 1999) (Nottelmann et Fuhr 2003) (Si et Callan 2005), et 3) fusion des résultats des sources et affichage d une seule liste de résultats à l utilisateur «fusion de résultats» (Lark et al 2000) (Xu et al 1998) (Si et Callan. 2003). Ces trois sous problèmes sont souvent résolus, prenant en compte uniquement la requête de l utilisateur. L utilisateur qui a exprimé ce besoin en information est mis à l écart du processus. L objectif de notre travail est de définir une approche permettant d intégrer l utilisateur via son profil dans les processus de sélection et de fusion des résultats des sources. Cet article est destiné à la conférence des jeunes chercheurs, il ne présente pas des résultats finaux, il présente notre axe de recherche et les objectifs que nous voulons atteindre par notre travail de thèse. 2. Notre approche Notre contribution consiste à définir d un côté un profil utilisateur pour décrire le centre d intérêt et les préférences de l utilisateur, de l autre côté de définir un profil de la source pour décrire la source. Le profil utilisateur et le profil de la source sont utilisés dans le processus de sélection de source et de fusion des résultats, pour délivrer à l utilisateur des résultats pertinents à sa requête tout en satisfaisant au maximum son centre d intérêt et ses préférences. Nous présentons notre démarche par les tâches suivantes : 1- Définir un profil pour chaque utilisateur, qui permet de décrire le centre d intérêt de l utilisateur et ses préférences 2- Définir un profil pour chaque source d information, qui permet de décrire la source. 3- Définir une méthode pour apparier le profil utilisateur avec les profils des sources, dans le but de sélectionner pour cet utilisateur les sources pertinentes. 4- Interroger les sources sélectionnées avec la requête utilisateur. 5- Définir une méthode pour fusionner et classer les résultats retournés par les sources, en prenant en compte le profil utilisateur. 402

Lyon - France Nous présentons l architecture générale de notre approche par la figure suivante (Ns est le nombre de sources): Profil utilisateur Utilisateur Interaction Profil source 1 Processus de gestion de l utilisateur Profil source 2 Profil source Ns Processus de gestion de la source Processus de gestion de la source. Processus de gestion de la source Figure 1 : architecture générale L architecture de la figure1 décrit le fonctionnement global de notre approche. Le processus de gestion de l utilisateur assure les tâches 1, 3 et 5, en interaction avec le processus de gestion de la source. Le processus de gestion de la source assure les tâches 2 et 4. Pour le fonctionnement de notre approche, nous nous sommes orienté vers les agents intelligents. Ce choix a été fait sur la base des caractéristiques qu ils possèdent et qui s adaptent mieux à notre approche. Nous pouvons résumer les caractéristiques d un agent intelligent comme suit : - L'autonomie Source1 Source 2 Source Ns - Capacité à communiquer et à coopérer.. - Capacité à raisonner, à réagir à leur environnement. Plusieurs approches ont été développées sur la base des agents intelligents pour l apprentissage de l utilisateur (Baldwin et al 2000) (Chen et Sycara 1998) (Seo et Zhang 2000). D autres approches ont utilisées les agents intelligents pour capturer les informations distribuées (Ogston 2003) (Yu et Singh 2003) (Zhang et al 2004). Le rôle des agents intelligents dans notre approche est de capturer les informations de l utilisateur et de son environnement pour construire son profil, de capturer les informations des sources pour construire le profil de chaque source, de décider quelles sont les sources à utiliser pour l utilisateur lors de ses recherches en information, et lui délivrer des informations pertinentes. 403

Actes des 1ères Rencontres Jeunes Chercheurs en Recherche d Information Nous distinguons suivant nos besoins deux types d agents, 1- Des agents sources. Un agent source s occupe de la source, en fournissant à l agent utilisateur les informations de la source dont il a besoin pour accomplir ses tâches. Cet agent assure le fonctionnement du processus de gestion de source. Un agent est associé à une source. 2- Des agents utilisateurs. Un agent utilisateur s occupe de l utilisateur, en répondant à ses besoins en informations. Cet agent assure le fonctionnement du processus de gestion de l utilisateur. Un agent utilisateur est associé à un utilisateur. Nous présentons dans ce qui suit la description générale du profil utilisateur et du profil source. 2.1. Description du profil de l utilisateur Plusieurs approches ont été développées pour définir le profil utilisateur, nous pouvons citer : les approches adaptatives (Rochio 1971) WebMate (Chen et Sycara 1998) (Poo et al 2003) ; les approches sémantiques (Billsus et Pazzani 1999) (Pretschner et Gauch 1999) (Gauch et al 2003) ; approche multidimensionnelle (kostadinov 2003) Pour mieux exploiter le profil utilisateur tout en l adaptant à nos besoins nous le divisons en trois dimensions. La première dimension représente l historique des interactions de l utilisateur, la deuxième représente le centre d intérêt de l utilisateur et la troisième représente les préférences de l utilisateur. Nous avons défini la représentation globale que nous adoptons pour décrire un utilisateur. La suite de notre travail consiste à : 1- Comment instancier ces trois dimensions du profil? 2- Comment exploiter ce profil dans le processus de sélection et de fusion. 2.2. Description du profil source Le profil source doit contenir un maximum d informations pour décrire la source. Nous avons proposé de définir le profil source en deux dimensions principales. Une dimension pour décrire le contenu de la source, nommée Thèmes, l autre pour décrire les caractéristiques de la source nommée Critères. - Thèmes : les thèmes décrivent le contenu de la source. - Les critères : les critères décrivent les caractéristiques de la source. Nous avons défini la représentation globale que nous adoptons pour décrire une source d information. La suite de notre travail consiste à répondre à ces questions : 1- Que doit contenir la dimension «Thèmes»? 404

Lyon - France 2- Que doit contenir la dimension «Critères»? 3- Comment «apparier» entre le profil utilisateur et le profil des sources, pour choisir les sources pertinentes à un utilisateur? 3. Conclusion Cet article décrit les objectifs que nous voulons atteindre par notre travail de thèse. Qui se caractérise à définir une approche d accès personnalisée dans un environnement multi sources. Pour ce faire nous nous sommes orientés vers la définition d un profil de la source d un côté, de l autre côté la définition d un profil utilisateur, puis de définir une méthode pour «apparier» le profil utilisateur avec les profils des sources pour délivrer à l utilisateur les informations pertinentes suivant son centre d intérêt et ses préférences personnelles. Pour le fonctionnement de notre approche, nous avons proposé d utiliser des agents intelligents, un agent par source et un agent par utilisateur. L agent de chaque source a pour rôle de maintenir à jour le profil de la source, et de fournir à l agent utilisateur les informations nécessaires pour accomplir ses tâches. L agent utilisateur a pour rôle de maintenir à jour le profil de l utilisateur, lui trouver les sources d informations pertinentes et lui délivrer les informations pertinentes. Nous avons défini une représentation globale d un profil source, et d un profil utilisateur, notre travail consiste par la suite à décrire le contenu de chaque profil, et de définir une méthode pour «apparier» le profil utilisateur avec le profil des sources, afin de trouver les sources et les informations qui sont pertinentes pour l utilisateur. Bibliographie Billsus D, Pazzani J. A Hybrid User Model for News Story Classification. 7-th International Conference on User Modeling (UM 99), Banff, Canada, June 20-24, 1999. Callan J. Distributed information retrieval. In W.B. Croft, editor, Advances in Information Retrieval. Kluwer Academic Publishers. (pp. 127-150), 2000. Chen L, Sycara K. WebMate: A Personal Agent for Browsing and Searching, In Proceedings of the 2nd International Conference on Autonomous Agents and Multi Agent Systems, Minneapolis, MN, May 10-13, 1998. Gauch S, Chaffe J, Pretschner A. Ontology-Based User Profiles for Search and Browsing, To appear in J. User Modeling and User-Adapted Interaction, the Journal of Personalization Research, Special Issue on User Modeling for Web and Hypermedia Information Retrieval, 2003. Gravano L, Garcia-Molina H, Tomasic A. GLOSS: Text-source iscovery over the Internet, ACM Transactions on Database Systems, 24(2), (pp. 229-264, 1999). 405

Actes des 1ères Rencontres Jeunes Chercheurs en Recherche d Information Kostadinov D. Personnalisation de l information et gestion des profils utilisateurs. Mémoire de DEA PRiSM, Versailles. 2003. Larkey L.S, Connell M.E, Callan J. Collection and Results Merging with Topically Organized U.S. Patents and TREC Data. Proceedings of CIKM 2000. (pp.282-289), 2000. Nottelmann H et Fuhr N. Evaluating different method of estimating retrieval quality for resource selection. In Proceedings of the 25th Annual InternationalACM SIGIR Conference on Research and Development in Information etrieval, 2003. Ogston. E. Group formation among peer-to-peer agents: learning group. Proceedings of the Second International Joint Conference on Autonomous Agents and Multiagent Systems, 2003. Poo D, Chang B, Goh J. A Hybrid Approach for User Profiling. 36th Annual Hawaii International Conference on System Sciences (HICSS'03) - Track 4, January 06-09, 2003. Pretschner A, Gauch S. Ontology Based Personalized Search. In Proceedings of the 11th IEEE International Conference on Tools with Artificial Intelligence (ICTAI), November 1999. Rochio J. Relevance feedback information retrieval. In Gerald Salton (editor), The SMART retrieval system- experiments in automated document processing. Prentice-Hall, Englewood Cliffs, NJ, 1971. Seo Y-W, Zhang T A Reinforcement Learning Agent for Personalized Information Filtering, Proceedings of the 2000 International Conference on Intelligent User Interfaces, New- Orleans, USA, Jan 9-12, 2000, ACM, pp248-251, 2000. Si L and Callan J. A Semi-Supervised learning method to merge search engine results. ACM Transactions on Information Systems, 21(4). (pp. 457-491), 2003. Si L and Callan J. Modeling Search Engine Effectiveness for Federated Search. In Proceedings of the Twenty Seventh Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. Toronto, Canada: ACM 2005. Xu J, Callan J.P. Effective retrieval with distributed collections. ACMSIGIR 98, (pp. 112-120), 1998. Yu. B and Singh. M. Incentive mechanisms for agent-based peer-to-peer systems. Proceedings of the Second International Joint Conference on Autonomous Agents and Multiagent Systems, 2003. Zhang H, Croft W.B, Levine B, Victor Lesser. A Multi-agent Approach for Peer-to-Peerbased Information Retrieval Systems AAMAS'04, July 19-23, 2004, New York, New York, USA.Copyright 2004 ACM 1-58113-864-4/04/0007. 2004. 406