Brève introduction à la recherche d!information sur le Web à base d!agents logiciels



Documents pareils
Brève introduction aux agents logiciels Bernard ESPINASSE

Architecture d'entreprise : Guide Pratique de l'architecture Logique

Ecole Préparatoire SNV Université d Oran Semestre /2015 Matière : Travaux d Initiative Personnelle Encadrés (TIPE) Prof. M. Z.

Date de diffusion : Rédigé par : Version : Mars 2008 APEM 1.4. Sig-Artisanat : Guide de l'utilisateur 2 / 24

La plate-forme DIMA. Master 1 IMA COLI23 - Université de La Rochelle

Recherche d'information dans Internet Introduction

Introduction. Internet : Moteur de recherche : Google, Yahoo, Forum

SQUID P r o x y L i b r e p o u r U n i x e t L i n u x

Introduction : présentation de la Business Intelligence

La veille d'information sur Internet

Optimiser le référencement naturel de son site web

Une Architecture Basée Agents Mobiles Pour la Recherche D'information dans des Sources Hétérogènes et Réparties

Quels apprentissages info-documentaires au collège?

2. Activités et Modèles de développement en Génie Logiciel

Qu'est-ce qu'un moteur de recherche. Moteur de recherche sur Internet

Cognit Ive Cas d utilisation

Chapitre 10. Architectures des systèmes de gestion de bases de données

Prise en main du BusinessObjects XI R2 Service Pack 2/ Productivity Pack

ORGANISER LA RECHERCHE D'INFORMATIONS À L'ÈRE DU NUMÉRIQUE

CONTRÔLES D'ACCÈS PHYSIQUE AUTOMATISÉS

Modèle Cobit

Université de Bangui. Modélisons en UML

SAP BusinessObjects Web Intelligence (WebI) BI 4

Ebauche Rapport finale

Le modèle de données

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

Réflexion sur la mise en place d'un système mobile d'aide à la navigation destiné aux services d'urgence basée sur une solution libre.

Programmation d'agents intelligents Vers une refonte des fils de raisonnement. Stage de fin d'études Master IAD 2006

Poste : AGENT AUX ACHATS. Conditions d accès à la profession : Tâches : ACHATS

Déployer une Stratégie Web Globale

Logiciel EV3 LEGO MINDSTORMS Education

Refonte des sites internet du SIEDS

Annexe 5. Kaspersky Security For SharePoint Servers. Consulting Team

Le référencement de mon site

Nouveau Web Client marquant, Cumulus Video Cloud, optimisations de la base de données, et plus..

C ) Détail volets A, B, C, D et E. Hypothèses (facteurs externes au projet) Sources de vérification. Actions Objectifs Méthode, résultats

AGATHE : une architecture générique à base d agents et d ontologies pour la collecte d information sur domaines restreints du Web

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Manuel d'utilisation. Ticket Center Manuel d'utilisation. Ticket Center 2: mai AdNovum Informatik AG. Mis en circulation

ManageEngine IT360 : Gestion de l'informatique de l'entreprise

L'évolution de VISUAL MESSAGE CENTER Architecture et intégration

LE RESEAU GLOBAL INTERNET

Le bénéfice maximal de votre documentation

Les clusters Linux. 4 août 2004 Benoît des Ligneris, Ph. D. benoit.des.ligneris@revolutionlinux.com. white-paper-cluster_fr.sxw, Version 74 Page 1


Les réseaux de campus. F. Nolot

Manuel d'utilisation du Journal de bord de Trading

INTERNET, C'EST QUOI?

ACCÈS AUX RESSOURCES NUMÉRIQUES

18 TCP Les protocoles de domaines d applications

Référencement naturel

Fiche de l'awt La newsletter ou lettre d'information

Formation à la recherche documentaire sur le web

Peregrine. AssetCenter. Product Documentation. Solution Asset Tracking. Part No. DAC-441-FR38. Build 49

Travail collaboratif à distance

Écrire pour internet. Comment les internautes lisent ils? La lecture à l'écran

portnox pour un contrôle amélioré des accès réseau Copyright 2008 Access Layers. Tous droits réservés.

L'appel public à l'épargne, pour quel besoin de financement? (2/3)

Document d accompagnement pour le référentiel national du C2i niveau 2 Métiers de l environnement et de l aménagement durables

I.1 Introduction. I.2 La recherche d information. I.2.1 Définitions

Diagnostic adaptatif d'un flux d'alarmes par méta diagnostic distribué Application à la détection d'intrusions dans un serveur Web

Irrigation Marketing. >1 : Un nouveau concept : l irrigation marketing

Campagne de Communication Prévisionnelle. Web Intelligence & Réputation Internet

Les modes de recherche sur le Web 2.0

Gestion de Projet Agile

Utiliser Access ou Excel pour gérer vos données

Business Intelligence

v7.1 SP2 Guide des Nouveautés

Catalogue des formations Edition 2015

BANQUES DE DONNÉES PÉDAGOGIQUES

1/ La place du référencement dans la gestion de trafic sur un site web

Contrôle interne et organisation comptable de l'entreprise

Nouvelle plateforme disponible pour les professeurs et les élèves de la Promotion Sociale du Collège Technique «Aumôniers du travail»

SQL Server 2014 Administration d'une base de données transactionnelle avec SQL Server Management Studio

Service de certificat

TeamViewer 9 Manuel Management Console

10. Base de données et Web. OlivierCuré

Petite définition : Présentation :

Veille Internet avec les flux RSS, recherche et veille sur les réseaux sociaux

Banque de données d offres & carte web interactive d offres

Documentation de produit SAP Cloud for Customer (novembre 2013) Nouveautés de SAP Cloud for Customer pour les administrateurs

Cours n 2. UE706: Veille et intelligence économique EC3: Intelligence Économique et réseaux. Promo. Master : SIC. Documentation numérique

Configuration de SQL server 2005 pour la réplication

PTV MAP&GUIDE INTRANET QUELLES SONT LES NOUVEAUTÉS?

Guide d'utilisation du logiciel de NEWSLETTERS

FazaANGEL supervision pro-active

Chapitre 2. Classes et objets

Nom-Projet MODELE PLAN DE MANAGEMENT DE PROJET

Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte

L apprentissage automatique

1 LE L S S ERV R EURS Si 5

ERGONOMIE GESTION DES DONNEES CLIENT. Gestion données client Vue 360 (Obligatoire) Données récupérées. Données calculées

Fiche technique: Archivage Symantec Enterprise Vault for Microsoft Exchange Stocker, gérer et rechercher les informations stratégiques de l'entreprise

Domaine D4 KARINE SILINI UNIVERSITÉ DU LITTORAL CÔTE D'OPALE --LICENCE CREATIVE COMMONS : PATERNITÉ - PAS D'UTILISATION COMMERCIALE - PARTAGE

Transcription:

Plan Brève introduction à la recherche d!information sur le Web à base d!agents logiciels Bernard ESPINASSE Université d!aix-marseille 2010 Rappels sur les agents logiciels Problématique de la RI sur le Web Pourquoi les agents pour la RI Les grandes approches de la RI à base d!agents 1. Rappels sur les agents logiciels 2. Problématique de la RI sur le Web 3. Pourquoi les agents pour la RI 4. Les grandes approches de la RI à base d!agents Bernard ESPINASSE - Introduction à l ABIR 1 Bernard ESPINASSE - Introduction à l ABIR 2 Qu!est ce qu!un agent logiciel (sofware agent)? DéfinitionS : 1 Rappels sur les agents logiciels Qu!est-ce qu!un agent logiciel Caractéristiques générales d!un agent logiciel Typologie des agents logiciels un système informatique, situé dans un environnement, et qui agît d'une façon autonome et flexible pour atteindre des objectifs pour lequel il a été conçu [Sycara & Wooldridge] une entité computationnelle active, avec une identité persistente, qui peut percevoir, raisonner et agir dans son environnement et qui peut communiquer notamment avec d'autres agents [Huhns] un composant logiciel ou matériel qui est capable d'agir afin d'accomplir des tâches au nom de son utilisateur [Nwana] Bernard ESPINASSE - Introduction à l ABIR 3 Bernard ESPINASSE - Introduction à l ABIR 4

Caractéristiques générales des agents Caractéristiques générales des agents Situé : capable d'agir sur son environnement à partir d'entrées sensorielles qu'il en reçoit Autonomie : capable d'agir sans l'intervention d'un tiers (humain ou agent) et de contrôler ses propres actions ainsi que son état interne (autonomie limitée à son comportement dans une société d'agents) : réactif : capable de percevoir son environnement et de réagir à temps proactif : capable de prendre l'initiative et être opportuniste au bon moment Adaptation : capable de s!adapter à différentes situations de par son autonomie Coopération : capable d'interagir avec les autres agents quand la situation l'exige pour réaliser ses tâches et coopérer avec eux Mobilité : un agent logiciel peut voyager sur un réseau local ou le Web Bernard ESPINASSE - Introduction à l ABIR 5 Bernard ESPINASSE - Introduction à l ABIR 6 Typologie des agents logiciels Agents mobiles / statiques : agent mobiles : agents capables de se déplacer sur un réseau agents statiques : agents pas capables de se déplacer sur un réseau Agents collaboratifs / réactifs : agents collaboratifs (délibératifs, cognitifs, ) : possédent un modèle de raisonnement symbolique interne, se coordonnent entre eux par planification ou négociation agents réactifs : ne possèdent pas de modèle de raisonnement symbolique interne, agissent par stimulis - réponse ont un comportement répondant à l'état courant de l'environnement dans lequel ils sont immergés Agents assistants : assiste un utilisateur 2. Problématique de la RI sur le Web Diversité et quantité de documents accessibles sur le Web Principaux outils de RI sur le Web existants Faiblesses des outils de RI sur le Web existants Bernard ESPINASSE - Introduction à l ABIR 7 Bernard ESPINASSE - Introduction à l ABIR 8

Problématique de la RI sur le Web Diversité et quantité de documents accessibles sur le Web : Quantité : croissance exponentielle du nombre des ressources électroniques mis à la disposition des internautes. Diversité : multimédias, fichiers sur serveurs FTP, «news letters» issues de «news groups» etc. Principaux outils de RI /Web existants Moteurs généralistes (Google, Yahoo, Altavista, ) Méta-moteurs :! Thématiques hiérarchiques (ou annuaires, )! Disciplinaires (biolinks.com) Outils peu satisfaisants pour une grande majorité d!internautes (ils passent plus de 70% de leur temps à cette recherche) Bernard ESPINASSE - Introduction à l ABIR 9 Bernard ESPINASSE - Introduction à l ABIR 10 Faiblesses des outils de RI /Web existants (1) Atomicité de la page HTML : Outils actuels : niveau de granularité pour une recherche donnée est en général la page HTML. Mais les informations pertinentes pour l!utilisateur se trouvent dans des pages qui contiennent des suppléments d!informations => parcours manuels de la page pour accéder aux informations qui lui sont utiles. Indépendance des documents : Outils actuels : pages HTML indexées indépendamment les unes des autres et perdent ainsi leur contexte (liens vers autres pages) Mais très rare que les informations utiles soient localisées sur une seule page, en général elles sont dispersées sur un ensemble de pages. => pas de réponse complète fournie Bernard ESPINASSE - Introduction à l ABIR 11 Faiblesses des outils de RI /Web existants (2) Différenciation des liens : Outils actuels : distinguent uniquement les liens internes des liens externes : ils ne différencient pas les liens selon leur sémantique Mais, grandes différences entre les liens de publicité, les liens vers du contenu, les liens d!aide à la navigation,... Différenciation des pages : Outils actuels : indexation des pages HTML, se fait de la même façon pour toutes les pages HTML du Web Mais il existe beaucoup de différences entre ces pages, comme il existe des différences entre les paragraphes d!un même livre, il existe des différences entre une page de lien, une page personnelle,... Bernard ESPINASSE - Introduction à l ABIR 12

Faiblesses des outils de RI /Web existants (3) Perte sémantique lors de la construction d!une requête : Outils actuels : il est impossible de donner de la sémantique à une requête Ex : On désire connaître les livres de science fiction édités en 1999 par Pocket : on devrait entrer les mots clés suivants «pocket» «1999» «édition» «science fiction» mais toute la sémantique qui relie les mots est perdue : le moteur ne saura pas que «1999» est la date d!édition des livres, que «science fiction» est le genre du livre, que «pocket» est l!éditeur,... Origine des données : Outils actuels : sont incapables d!évaluer le degré de vérité des données trouvées Approche à base d!agents permet de dépasser certaines de ces faiblesses 3. Des agents pour la RI Collaboration des agents et RI Autonomie des agents et RI Adaptation des agents et RI Mobilité des agents et RI Tâches de la RI concernées par les agents Bernard ESPINASSE - Introduction à l ABIR 13 Bernard ESPINASSE - Introduction à l ABIR 14 Caractéristiques des agents intelligents Rappel des principales caractéristiques des agents Collaboration des agents et RI Constituer un système de RI composé d!agents qui collaborent en échangeant de l!information entre eux (usage de langages de communication comme FIPA ACL ou KQML) Doit faciliter : la découverte de nouvelles sources d!informations, le découpage modulaire du système de RI sur un ensemble d!agents doit rendre le système :! plus souple et il est facile de l!étendre («scalable» par ajout de nouveaux agents)! plus tolérant aux erreurs! plus performant car il est possible d!affecter un agent à un domaine en le dotant d!une parfaite connaissance de ce domaine notamment à travers une ontologie Bernard ESPINASSE - Introduction à l ABIR 15 Bernard ESPINASSE - Introduction à l ABIR 16

Autonomie des agents et RI L!autonomie des agents est primordiale dans la RI elle permet de faciliter le travail de l!utilisateur en agissant à sa place : Pendant la collecte : Lorsque l!agent collecte de l!information, il peut selon ses connaissances de l!utilisateur (profil), affiner sa requête pour récupérer de l!information plus pertinente Lors du rendu de l!information : Plus gros problème à l!heure actuel est le tri de l!information utile, avant restitution de l!information à l!utilisateur, l!agent doit :! réaliser ce tri, il doit donc de lui-même! discriminer les informations pertinentes de celles qui ne le sont pas. Adaptation des agents et RI La capacité d!adaptation des agents leur permet :! d!évoluer avec leur environnement! d!apprendre de leur utilisateur Ce qui permet aux agents :! de cibler de plus en plus précisément les informations utiles! de devenir plus compétitifs que les simples moteurs de recherche qui eux n!évoluent pas en fonction de l!utilisateur On peut ainsi introduire les notions de personnalisation et de recommandation, réalisées à travers des profils utilisateurs construits par les agents. Bernard ESPINASSE - Introduction à l ABIR 17 Bernard ESPINASSE - Introduction à l ABIR 18 Mobilité des agents et RI Les agents de recherche peuvent être des agents mobiles : Intérêt des agents pour la RI Usage de capacités d!agents dans différentes tâches de la RI : Ils permettent de recueillir plus facilement de l!information en parcourant à la place de l!utilisateur les pages web : «Puisque l!information ne vient pas à toi c!est à toi d!aller à l!information» Bernard ESPINASSE - Introduction à l ABIR 19 Bernard ESPINASSE - Introduction à l ABIR 20

Différentes approches en RI à base d!agents 4. Grandes approches de la RI à base d!agents Il existe différentes approches dans l! «ABIR» (Agent Based Information Retrieval - Finin & Nicholas 98): Les grandes approches de la RI à base d!agents Approche «KnowBot» Approche «Adaptative Interface» Approche «Proactive» Approche «Collaborative» Bernard ESPINASSE - Introduction à l ABIR 21 Bernard ESPINASSE - Introduction à l ABIR 22 Les grandes approches de la RI à base d!agents Approche «KnowBot» Approche «Adaptative Interface» Approche «Proactive» Approche «Collaborative» 1. Approche «KnowBot» Approche permettant à l!aide d!une seule requête, d!accéder à de multiples sources de données Dans cette approche : les agents représentent l!utilisateur devant différents moteurs de recherche sur lesquels ils lancent des requêtes pour récolter de l!information forte autonomie des agents : des agents peuvent être capable :! d!affiner leurs requêtes en fonction de ce que retourne les moteurs de recherche,! de fusionner et filtrer les résultats avant de les rendre à l!utilisateur. Exemples de KnowBot : MétaCrawler, SavvySearch, Shopbot, BargainFinder, Netbot, Bernard ESPINASSE - Introduction à l ABIR 23 Bernard ESPINASSE - Introduction à l ABIR 24

Approche «KnowBot» : exemple de Netbot (1) Netbot s!intéresse à la recherche de produits sur Internet Approche «KnowBot» : exemple de Netbot (2) Interface Web de Netbot : Principe : Bernard ESPINASSE - Introduction à l ABIR 25 Bernard ESPINASSE - Introduction à l ABIR 26 2. Approche «Adaptative Interface» (1) Approche basée sur le principe de la recommandation de documents à l!utilisateur, à partir d!un profil utilisateur construit par les agents Elle est décomposée en 3 grandes étapes : Collecte d!informations par le système multi agents Filtrage et sélection des informations pertinentes Rendu de l!information à l!utilisateur Remarque : l!étape de requêtage de l!utilisateur a ici disparu, en effet cette méthode est une méthode «push» car l!agent va de lui-même chercher de l!information et le proposer à l!utilisateur (recommandation). Approche «Adaptative Interface» (2) Afin de recommander des informations pertinentes aux utilisateurs un profil est construit pour chaque utilisateur : Il sert à renseigner les agents sur les domaines de recherche auxquels s!intéresse l!utilisateur Il est remis continuellement à jour par les agents afin d!avoir une description des domaines d!intérêt de l!utilisateur de plus en plus précise les mises à jour du profil peuvent se faire par retour de l!utilisateur sur la qualité des documents qui lui ont été recommandé. Bernard ESPINASSE - Introduction à l ABIR 27 Bernard ESPINASSE - Introduction à l ABIR 28

Approche «Adaptative Interface» (3) Schéma décrivant le processus de recommandation se déroule du requêtage de l!utilisateur jusqu'à la mise à jour de son profil : 3. Approche «Proactive» Dans cette approche, les agents parcourent le Web comme l!utilisateur le fait sauf que le parcours se fait en largeur, alors que le parcours normal des utilisateurs se fait en profondeur Les agents récoltent ainsi de l!information qu!ils jugent utile et cela grâce à un ensemble d!heuristiques Lorsque des informations utiles sont trouvées, puis classées par ordre de pertinence et restituées à l!utilisateur. Un des systèmes les plus célèbres basé sur cette approche est Letizia Bernard ESPINASSE - Introduction à l ABIR 29 Bernard ESPINASSE - Introduction à l ABIR 30 4. Approche «Collaborative» C!est une des approches les plus efficaces en RI : A chaque utilisateur est affecté un agent qui gère son profil Les agents font des comparaisons entre les profils utilisateurs afin d!identifier les utilisateurs qui ont les mêmes centres d!intérêts Lorsque 2 utilisateurs (U1 et U2) ont des profils similaires : U1 se voit recommandé, par son agent personnel, les documents qu!il n!a pas visité et que U2 a jugé intéressants (il en sera de même pour U2, il se verra recommander les documents de U1, qu!il n!a pas vu). Ainsi : les utilisateurs qui ont un centre d!intérêt commun collaborent au travers de leurs agents cette approche assure que les documents recommandés soient pertinents les utilisateurs peuvent donner un feedback sur les recommandations de leur agent pour que celui-ci puisse améliorer le profil utilisateur. Bernard ESPINASSE - Introduction à l ABIR 31 Approche «Collaborative» : basée sur la négociation Dans cette approche, on identifie 3 types d!agents : les «user agents» : ils sont du côté de l!utilisateur et gardent en mémoire ce dont a besoin chaque utilisateur. lorsque la collecte d!informations est faite c!est eux qui fusionneront les données et les classeront afin de les restituer à l!utilisateur les «broker agents» : ils facilitent la communication entre les différents types d!agents et permettent de router les requêtes vers les «provider agent» adéquats. les «provider agents» : ils s!occupent des requêtes vers les sources de données afin de collecter l!information. Bernard ESPINASSE - Introduction à l ABIR 32

Approche «Collaborative» : basée sur la négociation Lorsque les informations sont collectées, elles remontent la chaîne «provider agents», «broker agents», «user agents» pour être restituées à l!utilisateur : Approche «Collaborative» : exemple de Restina Restina (Reusable Task Structure-based Intelligent Network Agents) Cette architecture différencie 3 types d!agents travaillant à différents niveaux : Les «interface agents» : ils représentent les utilisateurs et peuvent communiquer entre eux Les «task agents» : ils doivent atteindre un certain nombre de buts et doivent pour cela réaliser un certain nombre de tâches. ils travaillent soit dans des domaines spécifiques soit dans des domaines indépendants Les «information agents» : ils collaborent entre eux et exploitent les différentes sources de données Bernard ESPINASSE - Introduction à l ABIR 33 Bernard ESPINASSE - Introduction à l ABIR 34 Restina : architecture Restina : architecture d!un agent un module se charge de l!action qui est en cours de réalisation un module s!occupe de l!enchaînement des différentes tâches un module possède une description précise des tâches et des objectifs auxquels ces tâches sont associées un module s!occupe de recenser l!ensemble des différents objectifs que doit atteindre l!agent. Bernard ESPINASSE - Introduction à l ABIR 35 Bernard ESPINASSE - Introduction à l ABIR 36