Système d'aide à l Indexation et à la recherche d Information sur le Web



Documents pareils
Exemple de Plan d Assurance Qualité Projet PAQP simplifié

CSMA e Colloque National en Calcul des Structures Mai 2013

Les nouvelles orientations politiques du budget 2015 du Gouvernement prévoient

7. Droit fiscal. Calendrier Actualité fiscale 7.2 Contrôle et contentieux fiscal 7.3 Détermination du résultat fiscal.

Devenez ingénieur en Génie Informatique et Statistique par la voie de l apprentissage

Le guide du parraina

A. RENSEIGNEMENTS GÉNÉRAUX. (Adresse civique) 3. Veuillez remplir l'annexe relative aux Sociétés en commandites assurées à la partie E.

MAISON DE LA RATP 54, quai de la Râpée -189, rue de Bercy Paris. M Gare de Lyon. M Gare de Lyon

Matériau pour greffe MIS Corporation. Al Rights Reserved.

DEMANDE DE GARANTIE FINANCIÈRE ET PACK RCP

Sommaire G-apps : Smart fun for your smartphone!

Programme GénieArts Î.-P.-É GénieArts

Bloc 1 : La stabilité, une question d équilibre

TVA et Systèmes d Information. Retour d expérience d entreprise. A3F - 26 mars 2015 Hélène Percie du Sert COFELY INEO

Les maisons de santé pluridisciplinaires en Haute-Normandie

Vu la loi n portant code des assurances prom ulguée par le dahir n du 25 rejeb 1423 (3 octobre 2002), telle qu'elle a été complétée ;

Développement de site web dynaùique Dot.NET

THÈSE. présentée à. par Nicolas Palix. DOCTEUR Spécialité: INFORMATIQUE. Langages dédiés au développement de services de communications

DOSSIER DE CANDIDATURE POUR UNE LOCATION

Évaluation de performance et optimisation de réseaux IP/MPLS/DiffServ

Garantie des Accidents de la Vie - Protection Juridique des Risques liés à Internet

Les ressources du PC

Systèmes à événements discrets : de la simulation à l'analyse temporelle de la décision en agriculture

Journée d échanges techniques sur la continuité écologique

La lettre du Bureau Asie-Pacifique

CENTRE FRANCO-ONTARIEN DE RESSOURCES PÉDAGOGIQUES

Produits à base de cellules souches de pomme

Impôts PLUS ou moins-values

Corrigé du baccalauréat S Pondichéry 13 avril 2011

DELIBERATION DU CONSEIL REGIONAL

Initiation à la virologie Chapitre IV : Diagnostic viral

Comment utiliser une banque en France. c 2014 Fabian M. Suchanek

Découverte Sociale et Patrimoniale

Juin

Réseau des bibliothèques du Pays de Pamiers Guide du Numérique

au Point Info Famille

Florence Jusot, Myriam Khlat, Thierry Rochereau, Catherine Sermet*

CLOUD TROTTER La Vache Noire Sud rue Oscar Roulet Robion - Tél. :

FORMATIONS 2014 CENTRE EUROPÉEN DE FORMATION À LA PRODUCTION DE FILMS

La transformation et la mutation des immeubles de bureaux

Le traitement des expulsions locatives

C est signé mars 2015 Mutuelle soumise au livre II du Code de la Mutualité - SIREN N DOC 007 B-06-18/02/2015

Rassemblement National des Interlocuteurs Academiques TICE Éducation Physique et Sportive - Evry - 20/21 Janvier 2014 TABLETTES TACTILES

«COMBATTRE LES BLEUS» Ce que signifie le programme social des Conservateurs pour les femmes

Focus. Les placements éthiques : entre défis et opportunités. Patrick Barisan. Sintesi a cura di Luisa Crisigiovanni

Le mandat de Chercheur qualifié du F.R.S.-FNRS

Gestion de casiers en milieu scolaire. Augmenter la disponibilité en mode centralisé ou consignes, avec les casiers de Traka. traka.

Demande de retraite de réversion

Assurer les proposants donneurs de rein

Guide de correction TD 6

Subventions Diverses 2009

Le nouveau projet Israélo-Palestinien : Terreau pour une culture de paix

Sommaire. qui sommes-nous. Nos grandes realisations. 4 Madagascar 5 Nous vivons nos valeurs 6 Telma en bref 8 La Gouvernance

nous votre service clients orange.fr > espace client 3970*

Inclure la vidéo comme levier de sa stratégie marketing

UNIVERSITÉ SAVOIE MONT BLANC FRANCE KIT DE SURVIE DE L ÉTUDIANT ETRANGER.

f n (x) = x n e x. T k

RAPPORT D ACTIVITÉ. Maison de l Emploi Sarthe Nord

J adopte le geste naturel

ces révolutions qui nous attendent Jeudi 23 octobre 2014 Bien assuré, on peut tout oser. programme

UNE AVENTVRE DE AGILE & CMMI POTION MAGIQUE OU GRAND FOSSÉ? AGILE TOVLOVSE 2011 I.VI VERSION

BEC-BENCHMARKING (Benchmarks inclus dans le club des Brand Managers) Exemple Veille Stratégique n 1

Titrages acidobasiques de mélanges contenant une espèce forte et une espèce faible : successifs ou simultanés?

Le Songe d une nuit d été

LE SURENDETTEMENT. a s s e c o. leo lagrange UNION NATIONALE DES ASSOCIATIONS FAMILIALES. union féminine civique et sociale

Base de données bibliographique. p p. 33. valorisation économique de l'eau potable. energétique et municipales. p.13 - fédérale de.

Date de publication : Juillet 2014

CASIO D 20 Mémoire du grand total CASIO ECO Affichage 8, 10 ou 12 chiffres Tous les calculs de bases Calcul de taxes

Plan directeur des zones 30 km/h

Les odeurs. é ens M. d e. sur. / janvier-février Informations sur la Qualité de l Air en Picardie

Hector Guimard et le fer : inventivité et économie

S a i n t - M a l o G R O U P E

Commune de Villars-sur-Glâne Plan directeur du stationnement Bases

Bénévole pour quoi? N 20 - Sommaire. N 20 - Déc 08. v d s. f bénévoles désormais, et on s'arrête là pour l'instant.

BOULOGNE (92) TRIANGLE ENTRE VERDURE ET BOUCLE DE SEINE INVESTISSEMENT EN NUE-PROPRIÉTÉ IMMOBILIER NEUF

Agricoles LES BONNES RÉSOLUTIONS DU MODEF DES LANDES. le 15 janvier. sommaire. édito. Aides aux fourrages (CG 40) et aide MSA : Dossiers à déposer

LISTE DES PROJETS -EXTERNES- MASTER - PROMO : 2015

L innovation. du participant. 5 et 6 décembre 2011 Palais des congrès de Montréal. dans une chaîne d approvisionnement durable : un enjeu mondial

Enquête sur le naufrage de Serono, coulé par une gestion aberrante > Biotech Toute l histoire du fleuron déchu de l économie genevoise

magazine N 61 décembre 2011 Joyeuses fêtes Dossier : Fiscalité locale Vie économique : Animations commerciales Travaux : Plan neige

!!!! "#$$%&'(%)!*+!,-+..+! /0-'.1!2+!34!&#5+$6-+!3788!! 9+!8+-!:#-%$!*+.!;)<'+-.!*+!2='&*%.<-'+!'$$#6'2'>-+!.+!<'+&*-0!?+%*'!

SEPTEMBRE 2014 C EST AUSSI LA RENTRÉE DES PETITS ALBIGEOIS ALBI PENDANT LA PREMIÈRE GUERRE MONDIALE QUATRE SPORTIFS SOUS LES FEUX DE LA RAMPE

La aème législature est à sa fin

programme mars 2015 VENEZ DÉCOUVRIR LES SAVOIR-FAIRE DES ARTISANS D ART À GENÈVE Genève, ville d art

Murs coupe-feu dans maisons mitoyennes à une famille

Lundi 7 mars Trier et réduire ses déchets

responsabilité Analyse des décisions civiles, pénales et avis CCI des anesthésistes, obstétriciens et chirurgiens concernant supplément au N o 52

LE DEFI L HOMME ET LES TECHNOSCIENCES. 21, 22, 23 novembre e Semaine sociale de France. à l Université catholique de Lille

Bord ailes Hélène Pilotte

PAR. été Les Affaires Plus

- Organisé par - L AUDAX CLUB PARISIEN avec le concours DES VILLES CONTRÔLE et. de l agglomération de SAINT-QUENTIN -EN-YVELINES

PARTIE 1 : La gestion administrative des relations avec les fournisseurs

Le conseil municipal vous présente ses meilleurs vœux pour 2014

ADMINISTRATEUR DE PRODUCTION FORMATIONS 2014 CENTRE EUROPÉEN DE FORMATION À LA PRODUCTION DE FILMS

L ENSEEIHT. et intégrez une formation innovante en Midi-Pyrénées. Ingénierie Informatique et Réseaux : un métier d avenir 50 %

Introduction sur l'état d'avancement de la esanté en France

ÉLECTRONIQUE NUMÉRIQUE

JOURNAL DE 'JURISPRUDENCE ET DES DEBATS JUDICIAIRES.

La GEIDE. Dans une solution GEIDE, il est possible d'associer au sein même d'un dossier:

LAITON A HAUTE RESISTANCE CuZn23Al4

Transcription:

TEXTES DES COMMUNICATIONS - Tom I Systèm d'aid à l Indxation t à la rchrch d Information sur l Wb Laïd BOUZIDI bouzidi@univ-lyon3.fr IAE - Univrsité Jan Moulin - Lyon3 / 6, cours Albrt Thomas B.P.8242 69355 Lyon cdx 08 Mots clfs : Indxation, Gstion ds Connaissancs, Aid à la Décision, Raisonnmnt par Cas, Systèms Multi- Agnt, Apprntissag, Rchrch d information sur l wb Kywords : Indxation, Knowldg managmnt, Dcision support, Cas basd rasoning, Multi-agnt systms, larning, rsarch for information wb Palabras clavs : Indxacion, busquda d informacion n la rd, bass d conociminto, ayuda a la toma d dcisions, rasonaminto por casos, aprntizaj Résumé L'xplosion ds sourcs d information t l dévloppmnt ds outils d accès à l information n particulir ls accès à distanc font qu l problèm aujourd hui n st plus l absnc d information mais plutôt sa prtinnc. Plusiurs étaps sont nécssairs pour aboutir à la fois à un rprésntation fiabl ds sourcs d information, mais aussi, à un bonn formulation ds bsoins ds utilisaturs. Crtains ds étaps qui constitunt l'activité d pilotag du procssus d rchrch d information dvinnnt d plus n plus complxs t un outil d aid à la décision dvint un nécssité, particulièrmnt dans ls étaps d'analys, d concption d scénario, d chminmnt t d xploitation, d'évaluation ds différnts cas possibls t d réutilisation d cas précédnts pour n traitr d nouvaux. Ls tchnologis informatiqus n particulir clls associés au wb, offrnt ds possibilités d accès à ds bass d informations hétérogèns, répartis aux quatr coins du mond, traitant d domains différnts. Néanmoins, l utilisatur st d plus n plus noyé dans ctt mass énorm d information t l choix d l information prtinnt par rapport à son bsoin rél rst actullmnt l problèm fondamntal. Plusiurs tchniqus xistnt tant au nivau d la phas d indxation ds rssourcs documntairs qu au nivau d la phas d rchrch. Nous ssayons dans notr approch d proposr un tchniqu «hybrid» qui prmt d augmntr l taux d satisfaction ds usagrs. Ell st fondé sur un architctur d systèm d aid à la pris d décision utilisant n particulir ls xpérincs antériurs n matièr d indxation t d rchrch d information. IRIT - DELTA VEILLE 25

VSST'2001 1 Introduction L'xplosion ds sourcs d information t l dévloppmnt ds outils d accès à l information n particulir ls accès à distanc font qu l problèm aujourd hui n st plus l absnc d information mais plutôt sa prtinnc. Plusiurs étaps sont nécssairs pour aboutir à la fois à un rprésntation fiabl ds sourcs d information, mais aussi, à un bonn formulation ds bsoins ds utilisaturs. Crtains ds étaps qui constitunt l'activité d pilotag du procssus d rchrch d information dvinnnt d plus n plus complxs t un outil d aid à la décision dvint un nécssité, particulièrmnt dans ls étaps d'analys, d concption d scénario, d chminmnt t d xploitation, d'évaluation ds différnts cas possibls t d réutilisation d cas précédnts pour n traitr d nouvaux. Ls tchnologis informatiqus n particulir clls associés au wb, offrnt ds possibilités d accès à ds bass d informations hétérogèns, répartis aux quatr coins du mond, traitant d domains différnts. Néanmoins, l utilisatur st d plus n plus noyé dans ctt mass énorm d information t l choix d l information prtinnt par rapport à son bsoin rél rst actullmnt l problèm fondamntal. La décision d sélctionnr tll ou tll sourc d information dépnd d plusiurs critèrs, j citrai n particulir : l profil d l utilisatur, son domain d compétnc, la catégori d l information qu il rchrch, son nivau t sa capacité d utilisr ls différnts tchniqus d rchrch, la convivialité qu offrnt cs outils. L émrgnc d nouvlls tchniqus informatiqus plus adaptés aux procssus non structurés tl qu la pris d décision prmttnt l'intégration d l'outil informatiqu dans la gstion ds procssus d décision n général. Ls systèms d aid à la décision [10] intègrnt différnts typs d'informations t d connaissancs dans ls différnts étaps du procssus d décision Dans l procssus d décision rlatif à l indxation ds sourcs d information, la phas d stockag ds informations conditionn la phas d xploitation ds sourcs d information. Dans c procssus sont utilisés ls donnés rlativs au domain traité, ls connaissancs ds différnts xprts qui analysnt ls sourcs d information, ls donnés historiqus t statistiqus ainsi qu ls xpérincs précédnts n matièr d pris d décision tant au nivau d la phas d indxation qu lors d la phas d xploitation t d rchrch. Crts, plusiurs tchniqus xistnt t sont utilisés lors ds dux phass : indxation t rchrch d information, tll qu l indxation t la rchrch n full-txt (txt intégral), mais cs tchniqus si lls prmttnt d générr t d stockr l information dans sa totalité, ll posnt aussi l problèm du tri d l information par rapport au bsoin rél d l utilisatur. Actullmnt, l utilisatur acquirt un démarch d rchrch plutôt par tâtonnmnt qu par un méthod précis. C st d ctt façon qu il s définit lui mêm son propr chminmnt n faisant référnc à un tram ou trac d xploitation qu il s constitu par un tchniqu d apprntissag mpiriqu. Ctt démarch, l utilisatur ssai d l appliqur lors d chaqu rchrch d information sans s soucir ni du contxt, ni du domain, ni du thèm t ncor moins d l information rchrché. S pos alors l problèm d la prtinnc ds résultats fournis par ls différnts procssus d rchrch. Nous proposons ici un systèm d'aid à la décision pour l indxation t la rchrch d information associant différnts approchs. Ls tchniqus d rprésntation ds sourcs d information t ds connaissancs t la réutilisation ds cas antériurs touchant au procssus d décision pour l indxation t la formulation ds bsoins ds utilisaturs n matièr d accès t d rchrch d information constitunt l'ssntil d cs approchs. C systèm d aid qu l on propos put êtr adapté à différnts contxts t domains d application mêm si nous proposons d dévloppr ici l cas d l'indxation t la rchrch d documnts dans ds sits wb. 2 L'utilisation d méthods d rchrch documntairs Dans un systèm d rchrch d information, on trouv généralmnt dux typs d moturs d rchrch, d'un part cux dévloppés autour d'un systèm d gstion d bas d donnés rlationnl t d'autr part cux qui ont été conçu autour d'un logicil documntair. D nombrux systèms proposnt égalmnt un rchrch d typ navigationnl ou n mod hyprmédia. 26

TEXTES DES COMMUNICATIONS - Tom I Ls moturs d rchrch dévloppés autour d'un systèm d gstion d bas d donnés rlationnl sont particulièrmnt dstinés à ds applications d typ dossir ou nomnclatur t dans lsqulls la rchrch st conduit d manièr arborscnt (thèm, sous thèm, dossir, sous dossir, documnt), cs systèms prmttnt égalmnt la rchrch sur ds mots clés. Toutfois t malgré l'intérêt qu présntnt crtains tchniqus d'accès à l'information, il convint d notr qu l'utilisation d méthods d rchrchs documntairs st primordial dans l cadr d'un systèm d rchrch d information utilisant la tchnologi WEB. En fft, l'objctif n'st plus alors d trouvr ds informations mais d sélctionnr la plus prtinnt parmi un mass important t très divrsifié d documnts (information structuré ou non). L'nsmbl ds moturs d rchrch dévloppés autour d'un logicil documntair classiqu sont ssntillmnt utilisés pour lurs fonctions d rchrch sur l txt ds documnts. Dans c cas, il st possibl d'utilisr n'import qul mot du txt comm critèr d rchrch (rchrch plin txt ou txt intégral). Cs logicils offrnt égalmnt un nsmbl d possibilités à l'utilisatur comm la rchrch sur racin d mots ou la rchrch d mots dans un contxt. Notons égalmnt qu la formulation ds qustions s fait d plus n plus dans un mod d'intrrogation qui s'apparnt au langag naturl t ainsi apport un plus grand confort d'utilisation dans l mécanism d rchrch d'informations. 2.1 Dscription ds procssus d rchrch xistants L documnt a été pndant longtmps synonym d txt, mais dpuis plusiurs annés il rcouvr un réalité bin différnt. Aussi, d par l'intrpénétration ds médias t ds supports, nous nous trouvons fac à un typologi documntair d plus n plus complx. Typologi qu'il nous st possibl d résumr d la façon suivant : Documnts txtuls : Il s'agit ssntillmnt d documnts xistants sous un form papir, qu'ils soint produits ou non par un application informatiqu. Un documnt txtul s présnt généralmnt comm un nsmbl d trms qui constitu un écrit ou un œuvr original. Documnts visuls : On ntnd par documnts visuls l'nsmbl ds sourcs d'information d natur graphiqu (plan, cart, schéma, tc.) ou iconographiqu (dssin, pintur, photographi, tc.) dirctmnt visibls par l'œil humain. Documnts sonors : La production d sons intlligibls, par l'homm sans transformation ni utilisation d'un machin, constitu un documnt sonor qu'il convint d'idntifir t d consrvr n l'état. Son contnu étant portur d sns, il rprésnt un témoignag qu'il st nécssair d stockr l plus fidèlmnt possibl afin d pouvoir l rproduir ultériurmnt sans altération ni déformation d'aucun sort. Documnts audiovisuls : Ls documnts audiovisuls rassmblnt l'nsmbl ds sourcs d'information qui utilisnt la présntation d'imags, d films t d'nrgistrmnts sonors (séquncs vidéos, diaporamas, tc.). Il s'agit n fait d documnts n'appartnant pas à l'univrs d l'écrit, ils apportnt un illustration sur ds événmnts ou ds objts avc un snsibilité plus important qu la sul dscription vrbal. Documnts structurés : Un documnt structuré s caractéris par un nsmbl d'élémnts organisés dont la présntation rlèv un aspct significatif. Dux nivaux d structuration puvnt êtr rtnus pour définir un documnt, la structur physiqu t la structur logiqu. Ctt séparation prmt au documnt élctroniqu d'acquérir sa virtualité t d'êtr indépndant ds matérils d visualisation ou d'imprssion. Un séri d norms intrnationals prmttnt d définir ctt structuration. IRIT - DELTA VEILLE 27

VSST'2001 Bin qu l'objctif principal d'un systèm d rchrch d information via l Wb, soit d manipulr différnts sourcs d'information, il st important d notr qu l typ d documnts à appréhndr st parfois très éloigné d la notion d documnt élctroniqu. C qui sous-ntnd, qu'un procssus d transformation doit êtr opéré afin d parvnir à stockr sous un form numériqu un documnt préxistant dont l'aspct dépnd ssntillmnt d son mod d production. Ctt transformation a un réprcussion sur l procssus d'indxation d l'information t donc par conséqunt sur l mod d'intrrogation du fonds documntair n particulir ls systèms d Gstion Elctroniqu d Documnts (GED), qui dvinnnt d plus n plus accssibls via l Wb. 2.2 Ls principals méthods d rchrch t lur limits Dans la plupart ds sourcs d informations, ls documnts sont généralmnt organisés autour d lur dscriptif t/ou d lur contnu, alors qu il st plus prtinnt qu ils soint organisés plutôt slon l'approch d rchrch d'informations souhaité. L problèm résid dans l fait qu cs approchs d rchrchs d informations dépndnt d plusiurs critèrs t qu aucun démarch n put êtr généralisé. Ls tchniqus utilisés ont pour principal objctif d résoudr fficacmnt l problèm du rpérag t d l'accssibilité aux informations. Parmi ls principals méthods d rchrch, il convint d citr : La rchrch boolénn consist à présntr un rquêt sous la form d'un xprssion mathématiqu composé d mots clés appartnant à un dictionnair ou à un thsaurus, séparés par ds opératurs booléns. La rchrch plin txt ou txt intégral évit l'indxation préalabl ds documnts. Ils sont décrits par ux-mêms, c'st-à-dir par ls chaîns d caractèrs qui ls constitu. Ls rchrchs boolénns s'appliqunt égalmnt à c cas. La rchrch par navigation ou tchniqu hyprtxtull : Ctt tchniqu suppos un structuration préalabl ds documnts avc la mis n œuvr d lins hyprtxtuls. L'intrrogation n langag naturl : Il s'agit d'un mécanism d'intrrogation rposant sur un analys linguistiqu d la rquêt d l'utilisatur t conduisant à l'élaboration d'un rquêt "intrn" à partir d laqull la rchrch st réalisé. Nous pouvons citr par ls limits ds tchniqus d rchrch xistants : L'absnc d convivialité dans l mécanism d rchrch : lourdur ds systèms d intrrogation La complxité d la rchrch dit n txt intégral : masqué par l'apparnt facilité d la form d'intrrogation. Ls limits d la rprésntation du contnu par l langag : la dscription d un documnt dépnd fortmnt d l utilisatur, d son xpérinc t d ss compétncs dans l domain d activité traité. L'apport limité ds systèms linguistiqus dans ls systèms d rprésntation t d rchrch d information : L manqu d maturité ds systèms d rchrch n langag naturl intégrant un aid sémantiqu t l'absnc d dictionnairs d jargon d'ntrpris ou d sctur, constitunt ds élémnts qui vont à l'ncontr d'un amélioration ds prformancs dans l domain d la rchrch d'information. 3 Notr approch L'approch qu l'on propos st fondé un modèl d systèm d'aid à la décision [2]. Il s'agit d'un systèm d'aid à l'indxation t à la rchrch d'information fondé sur. ds donnés txtulls ds informations t ds connaissancs liés aux savoirs d'xprts du domain traité l'xpérinc t la trac ds différnts xploitations antériurs 28

TEXTES DES COMMUNICATIONS - Tom I Il s'agit n fait d'un systèm basé sur la capitalisation ds indxations t ds rchrchs d'informations antériurs pour n traitr d nouvlls. L architctur du systèm qu l on propos, rpos sur : Un composant qui rprésnt l nsmbl ds donnés bruts (informations numérisés) t donnés structurés sous form d bass d donnés (informations indx) Un composant qui rprésnt ls connaissancs t ls savoirs liés aux domains Un composant qui rprésnt la trac ds indxations t ds rchrchs ffctués : c st c qui prmt d capitalisr t d traitr ls nouvaux bsoins n matièr d indxation t d rchrch d information. Pour ctt composant, l utilisation du raisonnmnt à partir d cas (RpC) nous paraît adéquat. Nous présntons ci dssous commnt ctt approch d RpC st utilisé. L'architctur du systèm général d'aid à la décision st composé d sous systèms. La figur 1 rprésnt ctt architctur. BC. M.I. BD BM SGBD SGBM Sous-systèm2 Sous-systèm 1 Smi Structuré Structuré BC Exprts Infos Résultats Bas d Cas Sous-systèm 3 Smi Structuré B d Décisions Choix d Décision t Evaluation Décision Adaptation à la situation courant BC. : M.I. : BD. : SGBD : Donnés B.M. : SGBM : Modèls LEGENDE Bas Connaissancs Motur d Inférnc Bas d Donnés Systèm d Gstion d Bass d Bass d Modèls Systèm d Gstion d Bass d Actions mis n ouvr Evaluation ds résultats ds actions Mis à jour d la Bas d cas Figur1:Architctur Général du Systèm d'aid à La Décision Proposé [3] IRIT - DELTA VEILLE 29

VSST'2001 3.1 Ls composants du systèm général L sous-systèm 1 collct ds informations rprésntativs ds sourcs d information n utilisant différnts tchniqus d rprésntation : ds bass d donnés classiqus aux systèms d gstion élctroniqu d documnts. L objctif étant d rcuillir ds informations prtinnts sous un form adéquat aidant à la pris d décision (information brut par ls tchniqus d numérisation, tablaux d critèrs, scénario, simulations d prévision, tablaux d bord, ). L sous-systèm 2 assur la collct d informations dynamiqus, fondé sur ds bass d connaissancs t l savoir du décidur. C sous-systèm caractéris l intrvntion du décidur par la pris n considération du savoir d c drnir. Ls procédurs qui caractérisnt c sous-systèm sont ds procédurs touchant plutôt à l informl, qui utilisnt t génèrnt ds informations t/ou ds connaissancs. Cs procédurs utilisnt ds modèls d structuration rlvant plutôt du domain d l intllignc artificill t aboutissant à la définition d bass d connaissancs t ds modèls qualitatifs rposnt sur ls connaissancs d xprts t ls méthods d raisonnmnt fondés sur ds règls d production. Pour pouvoir utilisr cs méthods qualitativs, il st nécssair d surmontr l problèm d l acquisition ds connaissancs provnant d xprts, la détction d huristiqus t l implémntation ds bass d connaissancs. L sous-systèm 3 concrn la concption t la génération d la bas d décisions.. L élaboration d ct nsmbl d décision st fondé sur ls informations résultats issus du sous-systèm 1, la bas d connaissancs xprts issu du sous systèm 2 t l analys ds différnts cas précédmmnt nrgistrés dans la bas d cas du sous-systèm 5. L sous-systèm 4 détrmin l choix d la décision t évalu son impact n considérant ls actions qu'll ngndr. L'actualisation d la bas d cas a liu n conséqunc. Dans un prmir tmps, c sous-systèm prmt au décidur d analysr, d xploitr la bas d décision t d évalur t d pondérr ls différnts décisions. Dans un duxièm tmps, il prmt d établir la list ds actions qui découlnt d la décision choisi. L sous-systèm 5 mémoris t rstitu ls cas étudiés n utilisant l raisonnmnt par cas(rpc). L'approch RpC comprnd l'nsmbl ds étaps nécssairs pour établir un raisonnmnt par analogi. Dux fonctions complémntairs intrvinnnt dans l cycl du RpC : l stockag ds cas à l'aid du modul d"indxation ds nouvaux cas" t l modul d "rchrch ds cas". La bas d cas contint ls cas ds évènmnts qui comportnt ds faits concrnant ls différnts étaps d la pris d décision. Durant l'étap d rchrch, l modul RpC calcul un scor d similarité structural ntr ls objts composits rprésntant ls cas précédmmnt stockés t l nouvau cas d indxation t/ou d rchrch d information actullmnt considéré. 3.2 L modèl d raisonnmnt à partir d cas (RpC) Il s agit ssntillmnt d un tchniqu qui s fond sur ds situations antériurs pour n traitr ds nouvlls. L raisonnmnt par cas (RpC) st un concpt puissant qui fournit un mod d raisonnmnt analogiqu pour résoudr ds problèms [1]. Ctt tchniqu d raisonnmnt consist à capitalisr ls xpérincs antériurs à un situation donné t ainsi d générr ds connaissancs liés à cs drnièrs. C st un approch qui prmt d'xprimr la connaissanc lié à l'xpérinc t au savoir-fair. Ctt connaissanc sra utilisé pour traitr ls nouvaux cas jugés similairs. L RpC st fondé sur la comparaison ds nouvaux cas avc ds cas indxés t précédmmnt stockés. Il s'agit nsuit d rchrchr cux qui sont similairs t d proposr d appliqur ls élémnts d décision t ls actions corrspondants n spérant qu "c qui sra fficac un fois l sra plusiurs fois" [7]. Ctt façon d intégrr l xpérinc pour l traitmnt d cas similairs st, slon l domain traité, d un apport important, citons l cas d la médcin t l cas d l indxation d txts t la formulation ds bsoins informationnls dans ds sits wb. L approch Rpc st fondamntalmnt constitué d dux moduls : «indxation ds nouvaux cas» t «Rchrch ds cas» 30

TEXTES DES COMMUNICATIONS - Tom I 3.2.1 Mémorisation t rstitution ds cas L modul «indxation ds nouvaux cas» prmt l stockag ds cas. La rchrch ds cas similairs quant à ll, st assuré par l modul «rchrch ds cas». La bas d cas contint ls cas ds évènmnts qui comportnt ds faits concrnant ls différnts étaps d la pris d décision, rprésntant ainsi l xpérinc capitalisé dans l domain traité. Dans l raisonnmnt par cas, durant l'étap d rchrch, l modul «rchrch ds cas» calcul un scor d similarité structural ntr ls objts composits rprésntant ls cas précédmmnt stockés t l nouvau cas actullmnt considéré. Un procssus d décomposition d l'objt composit cas produit ds sous-objts d typs suivants : la définition du problèm t but, la rprésntation d l'nvironnmnt, l protocol d raisonnmnt, la décision pris, ls actions nécssairs t l résultat réllmnt obtnu. Durant l'étap d'indxation, l nouvl objt cas st instancié t il comprnd ds composants concrnant ls étaps d la pris d décision. L'utilisatur doit fournir ds informations concrnant ls caractéristiqus du cas t ls circonstancs. Enfin, l nouvau cas st indxé t stocké dans la bas d cas. [4] L'indxation ds cas rpos sur l calcul d'un distanc. Différnts modèls d distanc puvnt êtr utilisés pour ordonnr ls cas : la logiqu flou t la théori d la pruv [9]. 4 Utilisation d ctt architctur pour l'aid n matièr d rchrch d information t d indxation d txts (ou indxation d sourcs informationnlls) L systèm d aid à la décision nous prmt d indxr au miux ls sourcs d information t ls rquêts d rchrch proposés par ls utilisaturs. Pour cla plusiurs étaps sont nécssairs : d l analys d la sourc à la qualification d la prtinnc ds réponss. Pour chaqu étap, ds sourcs d donnés t d connaissancs doivnt êtr sollicités. Crtains donnés provinnnt d l'intrfac avc l'utilisatur, d'autrs sont stockés dans ds bass d donnés, ds bass d connaissancs t ds bass d objts cas où sont capitalisés ls xpérincs antériurs. La figur 2 décrit ls élémnts d connaissanc nécssairs pour parvnir à la décision t au choix d sélctionnr ls informations jugés prtinnts pour rprésntr t rchrchr ds sourcs d informations. IRIT - DELTA VEILLE 31

VSST'2001 Analys Txtull Ds sourcs Analys d la Cibl Elémnts d connaissanc SDC Sourcs d donnés décisionnll t d connaissancs Contxt cadr S1 Donnés sur l txt Connaissancs liés au langag d indxation S2 Connaissancs académiqus du domain Donnés S1 Etuds sur ls pratiqus dans l dom Indxation précédnts Trac t tchniqus RpC d indxation précédnts Méthod d décision AEF Suprvisur : Automat d'états finis A n a l y s P h a s Proposition ds Indx Décision d classmnt/ prtinnc Suivi d prtinnc ds documnts, Txts sélctionnés Et ds qustions formulés Elémnts d connaissanc SDC Sourcs d donnés décisionnll t d connaissancs Evaluation sémantiqu du S1 Donnés sur l txt txt/documnt Connaissancs xprts sur l'évolution ds Indxations S2 Bas connaissancs linguistiqu /Rchrchs/Cibls Donnés statistiqus sur ls l indxation t la rchrch (bruit, silnc) S1 Etuds statistiqus sur ls tchniqus d indxation t d rquêts utilisés Expérinc d cas d txts RpC Cas d indxation t Elémnts d connaissanc SDC Sourcs d donnés décisionnll t d connaissancs Indxation précédnts d S1 txt d mêm classs, Donnés du txt Indications sémantiqus S2 ds contnus t caractérisation ds cibls Donnés t connaissancs linguistiqus Tsts d rquêts donnés statistiqus S1 Etuds t tsts d rchrch Expérinc d indxation RpC Cas d précédnts indxation - rchrch Méthods d décision d indxation t d rchrch AEF Suprvisur : Assistanc I n d x a t i o n P h a s Elémnts d connaissanc SDC Sourcs d donnés décisionnll t d connaissancs Indxation précédnts d S1 qustions d mêm class, Formulation ds qustions Indications sémantiqus ds S2 contnus ds qustions t Donnés t caractérisation ds cibls connaissancs linguistiqus Tsts d rquêts S1 Etuds t tsts d donnés statistiqus rchrch Expérinc d indxation RpC Cas d précédnts qustions indxations ds qustions Méthods d indxation t ds AEF Suprvisur : qustions Assistanc Figur 2 : Etaps t sourcs d un systèm d aid à l indxation t à la rchrch d information R c h r c h 32

TEXTES DES COMMUNICATIONS - Tom I 5 Conclusion L approch qu nous proposons nécssit qu différnts mécanisms d rchrch provnant d l'xpérinc humain soint préalablmnt modélisés puis stockés dans un bas d connaissancs. Ell soulign égalmnt la nécssité d s'appuyr sur ds méthods d rchrch traditionnlls tout n s'intérssant à la logiqu d'intrrogation d l'utilisatur t à la façon dont il formul sa dmand d'informations. Notr approch s voulant avant tout pragmatiqu, ll dvrait donnr liu à un réalisation pratiqu dans l cadr d'un projt Intrant où différnts outils dvraint êtr implémntés. En somm, l systèm d aid qu l on propos décrit ls élémnts d connaissanc nécssairs pour parvnir à la décision t au choix d sélctionnr ls informations jugés prtinnts pour rprésntr t rchrchr ds sourcs d informations. Il intègr différnts paradigms d décision. Nous pnsons qu la mis n œuvr d'un systèm d'aid à la décision, comm clui qu'on propos, put s fair par un approch d typ multi-agnts (SMA). Un systèm SMA [12] fondé sur un langag d communication comm KQML [5] t un protocol d négociation comm l "contract nt protocol" [6] nous paraît adéquat pour l dévloppmnt d notr systèm. C typ d systèm RpC qu l on intègr comm parti ntièr dans l procssus d aid à la l indxation t la rchrch d information nécssit qu ds cas provnant d l'xpérinc t d la pratiqu humains soint modélisés t stockés dans un bas initial. Un tll tâch st crts complx, mais c st ssntillmnt c qui rssort ds pratiqus d rchrch d information ffctués aujourd hui sur intrnt. Ls xpérincs nrgistrés par l systèm ds différnts cas d utilisation du systèm, tant lors d la phas d indxation t lors d la phas d rchrch d information, L contrôl d xploitation du systèm qui put êtr soit totalmnt assuré par l systèm lui mêm : c st l apprntissag non suprvisé où l systèm détrmin lui-mêm quls sous-nsmbls d caractéristiqus ou groups d caractéristiqus d ct nsmbl sont prtinnts pour rprésntr situation idntifié (la sourc d information t la formulation ds rquêts d l utilisatur) [11].), soit au contrair l intrvntion d xprts pour l indxation t d l utilisatur pour la formulation ds qustions pour la rchrch sont nécssairs à plusiurs nivaux d xécution : c st l apprntissag suprvisé, où pour chaqu cas, la solution jugé corrct st fourni au systèm par un ou plusiurs xprts t/ou utilisaturs. 6 Bibliographi [1.] AAMODT A., PLAZA E., Cas-basd rasoning : foundational issus, mthodological variations, and systm approachs, AI Communications, IOS Prss, Vol. 7 : 1, 1994, pp. 39-59 [2.] BOUZIDI L., SYBORD C., Systèm d aid à la décision : proposition d un architctur, Congrès Afct, Toulous, 1995 [3.] BOUZIDI L., COLLOC J., Utilisation du raisonnmnt par cas pour élaborr un systèm d'aid à la décision n médcin, INFORMATIK N 1, Zürich, 2001. [4.] COLLOC J., BOUZIDI L., A framwork for clinical dcision making and mdical xprinc storing, Procdings of ECIS'2000, Vinn (Autrich), 2000, pp. 1245-1252 [5.] FININ, WEBER, WIEDERHOLD,GENESERETH, FRITZON, MCKAY, MCGUIRE, PELAVIN, SHAPIRO, BECK, Spcification of th KQML Agnt Communication Languag, Tchnical Rport EIT 92-04, Entrpris Intgration Tchnologis, Palo Alto, USA, 1993 [6.] JENNINGS N.R., Spcification and Implmntation of a Blif-Dsir-Joint-Intntion Architctur for Collaborativ Solving, Int. Journal of Intllignt and Cooprativ Information Systms, 1993, Vol. 2, N 3.., pp 289-318. [7.] GUPTA HG, How Cas-basd Rasoning Solvs nw Problms, Intrfacs, Vol24, n 6, 1994 [8.] POMEROL J.C., BOY B., ROSENTHAL-SEHOUX C. and SAAD A., An intllignt DSS for th Multicritria Evaluation of Railway Timtabls, EuroConfrnc, Lisbonn Portugal, 1993. [9.] SCHUSTER A., DUBITZKY W., ADAMSON K., BELL D.A. and HUGHES J.G., Procssing Similarity btwn a Mix of Crisply and Fuzzily Dfind Cas Proprtis, in Applid Intllignc: Int. IRIT - DELTA VEILLE 33

VSST'2001 Journ of Artificial Intllignc, Nural Ntworks, and Complx Problm-Solving Tchnologis, Vol.7, pp1-18, Kluwr Acadmic Publishrs, US, 1997. [10.]SIMON H.A., Th nw Scinc of Managrial Dcision, d; Prntic-Hall, Nw-Jrsy, 1977. [11.]VAN BEMMEL J.H., MUSEN M.A., MILLER R.A. and VAN DER MASS A.A.F, Mthods for Dcision Support, chap 15. in Mdical Informatics, d. by J.H. Van Bmml and M.A. Musn, Springr Vrlag, 1997, pp. 233-260. [12.]WIEDERHOLD G., Mdiators in th Architctur of Futur Information Systms, IEEE Computr, 1992, N 3, pp.38-49. 34