Contribution à la définition de modèles de recherche d information flexibles basés sur les CP-Nets
|
|
- Marc Ange Guérin
- il y a 8 ans
- Total affichages :
Transcription
1 Contrbuton à la défnton de modèles de recherche d nformaton flexbles basés sur les CP-Nets Fatha Boubekeur To cte ths verson: Fatha Boubekeur. Contrbuton à la défnton de modèles de recherche d nformaton flexbles basés sur les CP-Nets. Computer Scence [cs]. Unversté Paul Sabater - Toulouse III, French. <tel > HAL Id: tel Submtted on 25 Jan 2009 HAL s a mult-dscplnary open access archve for the depost and dssemnaton of scentfc research documents, whether they are publshed or not. The documents may come from teachng and research nsttutons n France or abroad, or from publc or prvate research centers. L archve ouverte plurdscplnare HAL, est destnée au dépôt et à la dffuson de documents scentfques de nveau recherche, publés ou non, émanant des établssements d ensegnement et de recherche franças ou étrangers, des laboratores publcs ou prvés.
2 THÈSE En vue de l'obtenton du DOCTORAT DE L UNIVERSITÉ DE TOULOUSE Délvré par l'unversté Toulouse III - Paul Sabater Dscplne ou spécalté : Informatque Présentée et soutenue par Fatha BOUBEKEUR-AMIROUCHE Le 01/ 07/ 2008 Ttre : Contrbuton à la défnton de modèles de recherche d'nformaton flexbles basés sur les CP-Nets JURY Florence SEDES : Professeur à l'unversté Paul Sabater (Présdente) Erc GAUSSIER : Professeur à l Unversté Joseph Fourer Grenoble I, France (Rapporteur) Mohand-Saïd HACID : Professeur à l Unversté Claude Bernard Lyon 1, France (Rapporteur) Gabrella PASI : Professeur à l'unversté de Mlan Bcocca, Itale (Examnatrce) Mohand BOUGHANEM : Professeur à l'unversté Paul Sabater (Drecteur de recherche) Lynda TAMINE-LECHANI : Maître de Conférences à l'unversté Paul Sabater (Co-encadrante) Ecole doctorale : MITT Unté de recherche : CNRS, 5505 Drecteur(s) de Thèse : Mohand BOUGHANEM : Professeur à l'unversté Paul Sabater (Drecteur de recherche) Lynda TAMINE-LECHANI : Maître de Conférences à l'unversté Paul Sabater (Co-encadrante) Rapporteurs :
3
4 A mes enfants Amne et Nassm A Boualem
5
6 Remercements Je tens à remercer en tout premer leu M. Mohand Boughanem qu a drgé cette thèse d une man de maître. Tout au long de ces quatre années, l a su orenter mes recherches aux bons moments, toujours dans les bonnes drectons. Malgré l élognement, l a toujours été dsponble pour prodguer des consels et des orentatons ô comben pertnentes. Pour tout cela, pour m avor offert la chance d en être là aujourd hu, pour sa confance et pour sa préceuse ade technque je le remerce du fond du coeur. Mes plus vfs remercements vont également à Mme Lynda Tamne-Lechan qu a codrgé cette thèse avec toute la grandeur et la générosté qu sont les sennes. Tout au long de ces années de thèse, malgré l élognement, avec une régularté horlogque elle a toujours été là par ses consels, par son suv mnuteux de toutes mes propostons dans le cadre de cette thèse, par ses correctons, par ses orentatons et suggestons, par de rches et longues dscussons. Et même au-delà de cet aspect scentfque, dans les plus pénbles moments de doute et de lasstude, elle a toujours été l ame qu m a adée à me relever, qu m a encouragée à persévérer. Pour tout cela, pour son ade ô comben préceuse, pour sa générosté, pour son amté qu elle trouve c l expresson de ma plus profonde reconnassance et de ma sncère amté. Je remerce les rapporteurs de cette thèse M. Mohand-Saïd Hacd et M. Erc Gausser pour la lecture et la correcton de mon manuscrt et pour l ntérêt qu ls ont porté à mon traval. Je remerce également les autres membres du jury, Mme Florence Sedes et Mme Gabrella Pas qu ont accepté de juger ce traval. Je n oublera pas de remercer le premer Responsable de l équpe SIG, M. Claude Chrsment, qu sans même me connaître, a fat confance à ceux qu m ont fat confance, à mon Drecteur de thèse en l occurrence que je remerce encore une fos, et qu m a admse au sen de son équpe, et m a offert la chance de poursuvre des études doctorales. Je remerce également M. Mustapha Bazz pour sa coopératon scentfque, pour son ade préceuse et pour sa gentllesse. Mes remercements auss à Maram Daoud, doctorante au sen de l équpe SIG, pour son ade, sa dsponblté et pour sa gentllesse exemplare.
7 Je n oublera pas les ades reçues du personnel admnstratf et du servce nformatque de l IRIT, n les sourres accuellants et la convvalté des membres de l équpe SIG. J a sûrement oublé de remercer beaucoup d autres personnes mértantes, des personnes qu m ont offert leur amté, qu m ont ouvert leur cœur, qu m ont ouvert leur porte, qu elles trouvent c l expresson de ma profonde grattude et de mon amté la plus sncère. Je tens à remercer également mes collègues et ams de l unversté de Tz-Ouzou (Algére) en les personnes de M. Samr Redaou, M. Yassne Djouad et Mme Sama Fellag grâce à qu j a pu effectuer un ultme séjour à l IRIT durant lequel j a boosté ce traval de thèse. Merc également à mes ames Malka et Soraya pour leur ade et leur souten. Merc à vous d avor été là pour mo à un moment crucal de cette thèse. Mes remercements fnaux et non les mondres vont à mon mar qu a supporté mes humeurs au gré de cette thèse, qu m a adée sur les nombreux fronts de la ve quotdenne, qu m a encouragée jusqu au bout, qu m a remplacée auprès de mes enfants les fos où j a du m absenter, qu a été mon appu tout smplement. Merc auss à vous mes enfants pour avor comprs, malgré votre jeune âge, les mpératfs de cette thèse pour mo et pour m avor adée à y arrver.
8 Résumé Ce traval de thèse adresse deux prncpaux problèmes en recherche d nformaton : (1) la formalsaton automatque des préférences utlsateur, (ou la pondératon automatque de requêtes) et (2) l ndexaton sémantque. Dans notre premère contrbuton, nous proposons une approche de recherche d nformaton (RI) flexble fondée sur l utlsaton des CP-Nets (Condtonal Preferences Networks). Le formalsme CP-Net est utlsé d une part, pour la représentaton graphque de requêtes flexbles exprmant des préférences qualtatves et d autre part pour l évaluaton flexble de la pertnence des documents. Pour l utlsateur, l'expresson de préférences qualtatves est plus smple et plus ntutve que la formulaton de pods numérques les quantfant. Cependant, un système automatsé rasonnerat plus smplement sur des pods ordnaux. Nous proposons alors une approche de pondératon automatque des requêtes par quantfcaton des CP-Nets correspondants par des valeurs d utlté. Cette quantfcaton condut à un UCP-Net qu correspond à une requête booléenne pondérée. Une utlsaton des CP-Nets est également proposée pour la représentaton des documents dans la perspectve d une évaluaton flexble des requêtes ans pondéreés. Dans notre seconde contrbuton, nous proposons une approche d ndexaton conceptuelle basée sur les CP-Nets. Nous proposons d'utlser le formalsme CP-Net comme langage d ndexaton afn de représenter les concepts et les relatons condtonnelles entre eux d'une manère relatvement compacte. Les noeuds du CP-Net sont les concepts représentatfs du contenu du document et les relatons entre ces noeuds exprment les assocatons condtonnelles qu les lent. Notre contrbuton porte sur un double aspect : d une part, nous proposons une approche d extracton des concepts en utlsant WordNet. Les concepts résultants forment les noeuds du CP-Net. D autre part, nous proposons d étendre et d utlser la technque de règles d'assocaton afn de découvrr les relatons condtonnelles entre les concepts nœuds du CP-Nets. Nous proposons enfn un mécansme d évaluaton des requêtes basé sur l apparement de graphes (les CP-Nets document et requête en l occurrence). Mots clés : Recherche d nformaton flexble, pondératon des requêtes, ndexaton sémantque, WordNet, Règles d assocaton, CP-Nets.
9
10 Table des matères Introducton générale...17 Contexte Problématque Contrbuton Publcatons dans le cadre de la thèse Organsaton du mémore PARTIE 1 De la RI classque à la RI sémantque Chaptre 1 Recherche d'nformaton Introducton La RI classque L'ndexaton Taxonome des modèles de RI Reformulaton de requêtes Concluson La RI flexble Indexaton floue des documents Formulaton de requêtes flexbles Evaluaton flexble des requêtes Evaluaton d un SRI La campagne d évaluaton TREC Autres mesures d évaluaton d un SRI Concluson Chaptre 2 Indexaton sémantque en RI Introducton Problématque L ndexaton conceptuelle L ndexaton sémantque basée sur la désambguïsaton Les approches de désambguïsaton des sens des mots (WSD) Les approches d ndexaton sémantque Concluson PARTIE 2 Modèles de RI flexbles basés sur les CP-Nets Chaptre 3 Modèle de RI flexble basé sur les CP-Nets
11 3.1 Introducton Problématque et motvatons Les CP-Nets Notatons et défntons prélmnares Le modèle CP-Net Les UCP-Nets Modèle de RI basé CP-Nets Représentaton CP-Net des requêtes préférentelles Pondératon automatque de la requête Evaluaton de la requête CP-Net Concluson Chaptre 4 Approche de RI sémantque Introducton Motvatons Les outls d ade à l ndexaton sémantque WordNet Les règles d assocaton Approche d ndexaton sémantque Aperçu général Identfcaton de concepts représentatfs du document Découverte des relatons entre concepts Constructon de l ndex conceptuel du document Illustraton Evaluaton des requêtes basée CP-Nets Défnton formelle Illustraton Évaluaton expérmentale Collecton Muchmore Protocole d évaluaton Résultats expérmentaux Concluson Concluson générale Synthèse Perspectves Valdaton expérmentale : Améloratons futures REFERENCES BIBLIOGRAPHIQUES ANNEXES Annexe A Evaluaton des technques de désambguïsaton Annexe B Les CP_Nets
12 B.1 Introducton B.2 Descrpton avancée B.2.1 Un exemple llustratf B.2.2 La sémantque du CP-Net B.2.3 Rasonner avec les CP-Nets B.2.4 Utlsaton des graphes CP-Nets Annexe C Les règles d assocaton en RI C.1 Introducton C.2 Extracton de connassances dans les bases de données (ECBD) C.2.1 Généraltés C.2.2 Le Data Mnng (DM) C.3 Extracton de connassances dans les bases de données textuelles (ECT) C.3.1 Introducton C.3.2 La foulle de texte C.3.3 Découverte de règles d assocaton C.4 CONCLUSION
13
14 Table des fgures FIGURE 1.1 : Processus en U de la RI FIGURE 1.2 : Taxonome des modèles en RI FIGURE 1.3 : Dstrbuton des documents dans une collecton face à une requête FIGURE 2.1 : Un exemple de taxonome conceptuelle FIGURE 2.2 : Exemple de vosnage du mot house FIGURE 3.1: Un exemple de CP-Net FIGURE 3.2 : Graphe de préférences ndut FIGURE 3.3 : Un exemple de UCP-Net FIGURE 3.4 : Famlle étendue de X FIGURE 3.5 : Représentaton CP-Net d une requête booléenne FIGURE 3.6 : L UCP-Net requête FIGURE 3.7 : D 1 vu comme un UCP-Net FIGURE 4.1: Sous hérarche de WordNet correspondant au concept "dog" FIGURE 4.2 : Extracton des temsets fréquents FIGURE 4.3 : Les étapes de l ndexaton conceptuelle basée CP-Nets FIGURE 4.4 : Identfcaton du context relatf d un mot dans d FIGURE 4.5 : Identfcaton des termes FIGURE 4.6 : Le CP-Net document FIGURE B.1 : Le CP-Net FIGURE B.2 : Exemple de CP-Net FIGURE B.3 : Exemple de reconfguraton du contenu FIGURE C.1 : Trells des partes assocé à I
15
16 Lste des tableaux TABLEAU 1.1 : Dstrbuton de probabltés de pertnence des termes d un corpus d apprentssage TABLEAU 3.1 : Document retourné TABLEAU 3.2 : Sous-requêtes conjonctves TABLEAU 3.3 : Pertnences partelles et totale du document D TABLEAU 4.1 : Les concepts de WordNet correspondants au mot dog TABLEAU 4.2 : Le nombre de mots et de synsets dans WordNet TABLEAU 4.3 : pseudo-code de l algorthme Apror TABLEAU 4.4 : Base transactonnelle D, avec 4 des transactons T TABLEAU 4.5 : Règles d'assocaton à 1 tem en conséquent TABLEAU 4.6 : Règles d'assocaton à 1 tem en conséquent TABLEAU 4.7 : Règles d'assocaton à 2 tems en conséquent TABLEAU 4.8 : Génératon des k-temsets fréquents TABLEAU 4.9 : Règles d assocaton générées TABLEAU 4.10 : Confances des règles TABLEAU 4.11 : Règles d assocaton sélectonnées TABLEAU 4.12 : Supports des règles d assocaton sémantques TABLEAU 4.13 : Calcul de smlarté entre les CP-Nets document et requête TABLEAU 4.14 : Résultats d évaluaton de la méthode de détecton de concepts TABLEAU 4.15 : Résultats d évaluaton de la méthode de pondératon de concepts : mpact de la méthode d ndexaton par les concepts
17
18 Introducton générale Contexte Le but prncpal d un système de recherche d nformaton (SRI) est de retrouver les documents pertnents en réponse à une requête utlsateur. Ces documents sont typquement retrournés sous forme d une lste ordonnée, où l ordre est basé sur des estmatons de pertnence. Le modèle de recherche pour un SRI ndque comment les documents et requêtes sont représentés et comment ces représentatons sont comparées pour évaluer la pertnence. Les SRI classques représentent les documents et les requêtes par les mots qu'ls contennent, et basent souvent cette comparason sur le nombre de mots qu ls ont en commun, c est l apparement lexcal. Dans cette approche, des documents pertnents, ne partageant pas de mots avec la requête ne sont pas retrouvés. Tands que des documents non pertnents, contenant des mots de la requête sont retournés à l utlsateur. Ces problèmes sont dus au fat que l apparement lexcal ne tent pas compte des sens des mots du document et de la requête. L ndexaton sémantque tente de paller ces problèmes en offrant le moyen de dstnguer ces sens, et de les utlser lors du processus d apparement. Notre traval s nscrt prncpalement dans ce contexte. En partculer, nous proposons une approche de RI sémantque basée sur l ndexaton des documents et requêtes, par les sens des mots plutôt que par les mots euxmêmes. L approche offre en outre le moyen de prendre en compte les préférences utlsateur sur les crtères de recherche, et d évaluer la pertnence d un document pour une requête en tenant compte de ces préférences. Problématque Dans les SRI classques, l évaluaton de la pertnence d un document pour une requête est basée sur la mesure de correspondance du document pour la requête. Plus la requête et le document ont de mots en commun, plus le document est consdéré comme étant pertnent. Ces systèmes présentent des nsuffsances à dfférents nveaux : au nveau du langage de requête, de la représentaton des documents et requêtes et de l apparement. 17
19 INTRODUCTION GENERALE Au nveau du langage de requêtes : une requête tradut le beson en nformaton de l utlsateur mas auss ses préférences sur les nformatons recherchées. La pondératon des termes de la requête par des pods numérques [Buell et al., 81; Bordogna et al., 91; Pas, 99] a perms d exprmer les préférences utlsateur sur les crtères de recherche. Cependant, les pods numérques des requêtes forcent l'utlsateur à quantfer le concept qualtatf et vague d'mportance. Cette tâche n est pas smple, en partculer s la requête exprme des préférences condtonnelles. D une part, car l n exste pas une bonne méthode pour pondérer correctement les termes de la requête, d autre part, lorsque le nombre de valeurs sur lesquelles portent les préférences est élevé, l est quasment mpossble d'énumérer un pods valde pour tous les termes de la requête. Ces problèmes sont d autant plus accrus que la requête exprme des préférences condtonnelles. Même s ce type de préférences n est pas spécfquement prs en charge par les SRI, l est toujours possble de les tradure en expressons booléennes. Cependant, une pondératon aléatore ou ntutve de telles requêtes préférentelles, peut condure à des énoncés qu sont complètement contradctores avec la sémantque qu elles tentent d exprmer. De ce fat, pour paller les dffcultés de la pondératon numérques des requêtes, des travaux se sont orentés vers l'utlsaton de préférences qualtatves plus smples et plus ntutves, formulées à partr de termes lngustques tels que : mportant, très mportant [Bordogna et al., 93; Bordogna et al., 95]. Cependant, le problème de la défnton des pods numérques des termes est reporté sur la défnton de la sémantque du concept flou mportant et des modulateurs lngustques très, peu, moyennement Au nveau de la représentaton des documents et requêtes, et de l apparement correspondant : dans les SRI classques, documents et requêtes sont représentés comme des lstes de mots clés, généralement pondérés. L apparement document-requête est lexcal et se base sur la présence ou l absence d un mot de la requête dans le document. Or l est ben connu que les mots de la langue sont ambgus. Un même mot peut désgner dfférents concepts (et donc exprmer dfférents sens) et dfférents mots peuvent avor une même sgnfcaton. L apparement lexcal ne consdère pas ces aspects. De ce fat, des documents pourtant pertnents, contenant des mots sémantquement équvalents mas lexcalement dfférents (synonymes) des mots de la requête, ne seront pas retrouvés. Par alleurs, des documents non pertnents, contenant des mots lexcalement dentques mas sémantquement dfférents (homonymes) des termes de la requête seront retournés à l utlsateur. L'ndexaton sémantque (ou ndexaton par les sens des mots) tente de paller les problèmes de l'apparement lexcal en utlsant pour la recherche, des ndex conceptuels ou sémantques au leu de smples mots clés. De tels ndex portent sur la sémantque des mots. Ils sont construts à partr (1) des concepts explctes des textes eux-mêmes (ndexaton conceptuelle), (2) de la sémantque latente des textes des documents (ndexaton par sémantque latente LSI [Deerwester et al., 90]), ou (3) extrats de la sémantque explcte des mots telle que défne dans les dctonnares, thésaurus ou ontologes (ndexaton sémantque). L approche d ndexaton par la sémantque latente résout les sens des mots par un clusterng des mots 18
20 INTRODUCTION GENERALE sémantquement proches va une technque de réducton de la dmensonnalté de la matrce termes-documents. L ndexaton conceptuelle tente à partr d une taxonome conceptuelle extrate du texte, de construre sa sémantque. Les lens entre les dfférents concepts d une telle taxonome sont des lens fonctonnels entre enttés lexcales. L ndexaton sémantque tente de retrouver, parm les dfférents sens possbles d un mot tels que défns dans les dctonnares, ontologes et autres ressources lngustques, le sens correct du mot dans le texte à ndexer. Les mots d un texte donné défnssent mplctement une sémantque orentée sujet (topc), du texte correspondant. Le sujet prncpal du document est porté par les termes les plus mportants. Des sujets connexes secondares sont portés par des termes mons mportants, qu s agencent dans le document en foncton de la sémantque même du topc du texte. Cet agencement des mots (et surtout des sens) dans le texte des documents défnt une dmenson sémantque du document orentée topc. Or, les approches d ndexaton sémantque classques gnorent cette dmenson. Nous nous sommes ntéressés aux problèmes partculers posés par la pondératon des termes de la requête, la représentaton basée mots-clés des documents et requêtes et l apparement lexcal, et avons proposé des technques et méthodes pour tenter d y reméder. Notre contrbuton globale consste en la défnton de deux nouvelles approches de recherche d nformaton (RI) flexble basées sur les CP-Nets. Chacune des deux approches proposées focalse sur les tros aspects d un SRI : la représentaton des documents (ndexaton), le langage de requêtes et l évaluaton. Contrbuton Notre premère contrbuton consste en un nouveau modèle de RI flexble basé sur les CP- Nets. Dans ce modèle, nous avons : 1. ntrodut un nouveau langage de requêtes exprmant les préférences qualtatves de l utlsateur. La spécfcté de ce langage concerne la prse en charge ntutve des préférences condtonnelles. Pour cela, nous explotons les CP-Nets pour la représentaton de telles requêtes préférentelles condtonnelles. 2. proposé un algorthme pour la pondératon automatque de requêtes qualtatves. L algorthme se base sur le formalsme UCP- Net, extenson des CP-Nets par des valeurs numérques de préférences (dtes valeurs d utltés). L'utlsateur est ans déchargé de cette lourde et non mons mprobable tâche, et les pods produts sont certfés corrects pusque basés sur les fondements théorques des UCP-Nets. 19
21 INTRODUCTION GENERALE 3. défn une approche de représentaton des documents par des CP-Nets. L approche est basée sur la projecton des documents sur chaque requête soumse. Le document est alors représenté par un CP-Net de même topologe que celu de la requête, facltant ans l évaluaton de la pertnence 4. proposé une approche d évaluaton des requêtes basée sur le paradgme booléen. Nous explotons pour cela l nterprétaton des CP-Nets dans le formalsme booléen, pus l évaluaton de la requête booléenne obtenue, au moyen de l opérateur d agrégaton du mnmum pondéré [ Dubos et al., 86; Yager, 87]. Notre seconde contrbuton se rapporte à la RI sémantque. Cette approche est proposée comme améloraton de notre premère contrbuton, au nveau de la représentaton des documents et au nveau de l évaluaton. En partculer, le modèle de RI proposé s affrancht d une part des lmtes de la représentaton basées mots-clés en proposant une approche d ndexaton sémantque, d autre part des lmtes de l apparement lexcal et du paradgme booléen en proposant un apparement entre représentatons sémantques des documents et requêtes. En partculer: 1. notre approche d ndexaton sémantque a pour objectf d amélorer la représentaton des documents, en se basant sur les sens des mots dans les textes correspondants, et sur les lens entre ces sens dans le texte du document consdéré. Notre approche est fondée sur deux étapes prncpales : une premère étape d extracton des sens des termes d ndexaton et une seconde étape de découverte des relatons entre ces sens. La premère étape se base sur l utlsaton de l ontologe lngustque WordNet pour dentfer, pondérer et désambguïser les sens des termes d ndexaton. La seconde étape est fondée sur l utlsaton des règles d'assocaton pour dérver des relatons de dépendance contextuelle entre les concepts menant à une représentaton plus expressve des documents. Le prncpe même de l approche n'est pas nouveau mas nous avons proposé : une nouvelle technque pour dentfer les termes d ndexaton (smples ou composés) par projecton sur l ontologe WordNet, une nouvelle approche de pondératon des termes d ndexaton tenant compte de la sémantque des termes, une approche de désambguïsaton des sens des mots basée sur la noton de dstance sémantque et tenant compte de l mportance du mot dans le texte, une nouvelle technque pour découvrr des relatons entre les concepts correspondants au moyen des règles d'assocaton sémantques proposées. Les règles d'assocaton sémantques permettent de découvrr des relatons contextuelles entre les concepts amenant à une représentaton plus expressve du document. 20
22 INTRODUCTION GENERALE 2. Notre approche d évaluaton des requêtes a pour objectf d évaluer la pertnence des documents et des requêtes représentés par des graphes CP-Nets. La requête CP-Net dérve de notre approche proposée en premère contrbuton. Tands qu un CP-Net document est construt à partr de l ndex conceptuel du document, ssu de l étape d ndexaton sémantque présentée en (1), en organsant l ensemble formé des concepts représentatfs du document d une part et des assocatons correspondantes d autre part, en un graphe condtonnel, le CP- Net document. L approche d évaluaton proposée calcule alors la pertnence d un document pour une requête donnée sur la base d'une mesure proposée de smlarté des graphes CP-Nets correspondants. L ensemble des technques ans défnes consttue alors la base théorque de notre modèle de RI sémantque basée sur les CP-Nets. 3. La valdaton expérmentale de notre approche concerne prncpalement deux aspects : la valdaton de l approche de détecton de concepts la valdaton de l approche de pondératon la valdaton du modèle de RI basé sur les CP-Nets la valdaton de l approche d ndexaton sémantque dont : - valdaton de l approche de désambguïsaton - valdaton de l approche d extracton des règles d assocaton sémantques La valdaton expérmentale de notre modèle de RI proposé dans notre premère contrbuton, nécesste l utlsaton d un cadre d évaluaton supportant des requêtes CP-Nets. Un tel envronnement est à notre connassance nexstant. Sa constructon relève d un traval de recherche à part entère, qu ndépendamment du modèle proposé peut servr de base à la prse en compte des préférences condtonnelles dans le processus de RI. Nous avons par alleurs testé notre approche d ndexaton sémantque. Les résultats expérmentaux obtenus ont montré l ntérêt d une ndexaton sémantque par les concepts de WordNet. Nous n avons cependant pas expérmenté le modèle dans sa totalté. En partculer, la technque de découverte des règles d assocaton sémantques n a pas été expérmentée. Publcatons dans le cadre de la thèse 1. Dans le cadre de notre proposton d un modèle de RI flexble basé sur les CP-Nets 1. Fatha Boubekeur, Lynda Tamne. Recherche d Informaton flexble basée CP-Nets. Dans : Conférence francophone en Recherche d'informaton et Applcatons (CORIA 2006), Lyon, 15/03/06-17/03/06, 21
23 INTRODUCTION GENERALE Assocaton Francophone de Recherche d'informaton et Applcatons (ARIA), p , mars Fatha Boubekeur, Mohand Boughanem, Lynda Tamne. Towards Flexble Informaton Retreval Based on CP-Nets. Dans : Flexble Query Answerng (FQAS 2006), Mlan, Itale, 07/01/06-10/06/06, Henrk Legnd Larsen, Gabrella Pas, Danel Ortz-Arroyo (Eds.), World Scentfc Publshng, Advances n Artfcal Intellgence, p , jun Lynda Tamne, Fatha Boubekeur, Mohand Boughanem. On Usng Graphcal Models for Supportng Context-Aware Informaton Retreval. Dans : Internatonal Conference on the Theory of Informaton Retreval (ICTIR 2007), Budapest (Hungary), 18/10/07-20/10/07, Foundaton for Informaton Socety, p , octobre Dans le cadre de notre proposton de modèle de RI sémantque basé sur les CP-Nets Fatha Boubekeur, Mohand Boughanem, Lynda Tamne. Semantc Informaton Retreval Based on CP-Nets. Dans : IEEE Internatonal Conference on Fuzzy Systems (FUZZ-IEEE 2007), London, 23/07/07-26/07/07, IEEE, (support électronque), jullet Fatha Boubekeur, Mohand Boughanem, Lynda Tamne. Une approche d ndexton conceptuelle de documents basée sur les graphes CP_Nets. Dans: cnquème édton du colloque sur l optmsaton et les systèmes d nformaton COSI 08, 8-10 jun 08, Tz-Ouzou, Algére. 6. Fatha Boubekeur, Mohand Boughanem, Lynda Tamne. Explotng assocaton rules and ontology for semantc document ndexng. Dans: 12th Internatonal conference IPMU08, Informaton Processng and Management of Uncertanty n knowledge-based Systems, Malaga, 22-27, june 08, Span. Organsaton du mémore Ce mémore est organsé en deux partes prncpales. La premère parte, composée de deux chaptres, est dédée à la présentaton de la RI classque (chaptre 1) et de l ndexaton sémantque (chaptre 2). La seconde parte présente nos contrbutons. Elle est dvsée en deux 22
24 INTRODUCTION GENERALE chaptres 3 et 4, dédés respectvement à la présentaton de notre modèle de RI flexble et de notre modèle de RI sémantque basés sur les CP-Nets. Le détal de cette organsaton est donné comme sut : Dans le chaptre 1, nous présentons les dfférents aspects lés à la RI et aux SRI. Nous nous attacherons en partculer à défnr les modèles de recherche tant classques (booléen, vectorel et probablste) que des modèles plus flexbles (extensons floues du modèle booléen). L ndexaton automatque est auss explctée ans que les mécansmes de raffnement des requêtes. Enfn, nous rappellerons les mesures d évaluaton courantes d un SRI et présenterons les technques d évaluaton des SRI mses en œuvre dans le cadre des campagnes d évaluaton. Le chaptre 2 sera dédé à la présentaton des approches d ndexaton sémantque des documents. L objectf de telles approches est d ndexer les documents par les sens des mots ou par les concepts, plutôt que par les mots eux-mêmes. Le but est de paller les problèmes d apparement lexcal des SRI classques et pouvor ans trater avec l ambguïté naturelle de la langue. L approche d ndexaton basée sur les concepts (ndexaton conceptuelle) est présentée en secton 2.2. Les approches d ndexaton basées sur les sens des mots (ndexaton sémantque) sont présentées en secton 2.3. Ces dernères s appuent sur des technques lngustques de désambguïsaton des sens des mots. Nous dédons alors la secton à la présentaton des travaux en désambguïsaton lngustque avant de présenter l état de l art sur l ndexaton sémantque en secton En chaptre 3, nous présentons notre premère contrbuton à la défnton d un modèle de RI flexble basé sur les CP-Nets. Le chaptre s artcule autour de tros sectons. La secton 3.1 présente nos motvatons. En secton 3.2, nous présentons le formalsme CP-Net sur lequel se basent nos modèles. La secton 3.3 présente notre modèle de RI basé sur les CP-Nets. En partculer, nous y défnssons (1) notre approche de pondératon automatque de requêtes qualtatves, (2) la technque de représentaton CP-Net des documents et (3) notre méthode d évaluaton des requêtes CP-Nets. Le chaptre 4, présente notre seconde contrbuton à travers un nouveau modèle de RI sémantque basé sur les CP-Nets. Le chaptre s artcule autour de 4 sectons. En secton 4.2, nous présentons les motvatons qu ont été à l orgne de nos propostons. En secton 4.3, nous présentons les outls sur lesquels est basée notre approche d ndexaton sémantque, à savor WordNet et les règles d assocaton. Les fondements théorques de notre approche d ndexaton sémantque, un exemple llustratf ans que quelques résultats expérmentaux sont donnés en secton 4.4. La secton 4.5 présente notre approche d évaluaton des requêtes CP-Nets. Quelques résultats expérmentaux sont donnés en secton 4.6. Enfn, en concluson générale, nous présentons les perspectves de nos présentes propostons. 23
25
26 PARTIE 1 De la RI classque à la RI sémantque
27
28 Chaptre 1 Recherche d nformaton 1.1 Introducton La recherche d nformaton (RI) trate de la représentaton, du stockage, de l organsaton et de l accès à l nformaton. Le but d'un système SRI est de retrouver, parm une collecton de documents préalablement stockés, les documents qu répondent au beson utlsateur exprmé sous forme de requête. Pour cela, un SRI met en oeuvre un ensemble de processus de sélecton des documents pertnents pour la requête. Le but de ce chaptre est de présenter les concepts de base de la RI. Dans une premère parte, nous nous ntéressons aux approches de RI classque, pus nous présentons les approches de RI basées sur la logque floue. Ce chaptre est organsé comme sut : en secton 1.2, nous présentons les concepts de base de la RI classque. Nous y décrvons notamment le processus d ndexaton en paragraphe 1.2.1, pus la taxonome de modèles en paragraphe Les technques de reformulaton des requêtes sont présentées en paragraphe Le paragraphe présente les outls et méthodes d évaluaton d un SRI. En secton 1.3, nous présentons les approches de RI flexble. 1.2 La RI classque De manère générale, la recherche dans un SRI consste à comparer la représentaton nterne de la requête aux représentatons nternes des documents de la collecton. La requête est formulée, par l utlsateur, dans un langage de requêtes qu peut être le langage naturel, un langage à base de mots clés ou le langage booléen. Elle sera transformée en une représentaton nterne équvalente, lors d un processus d nterprétaton. Un processus smlare, dt ndexaton, permet de construre la représentaton nterne des documents de la base documentare. Le processus de recherche consste alors à mettre 27
29 CHAPITRE 1. RECHERCHE D INFORMATION en correspondance et à calculer le degré d apparement des représentatons nternes des documents et de la requête. Les documents qu correspondent au meux à la requête, ou documents dts pertnents, sont alors retournés à l utlsateur, dans une lste ordonnée par ordre décrossant de degré de pertnence lorsque le système le permet. Afn d amélorer les résultats de la recherche, le système peut être doté d un mécansme d améloraton et de raffnement de la requête par reformulaton. Le fonctonnement général d'un SRI est donnée au travers du processus de recherche communément appelé processus en U [Belkn et al., 92], présenté en fgure 1.1. Ce processus fat ressortr tros mécansmes de base : le processus d ndexaton (quelques fos dt processus d nterprétaton pour les requêtes), le processus de recherche et le processus de reformulaton des requêtes. Nous les détallons dans les paragraphes suvants. FIGURE 1.1 : Processus en U de la RI L'ndexaton L'ndexaton est une phase très mportante pour un SRI car de sa qualté dépend la qualté des réponses du système et donc les performances de ce derner. Une bonne ndexaton dot permettre de retrouver tous les documents pertnents au beson de l'utlsateur et pas (ou peu) de documents non pertnents pour celu-c. 28
30 CHAPITRE 1. RECHERCHE D INFORMATION En phase d'ndexaton, le document (ou la requête) est analysé(e) et les mots clés caractérsant son contenu nformatonnel, sont extrats. Un mot clé peut-être sot un mot smple ou un groupe de mots. Les mots-clés descrptfs du contenu sémantque d'un document sont dts termes d'ndexaton. L ensemble de tous les termes d'ndexaton consttue le langage d'ndexaton. Ce langage peut être lbre ou contrôlé. Un langage ndexaton lbre est construt à partr des termes extrats du document analysé. Un langage d ndexaton contrôlé est construt à partr d un ensemble de termes préalablement défns et organsés généralement dans un thésaurus. Lorsqu'un document est analysé, on ne garde que les mots clés qu appartennent à ce thésaurus Approches d ndexaton Technquement, l'ndexaton peut-être manuelle, automatque ou sem-automatque [Salton, 88; Salton et al., 88]. En ndexaton manuelle, c'est un opérateur human, généralement expert du domane, qu se charge de caractérser, selon ses connassances propres, le contenu sémantque d'un document. Cette approche présente deux nconvénents : 1. elle est subjectve, pusque le chox des termes d'ndexaton dépend de l'ndexeur et de ses connassances du domane, 2. elle est pratquement napplcable aux corpus de textes volumneux. Néanmons, tel que rapporté dans [Savoy, 05], elle est plus performante que l'ndexaton automatque en termes de précson moyenne des documents retrouvés en réponse à une requête utlsateur donnée. En ndexaton automatque [Luhn, 57; Maron, 60; Salton, 68], c'est un processus complètement automatsé qu se charge d'extrare les termes caractérstques du document. L'ntérêt d'une telle approche résde dans sa capacté à trater les textes nettement plus rapdement que l'approche précédente, et de ce fat, elle est partculèrement adaptée aux corpus volumneux. L'ndexaton automatque est l approche la plus étudée en RI, nous la détallons en secton suvante. L ndexaton sem-automatque [Manez et al., 91; Balpe et al., 95; Jacquemn et al., 02], appelée auss ndexaton supervsée, est une combnason des deux approches d ndexaton précédentes. Dans ce cas, les ndexeurs utlsent un vocabulare contrôlé sous forme de thésaurus ou de base termnologque. Le chox fnal des termes d ndexaton à partr du vocabulare fourn, est lassé ans à l ndexeur human (généralement spécalste du domane). 29
31 CHAPITRE 1. RECHERCHE D INFORMATION Dans la secton suvante, nous nous ntéressons partculèrement à l approche d ndexaton automatque, plus répandue, pusque c est celle qu nous ntéresse dans le cadre de notre traval L ndexaton automatque L'ndexaton automatque classque est fondée sur l'analyse des documents en vue de l'extracton des termes (mots-clés smples ou composés) représentatfs de leur contenu nformatonnel. Elle repose sur les étapes suvantes : l'extracton des termes d'ndexaton, la réducton du langage d ndexaton et la pondératon des termes d'ndexaton. 1. L'extracton des termes d ndexaton repose sur une analyse lngustque du texte du document. Pluseurs nveaux d analyse peuvent être dstngués : le nveau lexcal, syntaxque et sémantque. - En analyse lexcale, les mots composant le texte sont extrats et les mots vdes (prépostons, pronoms personnels, ) élmnés. Une étape supplémentare peut être nécessare en vue d'élmner les varantes morphologques (genre, nombre, dérvatons,...) des mots. Le tratement assocé repose sur deux procédures : la lemmatsaton et la troncature (ou racnsaton). La racnsaton consste à supprmer le suffxe (et plus rarement le préfxe) des mots sgnfcatfs du texte ndexé. La lemmatsaton (stemmng en anglas) a pour objectf de prendre la forme canonque du mot. Des expérences ont montré que la racnsaton et la lemmatsaton amélorent sgnfcatvement les performances pour les langues rches morphologquement (ex. le franças, l talen, etc.) [Gausser et al., 1997; Gausser et al., 2000]. - En analyse syntaxque, l s'agt de repérer les groupes de mots ou des mots composés [Fagan, 87; Salton, 88]. L'utlsaton des termes composés dot permettre d'augmenter la précson de réponse dans la mesure où le crtère possède une sgnfcaton plus précse et un usage plus restrent (plus spécfque) que les mots qu le composent. Les approches d analyse syntaxque se basent en général sur l'utlsaton de patrons (templates) syntaxques [Bourgault, 96; Aussenac-Glles et al., 00; Jacquemn, 01; Jones et al., 02] pour détecter les termes composés. - L'analyse sémantque s'ntéresse à reconnaître les sens des mots, les mots synonymes, les concepts représentatfs de ces mots, et plus généralement les relatons sémantques entre les mots. Le chaptre 2 sera dédé à cette dernère approche (.e. l ndexaton sémantque) pusque c'est celle qu nous ntéresse dans le cadre de notre traval de thèse. 30
32 CHAPITRE 1. RECHERCHE D INFORMATION La réducton du langage d ndexaton vse à rédure le nombre de termes d ndexaton en élmnant tous les mots non mportants (mots rares ou mots trop fréquents) du langage d ndexaton. Pour mesurer l'mportance d'un mot dans un document, l'ndexaton s appue sur la fréquence d'occurrence de ce mot dans le document. Les mots de fréquences quas nulles et les mots à fréquences trop élevées peuvent être élmnés de l'ndex. Cette hypothèse tre ses orgnes de la conjecture de Luhn [Luhn, 58] qu, pratquement, défnt un seul de fréquence mnmal S mn et un seul de fréquence maxmal S max tels que, tout terme d ndexaton t de fréquence ntermédare ( Smn freq( t) Smax ), est consdéré comme sgnfcatf et appartent donc au langage d ndexaton. La pondératon des termes d ndexaton consste à assocer un pods d mportance (ou valeur de représentatvté) w j à chaque terme t j d un document d. De manère générale, les formules de pondératon utlsées sont basées sur la combnason d un facteur de pondératon local quantfant la représentatvté locale du terme dans le document, et d un facteur de pondératon global quantfant la représentatvté globale du terme vs-à-vs de la collecton de documents. Pluseurs formules exstent, dont : tf j 1 w j = = tf j = tf j df df df j j j [Salton et al., 73] Où : tf j est la fréquence d occurrences du terme t j dans le document d. df j est la fréquence documentare du terme t j (.e. la proporton de documents de la collecton qu contennent t j ) et df j sa fréquence documentare nverse. La mesure tf* df est une bonne approxmaton de l'mportance d'un terme dans un document, partculèrement dans des corpus de documents de talles ntermédares. Pour des documents plus longs des normalsatons ont été proposées, dont : - La normalsaton pvotée de Snghal [Snghal et al., 96] Où : w j = 1+ ( 1 slope) tf j * df slope * * pvot j ( tf j * df j ) tf j est le nombre d occurrences du terme t j dans l unté documentare d df j est la fréquence documentare nverse défne classquement par : log(n/n j ) tel que n est le nombre de documents de la collecton et N j le nombre de documents ndexés par le terme t j. j 2 31
33 CHAPITRE 1. RECHERCHE D INFORMATION pvot est une constante qu représente l écart nul entre la probablté de pertnence et la probablté de sélecton des documents. slope est un facteur de normalsaton fxé emprquement, de sorte à mnmser l écart entre la pertnence et la sélecton. La formule de Robertson [Robertson et al., 97] w j = K 1 tf j * ( K + 1) dl l ( 1 b) + b * + tf j Où : w j est le pods du terme t j dans le document d. K 1 constante qu permet de contrôler l nfluence de la fréquence du terme t j dans le document d. Sa valeur dépend de la longueur des documents dans la collecton. Le plus souvent, sa valeur est fxée à 1,2. b constante qu permet de contrôler l effet de la longueur du document. Sa valeur la plus souvent utlsée est : 0,75. dl est la longueur du document d. l est la longueur moyenne des documents dans la collecton entère Taxonome des modèles de RI S c est l ndexaton qu permet de détermner les termes représentatfs des documents et requêtes, c est le modèle qu assure leur nterprétaton dans un formalsme de représentaton propre et qu offre le mécansme de leur apparement en vue de calculer les degrés de pertnence des documents pour les requêtes. La fgure 1.2 présente une classfcaton des dfférents modèles de RI [Baeza-Yates et al., 99]. Les modèles de RI se déclnent en tros grandes catégores qu sont les modèles booléens, les modèles vectorels et les modèles probablstes. Les modèles vectorels sont des modèles algébrques. Les documents et requêtes sont représentés par des vecteurs de pods dans un espace vectorel composé de tous les termes d ndexaton. La pertnence d'un document vs à vs d'une requête est défne par des mesures de dstances entre vecteurs. Pluseurs modèles proposés en RI se basent sur le modèle vectorel, dont : le modèle connexonnste et le modèle LSI (Latent Semantc Indexng). Les modèles probablstes s'appuent sur la théore des probabltés. La pertnence d'un document vs à vs d'une requête est vue comme une probablté de pertnence document/requête. Les modèles de RI basés sur le modèle probablste sont le modèle BIR (Bnary Independance retreval), le modèle nférentel Bayésen et le 1 32
34 CHAPITRE 1. RECHERCHE D INFORMATION modèle de langue. Dans ce qu sut, nous décrvons pour chacune de ces classes, le modèle de base et quelques modèles assocés. FIGURE 1.2 : Taxonome des modèles en RI Les modèles booléens Le modèle booléen de base Dans ce modèle, basé sur la théore des ensembles, le document est représenté par un ensemble de termes. La requête est représentée par un ensemble de mots clés relés par des opérateurs booléens (AND, OR et NOT). L apparement requête-document est strct et se base sur des opératons ensemblstes selon les règles suvantes : RSV RSV RSV RSV ( d, t ) = 1 s t d, snon ( d, t AND t j ) = 1 s ( t d ) ( t j d ), ( d, t OR t ) = 1 s ( t d ) ( t d ), ( d, NOT t ) = 1 s t d, 0 snon. j 0 j 0 snon 0 snon Ben que ce modèle sot smple à mettre en oeuvre, l présente néanmons tros nconvénents majeurs : l'apparement est strct et ne permet de classer les documents que dans deux catégores, l ensemble des documents pertnents et l ensemble des documents non pertnents, dont les éléments ne sont pas ordonnables, tous les termes d un document ou d'une requête sont d égales mportances (pondérés à 0 ou 1), ce qu n est pas le cas en réalté, 33
35 CHAPITRE 1. RECHERCHE D INFORMATION les expressons booléennes ne sont pas accessbles à un large publc et des confusons exstent du fat de la dfférence de «sens» des opérateurs logques AND et OR et de leurs connotatons respectves en langage naturel. Le modèle booléen étendu et modèle basé sur les ensembles flous dérvent du modèle booléen Modèle booléen étendu Le modèle booléen étendu a été ntrodut par Salton [Salton et al., 1983]. C est une extenson du modèle précédent qu vse à tenr compte d une pondératon des termes dans le corpus. Cela permet de paller les problèmes du modèle de base en ordonnant les documents retrouvés par le SRI. La requête demeure une expresson booléenne classque. Tands que les termes d un document sont mantenant pondérés. En général le pods d un terme dans un document est foncton du nombre d occurrences de ce terme dans le document. L apparement requête_document est le plus souvent détermné par les relatons ntrodutes dans le modèle p-norm basées sur les les p-dstances, avec 1 p. La valeur de p est ndquée au moment de la requête. S m est le nombre de termes dans la requête, les fonctons de smlarté se calculent comme sut : RSV RSV ( d, Q ) ou ( d, Q ) et p p x1 + x2 + K+ x = m = 1 S p = 1, on se ramène au modèle booléen Les modèles vectorels Le modèle vectorel de base p m 1 p p p p p ( 1 x ) + ( 1 x ) + K+ ( 1 x ) 1 Dans ce modèle, un document est représenté sous forme d un vecteur dans l espace vectorel composé de tous les termes d ndexaton. Les coordonnées d un vecteur document représentent les pods des termes correspondants. Formellement, un document d est représenté par un vecteur de dmenson n, d = (w 1, w 2,..., w n ) pour = 1, 2,, m. Où w j est le pods du terme t j dans le document d, m est le nombre de documents dans la collecton, n est le nombre de termes d ndexaton. 2 m m 1 34
36 CHAPITRE 1. RECHERCHE D INFORMATION Une requête Q est auss représentée par un vecteur de mots-clés défn dans le même espace vectorel que le document. Q = (w Q1, w Q2,..., w Qn ) Où w Qj est le pods de terme t j dans la requête Q. Ce pods peut être sot une forme de tf*df, sot un pods attrbué manuellement par l utlsateur. La pertnence du document d pour la requête Q est mesurée comme le degré de corrélaton des vecteurs correspondants. Cette corrélaton peut être exprmée par l une des mesures suvantes : Le produt scalare : n Sm d, Q = w * w ( ) Sm d, Q La mesure du cosnus: ( ) 1/ 2 1/ 2 La mesure de Dce : Sm( d, Q) La mesure de Jacard : Sm( d, Q) j= 1 = n j= 1 Qj w n 2 Qj n j= 1 2 * w j w Qj j j= 1 = n 2 wqj n j= 1 j= 1 = n * w * * w Qj + w n j= 1 n w 2 j n j j= 1 w Qj 2 j 2 2 wqj + wj j= 1 j= 1 j= 1 j * w n w j * w Qj Le coeffcent de superposton : Sm( d, Q) = mn n j= 1 n n 2 wqj, j= 1 j= 1 w j * w Qj w 2 j L un des avantages du modèle vectorel résde dans sa smplcté conceptuelle et de mse en oeuvre. En outre, l permet de trer les résultats d une recherche à travers une mesure de smlarté document/requête, en plaçant en tête les documents jugés les plus smlares à la requête. Cependant, ce modèle ne permet pas de modélser les assocatons entre les termes 35
37 CHAPITRE 1. RECHERCHE D INFORMATION d ndexaton. Chacun des termes est consdéré comme ndépendant des autres. Le modèle vectorel généralsé (Generalzed Vector Space Model) [Wong et al, 1985] permet cependant de résoudre le problème d ndépendance des termes Le modèle connexonnste Les SRI basés sur l'approche connexonnste utlsent le fondement des réseaux de neurones, tant pour la modélsaton des untés textuelles que pour la mse en œuvre du processus de RI. L dée de base est que la RI est un processus assocatf qu peut être représenté par les mécansmes de propagaton d actvaton des réseaux de neurones. De plus, les capactés d apprentssage de ces modèles peuvent permettre d obtenr des SRI adaptatfs. Deux modèles théorques ont été utlsés : les modèles à auto-organsaton et les modèles à couches. Les modèles à auto-organsaton [Ln et al., 91] permettent à partr de la descrpton des documents, d en réalser une classfcaton par l apprentssage du réseau de neurones. Ces modèles sont basés sur les cartes auto-organsatrces de Kohonen [Kohonen, 89]. Les modèles à couches : Les SRI basés sur un modèle connexonnste à couches [Kwok, 89; Belew, 89; Boughanem, 92a-b; Mothe, 94] sont représentés par un mnmum de tros couches de neurones nterconnectées : la couche requête (Q), la couche termes (T) et la couche documents (D). Le mécansme de recherche est basé sur une actvaton ntale des neurones termes ndute par une requête, et qu se propage vers les documents à travers les connexons du réseau. Dans le modèle MERCURE [Boughanem, 92], une requête Q est représentée par un vecteur de pods sous forme : Q = ( t) u ( t) ( t) ( t) ( q, q,..., q ) u1 Les pods des termes dans la requête sont affectés aux lens requête-termes. L'actvté ntale du réseau correspond à l'actvaton d'un nœud requête en envoyant un sgnal de valeur 1 à travers les lens requête-termes. Chaque neurone terme t j affecté par la requête, reçot une entrée In(t j ) et fournt une sorte Out(t j ) respectvement défnes par : u2 ( t) ( t ) = q Out( t ) g( In( t ) In = j uj Un document d qu a des termes t j en commun avec la requête recevra une entrée In(d) et calculera sa sorte Out(d) telles que : j ut j 36
38 CHAPITRE 1. RECHERCHE D INFORMATION T ( d ) Out( t )* w Out( d ) g In( d ) In = j j = =1 Où w j est le pods du terme t j dans le document d. ( ) Les valeurs de sorte des dfférents documents correspondent à leurs degrés de pertnence pour la requête donnée Modèle d ndexaton sémantque latente (LSI) L objectf du modèle LSI est de construre des ndex conceptuels portant sur la sémantque des mots dans les documents. Ces ndex sont trés à partr de la structure sémantque latente des textes des documents. Pour ce fare, partant de l espace vectorel de tous les termes d ndexaton, le modèle LSI construt un espace d ndexaton de talle rédute k, par applcaton de la décomposton en valeurs sngulères (SVD) de la matrce termes-documents [Deerwester et al., 90]. Ces k dmensons capturent une parte mportante de la structure sémantque des documents [Berry et al., 94 ] portée par les assocatons des termes et documents, et élmnent le brut dû à la varablté dans l'usage des mots. Chaque vecteur document est au fnal représenté dans l'espace k-dmensonnel rédut des termes non brutés. Les documents qu partagent des termes co-occurrents ont des représentatons proches. La requête utlsateur est auss représentée par un vecteur dans l'espace k-dmensonnel. Une mesure de smlarté est ensute calculée entre le k-vecteur requête et chacun des k-vecteurs documents de la collecton. A l ssue de la recherche, le système sélectonne les documents pertnents même s ls ne contennent aucun mot de la requête Les modèles probablstes Le modèle probablste de base Le premer modèle probablste a été proposé par Maron et Kuhns [Maron et al., 60] au début des années 60. Le prncpe de base consste à présenter les résultats d un SRI dans un ordre basé sur la probablté de pertnence d un document vs-à-vs d une requête. Robertson [Robertson, 77] défnt son modèle PRP (Probablty Rankng Prncple), sur ce même prncpe. Etant donné une requête utlsateur notée Q et un document d, le modèle probablste tente d estmer la probablté que le document d appartenne à la classe des documents pertnents (non pertnents). Un document est alors sélectonné s la probablté qu l sot pertnent à Q, notée P(R/d), est supéreure à la probablté qu l sot non pertnent à Q, notée P(NR/d). Le score d apparement entre le document d et la requête Q, noté RSV (d,q), est donné par [Robertson, 94b]: 37
En vue de l'obtention du. Présentée et soutenue par Elayeb Bilel Le 26 juin 2009
THÈSE En vue de l'obtenton du DOCTORAT DE L UNIVERSITÉ DE TOULOUSE Délvré par Insttut Natonal Polytechnque de Toulouse (INPT) Dscplne ou spécalté : Informatque Présentée et soutenue par Elayeb Blel Le
Plus en détailLes jeunes économistes
Chaptre1 : les ntérêts smples 1. défnton et calcul pratque : Défnton : Dans le cas de l ntérêt smple, le captal reste nvarable pendant toute la durée du prêt. L emprunteur dot verser, à la fn de chaque
Plus en détailEditions ENI. Project 2010. Collection Référence Bureautique. Extrait
Edtons ENI Project 2010 Collecton Référence Bureautque Extrat Défnton des tâches Défnton des tâches Project 2010 Sasr les tâches d'un projet Les tâches représentent le traval à accomplr pour attendre l'objectf
Plus en détailMÉTHODES DE SONDAGES UTILISÉES DANS LES PROGRAMMES D ÉVALUATIONS DES ÉLÈVES
MÉTHODES DE SONDAGES UTILISÉES DANS LES PROGRAMMES D ÉVALUATIONS DES ÉLÈVES Émle Garca, Maron Le Cam et Therry Rocher MENESR-DEPP, bureau de l évaluaton des élèves Cet artcle porte sur les méthodes de
Plus en détailFiche n 7 : Vérification du débit et de la vitesse par la méthode de traçage
Fche n 7 : Vérfcaton du débt et de la vtesse par la méthode de traçage 1. PRINCIPE La méthode de traçage permet de calculer le débt d un écoulement ndépendamment des mesurages de hauteur et de vtesse.
Plus en détailChapitre 3 : Incertitudes CHAPITRE 3 INCERTITUDES. Lignes directrices 2006 du GIEC pour les inventaires nationaux de gaz à effet de serre 3.
Chaptre 3 : Incerttudes CHAPITRE 3 INCERTITUDES Lgnes drectrces 2006 du GIEC pour les nventares natonaux de gaz à effet de serre 3.1 Volume 1 : Orentatons générales et établssement des rapports Auteurs
Plus en détailRemboursement d un emprunt par annuités constantes
Sére STG Journées de formaton Janver 2006 Remboursement d un emprunt par annutés constantes Le prncpe Utlsaton du tableur Un emprunteur s adresse à un prêteur pour obtenr une somme d argent (la dette)
Plus en détailMesure avec une règle
Mesure avec une règle par Matheu ROUAUD Professeur de Scences Physques en prépa, Dplômé en Physque Théorque. Lycée Alan-Fourner 8000 Bourges ecrre@ncerttudes.fr RÉSUMÉ La mesure d'une grandeur par un système
Plus en détailPlan. Gestion des stocks. Les opérations de gestions des stocks. Les opérations de gestions des stocks
Plan Geston des stocks Abdellah El Fallah Ensa de Tétouan 2011 Les opératons de gestons des stocks Les coûts assocés à la geston des stocks Le rôle des stocks Modèle de la quantté économque Geston calendare
Plus en détailMETHODE AUTOMATIQUE POUR CORRIGER LA VARIATION LINGUISTIQUE LORS DE L INTERROGATION DE DOCUMENTS XML DE STRUCTURES HETEROGENES
METHODE AUTOMATIQUE POUR CORRIGER LA VARIATION LINGUISTIQUE LORS DE L INTERROGATION DE DOCUMENTS XML DE STRUCTURES HETEROGENES Ourda Boudghaghen(*),Mohand Boughanem(**) yugo_doudou@yahoo.fr, bougha@rt.fr
Plus en détailStéganographie Adaptative par Oracle (ASO)
Stéganographe Adaptatve par Oracle ASO Sarra Kouder, Marc Chaumont, Wllam Puech To cte ths verson: Sarra Kouder, Marc Chaumont, Wllam Puech. Stéganographe Adaptatve par Oracle ASO. CORESA 12: COmpresson
Plus en détailI. Présentation générale des méthodes d estimation des projets de type «unité industrielle»
Evaluaton des projets et estmaton des coûts Le budget d un projet est un élément mportant dans l étude d un projet pusque les résultats économques auront un mpact sur la réalsaton ou non et sur la concepton
Plus en détailContrats prévoyance des TNS : Clarifier les règles pour sécuriser les prestations
Contrats prévoyance des TNS : Clarfer les règles pour sécurser les prestatons Résumé de notre proposton : A - Amélorer l nformaton des souscrpteurs B Prévor plus de souplesse dans l apprécaton des revenus
Plus en détailÉLÉMENTS DE THÉORIE DE L INFORMATION POUR LES COMMUNICATIONS.
ÉLÉMETS DE THÉORIE DE L IFORMATIO POUR LES COMMUICATIOS. L a théore de l nformaton est une dscplne qu s appue non seulement sur les (télé-) communcatons, mas auss sur l nformatque, la statstque, la physque
Plus en détailAssurance maladie et aléa de moralité ex-ante : L incidence de l hétérogénéité de la perte sanitaire
Assurance malade et aléa de moralté ex-ante : L ncdence de l hétérogénété de la perte santare Davd Alary 1 et Franck Ben 2 Cet artcle examne l ncdence de l hétérogénété de la perte santare sur les contrats
Plus en détailCOMPARAISON DE MÉTHODES POUR LA CORRECTION
COMPARAISON DE MÉTHODES POUR LA CORRECTION DE LA NON-RÉPONSE TOTALE : MÉTHODE DES SCORES ET SEGMENTATION Émle Dequdt, Benoît Busson 2 & Ncolas Sgler 3 Insee, Drecton régonale des Pays de la Lore, Servce
Plus en détailEn vue de l'obtention du. Présentée et soutenue par Meva DODO Le 06 novembre 2008
THÈSE En vue de l'obtenton du DOCTORAT DE L UNIVERSITÉ DE TOULOUSE Délvré par l'unversté Toulouse III - Paul Sabater Spécalté : Informatque Présentée et soutenue par Meva DODO Le 06 novembre 2008 Ttre
Plus en détailEH SmartView. Identifiez vos risques et vos opportunités. www.eulerhermes.be. Pilotez votre assurance-crédit. Services en ligne Euler Hermes
EH SmartVew Servces en lgne Euler Hermes Identfez vos rsques et vos opportuntés Plotez votre assurance-crédt www.eulerhermes.be Les avantages d EH SmartVew L expertse Euler Hermes présentée de manère clare
Plus en détailhal-00409942, version 1-14 Aug 2009
Manuscrt auteur, publé dans "MOSIM' 008, Pars : France (008)" 7 e Conférence Francophone de MOdélsaton et SIMulaton - MOSIM 08 - du mars au avrl 008 - Pars - France «Modélsaton, Optmsaton et Smulaton des
Plus en détailINTERNET. Initiation à
Intaton à INTERNET Surfez sur Internet Envoyez des messages Téléchargez Dscutez avec Skype Découvrez Facebook Regardez des vdéos Protégez votre ordnateur Myram GRIS Table des matères Internet Introducton
Plus en détailMontage émetteur commun
tour au menu ontage émetteur commun Polarsaton d un transstor. ôle de la polarsaton La polarsaton a pour rôle de placer le pont de fonctonnement du transstor dans une zone où ses caractérstques sont lnéares.
Plus en détailL enseignement virtuel dans une économie émergente : perception des étudiants et perspectives d avenir
L ensegnement vrtuel dans une économe émergente : percepton des étudants et perspectves d avenr Hatem Dellag Laboratore d Econome et de Fnances applquées Faculté des scences économques et de geston de
Plus en détailContact SCD Nancy 1 : theses.sciences@scd.uhp-nancy.fr
AVERTISSEMENT Ce document est le frut d'un long traval approuvé par le jury de soutenance et ms à dsposton de l'ensemble de la communauté unverstare élarge. Il est soums à la proprété ntellectuelle de
Plus en détailDES EFFETS PERVERS DU MORCELLEMENT DES STOCKS
DES EFFETS PERVERS DU MORCELLEMENT DES STOCKS Le cabnet Enetek nous démontre les mpacts négatfs de la multplcaton des stocks qu au leu d amélorer le taux de servce en se rapprochant du clent, le dégradent
Plus en détailPrise en compte des politiques de transport dans le choix des fournisseurs
INSTITUT NATIONAL POLYTECHNIQUE DE GRENOBLE N attrbué par la bblothèque THÈSE Pour obtenr le grade de DOCTEUR DE L I.N.P.G. Spécalté : Géne Industrel Préparée au Laboratore d Automatque de Grenoble Dans
Plus en détailChapitre IV : Inductance propre, inductance mutuelle. Energie électromagnétique
Spécale PSI - Cours "Electromagnétsme" 1 Inducton électromagnétque Chaptre IV : Inductance propre, nductance mutuelle. Energe électromagnétque Objectfs: Coecents d nductance propre L et mutuelle M Blan
Plus en détailInterface OneNote 2013
Interface OneNote 2013 Interface OneNote 2013 Offce 2013 - Fonctons avancées Lancer OneNote 2013 À partr de l'nterface Wndows 8, utlsez une des méthodes suvantes : - Clquez sur la vgnette OneNote 2013
Plus en détailTerminal numérique TM 13 raccordé aux installations Integral 33
Termnal numérque TM 13 raccordé aux nstallatons Integral 33 Notce d utlsaton Vous garderez une longueur d avance. Famlarsez--vous avec votre téléphone Remarques mportantes Chaptres à lre en prorté -- Vue
Plus en détailDirigeant de SAS : Laisser le choix du statut social
Drgeant de SAS : Lasser le chox du statut socal Résumé de notre proposton : Ouvrr le chox du statut socal du drgeant de SAS avec 2 solutons possbles : apprécer la stuaton socale des drgeants de SAS comme
Plus en détailIntegral T 3 Compact. raccordé aux installations Integral 5. Notice d utilisation
Integral T 3 Compact raccordé aux nstallatons Integral 5 Notce d utlsaton Remarques mportantes Remarques mportantes A quelle nstallaton pouvez-vous connecter votre téléphone Ce téléphone est conçu unquement
Plus en détailCREATION DE VALEUR EN ASSURANCE NON VIE : COMMENT FRANCHIR UNE NOUVELLE ETAPE?
CREATION DE VALEUR EN ASSURANCE NON VIE : COMMENT FRANCHIR UNE NOUVELLE ETAPE? Boulanger Frédérc Avanssur, Groupe AXA 163-167, Avenue Georges Clémenceau 92742 Nanterre Cedex France Tel: +33 1 46 14 43
Plus en détailSystème solaire combiné Estimation des besoins énergétiques
Revue des Energes Renouvelables ICRESD-07 Tlemcen (007) 109 114 Système solare combné Estmaton des besons énergétques R. Kharch 1, B. Benyoucef et M. Belhamel 1 1 Centre de Développement des Energes Renouvelables
Plus en détailLes déterminants de la détention et de l usage de la carte de débit : une analyse empirique sur données individuelles françaises
Les détermnants de la détenton et de l usage de la carte de débt : une analyse emprque sur données ndvduelles françases Davd Boune a, Marc Bourreau a,b et Abel Franços a,c a Télécom ParsTech, Département
Plus en détailGrandeur physique, chiffres significatifs
Grandeur physque, chffres sgnfcatfs I) Donner le résultat d une mesure en correspondance avec l nstrument utlsé : S avec un nstrument, ren n est ndqué sur l ncerttude absolue X d une mesure X, on consdère
Plus en détailBTS GPN 2EME ANNEE-MATHEMATIQUES-MATHS FINANCIERES MATHEMATIQUES FINANCIERES
MATHEMATIQUES FINANCIERES I. Concepts généraux. Le référentel précse : Cette parte du module M4 «Acquérr des outls mathématques de base nécessares à l'analyse de données économques» est en relaton avec
Plus en détailVIELLE Marc. CEA-IDEI Janvier 1998. 1 La nomenclature retenue 3. 2 Vue d ensemble du modèle 4
GEMINI-E3 XL France Un outl destné à l étude des mpacts ndustrels de poltques énergétques et envronnementales VIELLE Marc CEA-IDEI Janver 1998 I LA STRUCTURE DU MODELE GEMINI-E3 XL FRANCE 3 1 La nomenclature
Plus en détailLes déterminants de la détention et de l usage de la carte de débit : une analyse empirique sur données individuelles françaises
Les détermnants de la détenton et de l usage de la carte de débt : une analyse emprque sur données ndvduelles françases Davd Boune Marc Bourreau Abel Franços Jun 2006 Département Scences Economques et
Plus en détailGénéralités sur les fonctions 1ES
Généraltés sur les fonctons ES GENERALITES SUR LES FNCTINS I. RAPPELS a. Vocabulare Défnton Une foncton est un procédé qu permet d assocer à un nombre x appartenant à un ensemble D un nombre y n note :
Plus en détailLes prix quotidiens de clôture des échanges de quotas EUA et de crédits CER sont fournis par ICE Futures Europe
Méthodologe CDC Clmat Recherche puble chaque mos, en collaboraton avec Clmpact Metnext, Tendances Carbone, le bulletn mensuel d nformaton sur le marché européen du carbone (EU ETS). L obectf de cette publcaton
Plus en détailRéseau RRFR pour la surveillance dynamique : application en e-maintenance.
Réseau RRFR pour la survellance dynamue : applcaton en e-mantenance. RYAD ZEMOURI, DANIEL RACOCEANU, NOUREDDINE ZERHOUNI Laboratore Unverstare de Recherche en Producton Automatsée (LURPA) 6, avenue du
Plus en détailGENESIS - Generalized System for Imputation Simulations (Système généralisé pour simuler l imputation)
GENESS - Generalzed System for mputaton Smulatons (Système généralsé pour smuler l mputaton) GENESS est un système qu permet d exécuter des smulatons en présence d mputaton. L utlsateur fournt un ensemble
Plus en détailPourquoi LICIEL? Avec LICIEL passez à la vitesse supérieure EPROUVE TECHNICITE CONNECTE STABILITE SUIVIE COMMUNAUTE
L og c el s de D agnos t c s I mmob l er s Cont ac t eznous 32BddeS t r as bougcs3010875468 Par scedex10tel. 0253354064Fax0278084116 ma l : s er v c e. c l ent @l c el. f r Pourquo LICIEL? Implanté sur
Plus en détailSTATISTIQUE AVEC EXCEL
STATISTIQUE AVEC EXCEL Excel offre d nnombrables possbltés de recuellr des données statstques, de les classer, de les analyser et de les représenter graphquement. Ce sont prncpalement les tros éléments
Plus en détailExercices d Électrocinétique
ercces d Électrocnétque Intensté et densté de courant -1.1 Vtesse des porteurs de charges : On dssout une masse m = 20g de chlorure de sodum NaCl dans un bac électrolytque de longueur l = 20cm et de secton
Plus en détailLa Quantification du Risque Opérationnel des Institutions Bancaires
HEC Montréal Afflée à l Unversté de Montréal La Quantfcaton du Rsque Opératonnel des Insttutons Bancares par Hela Dahen Département Fnance Thèse présentée à la Faculté des études supéreures en vue d obtenton
Plus en détailProfessionnel de santé équipé de Médiclick!
Professonnel de santé équpé de Médclck! Dosser Médcal Partagé en Aqutane Ce gude vous présente les prncpales fonctonnaltés réservées aux professonnels de santé membres du réseau AquDMP. Sommare Connexon
Plus en détail1 Introduction. 2 Définitions des sources de tension et de courant : Cours. Date : A2 Analyser le système Conversion statique de l énergie. 2 h.
A2 Analyser le système Converson statque de l énerge Date : Nom : Cours 2 h 1 Introducton Un ConVertsseur Statque d énerge (CVS) est un montage utlsant des nterrupteurs à semconducteurs permettant par
Plus en détailCalcul de tableaux d amortissement
Calcul de tableaux d amortssement 1 Tableau d amortssement Un emprunt est caractérsé par : une somme empruntée notée ; un taux annuel, en %, noté ; une pérodcté qu correspond à la fréquence de remboursement,
Plus en détailCorrections adiabatiques et nonadiabatiques dans les systèmes diatomiques par calculs ab-initio
Correctons adabatques et nonadabatques dans les systèmes datomques par calculs ab-nto Compte rendu du traval réalsé dans le cadre d un stage de quatre mos au sen du Groupe de Spectroscope Moléculare et
Plus en détailTD 1. Statistiques à une variable.
Danel Abécasss. Année unverstare 2010/2011 Prépa-L1 TD de bostatstques. Exercce 1. On consdère la sére suvante : TD 1. Statstques à une varable. 1. Calculer la moyenne et l écart type. 2. Calculer la médane
Plus en détailTABLE DES MATIERES CONTROLE D INTEGRITE AU SEIN DE LA RECHERCHE LOCALE DE LA POLICE LOCALE DE BRUXELLES-CAPITALE/IXELLES (DEUXIEME DISTRICT) 1
TABLE DES MATIERES CONTROLE D INTEGRITE AU SEIN DE LA RECHERCHE LOCALE DE LA POLICE LOCALE DE BRUXELLES-CAPITALE/IXELLES (DEUXIEME DISTRICT) 1 1. PROBLEMATIQUE 1 2. MISSION 1 3. ACTES D ENQUETE 2 4. ANALYSE
Plus en détailBUREAU D'APPLICATION DES METHODES STATISTIQUES ET INFORMATIQUES
BUREAU DAPPLICATION DES METHODES STATISTIQUES ET INFORMATIQUES BAMSI REPRINT 04/2003 Introducton à l analyse des données Samuel AMBAPOUR BAMSSI I BAMSI B.P. 13734 Brazzavlle BAMSI REPRINT 04/2003 Introducton
Plus en détailPage 5 TABLE DES MATIÈRES
Page 5 TABLE DES MATIÈRES CHAPITRE I LES POURCENTAGES 1. LES OBJECTIFS 12 2. LES DÉFINITIONS 14 1. La varaton absolue d'une grandeur 2. La varaton moyenne d'une grandeur (par unté de temps) 3. Le coeffcent
Plus en détailQ x2 = 1 2. est dans l ensemble plus grand des rationnels Q. Continuons ainsi, l équation x 2 = 1 2
Exo7 Nombres complexes Vdéo parte. Les nombres complexes, défntons et opératons Vdéo parte. Racnes carrées, équaton du second degré Vdéo parte 3. Argument et trgonométre Vdéo parte 4. Nombres complexes
Plus en détail1.0 Probabilité vs statistique...1. 1.1 Expérience aléatoire et espace échantillonnal...1. 1.2 Événement...2
- robabltés - haptre : Introducton à la théore des probabltés.0 robablté vs statstque.... Expérence aléatore et espace échantllonnal.... Événement.... xomes défnton de probablté..... Quelques théorèmes
Plus en détailPro2030 GUIDE D UTILISATION. Français
Pro2030 GUIDE D UTILISATION Franças Contents Garante... Introducton... 1 Artcle nº 605056 Rév C Schéma nº A605056 Novembre 2010 2010 YSI Incorporated. Le logo YSI est une marque déposée de YSI Incorporated.
Plus en détailUNE ETUDE ECONOMÉTRIQUE DU NOMBRE D ACCIDENTS
BRUSSELS ECONOMIC REVIEW - CAHIERS ECONOMIQUES DE BRUXELLES VOL. 49 - N 2 SUMMER 2006 UNE ETUDE ECONOMÉTRIQUE DU NOMBRE D ACCIDENTS DANS LE SECTEUR DE L ASSURANCE AUTOMOBILE* MARÍA DEL CARMEN MELGAR**
Plus en détailSurveillance temps-réel des systèmes Homme-Machine. Application à l assistance à la conduite automobile
Survellance temps-réel des systèmes Homme-Machne. Applcaton à l assstance à la condute automoble Mguel Gonzalez-Mendoza To cte ths verson: Mguel Gonzalez-Mendoza. Survellance temps-réel des systèmes Homme-Machne.
Plus en détailAnalyse des Performances et Modélisation d un Serveur Web
SETIT 2009 5 th Internatonal Conference: Scences of Electronc, Technologes of Informaton and Telecommuncatons March 22-26, 2009 TUNISIA Analyse des Performances et Modélsaton d un Serveur Web Fontane RAFAMANTANANTSOA*,
Plus en détailIDEI Report # 18. Transport. December 2010. Elasticités de la demande de transport ferroviaire: définitions et mesures
IDEI Report # 18 Transport December 2010 Elastctés de la demande de transport ferrovare: défntons et mesures Elastctés de la demande de transport ferrovare : Défntons et mesures Marc Ivald Toulouse School
Plus en détailBe inspired. Numéro Vert. Via Caracciolo 20 20155 Milano tel. +39 02 365 22 990 fax +39 02 365 22 991
Ggaset SX353 / französsch / A31008-X353-P100-1-7719 / cover_0_hedelberg.fm / 03.12.2003 s Be nspred www.onedrect.fr www.onedrect.es www.onedrect.t www.onedrect.pt 0 800 72 4000 902 30 32 32 02 365 22 990
Plus en détailPour plus d'informations, veuillez nous contacter au 04.75.05.52.62. ou à contact@arclim.fr.
Régulaton Sondes & Capteurs Détente frgo électronque Supervson & GTC Humdfcaton & Déshu. Vannes & Servomoteurs Comptage eau, elec., énerge Ancens artcles Cette documentaton provent du ste www.arclm.eu
Plus en détailParlons. retraite. au service du «bien vieillir» L Assurance retraite. en chiffres* 639 192 retraités payés pour un montant de 4,2 milliards d euros
Édton Pays de la Lore Parlons La lettre aux retratés du régme général de la Sécurté socale 2012 retrate L Assurance retrate en chffres* 12,88 mllons de retratés 17,58 mllons de cotsants 346 000 bénéfcares
Plus en détailSéparation de Sources par lissage cepstral des masques binaires
Séparaton de Sources par lssage cepstral des masques bnares Ibrahm Mssaou 1 Zed Lachr 1, 2 (1) École natonale d ngéneurs de Tuns, ENIT, BP. 37 Le Belvedere, 1002 Tuns, Tunse (2) Insttut natonal des scences
Plus en détailREPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE. MEMOIRE Présentée à
REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE MEMOIRE Présentée à L Unversté de Batna Faculté des Scences Département de Physque
Plus en détailTable des Matières RÉSUMÉ ANALYTIQUE... 1 I. CONTEXTE... 2 1. La dette publique du Gouvernement... 2 2. Contexte institutionnel de gestion de la
Out ld éval uat on del aper f or manceen mat èr e degest on del adet t e (empa) Maur t an a Mar s2011 LeeMPA estunemét hodol og epouréval uerl aper f or manceenmat èr edegest on del adet t eàt r aver sunensembl
Plus en détailCHAPITRE DEUX : FORMALISME GEOMETRIQUE
CHPITRE DEUX FORMLISME GEOMETRIQUE. CHPITRE DEUX : FORMLISME GEOMETRIQUE verson.3, -8 I. GEOMETRIE DNS L ESPCE-TEMPS ) Prncpe de relatvté Le prncpe de relatvté peut s exprmer ans : toutes les los physques
Plus en détailsanté Les arrêts de travail des séniors en emploi
soldarté et DOSSIERS Les arrêts de traval des sénors en emplo N 2 2007 Les sénors en emplo se dstnguent-ls de leurs cadets en termes de recours aux arrêts de traval? Les sénors ne déclarent pas plus d
Plus en détailGUIDE D ÉLABORATION D UN PLAN D INTERVENTION POUR LE RENOUVELLEMENT DES CONDUITES D EAU POTABLE, D ÉGOUTS ET DES CHAUSSÉES
GUIDE D ÉLABORATION D UN PLAN D INTERVENTION POUR LE RENOUVELLEMENT DES CONDUITES D EAU POTABLE, D ÉGOUTS ET DES CHAUSSÉES Gude destné au mleu muncpal québécos NOVEMBRE 2013 Coordnaton : Martn Cormer,
Plus en détailRAPPORT DE STAGE. Approcher la frontière d'une sous-partie de l'espace ainsi que la distance à cette frontière. Sujet : Master II : SIAD
UFR SCIENCES ET TECHNOLOGIES DEPARTEMENT DE MATHEMATIQUES ET INFORMATIQUE 63 177 AUBIERE CEDEX Année 2008-2009 Master II : SIAD RAPPORT DE STAGE Sujet : Approcher la frontère d'une sous-parte de l'espace
Plus en détailCalculer le coût amorti d une obligation sur chaque exercice et présenter les écritures dans les comptes individuels de la société Plumeria.
1 CAS nédt d applcaton sur les normes IAS/IFRS Coût amort sur oblgatons à taux varable ou révsable La socété Plumera présente ses comptes annuels dans le référentel IFRS. Elle détent dans son portefeulle
Plus en détail1. Les enjeux de la prévision du risque de défaut de paiement
Scorng sur données d entreprses : nstrument de dagnostc ndvduel et outl d analyse de portefeulle d une clentèle Mrelle Bardos Ancen chef de servce de l Observatore des entreprses de la Banque de France
Plus en détailPrêt de groupe et sanction sociale Group lending and social fine
Prêt de roupe et sancton socale Group lendn and socal fne Davd Alary Résumé Dans cet artcle, nous présentons un modèle d antsélecton sur un marché concurrentel du crédt. Nous consdérons l ntroducton de
Plus en détailPaquets. Paquets nationaux 1. Paquets internationaux 11
Paquets Paquets natonaux 1 Paquets nternatonaux 11 Paquets natonaux Servces & optons 1 Créaton 3 1. Dmensons, pods & épasseurs 3 2. Présentaton des paquets 4 2.1. Face avant du paquet 4 2.2. Comment obtenr
Plus en détailP R I S E E N M A I N R A P I D E O L I V E 4 H D
P R I S E E N M A I N R A P I D E O L I V E 4 H D Sommare 1 2 2.1 2.2 2.3 3 3.1 3.2 3.3 4 4.1 4.2 4.3 4.4 4.5 4.6 5 6 7 7.1 7.2 7.3 8 8.1 8.2 8.3 8.4 8.5 8.6 Contenu du carton... 4 Paramétrage... 4 Connexon
Plus en détailThermodynamique statistique Master Chimie Université d Aix-Marseille. Bogdan Kuchta
hermodynamque statstque Master Chme Unversté d Ax-Marselle Bogdan Kuchta Plan: Rappel: thermodynamque phénoménologque (dscuter l entrope, l évoluton de gaz parfat,) Premer prncpe Deuxème prncpe (transformaton
Plus en détailLe Prêt Efficience Fioul
Le Prêt Effcence Foul EMPRUNTEUR M. Mme CO-EMPRUNTEUR M. Mlle Mme Mlle (CONJOINT, PACSÉ, CONCUBIN ) Départ. de nass. Nature de la pèce d dentté : Natonalté : CNI Passeport Ttre de séjour N : Salaré Stuaton
Plus en détailTHESE. Khalid LEKOUCH
N d ordre : /2012 THESE Présentée à la FACULTE DES SCIENCES D AGADIR En vue de l obtenton du GRADE DE DOCTEUR EN PHYSIQUE (Spécalté : Energétque, Thermque et Métrologe) Par Khald LEKOUCH MODELISATION ET
Plus en détailUne analyse économique et expérimentale de la fraude à l assurance et de l audit
Une analyse économque et expérmentale de la fraude à l assurance et de l audt Sameh Borg To cte ths verson: Sameh Borg. Une analyse économque et expérmentale de la fraude à l assurance et de l audt. Economes
Plus en détailUNIVERSITÉ DU QUÉBEC À MONTRÉAL L ASSURANCE AUTOMOBILE AU QUÉBEC : UNE PRIME SELON LE COÛT SOCIAL MARGINAL MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE
UNIVERSITÉ DU QUÉBEC À MONTRÉAL L ASSURANCE AUTOMOBILE AU QUÉBEC : UNE PRIME SELON LE COÛT SOCIAL MARGINAL MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE DE LA MAÎTRISE EN ÉCONOMIQUE PAR ERIC LÉVESQUE JANVIER
Plus en détailComparative performance for isolated points detection operators: application on surface defects extraction
Comparatve performance for solate ponts etecton operators: applcaton on surface efects extracton R. Seuln, G. Delcrox, F. Merenne Laboratore Le2-12, Rue e la Fonere - 71200 Le Creusot - FRANCE e-mal: ralph.seuln@utlecreusot.u-bourgogne.fr
Plus en détailLE RÉGIME DE RETRAITE DU PERSONNEL CANADIEN DE LA CANADA-VIE (le «régime») INFORMATION IMPORTANTE CONCERNANT LE RECOURS COLLECTIF
1 LE RÉGIME DE RETRAITE DU PERSONNEL CANADIEN DE LA CANADA-VIE (le «régme») INFORMATION IMPORTANTE CONCERNANT LE RECOURS COLLECTIF AVIS AUX RETRAITÉS ET AUX PARTICIPANTS AVEC DROITS ACQUIS DIFFÉRÉS Expédteurs
Plus en détailFaire des régimes TNS les laboratoires de la protection sociale de demain appelle des évolutions à deux niveaux :
Réformer en profondeur la protecton socale des TNS pour la rendre plus effcace Résumé de notre proposton : Fare des régmes TNS les laboratores de la protecton socale de deman appelle des évolutons à deux
Plus en détailAVERTISSEMENT. Contact SCD INPL: mailto:scdinpl@inpl-nancy.fr LIENS
AVERTISSEMENT Ce document est le frut d un long traval approuvé par le jury de soutenance et ms à dsposton de l ensemble de la communauté unverstare élarge. Il est soums à la proprété ntellectuelle de
Plus en détailRÉSUMÉ ANALYTIQUE... 1
Out ld éval uat on del aper f or manceen mat èr e degest on del adet t e (DeMPA) Républ quedu Sénégal Ma2010 LeDeMPA estunemét hodol og epouréval uerl aper f or manceenmat èr edegest on del adet t eàt
Plus en détailLA SURVIE DES ENTREPRISES DÉPEND-ELLE DU TERRITOIRE D'IMPLANTATION?
LA SURVIE DES ENTREPRISES DÉPEND-ELLE DU TERRITOIRE D'IMPLANTATION? Anne PERRAUD (CRÉDOC) Phlppe MOATI (CRÉDOC Unversté Pars) Nadège COUVERT (ENSAE) INTRODUCTION Au cours des dernères années, de nombreux
Plus en détailCalculs des convertisseurs en l'electronique de Puissance
Calculs des conertsseurs en l'electronque de Pussance Projet : PROGRAMMAON ate : 14 arl Auteur : herry EQUEU. EQUEU 1, rue Jules Massenet 37 OURS el 47 5 93 64 herry EQUEU Jun [V37] Fcher : ESGN.OC Calculs
Plus en détailPratique de la statistique avec SPSS
Pratque de la statstque avec SPSS SUPPORT Transparents ultéreurement amélorés et ms à jour sur le ste du SMCS LIENS UTILES Ste du SMCS (Support en Méthodologe et Calcul Statstque) : http://www.stat.ucl.ac.be/smcs/
Plus en détailImpôt sur la fortune et investissement dans les PME Professeur Didier MAILLARD
Conservatore atonal des Arts et Méters Chare de BAQUE Document de recherche n 9 Impôt sur la fortune et nvestssement dans les PME Professeur Dder MAILLARD Avertssement ovembre 2007 La chare de Banque du
Plus en détailErP : éco-conception et étiquetage énergétique. Les solutions Vaillant. Pour dépasser la performance. La satisfaction de faire le bon choix.
ErP : éco-concepton et étquetage énergétque Les solutons Vallant Pour dépasser la performance La satsfacton de fare le bon chox. ErP : éco-concepton et étquetage énergétque Eco-concepton et Etquetage
Plus en détailDriss HARRIZI. MOTS CLES : contrôle de gestion - système d'éducation et de formation système d information - établissement public.
Ver sunenouvel l ecul t ur emanagér al e:mét hodol og e dem seenpl aced unsyst èmedecont r ôl edegest on dansunét abl ssementpubl c Casd uneacadém er ég onal ed éducat onetde f or mat on. Aut eur s:dr
Plus en détailTRAVAUX PRATIQUES SPECTRO- COLORIMETRIE
UNIVERSITE MONTPELLIER 2 Département de Physque TRAVAUX PRATIQUES DE SPECTRO- COLORIMETRIE F. GENIET 2 INTRODUCTION Cet ensegnement de travaux pratques de seconde année se propose de revor rapdement l'aspect
Plus en détailPREMIERS PAS en REGRESSION LINEAIRE avec SAS. Josiane Confais (UPMC-ISUP) - Monique Le Guen (CNRS-CES-MATISSE- UMR8174)
PREMIERS PAS en REGRESSION LINEAIRE avec SAS Josane Confas (UPMC-ISUP) - Monque Le Guen (CNRS-CES-MATISSE- UMR874) e-mal : confas@ccr.jusseu.fr e-mal : monque.leguen@unv-pars.fr Résumé Ce tutorel accessble
Plus en détailLes méthodes numériques de la dynamique moléculaire
Les méthodes numérques de la dynamque moléculare Chrstophe Chpot Equpe de chme et & bochme théorques, Unté Mxte de Recherche CNRS/UHP 7565, Insttut Nancéen de Chme Moléculare, Unversté Henr Poncaré, B.P.
Plus en détailMEMOIRE. Présenté au département des sciences de la matière Faculté des sciences
REPUBLIQUE LERIEN DEMOCRTIQUE ET POPULIRE Mnstère de l ensegnement supéreur et de la recherche scentfque Unversté El-Hadj Lakhdar-BTN- MEMOIRE Présenté au département des scences de la matère Faculté des
Plus en détailMots-clés : Système multicapteurs, Réseau local, Réseaux de neurones, Supervision, Domotique. xigences système d'une nouvelle
Mots-clés : xgences système d'une nouvelle fonctonnalté dans l'habtat ndvduel : cas de la survellance Système multcapteurs, Réseau local, Réseaux de neurones, Supervson, Domotque. des personnes âgées et
Plus en détailEURIsCO. Cahiers de recherche. Cahier n 2008-05. L épargne des ménages au Maroc : Une analyse macroéconomique et microéconomique.
Cahers de recherche EURIsCO Caher n 2008-05 L épargne des ménages au Maroc : Une analyse macroéconomque et mcroéconomque Rapport d étude Najat El Mekkaou de Fretas (coordnateur) Eursco Unversté Pars Dauphne
Plus en détailmaster Objectif Université d Auvergne - Université Blaise Pascal Rentrée 2014 AUVERGNE
entrée 2014 Objectf master Unversté d Auvergne - Unversté Blase ascal Certans masters sont cohabltés avec d autres établssements d ensegnement supéreur mnstère de l éducaton natonale, de l ensegnement
Plus en détail- Acquisition de signaux en sismologie large bande. - Acquisition de signaux lents, magnétisme, MT.
87 DUCAPTEURAUXEANQUESDEDONNEES. TECHNQUES D'NSTRUMENTATON EN GEOPEY8QUE. J:M. CANTN Unversté Lous Pasteur (Strasbourg 1) nsttut de Physque du Globe de Strasbourg Ecole et Observatore de Physque du Globe.
Plus en détailLa théorie classique de l information. 1 ère partie : le point de vue de Kolmogorov.
La théore classque de l nformaton. ère parte : le pont de vue de Kolmogorov. La sute de caractères comme outl de descrpton des systèmes. La scence peut être vue comme l art de compresser les données quelles
Plus en détail