Contribution à la définition de modèles de recherche d information flexibles basés sur les CP-Nets

Dimension: px
Commencer à balayer dès la page:

Download "Contribution à la définition de modèles de recherche d information flexibles basés sur les CP-Nets"

Transcription

1 Contrbuton à la défnton de modèles de recherche d nformaton flexbles basés sur les CP-Nets Fatha Boubekeur To cte ths verson: Fatha Boubekeur. Contrbuton à la défnton de modèles de recherche d nformaton flexbles basés sur les CP-Nets. Computer Scence [cs]. Unversté Paul Sabater - Toulouse III, French. <tel > HAL Id: tel Submtted on 25 Jan 2009 HAL s a mult-dscplnary open access archve for the depost and dssemnaton of scentfc research documents, whether they are publshed or not. The documents may come from teachng and research nsttutons n France or abroad, or from publc or prvate research centers. L archve ouverte plurdscplnare HAL, est destnée au dépôt et à la dffuson de documents scentfques de nveau recherche, publés ou non, émanant des établssements d ensegnement et de recherche franças ou étrangers, des laboratores publcs ou prvés.

2 THÈSE En vue de l'obtenton du DOCTORAT DE L UNIVERSITÉ DE TOULOUSE Délvré par l'unversté Toulouse III - Paul Sabater Dscplne ou spécalté : Informatque Présentée et soutenue par Fatha BOUBEKEUR-AMIROUCHE Le 01/ 07/ 2008 Ttre : Contrbuton à la défnton de modèles de recherche d'nformaton flexbles basés sur les CP-Nets JURY Florence SEDES : Professeur à l'unversté Paul Sabater (Présdente) Erc GAUSSIER : Professeur à l Unversté Joseph Fourer Grenoble I, France (Rapporteur) Mohand-Saïd HACID : Professeur à l Unversté Claude Bernard Lyon 1, France (Rapporteur) Gabrella PASI : Professeur à l'unversté de Mlan Bcocca, Itale (Examnatrce) Mohand BOUGHANEM : Professeur à l'unversté Paul Sabater (Drecteur de recherche) Lynda TAMINE-LECHANI : Maître de Conférences à l'unversté Paul Sabater (Co-encadrante) Ecole doctorale : MITT Unté de recherche : CNRS, 5505 Drecteur(s) de Thèse : Mohand BOUGHANEM : Professeur à l'unversté Paul Sabater (Drecteur de recherche) Lynda TAMINE-LECHANI : Maître de Conférences à l'unversté Paul Sabater (Co-encadrante) Rapporteurs :

3

4 A mes enfants Amne et Nassm A Boualem

5

6 Remercements Je tens à remercer en tout premer leu M. Mohand Boughanem qu a drgé cette thèse d une man de maître. Tout au long de ces quatre années, l a su orenter mes recherches aux bons moments, toujours dans les bonnes drectons. Malgré l élognement, l a toujours été dsponble pour prodguer des consels et des orentatons ô comben pertnentes. Pour tout cela, pour m avor offert la chance d en être là aujourd hu, pour sa confance et pour sa préceuse ade technque je le remerce du fond du coeur. Mes plus vfs remercements vont également à Mme Lynda Tamne-Lechan qu a codrgé cette thèse avec toute la grandeur et la générosté qu sont les sennes. Tout au long de ces années de thèse, malgré l élognement, avec une régularté horlogque elle a toujours été là par ses consels, par son suv mnuteux de toutes mes propostons dans le cadre de cette thèse, par ses correctons, par ses orentatons et suggestons, par de rches et longues dscussons. Et même au-delà de cet aspect scentfque, dans les plus pénbles moments de doute et de lasstude, elle a toujours été l ame qu m a adée à me relever, qu m a encouragée à persévérer. Pour tout cela, pour son ade ô comben préceuse, pour sa générosté, pour son amté qu elle trouve c l expresson de ma plus profonde reconnassance et de ma sncère amté. Je remerce les rapporteurs de cette thèse M. Mohand-Saïd Hacd et M. Erc Gausser pour la lecture et la correcton de mon manuscrt et pour l ntérêt qu ls ont porté à mon traval. Je remerce également les autres membres du jury, Mme Florence Sedes et Mme Gabrella Pas qu ont accepté de juger ce traval. Je n oublera pas de remercer le premer Responsable de l équpe SIG, M. Claude Chrsment, qu sans même me connaître, a fat confance à ceux qu m ont fat confance, à mon Drecteur de thèse en l occurrence que je remerce encore une fos, et qu m a admse au sen de son équpe, et m a offert la chance de poursuvre des études doctorales. Je remerce également M. Mustapha Bazz pour sa coopératon scentfque, pour son ade préceuse et pour sa gentllesse. Mes remercements auss à Maram Daoud, doctorante au sen de l équpe SIG, pour son ade, sa dsponblté et pour sa gentllesse exemplare.

7 Je n oublera pas les ades reçues du personnel admnstratf et du servce nformatque de l IRIT, n les sourres accuellants et la convvalté des membres de l équpe SIG. J a sûrement oublé de remercer beaucoup d autres personnes mértantes, des personnes qu m ont offert leur amté, qu m ont ouvert leur cœur, qu m ont ouvert leur porte, qu elles trouvent c l expresson de ma profonde grattude et de mon amté la plus sncère. Je tens à remercer également mes collègues et ams de l unversté de Tz-Ouzou (Algére) en les personnes de M. Samr Redaou, M. Yassne Djouad et Mme Sama Fellag grâce à qu j a pu effectuer un ultme séjour à l IRIT durant lequel j a boosté ce traval de thèse. Merc également à mes ames Malka et Soraya pour leur ade et leur souten. Merc à vous d avor été là pour mo à un moment crucal de cette thèse. Mes remercements fnaux et non les mondres vont à mon mar qu a supporté mes humeurs au gré de cette thèse, qu m a adée sur les nombreux fronts de la ve quotdenne, qu m a encouragée jusqu au bout, qu m a remplacée auprès de mes enfants les fos où j a du m absenter, qu a été mon appu tout smplement. Merc auss à vous mes enfants pour avor comprs, malgré votre jeune âge, les mpératfs de cette thèse pour mo et pour m avor adée à y arrver.

8 Résumé Ce traval de thèse adresse deux prncpaux problèmes en recherche d nformaton : (1) la formalsaton automatque des préférences utlsateur, (ou la pondératon automatque de requêtes) et (2) l ndexaton sémantque. Dans notre premère contrbuton, nous proposons une approche de recherche d nformaton (RI) flexble fondée sur l utlsaton des CP-Nets (Condtonal Preferences Networks). Le formalsme CP-Net est utlsé d une part, pour la représentaton graphque de requêtes flexbles exprmant des préférences qualtatves et d autre part pour l évaluaton flexble de la pertnence des documents. Pour l utlsateur, l'expresson de préférences qualtatves est plus smple et plus ntutve que la formulaton de pods numérques les quantfant. Cependant, un système automatsé rasonnerat plus smplement sur des pods ordnaux. Nous proposons alors une approche de pondératon automatque des requêtes par quantfcaton des CP-Nets correspondants par des valeurs d utlté. Cette quantfcaton condut à un UCP-Net qu correspond à une requête booléenne pondérée. Une utlsaton des CP-Nets est également proposée pour la représentaton des documents dans la perspectve d une évaluaton flexble des requêtes ans pondéreés. Dans notre seconde contrbuton, nous proposons une approche d ndexaton conceptuelle basée sur les CP-Nets. Nous proposons d'utlser le formalsme CP-Net comme langage d ndexaton afn de représenter les concepts et les relatons condtonnelles entre eux d'une manère relatvement compacte. Les noeuds du CP-Net sont les concepts représentatfs du contenu du document et les relatons entre ces noeuds exprment les assocatons condtonnelles qu les lent. Notre contrbuton porte sur un double aspect : d une part, nous proposons une approche d extracton des concepts en utlsant WordNet. Les concepts résultants forment les noeuds du CP-Net. D autre part, nous proposons d étendre et d utlser la technque de règles d'assocaton afn de découvrr les relatons condtonnelles entre les concepts nœuds du CP-Nets. Nous proposons enfn un mécansme d évaluaton des requêtes basé sur l apparement de graphes (les CP-Nets document et requête en l occurrence). Mots clés : Recherche d nformaton flexble, pondératon des requêtes, ndexaton sémantque, WordNet, Règles d assocaton, CP-Nets.

9

10 Table des matères Introducton générale...17 Contexte Problématque Contrbuton Publcatons dans le cadre de la thèse Organsaton du mémore PARTIE 1 De la RI classque à la RI sémantque Chaptre 1 Recherche d'nformaton Introducton La RI classque L'ndexaton Taxonome des modèles de RI Reformulaton de requêtes Concluson La RI flexble Indexaton floue des documents Formulaton de requêtes flexbles Evaluaton flexble des requêtes Evaluaton d un SRI La campagne d évaluaton TREC Autres mesures d évaluaton d un SRI Concluson Chaptre 2 Indexaton sémantque en RI Introducton Problématque L ndexaton conceptuelle L ndexaton sémantque basée sur la désambguïsaton Les approches de désambguïsaton des sens des mots (WSD) Les approches d ndexaton sémantque Concluson PARTIE 2 Modèles de RI flexbles basés sur les CP-Nets Chaptre 3 Modèle de RI flexble basé sur les CP-Nets

11 3.1 Introducton Problématque et motvatons Les CP-Nets Notatons et défntons prélmnares Le modèle CP-Net Les UCP-Nets Modèle de RI basé CP-Nets Représentaton CP-Net des requêtes préférentelles Pondératon automatque de la requête Evaluaton de la requête CP-Net Concluson Chaptre 4 Approche de RI sémantque Introducton Motvatons Les outls d ade à l ndexaton sémantque WordNet Les règles d assocaton Approche d ndexaton sémantque Aperçu général Identfcaton de concepts représentatfs du document Découverte des relatons entre concepts Constructon de l ndex conceptuel du document Illustraton Evaluaton des requêtes basée CP-Nets Défnton formelle Illustraton Évaluaton expérmentale Collecton Muchmore Protocole d évaluaton Résultats expérmentaux Concluson Concluson générale Synthèse Perspectves Valdaton expérmentale : Améloratons futures REFERENCES BIBLIOGRAPHIQUES ANNEXES Annexe A Evaluaton des technques de désambguïsaton Annexe B Les CP_Nets

12 B.1 Introducton B.2 Descrpton avancée B.2.1 Un exemple llustratf B.2.2 La sémantque du CP-Net B.2.3 Rasonner avec les CP-Nets B.2.4 Utlsaton des graphes CP-Nets Annexe C Les règles d assocaton en RI C.1 Introducton C.2 Extracton de connassances dans les bases de données (ECBD) C.2.1 Généraltés C.2.2 Le Data Mnng (DM) C.3 Extracton de connassances dans les bases de données textuelles (ECT) C.3.1 Introducton C.3.2 La foulle de texte C.3.3 Découverte de règles d assocaton C.4 CONCLUSION

13

14 Table des fgures FIGURE 1.1 : Processus en U de la RI FIGURE 1.2 : Taxonome des modèles en RI FIGURE 1.3 : Dstrbuton des documents dans une collecton face à une requête FIGURE 2.1 : Un exemple de taxonome conceptuelle FIGURE 2.2 : Exemple de vosnage du mot house FIGURE 3.1: Un exemple de CP-Net FIGURE 3.2 : Graphe de préférences ndut FIGURE 3.3 : Un exemple de UCP-Net FIGURE 3.4 : Famlle étendue de X FIGURE 3.5 : Représentaton CP-Net d une requête booléenne FIGURE 3.6 : L UCP-Net requête FIGURE 3.7 : D 1 vu comme un UCP-Net FIGURE 4.1: Sous hérarche de WordNet correspondant au concept "dog" FIGURE 4.2 : Extracton des temsets fréquents FIGURE 4.3 : Les étapes de l ndexaton conceptuelle basée CP-Nets FIGURE 4.4 : Identfcaton du context relatf d un mot dans d FIGURE 4.5 : Identfcaton des termes FIGURE 4.6 : Le CP-Net document FIGURE B.1 : Le CP-Net FIGURE B.2 : Exemple de CP-Net FIGURE B.3 : Exemple de reconfguraton du contenu FIGURE C.1 : Trells des partes assocé à I

15

16 Lste des tableaux TABLEAU 1.1 : Dstrbuton de probabltés de pertnence des termes d un corpus d apprentssage TABLEAU 3.1 : Document retourné TABLEAU 3.2 : Sous-requêtes conjonctves TABLEAU 3.3 : Pertnences partelles et totale du document D TABLEAU 4.1 : Les concepts de WordNet correspondants au mot dog TABLEAU 4.2 : Le nombre de mots et de synsets dans WordNet TABLEAU 4.3 : pseudo-code de l algorthme Apror TABLEAU 4.4 : Base transactonnelle D, avec 4 des transactons T TABLEAU 4.5 : Règles d'assocaton à 1 tem en conséquent TABLEAU 4.6 : Règles d'assocaton à 1 tem en conséquent TABLEAU 4.7 : Règles d'assocaton à 2 tems en conséquent TABLEAU 4.8 : Génératon des k-temsets fréquents TABLEAU 4.9 : Règles d assocaton générées TABLEAU 4.10 : Confances des règles TABLEAU 4.11 : Règles d assocaton sélectonnées TABLEAU 4.12 : Supports des règles d assocaton sémantques TABLEAU 4.13 : Calcul de smlarté entre les CP-Nets document et requête TABLEAU 4.14 : Résultats d évaluaton de la méthode de détecton de concepts TABLEAU 4.15 : Résultats d évaluaton de la méthode de pondératon de concepts : mpact de la méthode d ndexaton par les concepts

17

18 Introducton générale Contexte Le but prncpal d un système de recherche d nformaton (SRI) est de retrouver les documents pertnents en réponse à une requête utlsateur. Ces documents sont typquement retrournés sous forme d une lste ordonnée, où l ordre est basé sur des estmatons de pertnence. Le modèle de recherche pour un SRI ndque comment les documents et requêtes sont représentés et comment ces représentatons sont comparées pour évaluer la pertnence. Les SRI classques représentent les documents et les requêtes par les mots qu'ls contennent, et basent souvent cette comparason sur le nombre de mots qu ls ont en commun, c est l apparement lexcal. Dans cette approche, des documents pertnents, ne partageant pas de mots avec la requête ne sont pas retrouvés. Tands que des documents non pertnents, contenant des mots de la requête sont retournés à l utlsateur. Ces problèmes sont dus au fat que l apparement lexcal ne tent pas compte des sens des mots du document et de la requête. L ndexaton sémantque tente de paller ces problèmes en offrant le moyen de dstnguer ces sens, et de les utlser lors du processus d apparement. Notre traval s nscrt prncpalement dans ce contexte. En partculer, nous proposons une approche de RI sémantque basée sur l ndexaton des documents et requêtes, par les sens des mots plutôt que par les mots euxmêmes. L approche offre en outre le moyen de prendre en compte les préférences utlsateur sur les crtères de recherche, et d évaluer la pertnence d un document pour une requête en tenant compte de ces préférences. Problématque Dans les SRI classques, l évaluaton de la pertnence d un document pour une requête est basée sur la mesure de correspondance du document pour la requête. Plus la requête et le document ont de mots en commun, plus le document est consdéré comme étant pertnent. Ces systèmes présentent des nsuffsances à dfférents nveaux : au nveau du langage de requête, de la représentaton des documents et requêtes et de l apparement. 17

19 INTRODUCTION GENERALE Au nveau du langage de requêtes : une requête tradut le beson en nformaton de l utlsateur mas auss ses préférences sur les nformatons recherchées. La pondératon des termes de la requête par des pods numérques [Buell et al., 81; Bordogna et al., 91; Pas, 99] a perms d exprmer les préférences utlsateur sur les crtères de recherche. Cependant, les pods numérques des requêtes forcent l'utlsateur à quantfer le concept qualtatf et vague d'mportance. Cette tâche n est pas smple, en partculer s la requête exprme des préférences condtonnelles. D une part, car l n exste pas une bonne méthode pour pondérer correctement les termes de la requête, d autre part, lorsque le nombre de valeurs sur lesquelles portent les préférences est élevé, l est quasment mpossble d'énumérer un pods valde pour tous les termes de la requête. Ces problèmes sont d autant plus accrus que la requête exprme des préférences condtonnelles. Même s ce type de préférences n est pas spécfquement prs en charge par les SRI, l est toujours possble de les tradure en expressons booléennes. Cependant, une pondératon aléatore ou ntutve de telles requêtes préférentelles, peut condure à des énoncés qu sont complètement contradctores avec la sémantque qu elles tentent d exprmer. De ce fat, pour paller les dffcultés de la pondératon numérques des requêtes, des travaux se sont orentés vers l'utlsaton de préférences qualtatves plus smples et plus ntutves, formulées à partr de termes lngustques tels que : mportant, très mportant [Bordogna et al., 93; Bordogna et al., 95]. Cependant, le problème de la défnton des pods numérques des termes est reporté sur la défnton de la sémantque du concept flou mportant et des modulateurs lngustques très, peu, moyennement Au nveau de la représentaton des documents et requêtes, et de l apparement correspondant : dans les SRI classques, documents et requêtes sont représentés comme des lstes de mots clés, généralement pondérés. L apparement document-requête est lexcal et se base sur la présence ou l absence d un mot de la requête dans le document. Or l est ben connu que les mots de la langue sont ambgus. Un même mot peut désgner dfférents concepts (et donc exprmer dfférents sens) et dfférents mots peuvent avor une même sgnfcaton. L apparement lexcal ne consdère pas ces aspects. De ce fat, des documents pourtant pertnents, contenant des mots sémantquement équvalents mas lexcalement dfférents (synonymes) des mots de la requête, ne seront pas retrouvés. Par alleurs, des documents non pertnents, contenant des mots lexcalement dentques mas sémantquement dfférents (homonymes) des termes de la requête seront retournés à l utlsateur. L'ndexaton sémantque (ou ndexaton par les sens des mots) tente de paller les problèmes de l'apparement lexcal en utlsant pour la recherche, des ndex conceptuels ou sémantques au leu de smples mots clés. De tels ndex portent sur la sémantque des mots. Ils sont construts à partr (1) des concepts explctes des textes eux-mêmes (ndexaton conceptuelle), (2) de la sémantque latente des textes des documents (ndexaton par sémantque latente LSI [Deerwester et al., 90]), ou (3) extrats de la sémantque explcte des mots telle que défne dans les dctonnares, thésaurus ou ontologes (ndexaton sémantque). L approche d ndexaton par la sémantque latente résout les sens des mots par un clusterng des mots 18

20 INTRODUCTION GENERALE sémantquement proches va une technque de réducton de la dmensonnalté de la matrce termes-documents. L ndexaton conceptuelle tente à partr d une taxonome conceptuelle extrate du texte, de construre sa sémantque. Les lens entre les dfférents concepts d une telle taxonome sont des lens fonctonnels entre enttés lexcales. L ndexaton sémantque tente de retrouver, parm les dfférents sens possbles d un mot tels que défns dans les dctonnares, ontologes et autres ressources lngustques, le sens correct du mot dans le texte à ndexer. Les mots d un texte donné défnssent mplctement une sémantque orentée sujet (topc), du texte correspondant. Le sujet prncpal du document est porté par les termes les plus mportants. Des sujets connexes secondares sont portés par des termes mons mportants, qu s agencent dans le document en foncton de la sémantque même du topc du texte. Cet agencement des mots (et surtout des sens) dans le texte des documents défnt une dmenson sémantque du document orentée topc. Or, les approches d ndexaton sémantque classques gnorent cette dmenson. Nous nous sommes ntéressés aux problèmes partculers posés par la pondératon des termes de la requête, la représentaton basée mots-clés des documents et requêtes et l apparement lexcal, et avons proposé des technques et méthodes pour tenter d y reméder. Notre contrbuton globale consste en la défnton de deux nouvelles approches de recherche d nformaton (RI) flexble basées sur les CP-Nets. Chacune des deux approches proposées focalse sur les tros aspects d un SRI : la représentaton des documents (ndexaton), le langage de requêtes et l évaluaton. Contrbuton Notre premère contrbuton consste en un nouveau modèle de RI flexble basé sur les CP- Nets. Dans ce modèle, nous avons : 1. ntrodut un nouveau langage de requêtes exprmant les préférences qualtatves de l utlsateur. La spécfcté de ce langage concerne la prse en charge ntutve des préférences condtonnelles. Pour cela, nous explotons les CP-Nets pour la représentaton de telles requêtes préférentelles condtonnelles. 2. proposé un algorthme pour la pondératon automatque de requêtes qualtatves. L algorthme se base sur le formalsme UCP- Net, extenson des CP-Nets par des valeurs numérques de préférences (dtes valeurs d utltés). L'utlsateur est ans déchargé de cette lourde et non mons mprobable tâche, et les pods produts sont certfés corrects pusque basés sur les fondements théorques des UCP-Nets. 19

21 INTRODUCTION GENERALE 3. défn une approche de représentaton des documents par des CP-Nets. L approche est basée sur la projecton des documents sur chaque requête soumse. Le document est alors représenté par un CP-Net de même topologe que celu de la requête, facltant ans l évaluaton de la pertnence 4. proposé une approche d évaluaton des requêtes basée sur le paradgme booléen. Nous explotons pour cela l nterprétaton des CP-Nets dans le formalsme booléen, pus l évaluaton de la requête booléenne obtenue, au moyen de l opérateur d agrégaton du mnmum pondéré [ Dubos et al., 86; Yager, 87]. Notre seconde contrbuton se rapporte à la RI sémantque. Cette approche est proposée comme améloraton de notre premère contrbuton, au nveau de la représentaton des documents et au nveau de l évaluaton. En partculer, le modèle de RI proposé s affrancht d une part des lmtes de la représentaton basées mots-clés en proposant une approche d ndexaton sémantque, d autre part des lmtes de l apparement lexcal et du paradgme booléen en proposant un apparement entre représentatons sémantques des documents et requêtes. En partculer: 1. notre approche d ndexaton sémantque a pour objectf d amélorer la représentaton des documents, en se basant sur les sens des mots dans les textes correspondants, et sur les lens entre ces sens dans le texte du document consdéré. Notre approche est fondée sur deux étapes prncpales : une premère étape d extracton des sens des termes d ndexaton et une seconde étape de découverte des relatons entre ces sens. La premère étape se base sur l utlsaton de l ontologe lngustque WordNet pour dentfer, pondérer et désambguïser les sens des termes d ndexaton. La seconde étape est fondée sur l utlsaton des règles d'assocaton pour dérver des relatons de dépendance contextuelle entre les concepts menant à une représentaton plus expressve des documents. Le prncpe même de l approche n'est pas nouveau mas nous avons proposé : une nouvelle technque pour dentfer les termes d ndexaton (smples ou composés) par projecton sur l ontologe WordNet, une nouvelle approche de pondératon des termes d ndexaton tenant compte de la sémantque des termes, une approche de désambguïsaton des sens des mots basée sur la noton de dstance sémantque et tenant compte de l mportance du mot dans le texte, une nouvelle technque pour découvrr des relatons entre les concepts correspondants au moyen des règles d'assocaton sémantques proposées. Les règles d'assocaton sémantques permettent de découvrr des relatons contextuelles entre les concepts amenant à une représentaton plus expressve du document. 20

22 INTRODUCTION GENERALE 2. Notre approche d évaluaton des requêtes a pour objectf d évaluer la pertnence des documents et des requêtes représentés par des graphes CP-Nets. La requête CP-Net dérve de notre approche proposée en premère contrbuton. Tands qu un CP-Net document est construt à partr de l ndex conceptuel du document, ssu de l étape d ndexaton sémantque présentée en (1), en organsant l ensemble formé des concepts représentatfs du document d une part et des assocatons correspondantes d autre part, en un graphe condtonnel, le CP- Net document. L approche d évaluaton proposée calcule alors la pertnence d un document pour une requête donnée sur la base d'une mesure proposée de smlarté des graphes CP-Nets correspondants. L ensemble des technques ans défnes consttue alors la base théorque de notre modèle de RI sémantque basée sur les CP-Nets. 3. La valdaton expérmentale de notre approche concerne prncpalement deux aspects : la valdaton de l approche de détecton de concepts la valdaton de l approche de pondératon la valdaton du modèle de RI basé sur les CP-Nets la valdaton de l approche d ndexaton sémantque dont : - valdaton de l approche de désambguïsaton - valdaton de l approche d extracton des règles d assocaton sémantques La valdaton expérmentale de notre modèle de RI proposé dans notre premère contrbuton, nécesste l utlsaton d un cadre d évaluaton supportant des requêtes CP-Nets. Un tel envronnement est à notre connassance nexstant. Sa constructon relève d un traval de recherche à part entère, qu ndépendamment du modèle proposé peut servr de base à la prse en compte des préférences condtonnelles dans le processus de RI. Nous avons par alleurs testé notre approche d ndexaton sémantque. Les résultats expérmentaux obtenus ont montré l ntérêt d une ndexaton sémantque par les concepts de WordNet. Nous n avons cependant pas expérmenté le modèle dans sa totalté. En partculer, la technque de découverte des règles d assocaton sémantques n a pas été expérmentée. Publcatons dans le cadre de la thèse 1. Dans le cadre de notre proposton d un modèle de RI flexble basé sur les CP-Nets 1. Fatha Boubekeur, Lynda Tamne. Recherche d Informaton flexble basée CP-Nets. Dans : Conférence francophone en Recherche d'informaton et Applcatons (CORIA 2006), Lyon, 15/03/06-17/03/06, 21

23 INTRODUCTION GENERALE Assocaton Francophone de Recherche d'informaton et Applcatons (ARIA), p , mars Fatha Boubekeur, Mohand Boughanem, Lynda Tamne. Towards Flexble Informaton Retreval Based on CP-Nets. Dans : Flexble Query Answerng (FQAS 2006), Mlan, Itale, 07/01/06-10/06/06, Henrk Legnd Larsen, Gabrella Pas, Danel Ortz-Arroyo (Eds.), World Scentfc Publshng, Advances n Artfcal Intellgence, p , jun Lynda Tamne, Fatha Boubekeur, Mohand Boughanem. On Usng Graphcal Models for Supportng Context-Aware Informaton Retreval. Dans : Internatonal Conference on the Theory of Informaton Retreval (ICTIR 2007), Budapest (Hungary), 18/10/07-20/10/07, Foundaton for Informaton Socety, p , octobre Dans le cadre de notre proposton de modèle de RI sémantque basé sur les CP-Nets Fatha Boubekeur, Mohand Boughanem, Lynda Tamne. Semantc Informaton Retreval Based on CP-Nets. Dans : IEEE Internatonal Conference on Fuzzy Systems (FUZZ-IEEE 2007), London, 23/07/07-26/07/07, IEEE, (support électronque), jullet Fatha Boubekeur, Mohand Boughanem, Lynda Tamne. Une approche d ndexton conceptuelle de documents basée sur les graphes CP_Nets. Dans: cnquème édton du colloque sur l optmsaton et les systèmes d nformaton COSI 08, 8-10 jun 08, Tz-Ouzou, Algére. 6. Fatha Boubekeur, Mohand Boughanem, Lynda Tamne. Explotng assocaton rules and ontology for semantc document ndexng. Dans: 12th Internatonal conference IPMU08, Informaton Processng and Management of Uncertanty n knowledge-based Systems, Malaga, 22-27, june 08, Span. Organsaton du mémore Ce mémore est organsé en deux partes prncpales. La premère parte, composée de deux chaptres, est dédée à la présentaton de la RI classque (chaptre 1) et de l ndexaton sémantque (chaptre 2). La seconde parte présente nos contrbutons. Elle est dvsée en deux 22

24 INTRODUCTION GENERALE chaptres 3 et 4, dédés respectvement à la présentaton de notre modèle de RI flexble et de notre modèle de RI sémantque basés sur les CP-Nets. Le détal de cette organsaton est donné comme sut : Dans le chaptre 1, nous présentons les dfférents aspects lés à la RI et aux SRI. Nous nous attacherons en partculer à défnr les modèles de recherche tant classques (booléen, vectorel et probablste) que des modèles plus flexbles (extensons floues du modèle booléen). L ndexaton automatque est auss explctée ans que les mécansmes de raffnement des requêtes. Enfn, nous rappellerons les mesures d évaluaton courantes d un SRI et présenterons les technques d évaluaton des SRI mses en œuvre dans le cadre des campagnes d évaluaton. Le chaptre 2 sera dédé à la présentaton des approches d ndexaton sémantque des documents. L objectf de telles approches est d ndexer les documents par les sens des mots ou par les concepts, plutôt que par les mots eux-mêmes. Le but est de paller les problèmes d apparement lexcal des SRI classques et pouvor ans trater avec l ambguïté naturelle de la langue. L approche d ndexaton basée sur les concepts (ndexaton conceptuelle) est présentée en secton 2.2. Les approches d ndexaton basées sur les sens des mots (ndexaton sémantque) sont présentées en secton 2.3. Ces dernères s appuent sur des technques lngustques de désambguïsaton des sens des mots. Nous dédons alors la secton à la présentaton des travaux en désambguïsaton lngustque avant de présenter l état de l art sur l ndexaton sémantque en secton En chaptre 3, nous présentons notre premère contrbuton à la défnton d un modèle de RI flexble basé sur les CP-Nets. Le chaptre s artcule autour de tros sectons. La secton 3.1 présente nos motvatons. En secton 3.2, nous présentons le formalsme CP-Net sur lequel se basent nos modèles. La secton 3.3 présente notre modèle de RI basé sur les CP-Nets. En partculer, nous y défnssons (1) notre approche de pondératon automatque de requêtes qualtatves, (2) la technque de représentaton CP-Net des documents et (3) notre méthode d évaluaton des requêtes CP-Nets. Le chaptre 4, présente notre seconde contrbuton à travers un nouveau modèle de RI sémantque basé sur les CP-Nets. Le chaptre s artcule autour de 4 sectons. En secton 4.2, nous présentons les motvatons qu ont été à l orgne de nos propostons. En secton 4.3, nous présentons les outls sur lesquels est basée notre approche d ndexaton sémantque, à savor WordNet et les règles d assocaton. Les fondements théorques de notre approche d ndexaton sémantque, un exemple llustratf ans que quelques résultats expérmentaux sont donnés en secton 4.4. La secton 4.5 présente notre approche d évaluaton des requêtes CP-Nets. Quelques résultats expérmentaux sont donnés en secton 4.6. Enfn, en concluson générale, nous présentons les perspectves de nos présentes propostons. 23

25

26 PARTIE 1 De la RI classque à la RI sémantque

27

28 Chaptre 1 Recherche d nformaton 1.1 Introducton La recherche d nformaton (RI) trate de la représentaton, du stockage, de l organsaton et de l accès à l nformaton. Le but d'un système SRI est de retrouver, parm une collecton de documents préalablement stockés, les documents qu répondent au beson utlsateur exprmé sous forme de requête. Pour cela, un SRI met en oeuvre un ensemble de processus de sélecton des documents pertnents pour la requête. Le but de ce chaptre est de présenter les concepts de base de la RI. Dans une premère parte, nous nous ntéressons aux approches de RI classque, pus nous présentons les approches de RI basées sur la logque floue. Ce chaptre est organsé comme sut : en secton 1.2, nous présentons les concepts de base de la RI classque. Nous y décrvons notamment le processus d ndexaton en paragraphe 1.2.1, pus la taxonome de modèles en paragraphe Les technques de reformulaton des requêtes sont présentées en paragraphe Le paragraphe présente les outls et méthodes d évaluaton d un SRI. En secton 1.3, nous présentons les approches de RI flexble. 1.2 La RI classque De manère générale, la recherche dans un SRI consste à comparer la représentaton nterne de la requête aux représentatons nternes des documents de la collecton. La requête est formulée, par l utlsateur, dans un langage de requêtes qu peut être le langage naturel, un langage à base de mots clés ou le langage booléen. Elle sera transformée en une représentaton nterne équvalente, lors d un processus d nterprétaton. Un processus smlare, dt ndexaton, permet de construre la représentaton nterne des documents de la base documentare. Le processus de recherche consste alors à mettre 27

29 CHAPITRE 1. RECHERCHE D INFORMATION en correspondance et à calculer le degré d apparement des représentatons nternes des documents et de la requête. Les documents qu correspondent au meux à la requête, ou documents dts pertnents, sont alors retournés à l utlsateur, dans une lste ordonnée par ordre décrossant de degré de pertnence lorsque le système le permet. Afn d amélorer les résultats de la recherche, le système peut être doté d un mécansme d améloraton et de raffnement de la requête par reformulaton. Le fonctonnement général d'un SRI est donnée au travers du processus de recherche communément appelé processus en U [Belkn et al., 92], présenté en fgure 1.1. Ce processus fat ressortr tros mécansmes de base : le processus d ndexaton (quelques fos dt processus d nterprétaton pour les requêtes), le processus de recherche et le processus de reformulaton des requêtes. Nous les détallons dans les paragraphes suvants. FIGURE 1.1 : Processus en U de la RI L'ndexaton L'ndexaton est une phase très mportante pour un SRI car de sa qualté dépend la qualté des réponses du système et donc les performances de ce derner. Une bonne ndexaton dot permettre de retrouver tous les documents pertnents au beson de l'utlsateur et pas (ou peu) de documents non pertnents pour celu-c. 28

30 CHAPITRE 1. RECHERCHE D INFORMATION En phase d'ndexaton, le document (ou la requête) est analysé(e) et les mots clés caractérsant son contenu nformatonnel, sont extrats. Un mot clé peut-être sot un mot smple ou un groupe de mots. Les mots-clés descrptfs du contenu sémantque d'un document sont dts termes d'ndexaton. L ensemble de tous les termes d'ndexaton consttue le langage d'ndexaton. Ce langage peut être lbre ou contrôlé. Un langage ndexaton lbre est construt à partr des termes extrats du document analysé. Un langage d ndexaton contrôlé est construt à partr d un ensemble de termes préalablement défns et organsés généralement dans un thésaurus. Lorsqu'un document est analysé, on ne garde que les mots clés qu appartennent à ce thésaurus Approches d ndexaton Technquement, l'ndexaton peut-être manuelle, automatque ou sem-automatque [Salton, 88; Salton et al., 88]. En ndexaton manuelle, c'est un opérateur human, généralement expert du domane, qu se charge de caractérser, selon ses connassances propres, le contenu sémantque d'un document. Cette approche présente deux nconvénents : 1. elle est subjectve, pusque le chox des termes d'ndexaton dépend de l'ndexeur et de ses connassances du domane, 2. elle est pratquement napplcable aux corpus de textes volumneux. Néanmons, tel que rapporté dans [Savoy, 05], elle est plus performante que l'ndexaton automatque en termes de précson moyenne des documents retrouvés en réponse à une requête utlsateur donnée. En ndexaton automatque [Luhn, 57; Maron, 60; Salton, 68], c'est un processus complètement automatsé qu se charge d'extrare les termes caractérstques du document. L'ntérêt d'une telle approche résde dans sa capacté à trater les textes nettement plus rapdement que l'approche précédente, et de ce fat, elle est partculèrement adaptée aux corpus volumneux. L'ndexaton automatque est l approche la plus étudée en RI, nous la détallons en secton suvante. L ndexaton sem-automatque [Manez et al., 91; Balpe et al., 95; Jacquemn et al., 02], appelée auss ndexaton supervsée, est une combnason des deux approches d ndexaton précédentes. Dans ce cas, les ndexeurs utlsent un vocabulare contrôlé sous forme de thésaurus ou de base termnologque. Le chox fnal des termes d ndexaton à partr du vocabulare fourn, est lassé ans à l ndexeur human (généralement spécalste du domane). 29

31 CHAPITRE 1. RECHERCHE D INFORMATION Dans la secton suvante, nous nous ntéressons partculèrement à l approche d ndexaton automatque, plus répandue, pusque c est celle qu nous ntéresse dans le cadre de notre traval L ndexaton automatque L'ndexaton automatque classque est fondée sur l'analyse des documents en vue de l'extracton des termes (mots-clés smples ou composés) représentatfs de leur contenu nformatonnel. Elle repose sur les étapes suvantes : l'extracton des termes d'ndexaton, la réducton du langage d ndexaton et la pondératon des termes d'ndexaton. 1. L'extracton des termes d ndexaton repose sur une analyse lngustque du texte du document. Pluseurs nveaux d analyse peuvent être dstngués : le nveau lexcal, syntaxque et sémantque. - En analyse lexcale, les mots composant le texte sont extrats et les mots vdes (prépostons, pronoms personnels, ) élmnés. Une étape supplémentare peut être nécessare en vue d'élmner les varantes morphologques (genre, nombre, dérvatons,...) des mots. Le tratement assocé repose sur deux procédures : la lemmatsaton et la troncature (ou racnsaton). La racnsaton consste à supprmer le suffxe (et plus rarement le préfxe) des mots sgnfcatfs du texte ndexé. La lemmatsaton (stemmng en anglas) a pour objectf de prendre la forme canonque du mot. Des expérences ont montré que la racnsaton et la lemmatsaton amélorent sgnfcatvement les performances pour les langues rches morphologquement (ex. le franças, l talen, etc.) [Gausser et al., 1997; Gausser et al., 2000]. - En analyse syntaxque, l s'agt de repérer les groupes de mots ou des mots composés [Fagan, 87; Salton, 88]. L'utlsaton des termes composés dot permettre d'augmenter la précson de réponse dans la mesure où le crtère possède une sgnfcaton plus précse et un usage plus restrent (plus spécfque) que les mots qu le composent. Les approches d analyse syntaxque se basent en général sur l'utlsaton de patrons (templates) syntaxques [Bourgault, 96; Aussenac-Glles et al., 00; Jacquemn, 01; Jones et al., 02] pour détecter les termes composés. - L'analyse sémantque s'ntéresse à reconnaître les sens des mots, les mots synonymes, les concepts représentatfs de ces mots, et plus généralement les relatons sémantques entre les mots. Le chaptre 2 sera dédé à cette dernère approche (.e. l ndexaton sémantque) pusque c'est celle qu nous ntéresse dans le cadre de notre traval de thèse. 30

32 CHAPITRE 1. RECHERCHE D INFORMATION La réducton du langage d ndexaton vse à rédure le nombre de termes d ndexaton en élmnant tous les mots non mportants (mots rares ou mots trop fréquents) du langage d ndexaton. Pour mesurer l'mportance d'un mot dans un document, l'ndexaton s appue sur la fréquence d'occurrence de ce mot dans le document. Les mots de fréquences quas nulles et les mots à fréquences trop élevées peuvent être élmnés de l'ndex. Cette hypothèse tre ses orgnes de la conjecture de Luhn [Luhn, 58] qu, pratquement, défnt un seul de fréquence mnmal S mn et un seul de fréquence maxmal S max tels que, tout terme d ndexaton t de fréquence ntermédare ( Smn freq( t) Smax ), est consdéré comme sgnfcatf et appartent donc au langage d ndexaton. La pondératon des termes d ndexaton consste à assocer un pods d mportance (ou valeur de représentatvté) w j à chaque terme t j d un document d. De manère générale, les formules de pondératon utlsées sont basées sur la combnason d un facteur de pondératon local quantfant la représentatvté locale du terme dans le document, et d un facteur de pondératon global quantfant la représentatvté globale du terme vs-à-vs de la collecton de documents. Pluseurs formules exstent, dont : tf j 1 w j = = tf j = tf j df df df j j j [Salton et al., 73] Où : tf j est la fréquence d occurrences du terme t j dans le document d. df j est la fréquence documentare du terme t j (.e. la proporton de documents de la collecton qu contennent t j ) et df j sa fréquence documentare nverse. La mesure tf* df est une bonne approxmaton de l'mportance d'un terme dans un document, partculèrement dans des corpus de documents de talles ntermédares. Pour des documents plus longs des normalsatons ont été proposées, dont : - La normalsaton pvotée de Snghal [Snghal et al., 96] Où : w j = 1+ ( 1 slope) tf j * df slope * * pvot j ( tf j * df j ) tf j est le nombre d occurrences du terme t j dans l unté documentare d df j est la fréquence documentare nverse défne classquement par : log(n/n j ) tel que n est le nombre de documents de la collecton et N j le nombre de documents ndexés par le terme t j. j 2 31

33 CHAPITRE 1. RECHERCHE D INFORMATION pvot est une constante qu représente l écart nul entre la probablté de pertnence et la probablté de sélecton des documents. slope est un facteur de normalsaton fxé emprquement, de sorte à mnmser l écart entre la pertnence et la sélecton. La formule de Robertson [Robertson et al., 97] w j = K 1 tf j * ( K + 1) dl l ( 1 b) + b * + tf j Où : w j est le pods du terme t j dans le document d. K 1 constante qu permet de contrôler l nfluence de la fréquence du terme t j dans le document d. Sa valeur dépend de la longueur des documents dans la collecton. Le plus souvent, sa valeur est fxée à 1,2. b constante qu permet de contrôler l effet de la longueur du document. Sa valeur la plus souvent utlsée est : 0,75. dl est la longueur du document d. l est la longueur moyenne des documents dans la collecton entère Taxonome des modèles de RI S c est l ndexaton qu permet de détermner les termes représentatfs des documents et requêtes, c est le modèle qu assure leur nterprétaton dans un formalsme de représentaton propre et qu offre le mécansme de leur apparement en vue de calculer les degrés de pertnence des documents pour les requêtes. La fgure 1.2 présente une classfcaton des dfférents modèles de RI [Baeza-Yates et al., 99]. Les modèles de RI se déclnent en tros grandes catégores qu sont les modèles booléens, les modèles vectorels et les modèles probablstes. Les modèles vectorels sont des modèles algébrques. Les documents et requêtes sont représentés par des vecteurs de pods dans un espace vectorel composé de tous les termes d ndexaton. La pertnence d'un document vs à vs d'une requête est défne par des mesures de dstances entre vecteurs. Pluseurs modèles proposés en RI se basent sur le modèle vectorel, dont : le modèle connexonnste et le modèle LSI (Latent Semantc Indexng). Les modèles probablstes s'appuent sur la théore des probabltés. La pertnence d'un document vs à vs d'une requête est vue comme une probablté de pertnence document/requête. Les modèles de RI basés sur le modèle probablste sont le modèle BIR (Bnary Independance retreval), le modèle nférentel Bayésen et le 1 32

34 CHAPITRE 1. RECHERCHE D INFORMATION modèle de langue. Dans ce qu sut, nous décrvons pour chacune de ces classes, le modèle de base et quelques modèles assocés. FIGURE 1.2 : Taxonome des modèles en RI Les modèles booléens Le modèle booléen de base Dans ce modèle, basé sur la théore des ensembles, le document est représenté par un ensemble de termes. La requête est représentée par un ensemble de mots clés relés par des opérateurs booléens (AND, OR et NOT). L apparement requête-document est strct et se base sur des opératons ensemblstes selon les règles suvantes : RSV RSV RSV RSV ( d, t ) = 1 s t d, snon ( d, t AND t j ) = 1 s ( t d ) ( t j d ), ( d, t OR t ) = 1 s ( t d ) ( t d ), ( d, NOT t ) = 1 s t d, 0 snon. j 0 j 0 snon 0 snon Ben que ce modèle sot smple à mettre en oeuvre, l présente néanmons tros nconvénents majeurs : l'apparement est strct et ne permet de classer les documents que dans deux catégores, l ensemble des documents pertnents et l ensemble des documents non pertnents, dont les éléments ne sont pas ordonnables, tous les termes d un document ou d'une requête sont d égales mportances (pondérés à 0 ou 1), ce qu n est pas le cas en réalté, 33

35 CHAPITRE 1. RECHERCHE D INFORMATION les expressons booléennes ne sont pas accessbles à un large publc et des confusons exstent du fat de la dfférence de «sens» des opérateurs logques AND et OR et de leurs connotatons respectves en langage naturel. Le modèle booléen étendu et modèle basé sur les ensembles flous dérvent du modèle booléen Modèle booléen étendu Le modèle booléen étendu a été ntrodut par Salton [Salton et al., 1983]. C est une extenson du modèle précédent qu vse à tenr compte d une pondératon des termes dans le corpus. Cela permet de paller les problèmes du modèle de base en ordonnant les documents retrouvés par le SRI. La requête demeure une expresson booléenne classque. Tands que les termes d un document sont mantenant pondérés. En général le pods d un terme dans un document est foncton du nombre d occurrences de ce terme dans le document. L apparement requête_document est le plus souvent détermné par les relatons ntrodutes dans le modèle p-norm basées sur les les p-dstances, avec 1 p. La valeur de p est ndquée au moment de la requête. S m est le nombre de termes dans la requête, les fonctons de smlarté se calculent comme sut : RSV RSV ( d, Q ) ou ( d, Q ) et p p x1 + x2 + K+ x = m = 1 S p = 1, on se ramène au modèle booléen Les modèles vectorels Le modèle vectorel de base p m 1 p p p p p ( 1 x ) + ( 1 x ) + K+ ( 1 x ) 1 Dans ce modèle, un document est représenté sous forme d un vecteur dans l espace vectorel composé de tous les termes d ndexaton. Les coordonnées d un vecteur document représentent les pods des termes correspondants. Formellement, un document d est représenté par un vecteur de dmenson n, d = (w 1, w 2,..., w n ) pour = 1, 2,, m. Où w j est le pods du terme t j dans le document d, m est le nombre de documents dans la collecton, n est le nombre de termes d ndexaton. 2 m m 1 34

36 CHAPITRE 1. RECHERCHE D INFORMATION Une requête Q est auss représentée par un vecteur de mots-clés défn dans le même espace vectorel que le document. Q = (w Q1, w Q2,..., w Qn ) Où w Qj est le pods de terme t j dans la requête Q. Ce pods peut être sot une forme de tf*df, sot un pods attrbué manuellement par l utlsateur. La pertnence du document d pour la requête Q est mesurée comme le degré de corrélaton des vecteurs correspondants. Cette corrélaton peut être exprmée par l une des mesures suvantes : Le produt scalare : n Sm d, Q = w * w ( ) Sm d, Q La mesure du cosnus: ( ) 1/ 2 1/ 2 La mesure de Dce : Sm( d, Q) La mesure de Jacard : Sm( d, Q) j= 1 = n j= 1 Qj w n 2 Qj n j= 1 2 * w j w Qj j j= 1 = n 2 wqj n j= 1 j= 1 = n * w * * w Qj + w n j= 1 n w 2 j n j j= 1 w Qj 2 j 2 2 wqj + wj j= 1 j= 1 j= 1 j * w n w j * w Qj Le coeffcent de superposton : Sm( d, Q) = mn n j= 1 n n 2 wqj, j= 1 j= 1 w j * w Qj w 2 j L un des avantages du modèle vectorel résde dans sa smplcté conceptuelle et de mse en oeuvre. En outre, l permet de trer les résultats d une recherche à travers une mesure de smlarté document/requête, en plaçant en tête les documents jugés les plus smlares à la requête. Cependant, ce modèle ne permet pas de modélser les assocatons entre les termes 35

37 CHAPITRE 1. RECHERCHE D INFORMATION d ndexaton. Chacun des termes est consdéré comme ndépendant des autres. Le modèle vectorel généralsé (Generalzed Vector Space Model) [Wong et al, 1985] permet cependant de résoudre le problème d ndépendance des termes Le modèle connexonnste Les SRI basés sur l'approche connexonnste utlsent le fondement des réseaux de neurones, tant pour la modélsaton des untés textuelles que pour la mse en œuvre du processus de RI. L dée de base est que la RI est un processus assocatf qu peut être représenté par les mécansmes de propagaton d actvaton des réseaux de neurones. De plus, les capactés d apprentssage de ces modèles peuvent permettre d obtenr des SRI adaptatfs. Deux modèles théorques ont été utlsés : les modèles à auto-organsaton et les modèles à couches. Les modèles à auto-organsaton [Ln et al., 91] permettent à partr de la descrpton des documents, d en réalser une classfcaton par l apprentssage du réseau de neurones. Ces modèles sont basés sur les cartes auto-organsatrces de Kohonen [Kohonen, 89]. Les modèles à couches : Les SRI basés sur un modèle connexonnste à couches [Kwok, 89; Belew, 89; Boughanem, 92a-b; Mothe, 94] sont représentés par un mnmum de tros couches de neurones nterconnectées : la couche requête (Q), la couche termes (T) et la couche documents (D). Le mécansme de recherche est basé sur une actvaton ntale des neurones termes ndute par une requête, et qu se propage vers les documents à travers les connexons du réseau. Dans le modèle MERCURE [Boughanem, 92], une requête Q est représentée par un vecteur de pods sous forme : Q = ( t) u ( t) ( t) ( t) ( q, q,..., q ) u1 Les pods des termes dans la requête sont affectés aux lens requête-termes. L'actvté ntale du réseau correspond à l'actvaton d'un nœud requête en envoyant un sgnal de valeur 1 à travers les lens requête-termes. Chaque neurone terme t j affecté par la requête, reçot une entrée In(t j ) et fournt une sorte Out(t j ) respectvement défnes par : u2 ( t) ( t ) = q Out( t ) g( In( t ) In = j uj Un document d qu a des termes t j en commun avec la requête recevra une entrée In(d) et calculera sa sorte Out(d) telles que : j ut j 36

38 CHAPITRE 1. RECHERCHE D INFORMATION T ( d ) Out( t )* w Out( d ) g In( d ) In = j j = =1 Où w j est le pods du terme t j dans le document d. ( ) Les valeurs de sorte des dfférents documents correspondent à leurs degrés de pertnence pour la requête donnée Modèle d ndexaton sémantque latente (LSI) L objectf du modèle LSI est de construre des ndex conceptuels portant sur la sémantque des mots dans les documents. Ces ndex sont trés à partr de la structure sémantque latente des textes des documents. Pour ce fare, partant de l espace vectorel de tous les termes d ndexaton, le modèle LSI construt un espace d ndexaton de talle rédute k, par applcaton de la décomposton en valeurs sngulères (SVD) de la matrce termes-documents [Deerwester et al., 90]. Ces k dmensons capturent une parte mportante de la structure sémantque des documents [Berry et al., 94 ] portée par les assocatons des termes et documents, et élmnent le brut dû à la varablté dans l'usage des mots. Chaque vecteur document est au fnal représenté dans l'espace k-dmensonnel rédut des termes non brutés. Les documents qu partagent des termes co-occurrents ont des représentatons proches. La requête utlsateur est auss représentée par un vecteur dans l'espace k-dmensonnel. Une mesure de smlarté est ensute calculée entre le k-vecteur requête et chacun des k-vecteurs documents de la collecton. A l ssue de la recherche, le système sélectonne les documents pertnents même s ls ne contennent aucun mot de la requête Les modèles probablstes Le modèle probablste de base Le premer modèle probablste a été proposé par Maron et Kuhns [Maron et al., 60] au début des années 60. Le prncpe de base consste à présenter les résultats d un SRI dans un ordre basé sur la probablté de pertnence d un document vs-à-vs d une requête. Robertson [Robertson, 77] défnt son modèle PRP (Probablty Rankng Prncple), sur ce même prncpe. Etant donné une requête utlsateur notée Q et un document d, le modèle probablste tente d estmer la probablté que le document d appartenne à la classe des documents pertnents (non pertnents). Un document est alors sélectonné s la probablté qu l sot pertnent à Q, notée P(R/d), est supéreure à la probablté qu l sot non pertnent à Q, notée P(NR/d). Le score d apparement entre le document d et la requête Q, noté RSV (d,q), est donné par [Robertson, 94b]: 37

En vue de l'obtention du. Présentée et soutenue par Elayeb Bilel Le 26 juin 2009

En vue de l'obtention du. Présentée et soutenue par Elayeb Bilel Le 26 juin 2009 THÈSE En vue de l'obtenton du DOCTORAT DE L UNIVERSITÉ DE TOULOUSE Délvré par Insttut Natonal Polytechnque de Toulouse (INPT) Dscplne ou spécalté : Informatque Présentée et soutenue par Elayeb Blel Le

Plus en détail

Les jeunes économistes

Les jeunes économistes Chaptre1 : les ntérêts smples 1. défnton et calcul pratque : Défnton : Dans le cas de l ntérêt smple, le captal reste nvarable pendant toute la durée du prêt. L emprunteur dot verser, à la fn de chaque

Plus en détail

Editions ENI. Project 2010. Collection Référence Bureautique. Extrait

Editions ENI. Project 2010. Collection Référence Bureautique. Extrait Edtons ENI Project 2010 Collecton Référence Bureautque Extrat Défnton des tâches Défnton des tâches Project 2010 Sasr les tâches d'un projet Les tâches représentent le traval à accomplr pour attendre l'objectf

Plus en détail

MÉTHODES DE SONDAGES UTILISÉES DANS LES PROGRAMMES D ÉVALUATIONS DES ÉLÈVES

MÉTHODES DE SONDAGES UTILISÉES DANS LES PROGRAMMES D ÉVALUATIONS DES ÉLÈVES MÉTHODES DE SONDAGES UTILISÉES DANS LES PROGRAMMES D ÉVALUATIONS DES ÉLÈVES Émle Garca, Maron Le Cam et Therry Rocher MENESR-DEPP, bureau de l évaluaton des élèves Cet artcle porte sur les méthodes de

Plus en détail

Fiche n 7 : Vérification du débit et de la vitesse par la méthode de traçage

Fiche n 7 : Vérification du débit et de la vitesse par la méthode de traçage Fche n 7 : Vérfcaton du débt et de la vtesse par la méthode de traçage 1. PRINCIPE La méthode de traçage permet de calculer le débt d un écoulement ndépendamment des mesurages de hauteur et de vtesse.

Plus en détail

Chapitre 3 : Incertitudes CHAPITRE 3 INCERTITUDES. Lignes directrices 2006 du GIEC pour les inventaires nationaux de gaz à effet de serre 3.

Chapitre 3 : Incertitudes CHAPITRE 3 INCERTITUDES. Lignes directrices 2006 du GIEC pour les inventaires nationaux de gaz à effet de serre 3. Chaptre 3 : Incerttudes CHAPITRE 3 INCERTITUDES Lgnes drectrces 2006 du GIEC pour les nventares natonaux de gaz à effet de serre 3.1 Volume 1 : Orentatons générales et établssement des rapports Auteurs

Plus en détail

Remboursement d un emprunt par annuités constantes

Remboursement d un emprunt par annuités constantes Sére STG Journées de formaton Janver 2006 Remboursement d un emprunt par annutés constantes Le prncpe Utlsaton du tableur Un emprunteur s adresse à un prêteur pour obtenr une somme d argent (la dette)

Plus en détail

Mesure avec une règle

Mesure avec une règle Mesure avec une règle par Matheu ROUAUD Professeur de Scences Physques en prépa, Dplômé en Physque Théorque. Lycée Alan-Fourner 8000 Bourges ecrre@ncerttudes.fr RÉSUMÉ La mesure d'une grandeur par un système

Plus en détail

Plan. Gestion des stocks. Les opérations de gestions des stocks. Les opérations de gestions des stocks

Plan. Gestion des stocks. Les opérations de gestions des stocks. Les opérations de gestions des stocks Plan Geston des stocks Abdellah El Fallah Ensa de Tétouan 2011 Les opératons de gestons des stocks Les coûts assocés à la geston des stocks Le rôle des stocks Modèle de la quantté économque Geston calendare

Plus en détail

METHODE AUTOMATIQUE POUR CORRIGER LA VARIATION LINGUISTIQUE LORS DE L INTERROGATION DE DOCUMENTS XML DE STRUCTURES HETEROGENES

METHODE AUTOMATIQUE POUR CORRIGER LA VARIATION LINGUISTIQUE LORS DE L INTERROGATION DE DOCUMENTS XML DE STRUCTURES HETEROGENES METHODE AUTOMATIQUE POUR CORRIGER LA VARIATION LINGUISTIQUE LORS DE L INTERROGATION DE DOCUMENTS XML DE STRUCTURES HETEROGENES Ourda Boudghaghen(*),Mohand Boughanem(**) yugo_doudou@yahoo.fr, bougha@rt.fr

Plus en détail

Stéganographie Adaptative par Oracle (ASO)

Stéganographie Adaptative par Oracle (ASO) Stéganographe Adaptatve par Oracle ASO Sarra Kouder, Marc Chaumont, Wllam Puech To cte ths verson: Sarra Kouder, Marc Chaumont, Wllam Puech. Stéganographe Adaptatve par Oracle ASO. CORESA 12: COmpresson

Plus en détail

I. Présentation générale des méthodes d estimation des projets de type «unité industrielle»

I. Présentation générale des méthodes d estimation des projets de type «unité industrielle» Evaluaton des projets et estmaton des coûts Le budget d un projet est un élément mportant dans l étude d un projet pusque les résultats économques auront un mpact sur la réalsaton ou non et sur la concepton

Plus en détail

Contrats prévoyance des TNS : Clarifier les règles pour sécuriser les prestations

Contrats prévoyance des TNS : Clarifier les règles pour sécuriser les prestations Contrats prévoyance des TNS : Clarfer les règles pour sécurser les prestatons Résumé de notre proposton : A - Amélorer l nformaton des souscrpteurs B Prévor plus de souplesse dans l apprécaton des revenus

Plus en détail

ÉLÉMENTS DE THÉORIE DE L INFORMATION POUR LES COMMUNICATIONS.

ÉLÉMENTS DE THÉORIE DE L INFORMATION POUR LES COMMUNICATIONS. ÉLÉMETS DE THÉORIE DE L IFORMATIO POUR LES COMMUICATIOS. L a théore de l nformaton est une dscplne qu s appue non seulement sur les (télé-) communcatons, mas auss sur l nformatque, la statstque, la physque

Plus en détail

Assurance maladie et aléa de moralité ex-ante : L incidence de l hétérogénéité de la perte sanitaire

Assurance maladie et aléa de moralité ex-ante : L incidence de l hétérogénéité de la perte sanitaire Assurance malade et aléa de moralté ex-ante : L ncdence de l hétérogénété de la perte santare Davd Alary 1 et Franck Ben 2 Cet artcle examne l ncdence de l hétérogénété de la perte santare sur les contrats

Plus en détail

COMPARAISON DE MÉTHODES POUR LA CORRECTION

COMPARAISON DE MÉTHODES POUR LA CORRECTION COMPARAISON DE MÉTHODES POUR LA CORRECTION DE LA NON-RÉPONSE TOTALE : MÉTHODE DES SCORES ET SEGMENTATION Émle Dequdt, Benoît Busson 2 & Ncolas Sgler 3 Insee, Drecton régonale des Pays de la Lore, Servce

Plus en détail

En vue de l'obtention du. Présentée et soutenue par Meva DODO Le 06 novembre 2008

En vue de l'obtention du. Présentée et soutenue par Meva DODO Le 06 novembre 2008 THÈSE En vue de l'obtenton du DOCTORAT DE L UNIVERSITÉ DE TOULOUSE Délvré par l'unversté Toulouse III - Paul Sabater Spécalté : Informatque Présentée et soutenue par Meva DODO Le 06 novembre 2008 Ttre

Plus en détail

EH SmartView. Identifiez vos risques et vos opportunités. www.eulerhermes.be. Pilotez votre assurance-crédit. Services en ligne Euler Hermes

EH SmartView. Identifiez vos risques et vos opportunités. www.eulerhermes.be. Pilotez votre assurance-crédit. Services en ligne Euler Hermes EH SmartVew Servces en lgne Euler Hermes Identfez vos rsques et vos opportuntés Plotez votre assurance-crédt www.eulerhermes.be Les avantages d EH SmartVew L expertse Euler Hermes présentée de manère clare

Plus en détail

hal-00409942, version 1-14 Aug 2009

hal-00409942, version 1-14 Aug 2009 Manuscrt auteur, publé dans "MOSIM' 008, Pars : France (008)" 7 e Conférence Francophone de MOdélsaton et SIMulaton - MOSIM 08 - du mars au avrl 008 - Pars - France «Modélsaton, Optmsaton et Smulaton des

Plus en détail

INTERNET. Initiation à

INTERNET. Initiation à Intaton à INTERNET Surfez sur Internet Envoyez des messages Téléchargez Dscutez avec Skype Découvrez Facebook Regardez des vdéos Protégez votre ordnateur Myram GRIS Table des matères Internet Introducton

Plus en détail

Montage émetteur commun

Montage émetteur commun tour au menu ontage émetteur commun Polarsaton d un transstor. ôle de la polarsaton La polarsaton a pour rôle de placer le pont de fonctonnement du transstor dans une zone où ses caractérstques sont lnéares.

Plus en détail

L enseignement virtuel dans une économie émergente : perception des étudiants et perspectives d avenir

L enseignement virtuel dans une économie émergente : perception des étudiants et perspectives d avenir L ensegnement vrtuel dans une économe émergente : percepton des étudants et perspectves d avenr Hatem Dellag Laboratore d Econome et de Fnances applquées Faculté des scences économques et de geston de

Plus en détail

Contact SCD Nancy 1 : theses.sciences@scd.uhp-nancy.fr

Contact SCD Nancy 1 : theses.sciences@scd.uhp-nancy.fr AVERTISSEMENT Ce document est le frut d'un long traval approuvé par le jury de soutenance et ms à dsposton de l'ensemble de la communauté unverstare élarge. Il est soums à la proprété ntellectuelle de

Plus en détail

DES EFFETS PERVERS DU MORCELLEMENT DES STOCKS

DES EFFETS PERVERS DU MORCELLEMENT DES STOCKS DES EFFETS PERVERS DU MORCELLEMENT DES STOCKS Le cabnet Enetek nous démontre les mpacts négatfs de la multplcaton des stocks qu au leu d amélorer le taux de servce en se rapprochant du clent, le dégradent

Plus en détail

Prise en compte des politiques de transport dans le choix des fournisseurs

Prise en compte des politiques de transport dans le choix des fournisseurs INSTITUT NATIONAL POLYTECHNIQUE DE GRENOBLE N attrbué par la bblothèque THÈSE Pour obtenr le grade de DOCTEUR DE L I.N.P.G. Spécalté : Géne Industrel Préparée au Laboratore d Automatque de Grenoble Dans

Plus en détail

Chapitre IV : Inductance propre, inductance mutuelle. Energie électromagnétique

Chapitre IV : Inductance propre, inductance mutuelle. Energie électromagnétique Spécale PSI - Cours "Electromagnétsme" 1 Inducton électromagnétque Chaptre IV : Inductance propre, nductance mutuelle. Energe électromagnétque Objectfs: Coecents d nductance propre L et mutuelle M Blan

Plus en détail

Interface OneNote 2013

Interface OneNote 2013 Interface OneNote 2013 Interface OneNote 2013 Offce 2013 - Fonctons avancées Lancer OneNote 2013 À partr de l'nterface Wndows 8, utlsez une des méthodes suvantes : - Clquez sur la vgnette OneNote 2013

Plus en détail

Terminal numérique TM 13 raccordé aux installations Integral 33

Terminal numérique TM 13 raccordé aux installations Integral 33 Termnal numérque TM 13 raccordé aux nstallatons Integral 33 Notce d utlsaton Vous garderez une longueur d avance. Famlarsez--vous avec votre téléphone Remarques mportantes Chaptres à lre en prorté -- Vue

Plus en détail

Dirigeant de SAS : Laisser le choix du statut social

Dirigeant de SAS : Laisser le choix du statut social Drgeant de SAS : Lasser le chox du statut socal Résumé de notre proposton : Ouvrr le chox du statut socal du drgeant de SAS avec 2 solutons possbles : apprécer la stuaton socale des drgeants de SAS comme

Plus en détail

Integral T 3 Compact. raccordé aux installations Integral 5. Notice d utilisation

Integral T 3 Compact. raccordé aux installations Integral 5. Notice d utilisation Integral T 3 Compact raccordé aux nstallatons Integral 5 Notce d utlsaton Remarques mportantes Remarques mportantes A quelle nstallaton pouvez-vous connecter votre téléphone Ce téléphone est conçu unquement

Plus en détail

CREATION DE VALEUR EN ASSURANCE NON VIE : COMMENT FRANCHIR UNE NOUVELLE ETAPE?

CREATION DE VALEUR EN ASSURANCE NON VIE : COMMENT FRANCHIR UNE NOUVELLE ETAPE? CREATION DE VALEUR EN ASSURANCE NON VIE : COMMENT FRANCHIR UNE NOUVELLE ETAPE? Boulanger Frédérc Avanssur, Groupe AXA 163-167, Avenue Georges Clémenceau 92742 Nanterre Cedex France Tel: +33 1 46 14 43

Plus en détail

Système solaire combiné Estimation des besoins énergétiques

Système solaire combiné Estimation des besoins énergétiques Revue des Energes Renouvelables ICRESD-07 Tlemcen (007) 109 114 Système solare combné Estmaton des besons énergétques R. Kharch 1, B. Benyoucef et M. Belhamel 1 1 Centre de Développement des Energes Renouvelables

Plus en détail

Les déterminants de la détention et de l usage de la carte de débit : une analyse empirique sur données individuelles françaises

Les déterminants de la détention et de l usage de la carte de débit : une analyse empirique sur données individuelles françaises Les détermnants de la détenton et de l usage de la carte de débt : une analyse emprque sur données ndvduelles françases Davd Boune a, Marc Bourreau a,b et Abel Franços a,c a Télécom ParsTech, Département

Plus en détail

Grandeur physique, chiffres significatifs

Grandeur physique, chiffres significatifs Grandeur physque, chffres sgnfcatfs I) Donner le résultat d une mesure en correspondance avec l nstrument utlsé : S avec un nstrument, ren n est ndqué sur l ncerttude absolue X d une mesure X, on consdère

Plus en détail

BTS GPN 2EME ANNEE-MATHEMATIQUES-MATHS FINANCIERES MATHEMATIQUES FINANCIERES

BTS GPN 2EME ANNEE-MATHEMATIQUES-MATHS FINANCIERES MATHEMATIQUES FINANCIERES MATHEMATIQUES FINANCIERES I. Concepts généraux. Le référentel précse : Cette parte du module M4 «Acquérr des outls mathématques de base nécessares à l'analyse de données économques» est en relaton avec

Plus en détail

VIELLE Marc. CEA-IDEI Janvier 1998. 1 La nomenclature retenue 3. 2 Vue d ensemble du modèle 4

VIELLE Marc. CEA-IDEI Janvier 1998. 1 La nomenclature retenue 3. 2 Vue d ensemble du modèle 4 GEMINI-E3 XL France Un outl destné à l étude des mpacts ndustrels de poltques énergétques et envronnementales VIELLE Marc CEA-IDEI Janver 1998 I LA STRUCTURE DU MODELE GEMINI-E3 XL FRANCE 3 1 La nomenclature

Plus en détail

Les déterminants de la détention et de l usage de la carte de débit : une analyse empirique sur données individuelles françaises

Les déterminants de la détention et de l usage de la carte de débit : une analyse empirique sur données individuelles françaises Les détermnants de la détenton et de l usage de la carte de débt : une analyse emprque sur données ndvduelles françases Davd Boune Marc Bourreau Abel Franços Jun 2006 Département Scences Economques et

Plus en détail

Généralités sur les fonctions 1ES

Généralités sur les fonctions 1ES Généraltés sur les fonctons ES GENERALITES SUR LES FNCTINS I. RAPPELS a. Vocabulare Défnton Une foncton est un procédé qu permet d assocer à un nombre x appartenant à un ensemble D un nombre y n note :

Plus en détail

Les prix quotidiens de clôture des échanges de quotas EUA et de crédits CER sont fournis par ICE Futures Europe

Les prix quotidiens de clôture des échanges de quotas EUA et de crédits CER sont fournis par ICE Futures Europe Méthodologe CDC Clmat Recherche puble chaque mos, en collaboraton avec Clmpact Metnext, Tendances Carbone, le bulletn mensuel d nformaton sur le marché européen du carbone (EU ETS). L obectf de cette publcaton

Plus en détail

Réseau RRFR pour la surveillance dynamique : application en e-maintenance.

Réseau RRFR pour la surveillance dynamique : application en e-maintenance. Réseau RRFR pour la survellance dynamue : applcaton en e-mantenance. RYAD ZEMOURI, DANIEL RACOCEANU, NOUREDDINE ZERHOUNI Laboratore Unverstare de Recherche en Producton Automatsée (LURPA) 6, avenue du

Plus en détail

GENESIS - Generalized System for Imputation Simulations (Système généralisé pour simuler l imputation)

GENESIS - Generalized System for Imputation Simulations (Système généralisé pour simuler l imputation) GENESS - Generalzed System for mputaton Smulatons (Système généralsé pour smuler l mputaton) GENESS est un système qu permet d exécuter des smulatons en présence d mputaton. L utlsateur fournt un ensemble

Plus en détail

Pourquoi LICIEL? Avec LICIEL passez à la vitesse supérieure EPROUVE TECHNICITE CONNECTE STABILITE SUIVIE COMMUNAUTE

Pourquoi LICIEL? Avec LICIEL passez à la vitesse supérieure EPROUVE TECHNICITE CONNECTE STABILITE SUIVIE COMMUNAUTE L og c el s de D agnos t c s I mmob l er s Cont ac t eznous 32BddeS t r as bougcs3010875468 Par scedex10tel. 0253354064Fax0278084116 ma l : s er v c e. c l ent @l c el. f r Pourquo LICIEL? Implanté sur

Plus en détail

STATISTIQUE AVEC EXCEL

STATISTIQUE AVEC EXCEL STATISTIQUE AVEC EXCEL Excel offre d nnombrables possbltés de recuellr des données statstques, de les classer, de les analyser et de les représenter graphquement. Ce sont prncpalement les tros éléments

Plus en détail

Exercices d Électrocinétique

Exercices d Électrocinétique ercces d Électrocnétque Intensté et densté de courant -1.1 Vtesse des porteurs de charges : On dssout une masse m = 20g de chlorure de sodum NaCl dans un bac électrolytque de longueur l = 20cm et de secton

Plus en détail

La Quantification du Risque Opérationnel des Institutions Bancaires

La Quantification du Risque Opérationnel des Institutions Bancaires HEC Montréal Afflée à l Unversté de Montréal La Quantfcaton du Rsque Opératonnel des Insttutons Bancares par Hela Dahen Département Fnance Thèse présentée à la Faculté des études supéreures en vue d obtenton

Plus en détail

Professionnel de santé équipé de Médiclick!

Professionnel de santé équipé de Médiclick! Professonnel de santé équpé de Médclck! Dosser Médcal Partagé en Aqutane Ce gude vous présente les prncpales fonctonnaltés réservées aux professonnels de santé membres du réseau AquDMP. Sommare Connexon

Plus en détail

1 Introduction. 2 Définitions des sources de tension et de courant : Cours. Date : A2 Analyser le système Conversion statique de l énergie. 2 h.

1 Introduction. 2 Définitions des sources de tension et de courant : Cours. Date : A2 Analyser le système Conversion statique de l énergie. 2 h. A2 Analyser le système Converson statque de l énerge Date : Nom : Cours 2 h 1 Introducton Un ConVertsseur Statque d énerge (CVS) est un montage utlsant des nterrupteurs à semconducteurs permettant par

Plus en détail

Calcul de tableaux d amortissement

Calcul de tableaux d amortissement Calcul de tableaux d amortssement 1 Tableau d amortssement Un emprunt est caractérsé par : une somme empruntée notée ; un taux annuel, en %, noté ; une pérodcté qu correspond à la fréquence de remboursement,

Plus en détail

Corrections adiabatiques et nonadiabatiques dans les systèmes diatomiques par calculs ab-initio

Corrections adiabatiques et nonadiabatiques dans les systèmes diatomiques par calculs ab-initio Correctons adabatques et nonadabatques dans les systèmes datomques par calculs ab-nto Compte rendu du traval réalsé dans le cadre d un stage de quatre mos au sen du Groupe de Spectroscope Moléculare et

Plus en détail

TD 1. Statistiques à une variable.

TD 1. Statistiques à une variable. Danel Abécasss. Année unverstare 2010/2011 Prépa-L1 TD de bostatstques. Exercce 1. On consdère la sére suvante : TD 1. Statstques à une varable. 1. Calculer la moyenne et l écart type. 2. Calculer la médane

Plus en détail

TABLE DES MATIERES CONTROLE D INTEGRITE AU SEIN DE LA RECHERCHE LOCALE DE LA POLICE LOCALE DE BRUXELLES-CAPITALE/IXELLES (DEUXIEME DISTRICT) 1

TABLE DES MATIERES CONTROLE D INTEGRITE AU SEIN DE LA RECHERCHE LOCALE DE LA POLICE LOCALE DE BRUXELLES-CAPITALE/IXELLES (DEUXIEME DISTRICT) 1 TABLE DES MATIERES CONTROLE D INTEGRITE AU SEIN DE LA RECHERCHE LOCALE DE LA POLICE LOCALE DE BRUXELLES-CAPITALE/IXELLES (DEUXIEME DISTRICT) 1 1. PROBLEMATIQUE 1 2. MISSION 1 3. ACTES D ENQUETE 2 4. ANALYSE

Plus en détail

BUREAU D'APPLICATION DES METHODES STATISTIQUES ET INFORMATIQUES

BUREAU D'APPLICATION DES METHODES STATISTIQUES ET INFORMATIQUES BUREAU DAPPLICATION DES METHODES STATISTIQUES ET INFORMATIQUES BAMSI REPRINT 04/2003 Introducton à l analyse des données Samuel AMBAPOUR BAMSSI I BAMSI B.P. 13734 Brazzavlle BAMSI REPRINT 04/2003 Introducton

Plus en détail

Page 5 TABLE DES MATIÈRES

Page 5 TABLE DES MATIÈRES Page 5 TABLE DES MATIÈRES CHAPITRE I LES POURCENTAGES 1. LES OBJECTIFS 12 2. LES DÉFINITIONS 14 1. La varaton absolue d'une grandeur 2. La varaton moyenne d'une grandeur (par unté de temps) 3. Le coeffcent

Plus en détail

Q x2 = 1 2. est dans l ensemble plus grand des rationnels Q. Continuons ainsi, l équation x 2 = 1 2

Q x2 = 1 2. est dans l ensemble plus grand des rationnels Q. Continuons ainsi, l équation x 2 = 1 2 Exo7 Nombres complexes Vdéo parte. Les nombres complexes, défntons et opératons Vdéo parte. Racnes carrées, équaton du second degré Vdéo parte 3. Argument et trgonométre Vdéo parte 4. Nombres complexes

Plus en détail

1.0 Probabilité vs statistique...1. 1.1 Expérience aléatoire et espace échantillonnal...1. 1.2 Événement...2

1.0 Probabilité vs statistique...1. 1.1 Expérience aléatoire et espace échantillonnal...1. 1.2 Événement...2 - robabltés - haptre : Introducton à la théore des probabltés.0 robablté vs statstque.... Expérence aléatore et espace échantllonnal.... Événement.... xomes défnton de probablté..... Quelques théorèmes

Plus en détail

Pro2030 GUIDE D UTILISATION. Français

Pro2030 GUIDE D UTILISATION. Français Pro2030 GUIDE D UTILISATION Franças Contents Garante... Introducton... 1 Artcle nº 605056 Rév C Schéma nº A605056 Novembre 2010 2010 YSI Incorporated. Le logo YSI est une marque déposée de YSI Incorporated.

Plus en détail

UNE ETUDE ECONOMÉTRIQUE DU NOMBRE D ACCIDENTS

UNE ETUDE ECONOMÉTRIQUE DU NOMBRE D ACCIDENTS BRUSSELS ECONOMIC REVIEW - CAHIERS ECONOMIQUES DE BRUXELLES VOL. 49 - N 2 SUMMER 2006 UNE ETUDE ECONOMÉTRIQUE DU NOMBRE D ACCIDENTS DANS LE SECTEUR DE L ASSURANCE AUTOMOBILE* MARÍA DEL CARMEN MELGAR**

Plus en détail

Surveillance temps-réel des systèmes Homme-Machine. Application à l assistance à la conduite automobile

Surveillance temps-réel des systèmes Homme-Machine. Application à l assistance à la conduite automobile Survellance temps-réel des systèmes Homme-Machne. Applcaton à l assstance à la condute automoble Mguel Gonzalez-Mendoza To cte ths verson: Mguel Gonzalez-Mendoza. Survellance temps-réel des systèmes Homme-Machne.

Plus en détail

Analyse des Performances et Modélisation d un Serveur Web

Analyse des Performances et Modélisation d un Serveur Web SETIT 2009 5 th Internatonal Conference: Scences of Electronc, Technologes of Informaton and Telecommuncatons March 22-26, 2009 TUNISIA Analyse des Performances et Modélsaton d un Serveur Web Fontane RAFAMANTANANTSOA*,

Plus en détail

IDEI Report # 18. Transport. December 2010. Elasticités de la demande de transport ferroviaire: définitions et mesures

IDEI Report # 18. Transport. December 2010. Elasticités de la demande de transport ferroviaire: définitions et mesures IDEI Report # 18 Transport December 2010 Elastctés de la demande de transport ferrovare: défntons et mesures Elastctés de la demande de transport ferrovare : Défntons et mesures Marc Ivald Toulouse School

Plus en détail

Be inspired. Numéro Vert. Via Caracciolo 20 20155 Milano tel. +39 02 365 22 990 fax +39 02 365 22 991

Be inspired. Numéro Vert. Via Caracciolo 20 20155 Milano tel. +39 02 365 22 990 fax +39 02 365 22 991 Ggaset SX353 / französsch / A31008-X353-P100-1-7719 / cover_0_hedelberg.fm / 03.12.2003 s Be nspred www.onedrect.fr www.onedrect.es www.onedrect.t www.onedrect.pt 0 800 72 4000 902 30 32 32 02 365 22 990

Plus en détail

Pour plus d'informations, veuillez nous contacter au 04.75.05.52.62. ou à contact@arclim.fr.

Pour plus d'informations, veuillez nous contacter au 04.75.05.52.62. ou à contact@arclim.fr. Régulaton Sondes & Capteurs Détente frgo électronque Supervson & GTC Humdfcaton & Déshu. Vannes & Servomoteurs Comptage eau, elec., énerge Ancens artcles Cette documentaton provent du ste www.arclm.eu

Plus en détail

Parlons. retraite. au service du «bien vieillir» L Assurance retraite. en chiffres* 639 192 retraités payés pour un montant de 4,2 milliards d euros

Parlons. retraite. au service du «bien vieillir» L Assurance retraite. en chiffres* 639 192 retraités payés pour un montant de 4,2 milliards d euros Édton Pays de la Lore Parlons La lettre aux retratés du régme général de la Sécurté socale 2012 retrate L Assurance retrate en chffres* 12,88 mllons de retratés 17,58 mllons de cotsants 346 000 bénéfcares

Plus en détail

Séparation de Sources par lissage cepstral des masques binaires

Séparation de Sources par lissage cepstral des masques binaires Séparaton de Sources par lssage cepstral des masques bnares Ibrahm Mssaou 1 Zed Lachr 1, 2 (1) École natonale d ngéneurs de Tuns, ENIT, BP. 37 Le Belvedere, 1002 Tuns, Tunse (2) Insttut natonal des scences

Plus en détail

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE. MEMOIRE Présentée à

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE. MEMOIRE Présentée à REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE MEMOIRE Présentée à L Unversté de Batna Faculté des Scences Département de Physque

Plus en détail

Table des Matières RÉSUMÉ ANALYTIQUE... 1 I. CONTEXTE... 2 1. La dette publique du Gouvernement... 2 2. Contexte institutionnel de gestion de la

Table des Matières RÉSUMÉ ANALYTIQUE... 1 I. CONTEXTE... 2 1. La dette publique du Gouvernement... 2 2. Contexte institutionnel de gestion de la Out ld éval uat on del aper f or manceen mat èr e degest on del adet t e (empa) Maur t an a Mar s2011 LeeMPA estunemét hodol og epouréval uerl aper f or manceenmat èr edegest on del adet t eàt r aver sunensembl

Plus en détail

CHAPITRE DEUX : FORMALISME GEOMETRIQUE

CHAPITRE DEUX : FORMALISME GEOMETRIQUE CHPITRE DEUX FORMLISME GEOMETRIQUE. CHPITRE DEUX : FORMLISME GEOMETRIQUE verson.3, -8 I. GEOMETRIE DNS L ESPCE-TEMPS ) Prncpe de relatvté Le prncpe de relatvté peut s exprmer ans : toutes les los physques

Plus en détail

santé Les arrêts de travail des séniors en emploi

santé Les arrêts de travail des séniors en emploi soldarté et DOSSIERS Les arrêts de traval des sénors en emplo N 2 2007 Les sénors en emplo se dstnguent-ls de leurs cadets en termes de recours aux arrêts de traval? Les sénors ne déclarent pas plus d

Plus en détail

GUIDE D ÉLABORATION D UN PLAN D INTERVENTION POUR LE RENOUVELLEMENT DES CONDUITES D EAU POTABLE, D ÉGOUTS ET DES CHAUSSÉES

GUIDE D ÉLABORATION D UN PLAN D INTERVENTION POUR LE RENOUVELLEMENT DES CONDUITES D EAU POTABLE, D ÉGOUTS ET DES CHAUSSÉES GUIDE D ÉLABORATION D UN PLAN D INTERVENTION POUR LE RENOUVELLEMENT DES CONDUITES D EAU POTABLE, D ÉGOUTS ET DES CHAUSSÉES Gude destné au mleu muncpal québécos NOVEMBRE 2013 Coordnaton : Martn Cormer,

Plus en détail

RAPPORT DE STAGE. Approcher la frontière d'une sous-partie de l'espace ainsi que la distance à cette frontière. Sujet : Master II : SIAD

RAPPORT DE STAGE. Approcher la frontière d'une sous-partie de l'espace ainsi que la distance à cette frontière. Sujet : Master II : SIAD UFR SCIENCES ET TECHNOLOGIES DEPARTEMENT DE MATHEMATIQUES ET INFORMATIQUE 63 177 AUBIERE CEDEX Année 2008-2009 Master II : SIAD RAPPORT DE STAGE Sujet : Approcher la frontère d'une sous-parte de l'espace

Plus en détail

Calculer le coût amorti d une obligation sur chaque exercice et présenter les écritures dans les comptes individuels de la société Plumeria.

Calculer le coût amorti d une obligation sur chaque exercice et présenter les écritures dans les comptes individuels de la société Plumeria. 1 CAS nédt d applcaton sur les normes IAS/IFRS Coût amort sur oblgatons à taux varable ou révsable La socété Plumera présente ses comptes annuels dans le référentel IFRS. Elle détent dans son portefeulle

Plus en détail

1. Les enjeux de la prévision du risque de défaut de paiement

1. Les enjeux de la prévision du risque de défaut de paiement Scorng sur données d entreprses : nstrument de dagnostc ndvduel et outl d analyse de portefeulle d une clentèle Mrelle Bardos Ancen chef de servce de l Observatore des entreprses de la Banque de France

Plus en détail

Prêt de groupe et sanction sociale Group lending and social fine

Prêt de groupe et sanction sociale Group lending and social fine Prêt de roupe et sancton socale Group lendn and socal fne Davd Alary Résumé Dans cet artcle, nous présentons un modèle d antsélecton sur un marché concurrentel du crédt. Nous consdérons l ntroducton de

Plus en détail

Paquets. Paquets nationaux 1. Paquets internationaux 11

Paquets. Paquets nationaux 1. Paquets internationaux 11 Paquets Paquets natonaux 1 Paquets nternatonaux 11 Paquets natonaux Servces & optons 1 Créaton 3 1. Dmensons, pods & épasseurs 3 2. Présentaton des paquets 4 2.1. Face avant du paquet 4 2.2. Comment obtenr

Plus en détail

P R I S E E N M A I N R A P I D E O L I V E 4 H D

P R I S E E N M A I N R A P I D E O L I V E 4 H D P R I S E E N M A I N R A P I D E O L I V E 4 H D Sommare 1 2 2.1 2.2 2.3 3 3.1 3.2 3.3 4 4.1 4.2 4.3 4.4 4.5 4.6 5 6 7 7.1 7.2 7.3 8 8.1 8.2 8.3 8.4 8.5 8.6 Contenu du carton... 4 Paramétrage... 4 Connexon

Plus en détail

Thermodynamique statistique Master Chimie Université d Aix-Marseille. Bogdan Kuchta

Thermodynamique statistique Master Chimie Université d Aix-Marseille. Bogdan Kuchta hermodynamque statstque Master Chme Unversté d Ax-Marselle Bogdan Kuchta Plan: Rappel: thermodynamque phénoménologque (dscuter l entrope, l évoluton de gaz parfat,) Premer prncpe Deuxème prncpe (transformaton

Plus en détail

Le Prêt Efficience Fioul

Le Prêt Efficience Fioul Le Prêt Effcence Foul EMPRUNTEUR M. Mme CO-EMPRUNTEUR M. Mlle Mme Mlle (CONJOINT, PACSÉ, CONCUBIN ) Départ. de nass. Nature de la pèce d dentté : Natonalté : CNI Passeport Ttre de séjour N : Salaré Stuaton

Plus en détail

THESE. Khalid LEKOUCH

THESE. Khalid LEKOUCH N d ordre : /2012 THESE Présentée à la FACULTE DES SCIENCES D AGADIR En vue de l obtenton du GRADE DE DOCTEUR EN PHYSIQUE (Spécalté : Energétque, Thermque et Métrologe) Par Khald LEKOUCH MODELISATION ET

Plus en détail

Une analyse économique et expérimentale de la fraude à l assurance et de l audit

Une analyse économique et expérimentale de la fraude à l assurance et de l audit Une analyse économque et expérmentale de la fraude à l assurance et de l audt Sameh Borg To cte ths verson: Sameh Borg. Une analyse économque et expérmentale de la fraude à l assurance et de l audt. Economes

Plus en détail

UNIVERSITÉ DU QUÉBEC À MONTRÉAL L ASSURANCE AUTOMOBILE AU QUÉBEC : UNE PRIME SELON LE COÛT SOCIAL MARGINAL MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE

UNIVERSITÉ DU QUÉBEC À MONTRÉAL L ASSURANCE AUTOMOBILE AU QUÉBEC : UNE PRIME SELON LE COÛT SOCIAL MARGINAL MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE UNIVERSITÉ DU QUÉBEC À MONTRÉAL L ASSURANCE AUTOMOBILE AU QUÉBEC : UNE PRIME SELON LE COÛT SOCIAL MARGINAL MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE DE LA MAÎTRISE EN ÉCONOMIQUE PAR ERIC LÉVESQUE JANVIER

Plus en détail

Comparative performance for isolated points detection operators: application on surface defects extraction

Comparative performance for isolated points detection operators: application on surface defects extraction Comparatve performance for solate ponts etecton operators: applcaton on surface efects extracton R. Seuln, G. Delcrox, F. Merenne Laboratore Le2-12, Rue e la Fonere - 71200 Le Creusot - FRANCE e-mal: ralph.seuln@utlecreusot.u-bourgogne.fr

Plus en détail

LE RÉGIME DE RETRAITE DU PERSONNEL CANADIEN DE LA CANADA-VIE (le «régime») INFORMATION IMPORTANTE CONCERNANT LE RECOURS COLLECTIF

LE RÉGIME DE RETRAITE DU PERSONNEL CANADIEN DE LA CANADA-VIE (le «régime») INFORMATION IMPORTANTE CONCERNANT LE RECOURS COLLECTIF 1 LE RÉGIME DE RETRAITE DU PERSONNEL CANADIEN DE LA CANADA-VIE (le «régme») INFORMATION IMPORTANTE CONCERNANT LE RECOURS COLLECTIF AVIS AUX RETRAITÉS ET AUX PARTICIPANTS AVEC DROITS ACQUIS DIFFÉRÉS Expédteurs

Plus en détail

Faire des régimes TNS les laboratoires de la protection sociale de demain appelle des évolutions à deux niveaux :

Faire des régimes TNS les laboratoires de la protection sociale de demain appelle des évolutions à deux niveaux : Réformer en profondeur la protecton socale des TNS pour la rendre plus effcace Résumé de notre proposton : Fare des régmes TNS les laboratores de la protecton socale de deman appelle des évolutons à deux

Plus en détail

AVERTISSEMENT. Contact SCD INPL: mailto:scdinpl@inpl-nancy.fr LIENS

AVERTISSEMENT. Contact SCD INPL: mailto:scdinpl@inpl-nancy.fr LIENS AVERTISSEMENT Ce document est le frut d un long traval approuvé par le jury de soutenance et ms à dsposton de l ensemble de la communauté unverstare élarge. Il est soums à la proprété ntellectuelle de

Plus en détail

RÉSUMÉ ANALYTIQUE... 1

RÉSUMÉ ANALYTIQUE... 1 Out ld éval uat on del aper f or manceen mat èr e degest on del adet t e (DeMPA) Républ quedu Sénégal Ma2010 LeDeMPA estunemét hodol og epouréval uerl aper f or manceenmat èr edegest on del adet t eàt

Plus en détail

LA SURVIE DES ENTREPRISES DÉPEND-ELLE DU TERRITOIRE D'IMPLANTATION?

LA SURVIE DES ENTREPRISES DÉPEND-ELLE DU TERRITOIRE D'IMPLANTATION? LA SURVIE DES ENTREPRISES DÉPEND-ELLE DU TERRITOIRE D'IMPLANTATION? Anne PERRAUD (CRÉDOC) Phlppe MOATI (CRÉDOC Unversté Pars) Nadège COUVERT (ENSAE) INTRODUCTION Au cours des dernères années, de nombreux

Plus en détail

Calculs des convertisseurs en l'electronique de Puissance

Calculs des convertisseurs en l'electronique de Puissance Calculs des conertsseurs en l'electronque de Pussance Projet : PROGRAMMAON ate : 14 arl Auteur : herry EQUEU. EQUEU 1, rue Jules Massenet 37 OURS el 47 5 93 64 herry EQUEU Jun [V37] Fcher : ESGN.OC Calculs

Plus en détail

Pratique de la statistique avec SPSS

Pratique de la statistique avec SPSS Pratque de la statstque avec SPSS SUPPORT Transparents ultéreurement amélorés et ms à jour sur le ste du SMCS LIENS UTILES Ste du SMCS (Support en Méthodologe et Calcul Statstque) : http://www.stat.ucl.ac.be/smcs/

Plus en détail

Impôt sur la fortune et investissement dans les PME Professeur Didier MAILLARD

Impôt sur la fortune et investissement dans les PME Professeur Didier MAILLARD Conservatore atonal des Arts et Méters Chare de BAQUE Document de recherche n 9 Impôt sur la fortune et nvestssement dans les PME Professeur Dder MAILLARD Avertssement ovembre 2007 La chare de Banque du

Plus en détail

ErP : éco-conception et étiquetage énergétique. Les solutions Vaillant. Pour dépasser la performance. La satisfaction de faire le bon choix.

ErP : éco-conception et étiquetage énergétique. Les solutions Vaillant. Pour dépasser la performance. La satisfaction de faire le bon choix. ErP : éco-concepton et étquetage énergétque Les solutons Vallant Pour dépasser la performance La satsfacton de fare le bon chox. ErP : éco-concepton et étquetage énergétque Eco-concepton et Etquetage

Plus en détail

Driss HARRIZI. MOTS CLES : contrôle de gestion - système d'éducation et de formation système d information - établissement public.

Driss HARRIZI. MOTS CLES : contrôle de gestion - système d'éducation et de formation système d information - établissement public. Ver sunenouvel l ecul t ur emanagér al e:mét hodol og e dem seenpl aced unsyst èmedecont r ôl edegest on dansunét abl ssementpubl c Casd uneacadém er ég onal ed éducat onetde f or mat on. Aut eur s:dr

Plus en détail

TRAVAUX PRATIQUES SPECTRO- COLORIMETRIE

TRAVAUX PRATIQUES SPECTRO- COLORIMETRIE UNIVERSITE MONTPELLIER 2 Département de Physque TRAVAUX PRATIQUES DE SPECTRO- COLORIMETRIE F. GENIET 2 INTRODUCTION Cet ensegnement de travaux pratques de seconde année se propose de revor rapdement l'aspect

Plus en détail

PREMIERS PAS en REGRESSION LINEAIRE avec SAS. Josiane Confais (UPMC-ISUP) - Monique Le Guen (CNRS-CES-MATISSE- UMR8174)

PREMIERS PAS en REGRESSION LINEAIRE avec SAS. Josiane Confais (UPMC-ISUP) - Monique Le Guen (CNRS-CES-MATISSE- UMR8174) PREMIERS PAS en REGRESSION LINEAIRE avec SAS Josane Confas (UPMC-ISUP) - Monque Le Guen (CNRS-CES-MATISSE- UMR874) e-mal : confas@ccr.jusseu.fr e-mal : monque.leguen@unv-pars.fr Résumé Ce tutorel accessble

Plus en détail

Les méthodes numériques de la dynamique moléculaire

Les méthodes numériques de la dynamique moléculaire Les méthodes numérques de la dynamque moléculare Chrstophe Chpot Equpe de chme et & bochme théorques, Unté Mxte de Recherche CNRS/UHP 7565, Insttut Nancéen de Chme Moléculare, Unversté Henr Poncaré, B.P.

Plus en détail

MEMOIRE. Présenté au département des sciences de la matière Faculté des sciences

MEMOIRE. Présenté au département des sciences de la matière Faculté des sciences REPUBLIQUE LERIEN DEMOCRTIQUE ET POPULIRE Mnstère de l ensegnement supéreur et de la recherche scentfque Unversté El-Hadj Lakhdar-BTN- MEMOIRE Présenté au département des scences de la matère Faculté des

Plus en détail

Mots-clés : Système multicapteurs, Réseau local, Réseaux de neurones, Supervision, Domotique. xigences système d'une nouvelle

Mots-clés : Système multicapteurs, Réseau local, Réseaux de neurones, Supervision, Domotique. xigences système d'une nouvelle Mots-clés : xgences système d'une nouvelle fonctonnalté dans l'habtat ndvduel : cas de la survellance Système multcapteurs, Réseau local, Réseaux de neurones, Supervson, Domotque. des personnes âgées et

Plus en détail

EURIsCO. Cahiers de recherche. Cahier n 2008-05. L épargne des ménages au Maroc : Une analyse macroéconomique et microéconomique.

EURIsCO. Cahiers de recherche. Cahier n 2008-05. L épargne des ménages au Maroc : Une analyse macroéconomique et microéconomique. Cahers de recherche EURIsCO Caher n 2008-05 L épargne des ménages au Maroc : Une analyse macroéconomque et mcroéconomque Rapport d étude Najat El Mekkaou de Fretas (coordnateur) Eursco Unversté Pars Dauphne

Plus en détail

master Objectif Université d Auvergne - Université Blaise Pascal Rentrée 2014 AUVERGNE

master Objectif Université d Auvergne - Université Blaise Pascal Rentrée 2014 AUVERGNE entrée 2014 Objectf master Unversté d Auvergne - Unversté Blase ascal Certans masters sont cohabltés avec d autres établssements d ensegnement supéreur mnstère de l éducaton natonale, de l ensegnement

Plus en détail

- Acquisition de signaux en sismologie large bande. - Acquisition de signaux lents, magnétisme, MT.

- Acquisition de signaux en sismologie large bande. - Acquisition de signaux lents, magnétisme, MT. 87 DUCAPTEURAUXEANQUESDEDONNEES. TECHNQUES D'NSTRUMENTATON EN GEOPEY8QUE. J:M. CANTN Unversté Lous Pasteur (Strasbourg 1) nsttut de Physque du Globe de Strasbourg Ecole et Observatore de Physque du Globe.

Plus en détail

La théorie classique de l information. 1 ère partie : le point de vue de Kolmogorov.

La théorie classique de l information. 1 ère partie : le point de vue de Kolmogorov. La théore classque de l nformaton. ère parte : le pont de vue de Kolmogorov. La sute de caractères comme outl de descrpton des systèmes. La scence peut être vue comme l art de compresser les données quelles

Plus en détail