Recherche d information textuelle
|
|
- Adam Sylvain
- il y a 8 ans
- Total affichages :
Transcription
1 Recherche d nformaton textuelle LIP6 Unversté Pars 6 Patrck.Gallnar@lp6.fr www-connex.lp6.fr/~gallnar/ Master Informatque M2 : Apprentssage pour la recherche d'nformaton textuelle et multméda Recherche d'nformaton textuelle 1
2 Plan Introducton Recherche d nformaton textuelle Notons de base, modèles de recherche Corpus et documents structurés Recherche d'nformaton textuelle 2
3 Introducton Recherche d'nformaton textuelle 3
4 Problèmes de l accès à l nformaton Représentaton - ndexaton, cf W3C, MPEG7 non structuré (texte, mage), sem structuré (BD, balses, métadescrpton) Technques d accès - modèle de recherche présenter un ensemble de documents selon un ordre de pertnence, présenter un unque document,.. Interacton utlsateur feedback, recherche nteractve Adaptaton à l utlsateur modélser le comportement, mémore des demandes, Stockage quantté de données (tera), stockage dstrbué Recherche d'nformaton textuelle 4
5 Dversté des sources d nformaton Texte artcles (pdf, ps, ) lvres pages HTML, XML Images, Vdeo, Son, Musque Web (pages, stes, blogs etc), Messageres - fls de dscusson, etc Recherche d'nformaton textuelle 5
6 Dversté des demandes d accès à l nformaton Consultaton (browsng) Requêtes booléennes Recherche par le contenu Recherche nteractve Recherche automatque (e.g. robots) Recherche BD Recherche d'nformaton textuelle 6
7 Informaton textuelle Bases de données textes Bblothèques électronques Journaux (Le Monde, Wall Street Journal,...) Bases d'artcles Web Moyen d'accès, e.g. BD textes Source d'nformaton dynamque : stes, pages, % de l'nformaton présente sur le Web est sous forme textuelle Informaton majortarement non structurée, mas structures explotables (HTML, SGML, XML), hérarches,... Recherche d'nformaton textuelle 7
8 Los de pussance Lo de Zpf Caractérse la fréquence d occurrence en foncton du rang Emprquement : fréquence.rang = cte Le 1 er mot est envron 2 fos plus fréquent que le 2 nd qu est 2 fos plus fréquent que le 3 e etc Brown Corpus ( > 1 M mots) Mot Rang Fréquence % the % of % and % Implcatons Quelques mots communs représentent la plus grande parte des textes (stopwords) Recherche d'nformaton textuelle 8
9 Expresson formelle : f ( r, s, N) = log( f r : rang 1/ r n= 1 log N : talle du corpus N ) = log r s n= 1 s : paramètre qu dépend du corpus En anglas s 1,.e. f.r 1 s 1/ n s N 1/ n s N = 10, log fréquence vs log rang (Wkpeda) Recherche d'nformaton textuelle 9
10 Autres phénomènes suvant une lo de pussance à la Zpf (Fréquence vs rang) Fréquence d accès des pages web Populaton des vlles Trafc nternet par ste Noms dans une populaton etc Recherche d'nformaton textuelle 10
11 Lo de Heaps Caractérse le nombre de mots dstncts dans un document β V = Kn V : talle du vocabulare n : talle du texte K,B paramètres dépendant du texte Anglas K entre 10 et 100 et B entre 0.4 et 0.6 Crossance sous lnéare du vocabulare en foncton de la talle du texte ou du corpus V en foncton de n (Wkpeda) Recherche d'nformaton textuelle 11
12 Exemples de tâches Trouver parm un ensemble d'artcles ceux qu concernent un sujet spécfque : pertnence d'un document? Fare un résumé du contenu d'un document ou d un ensemble de documents (éventuellement sur un sujet) Structuraton (classfcaton) automatque d'un ensemble de documents (groupes) Trouver dans un document les passages pertnents, les nformatons pertnentes concernant un sujet (mots - phrases) Suvre dans une collecton d'artcles l'évoluton d'un sujet, Changements de sujets Velle scentfque - technque, Surveller la concurrence Guetter l'arrvée d'nformatons (appels d'offre, CFP, nouveaux produts,...) Daloguer avec les clents (e.g. Hot Lne, réclamatons,...)... Recherche d'nformaton textuelle 12
13 Recherche d nformaton textuelle Recherche d'nformaton textuelle 13
14 Recherche d nformaton Requêtes ouvertes Requête/ Classe Documents d Processus 3 étapes prncpales Modèles hypothèses : Sac de mots, Indépendance des termes Logque Vectorel Probablste Langage Réseaux bayesens Croyances etc INDEXATION Normalsaton Représentaton des Termes Sélecton de Varables / Projecton Représentaton du Document / Requête q=(q 1,...q n ) d =(d 1,...d n ) MATCHING + RETRIEVAL score RSV(d, q) lste des documents (feedback) USER Recherche d'nformaton textuelle 14
15 Text Retreval Conferences-TREC TREC 2006 Blog Track: explore nformaton seekng behavor n the blogosphere. Enterprse Track: study enterprse search: satsfyng a user who s searchng the data of an organzaton to complete some task. Genomcs Track: study retreval tasks n a specfc doman(nclude not just gene sequences but also supportng documentaton such as research papers, lab reports, etc.) Legal Track: develop search technology that meets the needs of lawyers to engage n effectve dscovery n dgtal document collectons. Queston Answerng Track: take a step closer to nformaton retreval rather than document retreval. SPAM Track: standard evaluaton of current and proposed spam flterng approaches, layng the foundaton for the evaluaton of more general emal flterng and retreval tasks. Terabyte Track: nvestgate whether/how the IR communty can scale tradtonal IR test-collecton-based evaluaton to sgnfcantly larger document collectons than those currently used n TREC. Recherche d'nformaton textuelle 15
16 Past tracks Cross-Language Track nvestgates the ablty of retreval systems to fnd documents that pertan to a topc regardless of the language n whch the document s wrtten. Flterng Track the user's nformaton need s stable (and some relevant documents are known) but there s a stream of new documents. For each document, the system must make a bnary decson as to whether the document should be retreved Interactve Track studyng user nteracton wth text retreval systems. studes wth real users usng a common collecton and set of user queres. Novelty Track nvestgate systems' abltes to locate new (.e., nonredundant) nformaton. Robust Retreval Track ncludes a tradtonal ad hoc retreval task task, but wth the focus on ndvdual topc effectveness rather than average effectveness. Vdeo Track research n automatc segmentaton, ndexng, and content-based retreval of dgtal vdeo. The track became an ndependent evaluaton (TRECVID). Web Track search tasks on a document set that s a snapshot of the World Wde Web. Last ran n TREC Recherche d'nformaton textuelle 16
17 RD : notons de base Requête : expresson en texte "lbre" formulée par l'utlsateur e.g. "text mnng", "je voudras trouver des documents qu parlent de...", paragraphes enters,. Document : texte, abstract, passage de texte, texte + structure (e.g. balses HTML : ttres, paragraphes,...)... Corpus : ensemble de documents textuels (statque ou dynamque), éventuellement lens entre documents. Talle : 10 3, 10 6, 10 9 Catégore : lste de mots clé Recherche d'nformaton textuelle 17
18 RD : Prétratement et représentaton des textes : le processus d ndexaton Analyse lexcale Converson du texte en un ensemble de termes Unté lexcale ou radcal Espaces, chffres, ponctuatons, etc Quelles untés conserver pour l'ndexaton? Stop words - ant-dctonnare Les mots les plus fréquents de la langue "stop words" n'apportent pas d'nformaton utle e.g. prépostons, pronoms, mots «athématques»,.. (peut représenter jusqu'à 30 ou 50% d'un texte) Ces "stop words" peuvent être dépendant d'un domane ou pas L'ensemble des mots élmnés est conservé dans un ant-dctonnare (e.g. 500 mots). Les mots les plus fréquents ou les plus rares dans un corpus (frequency cut-off ) Les connassances sémantques permettent également d'élmner des mots Technques de sélecton de caractérstques Recherche d'nformaton textuelle 18
19 Stoplst - exemple a about above accordngly after agan aganst ah all also although always am an and and/or any anymore anyone are as at away b be been begn begnnng begnnngs begns begone begun beng below between but by was we were what whatever when where whch whle who whom whomeve r whose why wth wthn wthout would yes your yours yourself yourselve s Recherche d'nformaton textuelle 19
20 Prétratement et représentaton des textes (2) Normalsaton (lemmatsaton) Utlsaton d'une forme canonque pour représenter les varantes morphologques d'un mot e.g. dynamc, dynamcs, dynamcally,...seront représentés par un même mot, navguer, navguant, navre...dem Augmente le rappel, peut dmnuer la précson Technques (exemples) : systèmes tératfs à base de règles smples (e.g. pour l anglas Porter stemmng -largement employé) : on établ une lste de suffxes et de préfxes qu sont élmnés tératvement. méthodes à base de dctonnares mot - forme canonque. Intérêt : langue présentant une forte dversté lexcale (e.g. franças) Regroupement de mots smlares au sens d'un crtère numérque Recherche d'nformaton textuelle 20
21 Prétratement et représentaton des textes (3) La pondératon des termes Mesure l mportance d un terme dans un document Comment représenter au meux le contenu d un document? Consdératons statstques, parfos lngustques Lo de Zpf : élmnaton des termes trop fréquents ou trop rares Facteurs de pondératon E.g. tf (pondératon locale), df (pondératon globale) Normalsaton : prse en compte de la longueur des documents, etc Recherche d'nformaton textuelle 21
22 Prétratement et représentaton des textes (4) :Implémentaton des ndex Technque la plus fréquente : ndex nversé chaque terme de l'ndex est décrt par le numéro de référence de tous les documents qu contennent ce terme et la poston dans ce document du terme. Permet une accélératon consdérable de la recherche pour une requête. Cet ndex peut être ordonné en foncton décrossante de le fréquence des termes. Implémentaton : dfférentes structures de données tres (stockage des chaînes de caractère dans des arbres) retrouve une chaîne de caractère en temps proportonnel à sa longueur Table de hashage, etc Recherche d'nformaton textuelle 22
23 Prétratement et représentaton des textes (5) Représentatons : booléenne : exstence des termes (fréquent en catégorsaton) réelle : fréquence des termes, locale (pr à un texte), globale (pr à un ens de textes), relatve à la longueur du texte. Sélecton de caractérstques Projectons : réducton supplémentare (SVD, ACP,...) Recherche d'nformaton textuelle 23
24 Modèles de recherche hypothèse de base Plus la requête et le document ont de mots en commun, plus grande sera la pertnence du document Plus la requête et le document ont une dstrbuton de termes smlare, plus grande sera la pertnence du document Recherche d'nformaton textuelle 24
25 Les classques modèle booléen Modèle ponner recherche de documents s'apparant de façon exacte avec la requête. Requête = expresson logque ET..OU..NON. Transparent pour l utlsateur, rapde (web) Rgde, non robuste, pas de pondératon de l'mportance des termes,.. modèle vectorel recherche de documents possédant un fort degré de smlarté avec la requête Permet d ordonner les documents Expresson du beson : requête en langage naturel Rq : sur le web, la requête moyenne est de 2,5 mots clé! modèle probablste probablté qu'un document sot pertnent pour la requête Qualtés : dem modèle vectorel Recherche d'nformaton textuelle 25
26 Modèle vectorel Recherche d'nformaton textuelle 26
27 Modèle vectorel Espace de caractérstques ϕ, = 1...n.e. termes sélectonnés pré-tratés Représentaton des documents - requêtes : vecteur de pods dans l'espace des caractérstques document: d=(x 0,..., x n-1 ) requête: q =(y 0,,..., y n-1 ) x k pods de la caractérstque k dans le document d, e.g. présence-absence, fréquence du terme dans le document, dans la collecton (cf. df) mportance du terme pour la recherche facteurs de normalsaton (longueur du document) Les mots sont supposés ndépendants Recherche d'nformaton textuelle 27
28 Modèle vectorel (2) Avantages les documents sont évalués sur une échelle contnue l'mportance des termes est pondérée permet de trater du texte lbre Inconvénents hypothèse d'ndépendance des termes ntalement conçu pour des documents courts, pour des documents longs, facteurs de normalsaton, approches hérarchques par paragraphes (sélecton de paragraphes pertnents + combnason des scores des paragraphes) Recherche d'nformaton textuelle 28
29 Une méthode de référence tf-df Term frequency - nverse document frequency (tf-df) x = tf ( ϕ, d ) df ( ϕ ) tf(ϕ,d): # occurrences de ϕ dans le document d df(ϕ ) : # documents contenant ϕ df(ϕ ) : fréquence nverse df décrot vers 0 s ϕ apparaît dans tous les documents Mesure de smlarté entre q et d (e.g. Salton) Nombreuses autres pondératons et smlartés. RSV 1+ N df ( ϕ = ) log 1+ df ( ϕ) cos ( d, q) = n 1 = 0 n 1 = 0 x y n 1 2 x y = 0 2 Recherche d'nformaton textuelle 29
30 Recherche nteractve Méthode classque : relevance feedback r réponses ordonnées relevance : v. a. dans {0, 1} dée : utlsateur examne une parte des melleurs documents et les étquette 1/0 la requête est reformulée (enrchssement) + utlsateur nouvelle requète nouvelle recherche Recherche d'nformaton textuelle 30
31 Recherche nteractve Lste ordonnée des r melleurs documents { d, d } D,..., r ( q) = 1 2 d r Partton de ces r documents (ou d'une parte) par l'utlsateur rel r nonrel D ( q) = D ( q) D ( q) r r Prncpe du relevance feedback q ' = f rel ( q, D r, D nonrel r ) Recherche d'nformaton textuelle 31
32 Recherche nteractve-exemple Query expanson : reestmaton des pods de la requête - Roccho 1971 (heurstque) réestmaton de la requête : q q' = α q améloratons allant de 20% a 80 % par rapport à sans RF. Dfférentes varantes : + consdérer D β rel r optmser α et β d j D nonrel D r rel r d d = j j optmser le nombre de documents du feedback... D γ nonrel r d j D nonrel r d d j j Recherche d'nformaton textuelle 32
33 Automatc query expanson pas de feedback utlsateur, les k premers documents sont consdérés comme pertnents Marche meux quand la dstrbuton de rel D r est unmodale, cas multmodal rsque de dsparton des modes non prncpaux Le système va fournr des documents smlares à ceux déjà trouvés Recherche d'nformaton textuelle 33
34 Recherche nteractve Exemple 2 Reestmaton de Robertson et Sparck-Jones (1976) (codage bnare) RSV ( q, d ) = n 1 = 0 x y x y = = 1 s ϕ d j 0 snon p (1 log q (1 0 snon q p ) ) s ϕ q avec : p = # documents d dans # documents D d j rel r contenant dans D rel r ϕ q = # documents d dans # documents D d j nonrel r dans contenant D nonrel r ϕ p : P(doc pertnent content le terme ϕ de la requête) q : P(doc non pertnent content le terme ϕ de la requête) Recherche d'nformaton textuelle 34
35 Recherche d'nformaton textuelle 35 Recherche nteractve Justfcaton Robertson et Sparck-Jones, x = 0 ou 1 (présence / absence du terme dans d) foncton de décson : ),..., ( 1 n x x d = ) / 1 ( ) / 1 ( R x P q R x P p = = = = x x x x q q R d p p p R d p = = 1 1 ) (1 ) / ( ) (1 ) / ( cte p q q p R d p R d p + = ) (1 ) (1 log ) / ( ) / ( log
36 Modèle probablste Recherche d'nformaton textuelle 36
37 Recherche d'nformaton textuelle 37 Modèle probablste Probablty Rankng Prncple (Robertson 77) présenter les documents à l utlsateur selon l ordre décrossant de leur probablté de pertnence P(R/q,d) est optmal (pour le coût, la précson, le rappel..) 2 événements R : d est pertnent pour q R : d n est pas pertnent pour q Calcul de P(R/d) Indépendance des caractérstques ) ( ) ( ) / ( ) / ( d P R P R d P d R P = ) ( ) ( log ) / ( ) / ( log ) / ( ) / ( log R P R P R d P R d P d R P d R P + = = R p R d P ) / ( ) / ( ϕ = R p R p q d RSV ) / ( ) / ( log ), ( ϕ ϕ ) / ( ) / ( log ), ( R d P R d P q d RSV =
38 Recherche d'nformaton textuelle 38 Modèle probablste Ne pas tenr compte des attrbuts absents : Nombreuses varantes / extensons Problèmes longueur des documents (hypothèse mplcte d égale longueur) expanson des requêtes # doc pertnents consdérés (e.g. cas recherche on lne <> off lne cooccurrence de termes, prse en compte de «phrases»... = = = R p R p R p R p q d RSV ) 0/ ( ) 0/ ( log ) / ( ) / ( log ), ( ϕ ϕ ϕ ϕ = d q p q q p q d RSV ϕ ) (1 ) (1 log ), ( ) / ( ) / ( R P q R P p = = ϕ ϕ
39 Okap - Un système «probablste» (Robertson et al.) w (tf) pour k1 = 1.2 et b = 0 Term Frequency tf ( k + 1) w ( tf t t ) = 1 K + tf t K = k1 *((1 b) + b( DL / AVDL)) 2,5 2 1,5 1 0, t f Prse en compte de la longueur des documents DL : longueur du document AVDL : longueur moyenne des docs. k1 et b constantes e.g. k1 = 1.2, b = 0.75 Recherche d'nformaton textuelle 39
40 Okap (2) Inverse Document Frequency Pas d nformaton de pertnence sur les documents Informaton de pertnence sur les documents " df " = log N n t ( r + 0.5)( ) " " = log t N nt R r df t ( R r + 0.5)( n r + 0.5) t t t Relevant Non Relevant total Content le terme t r n - r n Ne content pas le terme t R - r N n R + r N - n total R N - R N Recherche d'nformaton textuelle 40
41 Okap (3) Score du document d pour la requête q Score Okap = t q tf t, d K ( k + 1 tf + t, d 1) *" df ( t )" Automatc RF Sélectonner comme pertnents les B premer documents renvoyés, tous les autres sont non pertnents Calculer des pods pour les termes de ces documents Ajouter les pods à la requête pour les x (e.g x = 20) melleur termes " df " = log ( rt + 0.5)( N nt B + rt + 0.5) ( B r + 0.5)( n r + 0.5) t t t Recherche d'nformaton textuelle 41
42 Modèles de langage Recherche d'nformaton textuelle 42
43 Modèles de langage (Ponte, Croft, Hemstra, ) Varables d : document que l utlsateur a en tête t : eme terme de la requête I {0,1} mportance du e terme de la requête 1 : mportant, 0 : pas mportant Consdérons une requête de n termes t 1,, t n Les documents seront ordonnés selon la pertnence du document pour la requête : Score d un document : P( d t1,.., tn) P ( t 1,.., t d On a alors un modèle statstque par document n ) Recherche d'nformaton textuelle 43
44 Hypothèse : ndépendence des termes de la requête condtonnellement à leur mportance La foncton de score devent P( t n 1,.., tn d) = p( I = k) p( t / I = k, d) = 1 k = 0, 1 P( t1,..., tn d) = (1 λ ) p( t ) + λ p( t / d) = 1 Avec p(t/d) = p(t/i = 1,d) et p(t) = p(t/i=0) n Recherche d'nformaton textuelle 44
45 Modèles de langage Apprentssage Dfférents estmateurs possbles, le plus courant : maxmum de vrasemblance exemple : p( d) = p( t λ = p(i = 1) / I 1 # documents = 1, d) = tf ( t, d) tf ( t, d) t = 0) = Les λ sont estmés par EM en maxmsant la vrasemblance des documents pertnents et des requêtes assocées. p( t / I d ' d ', t tf ( t, d') tf ( t, d') Recherche d'nformaton textuelle 45
46 HMMs (BBN Mller et al. 99) score : p(q /R, d) q et d sont des varables aléatores q est l observaton, 1 modèle HMM par document TREC 6, 7, ~500 k docs, 50 requêtes Le modèle ncorpore naturellement les statstques sur les termes, la longueur des documents Modèle de base : P(q t /GE ) Général Englsh Start q a 0 a 1 P(q t /d) End q Document p q / d relevant) = ( a p( q / GE) + a p( q / d)) ( 0 t 1 t Recherche d'nformaton textuelle 46 t
47 Réseaux Bayesens Recherche d'nformaton textuelle 47
48 Bayesan Inference Network (Turtle, Croft 91 Inquery) varables bnares, Relevance : p(q = 1, d = 1) d d t 1 t 2 t 3 t n d = 1 evenement on observe d q = 1 la requête est satsfate q I and/or p( q q p( t / d) = = 1, d = 1) = p( t Recherche d'nformaton textuelle 48 all / d) / = 1 / t = 0 t Pour dfférents prors et P(node/parents) on retrouve les modèles booleens ou probablstes p( q / t). p( t / d). p( d) t p( t / d)
49 Réducton de dmenson Latent Semantc Indexng (LSI/LSA) Décomposton en valeur sngulère d'une matrce A m*n de rang r Σ: dagonale, racnes carrées des valeurs propres de AA T U : vecteurs propres de AA T V : vecteurs propres de A T A Proprétés Im (A) : span(u1,..., ur), Ker (A) : span(vr+1,..., vn) Sot k < r A = U Σ V T Mn B / rk( B)= k A B = A Ak A k = k = 1 u σ v T = U k Σ k V T k U et V sont orthogonales Recherche d'nformaton textuelle 49
50 LSI Matrce terme documents : terme * docs documents A = [a j ] termes a j = tf-df, ou 0/1 projecton de la matrce terme - documents: A k Interprétaton U : base des termes dans le nouvel espace Vecteurs propres de la matrce de cooccurrence des termes V : base des documents dans le nouvel espace Vecteurs propres de la matrce de cooccurrence des documents Recherche d'nformaton textuelle 50
51 Représentaton d'une requête ou d'un document dans l'espace des termes : 1 = q T U kσk Les termes qu cooccurent fréquemment sont projetés au même «endrot» q' dem pour la projecton dans l'espace des documents avec V Calcul de la smlarté : RSV ( q', d' ) cos Recherche d'nformaton textuelle 51
52 Probablstc Latent Semantc Analyss - PLSA (Hofmann 99) Modélsaton stochastque de LSA - Modèle à varable latente Une varable latente est assocée à chaque occurrence d un mot dans un document Processus génératf Chosr un document d,p(d) Chosr une classe latente z, P(z d) Chosr un mot w suvant P(w z) Recherche d'nformaton textuelle 52
53 Modèle PLSA Hypothèses P(d) P(z d) P(w z) d z w P( d, w) = P( w d ) = P( d )* P( w d ) z P( w z) P( z d ) # valeurs de z est fxé Indépendence des observatons (d, w),.e. sac de mots Connassant z, w ne dépend pas de d Apprentssage MV et EM Recherche d'nformaton textuelle 53
54 Applcatons Extracton de concepts Z k : concept P(w z k ) représentaton du concept z k P(z k d ) mportance du concept dans le document Un concept sera commun à pluseurs mots Un même mot peut être assocé à dfférents concepts Recherche d'nformaton textuelle 54
55 Applcatons (autres) Segmentaton thématque Constructon de hérarches de documents (# modèles plsa hérarchques) Recherche d nformaton Annotaton d mages Pour une mage nconnue : P(w mage) Recherche d'nformaton textuelle 55
56 Evaluaton en RD Problème dffcle, pas de mesure absolue Crtères de qualté d un système de RD effcacté de la recherche possbltés de formuler des requêtes rches outls de navgaton dans la collecton mse à jour et rchesse du corpus Nombreuses mesures qu donnent des rensegnements partels sur le comportement du système Effcacté de la recherche : hyp : on possède un corpus, un ens. De requêtes, des jugements sur les doc. R et R pour une requête. Recherche d'nformaton textuelle 56
57 Evaluaton en IR : mesures de rappel - précson précson r ( q) = Rappel à r: # documents pertnents découverts # documents pertnents dans la collecton p r ( q) = Précson à r: # documents pertnents découverts # documents decouverts r : nombre de documents nspectés par l utlsateur parm les doc. fourns par le système,.e. les r premers de la lste Valeurs typques, 5, 10, 20, 25, 100, 1000 rappel Recherche d'nformaton textuelle 57
58 Précson - exemple Précson moyenne non nterpolée Moyenne de la precson pour l ensemble des docs pertnents de la lste Précson moyenne nterpolée La précson est calculée à dfférents nveaux de rappel (0%; 10%, 20%, 100%) S la précson remonte après le pont de rappel, on prend la veleur de précson la plus forte rencontrée après le pont (nterpolaton) + : pertnent - Non pertnent d6 (-) d3 (+) d3 (+) p /3 p Precson moyenne non nterpolée Precson moyenne nterpôléee 11 ponts Lste 1 d1 (+) d2 (+) d3 (+) d4 (-) d5 (-) 1 1 Lste 2 d4 (-) d5 (-) d6 (-) d1 (+) d2 (+) 0.38 Recherche d'nformaton textuelle Lste 3 d4 (-) d1 (+) d2 (+) d5 (-) d6 (-) 0.55
59 Evaluaton en RI Autres mesures d évaluaton Précson moyenne = 1/3*(précson(0.25) + précson(0.5) + précson(0.75) ) F mesure F = 2 * P P + * R R etc Recherche d'nformaton textuelle 59
60 Recherche Web Recherche d'nformaton textuelle 60
61 RI Web vs RI classque Corpus Talle, Nature, Dynamcté Contexte Réseau, localsaton, hstorque Indvdus Grande varablté Prse en compte progressve des profls pour la recherche web Recherche d'nformaton textuelle 61
62 Indvdus Beson Transactonnel Achats en lgne Acceder à une ressource Musque, lvre, Informatonnel Consultaton Se rensegner sur un sujet Navgaton Jondre une page donnée Interacton Recall souvent peu mportant, precson mse en avant Recherche d'nformaton textuelle 62
63 Indvdus - exemple _SearchEngneUserBehavor.pdf Recherche d'nformaton textuelle 63
64 Indvdus Requêtes Lo de pussance Beaucoup de requêtes populares Talle moyenne requêtes < 3 mots Besons d nformaton dynamques Recherche d'nformaton textuelle 64
65 Corpus Crossance désordonnée Pas de coordnaton Nature des nformatons Content des nformatons obsoletes, mensongères, etc Texte, html, mages, structuré (XML), BD, Statque vs dynamque Le web dynamque n est pas ndexé Quelques travaux Web caché Multlngue Dffculté des analyses lexcales Forte crossance Double tous les mos La talle du web réel n est pas connue Etudes sur l estmaton du nombre de pages Pluseurs méthodes : marches aléatores, etc Nombre de stes (cf Netcraft) Nombre de pages ndexées Yahoo! Annonce 20 M en 2005? Recherche d'nformaton textuelle 65
66 Crossance du web Total Stes Across All Domans August January Recherche d'nformaton textuelle 66
67 Structure globale du Web Connexons Lo de pussance Le nombre de pages web de n-degree est proportonnel à 1/ k avec k = 2.1 Recherche d'nformaton textuelle 67
68 Bow-Te shape of the web Tros grandes catégores de pages web In, Out, SCC qu se dstnguent par les possbltés de navgaton From Mannng et al Recherche d'nformaton textuelle 68
69 Spam sur le Web Référencement Search Engne Optmzaton Mettre en avant ses pages / son ste dans les résultats des moteurs de recherche Motvatons Dverses : commercales, poltques, etc Devenu une ndustre Les moteurs essaent de fare respecter des règles aux SEO Très lé au SPAM Recherche d'nformaton textuelle 69
70 Bestare du Spam Modfcaton du contenu Keyword stuffng Répétton de termes pour augmenter le tf-df Varantes : meta-tags, texte caché (couleur du fond..), adresses url fréquement demandées, etc Vsat les 1ers moteurs de recherche (tf-df), faclement detecté actuellement Cloakng E.g. déréférencement de BMW par Google en 2006 Délvrer des nformatons dfférentes suvant l utlsateur (robot vs personne) Permet d ndexer des pages avec des mots (robot) dfférents du contenu vu par l utlsateur human Recherche d'nformaton textuelle 70
71 Basés sur les lens Lnk farms Référencement mutuel de stes Développer un grand nombre de stes nterconnectés qu pontent également sur des cbles dont on fat remonter le pagerank Honey pot Réplcaton de stes ou annuares très référencés le ste sera ensute référencé par d autres utlsateurs et augmentera son rang Blog ou wk spam Fare ponter sur son ste à partr de stes où l on peut écrre Clc spam Épuser le crédt de concurrents en fasant clquer que les lens sponsorés (pay per clc model) Camouflage Doorway Fare référencer une page avec un bon score (chox de mots clé, des lens etc) L utlsateur qu demande la page est renvoyé sur d autres pages (commercales etc) Recherche d'nformaton textuelle 71
72 [Ntoulas et al. 2006], la fgure 2 représente le taux de Web spam dans les 8 domanes les plus populares sur le Web, la fgure 3 le taux de spam dans les 5 langues les plus populares. Ces statstques sont calculées sur 100 mllons de pages, globalement représentatves du Web. Recherche d'nformaton textuelle 72
73 La lutte contre le Spam Edtoral Blacklsts, dénoncaton (Google), Usage Préférer les pages très utlsées, ben référencées Analyse de lens Gult by assocaton Algos robustes de référencement Machne learnng Cf Adversal retreval ntatve : Arweb Recherche d'nformaton textuelle 73
74 Evoluton des moteurs de recherche Excte, Lycos, etc Contenu 1998 Google, Yahoo Lens Clck through Anchor text 2002 Money Multplcaton des servces Prse en compte contexte et utlsateur Autres sources d nformaton Web 2.0 etc Recherche d'nformaton textuelle 74
75 Analyse de len Popularsée par Google avec PageRank Actuellement une composante parm beaucoup d autres des moteurs de recherche Entre 10 et 100 caractérstques prses en compte Cours : 2 algorthmes hstorques PageRank (Brn & Page 1998) HITS (Klenberg 1998) Très nombreuses varantes E.g. trustrank Recherche d'nformaton textuelle 75
76 Les lens Le web est vu comme un graphe orenté Les lens sont porteurs d nformaton Un len entre pages ndque une relaton de pertnence Un len est un ndcateur de qualté Le texte d un len résume la page cble L ndexaton d une page dot prendre en compte les lens vers cette page (contexte) Recherche d'nformaton textuelle 76
77 PageRank Idée Marche aléatore dans le graphe du web Au bout d un certan temps, on attent un état statonnare qu donne la probablté d attendre chaque page vstée Modélsaton : chane de Markov Les pages les plus vstées lors de la marche aléatore sont celles qu ont de nombreux n-lnks provenant de stes externes Recherche d'nformaton textuelle 77
78 PageRank On démarre d une page du web On effectue une marche aléatore On sut un len sur cette page avec une certane probablté Dans le modèle de base tous les lens sont équprobables On saute à une page quelconque avec une probablté q (0.15) : téléportaton Permet d évter de rester bloquer sur une page sans len Permet de vster l ensemble des pages On attent un état statonnare Le taux de vste des pages dans cet état sert de score PageRank (valeur entre 0 et 1) Rq : pas la pene de calculer la soluton exacte, seul l ordre entre les pages est mportant Recherche d'nformaton textuelle 78
79 Pagerank - modèle On modélse la M.A. par une chaîne de Markov N états Un état = une page Une matrce de transton A j A j = P(j ) : probablté d aller en j quand on est en Défnton Une chaîne de Markov est ergodque s l exste un enter k > 0 / pour toute pare d états, j, s le processus démarre à 0 en, alors pour t > k, on a P(j) > 0 Proprété Toute chaîne de Markov a une dstrbuton d états statonnare unque Sur une pérode de temps suffsement longue, chaque état est vsté en proporton de ce taux de vste Recherche d'nformaton textuelle 79
80 État de la chane X = (x 1,, x n ) vecteur lgne x = P(on se trouve dans l etat ) État suvant X = X.A Etat statonnare Résoudre X.A = X X est le vecteur propre de A assocé à sa plus grande valeur propre Une matrce stochastque (0 < A j < 1 et Σ j A j = 1) a une valeur propre ppale égale à 1. Un algorthme smple Algorthme de la pussance térée Partr d un état aléatore X Itérer X.A, X.A 2 X.A k jusqu à stablté Recherche d'nformaton textuelle 80
81 Pagerank résumé Requête Q : on consdère les pages qu sont pertnentes pour Q On les ordonne en foncton de leur score Pagerank Cet ordre est ndépendant de la requête Remarques Varantes Marches aléatores plus sophstquées (bouton back, bookmarks, selecton des lens non unforme, prse en compte des ntérets de l utlsateur, PageRank topc specfc, etc) Prse en compte du spam sur les lens Recherche d'nformaton textuelle 81
82 Hts 2 notons à la base de la méthode Hubs Pages qu pontent vers des pages pertnentes pour un sujet (lens sortants) Authortes Pages qu sont de bonne références sur un sujet qu sont donc pontées par les hubs Adapté à des recherches assez large E.g. voture Idée Chaque page va avor 2 scores H et A On aura 2 lstes ordonnées par H et A Algorthme Itératf Partr d un pett ensemble ntal de pages qu peuvent être de bons hubs ou authortes (obtenu par un moteur contenu) Calculer les scores h et a pour toutes les pages de cet ensemble et pour celles qu pontent sur cet ensemble et hors de cet ensemble (c est l ensemble de base) Recherche d'nformaton textuelle 82
83 Hts l algorthme But Calculer pour chaque page x dans le base set h(x), a(x) Intalser h(x) = 1, a(x) = 1 Repéter h( x) = a( x) = x y y x a( y) h( y) Après convergence Sortr les 2 lstes Melleurs h() Melleurs a() Recherche d'nformaton textuelle 83
84 L algorthme - sute Pour un ensemble de pages web h : vecteur des hubs de ces pages a : vecteur des authortes de ces pages L algorthme revent à répeter : h = A a = A T a = h = AA On retrouve un pb de valeur / vecteur propre A T A La méthode précédente est smplement l algorthme de la pussance térée pour les matrces AA T et A T A T h a Recherche d'nformaton textuelle 84
85 Remarques L algorthme converge En pratque quelques tératons suffsent (5) Indépendant du contenu effectf des pages Prse en compte ndrecte va les lens Dérve possble vers des pages qu ne sont pas pertnentes pour la requête Les stes afflés se renforcent ce qu n est pas l effet voulu Pluseurs solutons proposées pour ces problèmes Recherche d'nformaton textuelle 85
86 Corpus et documents structurés Modèles de RI pour le Web et les corpus XML Recherche d'nformaton textuelle 86
87 Les modèles standards de la RI consdèrent des documents plats L nformaton aujourd hu est largement structurée Web, corpus XML, blogs, fls de dscusson, etc Vdeo, multméda, web sémantque, ontologes Evoluton des modèles de RI pour prendre en compte les nouveaux méda et les nouveaux besons Remse à «plat» des prncpes de base de la RI En pratque : passe souvent par une adaptaton des concepts et modèles exstant Recherche d'nformaton textuelle 87
88 Modèles de RI et Web Recherche d'nformaton textuelle 88
89 La Webtrack de TREC (2004) Tâches Topc dstllaton Q décrt une requête générale, le système retourne des pages pertnentes Homepage fndng Q est le nom d un ste e.g. togo embassy, le systeme retourne l url du ste dans les top r Name page fndng Q correspond à une page e.g. servces socaux de la mare de Pars, le système renvoe l url de cette page dans les top r HP et NP : on ne cherche pas tous les docs pertnents mas un ste ou une page Recherche d'nformaton textuelle 89
90 Documents Web Structure Présente au nveau du web, des stes, des pages HTML, XHTML Nombreux algorthmes pour prendre en compte la structure du web Pagerank, Hts etc on n en parle pas dans l exposé Modèles de RI 2 grandes famlles Fuson de scores des dfférentes composantes du document ou sources d nformaton (heurstques ou par apprentssage) Fuson des nformaton au nveau de la représentaton même des documents Recherche d'nformaton textuelle 90
91 Okap pour des documents structurés BM25F (Robertson et al 2004) Document structuré avec dfférents champs (page ou ste web) Queston comment combner ces dfférentes nformatons? Constat La combnason de scores apporte peu lorsqu l faut combner de nombreux champs Proposton Prendre en compte les dfférents champs drectement dans la représentaton des documents La méthode obtent les melleurs résultats à TrecWeb 2004 Utlsée également pour pluseurs autres tâches Recherche d'nformaton textuelle 91
92 Rappel Okap Rappel : Okap BM25 classque tf t ( k + 1) w ( tf t ) = 1 K + tf t K = k1 *((1 b) + b( DL / AVDL)) Score Okap = t q tft, d ( k1 + 1) *" df K + tf t, d ( t)" Crtque de la combnason de scores Dffcle de combner les scores de champs de nature très dfférente Robustesse des statstques dans les dfférents champs, confance dans les scores pour les dfférents champs etc La non lnéarté (saturaton) de la foncton perd son sens dans cette combnason E.g. un document contenant un terme de la requête dans dfférents champs peut avor un melleur score qu un document contenant pluseurs termes de la requête dans un seul champs etc Recherche d'nformaton textuelle 92
93 BM25F Un document comprends dfférents champs A un terme t, on assoce le vecteur de ses fréquences dans les dfférents champs La représentaton fréquentelle d un document est défne par l ensemble des vecteurs de fréquence de ses termes. La fréquence d un terme t est alors défne comme une combnason des fréquences de t dans les dfférents champs Le score est calculé de manère analogue à OKAPI classque Recherche d'nformaton textuelle 93
94 BM25F F = (F 1,,F n ) un ensemble de champs A chaque champ F est assocé un pods v tf F,t fréquence de t dans le champs F de d DL F et AVDL F sont la longueur du champs F dans d et la longueur moyenne du champs F dans le corpus t f w K t = v F, t t 1 F ( tf t ) = K F + F DL F = k = AVDL 1 F = t tf f ( k + 1) tf *((1 b) + b( DL v. DL( F ) t F v. AVDL( F ) / AVDL Score BM 25F = w ( tf )*" df ( t)" t q F t F )) Recherche d'nformaton textuelle 94
95 Les dfférents paramètres sont choss séquentellement et séparément de façon à optmser une mesure e.g. Les formules utlsées effectvement (TREC) dffèrent un peu de celle donnée c Applcaton au Web Combnason des champs des documents Ttre, corps, ancre lens hypertexte Combnason avec d autres sources d nformaton (e.g. score page rank pour le web) par de smples combnasons lnéares L dée est utlsable avec d autres méthodes Recherche d'nformaton textuelle 95
96 Combnason dans des modèles de langage (Oglve, Callan 2003) Les modèles de langage permettent naturellement de combner dfférentes sources d nformaton Dans le cas du web par exemple λ = 1 P( d q) = P( d) λ1p( t Corpus) + λ2p( t d, ancre) + λ3p( t d, body) + λ4p( t t q d, ttre) Les λ sont estmés sur les données Rq : par rapport à des combnason classques, c, la combnason des scores est fate séparément pour chaque terme et non pour chaque composante équvalent à combner les composantes dans la représentaton des documents Recherche d'nformaton textuelle 96
97 La recherche dans les documents structurés XML Recherche d'nformaton textuelle 97
98 Documents XML <artcle> <hdr> <bdy> <fg> <fgc> texte <sec> <st> texte <p> texte Recherche d'nformaton textuelle 98
99 Recherche d nformaton structurée But RI dans les corpus de documents structurés e.g. XML Consderer smultanément la structure logque et le contenu Change la perspectve sur la RI Requêtes Eléménts à rechercher Evaluaton Interacton Recherche d'nformaton textuelle 99
100 «INEX» E. U. Corpus: Mo de documents XML + requêtes + jugements de pertnence, documents (IEEE journals), 10 mllons de doxels 2006 Wkpeda XML : textes anglas de Wkpeda, 659,388 artcles couvrant une herarche de 113,483 categores, > 60 Ggabytes, 5000 tags dfferents. En moyenne an artcle contans nœuds XML par artcle, profondeur moyenne d un élément Recherche d'nformaton textuelle 100
101 Inex - requêtes Requêtes Content Only CO Content and Structure CAS VCAS Consttuton d une requête Ttle Expresson du beson d nformaton CO : mots clés, CAS : //artcle[about(.,nterconnected networks]//p[about(.,crossbar networks)] Topc descrpton 1 ou 2 phrases en langage naturel Narratve Descrptf plus complet Exemple en CO, 30 CAS doxels judged for CO (1500 per queston) doxels judged for CAS (1137 per queston) Coût de l assessment : 20 h / requête! Recherche d'nformaton textuelle 101
102 Inex tâches (2005) Tâche de base : Focused Retrouver les éléments pertnents au bon nveau de granularté Pour analyser le comportement des systèmes, 2 autres tâches Thorough Retrouver tous les éléments pertnents sans prse en compte de la dépendance entre éléments (.e une secton et ses paragraphes) Fetch and browse Fetch : dentfer les artcles pertnents Browse : dentfer les éléments dans ces artcles Recherche d'nformaton textuelle 102
103 INEX 2002 assessments Deux dmensons Exhaustvté Un doxel «exhaustf» content l nformaton Echelle 4 valeurs Specfcté Il ne content pas d autre nformaton 4 valeurs 2004, contnu [0,1] valeurs ndépendantes sur 16 Too large (G) Exact (E) Too small (P) Non exhaustve (I) Recherche d'nformaton textuelle 103
104 Evaluaton Dffcultés Prse en compte des relatons entre éléments Near msses : on retourne un élément «vosn» d un élément recherché Overlap : la même nformaton est retournée pluseurs fos (paragraphes, secton, etc) Prse en compte de l echelle graduelle à 2 dmensons (E,S) Problème dffcle Dfférents métrques Recherche d'nformaton textuelle 104
105 Precson - rappel Pas adapté e.g. système retournant systèmatquement un doxel plus pett rappel = 0 precson = 0 Recherche d'nformaton textuelle 105
106 Mesure utlsée à nex 2005 : Gan cumulé (Kaza et al 2005) Base de rappel Base de doxels pertnents dans le corpus Lste de documents retournés par le système Gan d un doxel de rang dans la lste A un doxel x on assoce un score xg[] qu mesure le «gan» d nformaton apporté par ce doxel (dépend des jugements et de la lste elle-même) Gan déal xi[] La lste déale est composée de l ensemble des doxels pertnents de la base ordonnés par leur degré de pertnence calculé en foncton des «assessments» Gan cumulé au rang : Métrque : gan normalsé : xcg[ ] = xg[ ] CI[ ] = j= 1 j= 1 nxcg [ ] = xi[ ] xcg[ ] xci[ ] Recherche d'nformaton textuelle 106
107 Precson-Recall wth User Modelng (Pwowarsk et al. 2005) Mesure de précson-rappel probablste qu prend en compte overlap near msses navgaton utlsateur PRUM() = P(Lur Retr,L = l,q = q) = nveau de rappel dans [0,1] Lur = évènement : l élément condut à un doxel pertnent Retr = évènement : l élément est dans la lste consultée l = pourcentage d éléments pertnents que l utlsateur veut vor q = requête Recherche d'nformaton textuelle 107
108 Modèles Dfférentes adaptatons des modèles classques de RI Modèle vectorel Modèle de langage Réseaux Bayesens Remarques Nombreux essas sur l ndexaton, les pondératons, etc : pas de consensus général sur ce qu est le meux Importance du lssage des estmatons, Requêtes CAS : dfférentes méthodes pour la prse en compte des contrantes (ndex de la structure) Overlap souvent traté en post-processng Recherche d'nformaton textuelle 108
109 Modèle vectorel (Mas et al. 05) Adaptaton drecte du modèle vectorel 1 ndex par type d élément «sgnfcatf» (artcles, secton, sous secton, paragraphe) Modèle vectorel applqué séparément à chaque type Algorthme Applquer le modèle vectorel sur le type RF sur les sortes de type Normalser les scores dans [0,1] en dvsant le score par RSV(q,q) Interpolaton avec le score de l artcle Ordonner la lste globale comprenant tous les types avec les scores normalsés Leçon : mportance de l nterpolaton (+30 %) et du RF Recherche d'nformaton textuelle 109
110 Modèle de langage (Kamps et al. 2005) Index pour les artcles, et les types de doxels (redondance : l ndex de la secton content les termes du paragraphe) Un modèle de langage par type de doxel Lssage Prors sur la talle des éléments : ncorporaton d nformaton de contexte RF par type de doxel Comparason drecte des scores des dfférents éléments P ( e P ( t P ( e ) q ) e ) = = P ( e ) P ( q λ elt e e ' P e ' ml ( t e ) = e ) + λ P ( e ) doc P ml n = 1 ( t P ( t doc e ) ) + λ corpus P ml ( t corpus ) Recherche d'nformaton textuelle 110
111 Réseaux Bayesens (Pwowarsk et al. 2003) Les documents structurés sont consdérés comme des arbres Modèle : RB arborescent Les scores sont calculés par nférence dans le RB Probabltés condtonnelles du RB estmées sur le corpus Recherche d'nformaton textuelle 111
112 Corpus modelng Modèle de document Modèle du corpus : un RB construt à partr des RB des documents La structure du réseau reflète celle du corpus Recherche d'nformaton textuelle 112
113 Doxel La pertnence des doxel depend de Celle du parent La requête Word 1 Word 2 Word 3 frequency frequency frequency Document Query R Exact I Non relevant G Too large S Too small Secton R I G S exact non relevant too large too small Recherche d'nformaton textuelle 113
114 Modèle de Document Q=q D S1 S2 P1 P2 P3 P4 La pertnence du doxel est calculée par nférence dans le réseau P(D = R / Q = q), P(S 1 = R / Q = q), P(S 2 = R / Q = q), Pour cela l faut connatre P( doxel relevance = x / parent relevance = y, query = q) = F(doxel,x,y,q,Θ) Cette foncton est calculée pour chaque requête Apprentssage : parmètres du modèle Θ par gradent. Recherche d'nformaton textuelle 114
115 Requêtes «CAS» «I want a secton on XML n an artcle about RI publshed n 2000» Q1 Q2 Q3 //artcle[about(., RI ) and yr>=2000]//sec[about(., XML )] Q1 Q2 Q3 an an an artcle artcle artcle artcle artcle artcle yr sec sec yr sec yr sec sec yr sec yr sec sec yr sec P(an/artcle[1] Q1) P(an//yr[1] Q2) et et et P(an/artcle[1] Q1-2) Recherche d'nformaton textuelle 115 P(an/artcle[1]/sec[1] Q) P(an/artcle[1]/sec[2] Q)
116 Precson recall on INEX 2003 Recherche d'nformaton textuelle 116
117 Apprentssage de fonctons d ordonnancement pour la recherche structurée (Vttaut 2005) Recherche d'nformaton textuelle 117
118 Apprentssage de fonctons d ordonnancement Apprendre automatquement une foncton d ordonnancement Utlsé pour combner des caractérstques, des scores ou des relatons de préférence dans dfférentes tâches : meta search, Résumé automatque, RI, Poolng, etc Les algorthmes d ordonnancement combnent des caractérstques des éléments à ordonner. Possblté d ncorporer des nformatons de nature dfférente En SIR, les caractérstques vont dépendre : Du doxel lu même (contenu) De son contexte structurel (etquette, parent, etc) Peut être utlsé avec toute méthode qu fournt des scores pour les doxels et pour combner ces méthodes entre elles Recherche d'nformaton textuelle 118
119 Prncpe Apprendre un ordre total sur un ensemble X, qu permette de comparer tout couple d élément de cet ensemble. Etant donné cet ordre total, on peut ordonner tout sous ensemble de X Exemple En IR, X peut être un ensemble de couples (document, requête), et l ordre total est l ordre naturel sur les scores. Recherche d'nformaton textuelle 119
120 Comment apprendre? L ensemble d apprentssage consstera en pares d exemples ordonnés. Il n est pas nécessare d ordonner l ensemble des pares Cela va fournr un ordre partel sur les élements de X. L algorthme d ordonnancement va utlser cette nformaton pour apprendre un ordre total sur les éleéments de X : la foncton d ordonnancement. Celle c va permettre d étendre l ordre partel à tous les éléments du corpus (ordre total). Recherche d'nformaton textuelle 120
121 Exemple Pour SIR, X sera l ensemble de tous les couples (doxel, requête) dans la collecton de documents. Cet ensemble est partellement ordonné selon la pertnence des jugements pour chaque requête Recherche d'nformaton textuelle 121
122 Notatons Un élément de X sera représenté par un vecteur de caractérstques réelles x = (x 1, x 2,..., x n ) Dans notre cas, les caractérstques seront les scores locaux calculés sur dfférents éléments contextuels d un doxel. La foncton d ordonnancement sera une combnason lnéare des caractérstques de x f w ( x) = 1 w = (w 1,,w n ) sont les paramètres à apprendre = n w x Recherche d'nformaton textuelle 122
123 Recherche d'nformaton textuelle 123 Coût d ordonnancement le coût d ordonnancement mesure à quel pont f w respecte l ordre R est non dfférentable Les algorthmes d ordonnancement optmsent un coût exponentel : p snon et 0 ) ' ( ) ( s 1 '), ( avec ) ', ( ), ( ' '), ( 2 x f x f x x X x x X w X R w w x x X x x > = = p = ' '), ( ') ( ) ( 2 ), ( x x X x x x f x f e w w e w X R p
124 Rankng vs Classfcaton Classfcaton Prédt quel doxel est pertnent ou non pertnent Ne s ntéresse pas à l ordre des doxels Mnmse l erreur de classfcaton P( C x) Ordonnancement Consdère unquement l ordre des doxels Mnmse le nombre de couples mal ordonnés L échelle des scores n est pas mportante P( xp x' x, x') Recherche d'nformaton textuelle 124
125 Combnason Nous avons utlsé la combnason suvante f l l l l ( x) = w1 + w2okap( x) + w3okap( pa( x)) w4okap( doc( x)) w + Okap est un modèle Okap adapté à SIR Le paramètre l w dépend De la caractérstque Du type du noeud l Recherche d'nformaton textuelle 125
126 Combnason Recherche d'nformaton textuelle 126
127 Reducton de la complexté Comparer des éléments pour dfférentes requêtes n a pas de sens Pour chaque sous ensemble, les préférences entre les doxels sont exprmées suvant pluseurs dmensons Il n y a pas de préférence entre éléments partageant la même valeur d exhaustvté - spécfcté Recherche d'nformaton textuelle 127
128 Reducton de complexté La foncton de coût ntale est quadratque pr aux assessments R e ( X, w) = e ( x, x') assessments xpx' f w ( x) f 2 w ( x') Elle se réécrt sous une forme qu est lnéare pr aux nombre d assessments R ( X, w) = e ( e f w ( x) f ( ES, E' S ') x assessments( ES ) x' assessments( E' S ') E' S 'pes )( e w ( x') ) Recherche d'nformaton textuelle 128
129 Assessments Recherche d'nformaton textuelle 129
130 CO Focused Topcs et assessments de Inex 03, 04 pour l apprentssage Inex 05 pour le test Recherche d'nformaton textuelle 130
131 CO-Focused Recherche d'nformaton textuelle 131
132 CO-Thorough Recherche d'nformaton textuelle 132
133 CO-Thorough Recherche d'nformaton textuelle 133
134 Extracton d Informaton Recherche d'nformaton textuelle 134
135 Extracton examples Q/A What was W. Shakespeare occupaton before he began to wrte plays Who s Tom Cruse marred to marred actors T. Cruse and Ncole Kdman play dr. Wllam and Alce Hartford, a N.Y. couple who thnk ther eght year marrage s very good On lne adds Captal Hll 1 br twnhme. Fplc D/W/W/D Undrgrnd pkg ncl $675 3 B, upper flr of turn of ctry HOME. Incl. gard, grt N. Hll, loc $995. Recherche d'nformaton textuelle 135
136 Informaton Extracton Unstructured text Newspapers, scentfc artcles, etc Closed extracton - MUC: Message Understandng Conferences Open extracton - Queston/Answerng n TREC Structured text HTML pages Regular structures Specfc approaches for each task Recherche d'nformaton textuelle 136
137 Message Understandng Conferences (MUC) Message Understandng Conferences : évaluatons sur des tâches "pratques" d'analyse et de compréhenson de texte. MUC 1 (1987) à MUC7 (1998) 3 tâches : développer des composants IE mmédatement utlsables, ndépendants du domane, automatques e.g. dentfer tous les noms d'organsaton et d'ndvdus dans des textes. portablté des systèmes d'extracton e.g. retrouver dans un texte les nformatons concernant les mouvements d'ndvdus dans les compagnes. évaluaton sémantque Coréférences, Désambgüaton, Structure : consttuants d'une phrase Recherche d'nformaton textuelle 137
138 Extracton d nformaton (MUC) Une tâche TLN spécfque du domane Données : texte lbre Sorte : «résumé» du texte concernant des sujets d'ntérêt spécfque : codé sous une forme structurée Comment : analyse superfcelle du texte complet détecton des sectons pertnentes au sujet analyse de ces sectons pour extrare l'nformaton Recherche d'nformaton textuelle 138
139 Vson MUC de l IE... J o h n S m o n, C h e f F n a n c a l O ffc e r o f P rm e C o rp. s n c e , s a w h s p a y ju m p 2 0 %, to $ 1.3 m llo n, a s th e y e a r -o ld a ls o b e c a m e th e fn a n c a l- s e rv c e s c o m p a n y 's p re s d e n t... J o h n _ S m o n /n o u n /N A M E,/, C h e f/n a m e F n a n c a l_ O ffc e r/n a m e /P O S IT I O N o f/p r e p P r m e _ C o rp./n o u n /C O M P A N Y s n c e /a d v /n u m b e r /D A T E,/, s a w /v e r b... T o k e n s a to n + T a g g n g S e n te n c e A n a ly s s E x t r a c to n G e n e r a t o n d e P a t r o n M e r g n g E v e n t: S U C C E S S IO N _ E V E N T P O S T : " p re s d e n t" V A C A N C Y _ R E A S O N : O T H _ U N K P E R _ N A M E : " J h o n S m o n " N E W _ S T A T U S : I N O N _ T H E _ J O B : Y E S O T H E R _ O R G : S A M E _ O R G O R G _ N A M E : " P rm e C o rp." O R G _ D E S C R I P T O R : " th e fn a n c a l-s e r v c e s c o m p a n y " O R G _ T Y P E : C O M P A N Y P E R _ N A M E : " J h o n S m o n "... J o h n S m o n, C h e f F n a n c a l O ffc e r o f P r m e C o r p. s n c e , s a w h s p a y ju m p 2 0 %, to $ 1.3 m llo n, a s th e 3 7 -y e a r -o ld a ls o b e c a m e th e fn a n c a l-s e r v c e s c o m p a n y 's p re s d e n t... J o h n _ S m o n : P E R S O N _ N A M E C h e f F n a n c a l O ffc e r : P O S IT IO N o f P r m e C o rp. : C O M P A N Y a ls o b e c a m e th e : P O S IT IO N _ N E W b e c a m e th e p re s d e n t : P O S I T IO N fn a n c a l-se rv c e s c o m p a n y : O R G _ D E S C R IP T O R Recherche d'nformaton textuelle 139
Plan. Gestion des stocks. Les opérations de gestions des stocks. Les opérations de gestions des stocks
Plan Geston des stocks Abdellah El Fallah Ensa de Tétouan 2011 Les opératons de gestons des stocks Les coûts assocés à la geston des stocks Le rôle des stocks Modèle de la quantté économque Geston calendare
Plus en détailLes jeunes économistes
Chaptre1 : les ntérêts smples 1. défnton et calcul pratque : Défnton : Dans le cas de l ntérêt smple, le captal reste nvarable pendant toute la durée du prêt. L emprunteur dot verser, à la fn de chaque
Plus en détailRecherche d information textuelle
Recherche d information textuelle Recherche Web B. Piwowarski CNRS / LIP6 Université Paris 6 benjamin@bpiwowar.net http://www.bpiwowar.net Master IP - 2014-15 Cours et travaux pratiques basés sur les documents
Plus en détailRemboursement d un emprunt par annuités constantes
Sére STG Journées de formaton Janver 2006 Remboursement d un emprunt par annutés constantes Le prncpe Utlsaton du tableur Un emprunteur s adresse à un prêteur pour obtenr une somme d argent (la dette)
Plus en détailINTERNET. Initiation à
Intaton à INTERNET Surfez sur Internet Envoyez des messages Téléchargez Dscutez avec Skype Découvrez Facebook Regardez des vdéos Protégez votre ordnateur Myram GRIS Table des matères Internet Introducton
Plus en détailEH SmartView. Identifiez vos risques et vos opportunités. www.eulerhermes.be. Pilotez votre assurance-crédit. Services en ligne Euler Hermes
EH SmartVew Servces en lgne Euler Hermes Identfez vos rsques et vos opportuntés Plotez votre assurance-crédt www.eulerhermes.be Les avantages d EH SmartVew L expertse Euler Hermes présentée de manère clare
Plus en détailMesure avec une règle
Mesure avec une règle par Matheu ROUAUD Professeur de Scences Physques en prépa, Dplômé en Physque Théorque. Lycée Alan-Fourner 8000 Bourges ecrre@ncerttudes.fr RÉSUMÉ La mesure d'une grandeur par un système
Plus en détailMETHODE AUTOMATIQUE POUR CORRIGER LA VARIATION LINGUISTIQUE LORS DE L INTERROGATION DE DOCUMENTS XML DE STRUCTURES HETEROGENES
METHODE AUTOMATIQUE POUR CORRIGER LA VARIATION LINGUISTIQUE LORS DE L INTERROGATION DE DOCUMENTS XML DE STRUCTURES HETEROGENES Ourda Boudghaghen(*),Mohand Boughanem(**) yugo_doudou@yahoo.fr, bougha@rt.fr
Plus en détailÉLÉMENTS DE THÉORIE DE L INFORMATION POUR LES COMMUNICATIONS.
ÉLÉMETS DE THÉORIE DE L IFORMATIO POUR LES COMMUICATIOS. L a théore de l nformaton est une dscplne qu s appue non seulement sur les (télé-) communcatons, mas auss sur l nformatque, la statstque, la physque
Plus en détailChapitre 3 : Incertitudes CHAPITRE 3 INCERTITUDES. Lignes directrices 2006 du GIEC pour les inventaires nationaux de gaz à effet de serre 3.
Chaptre 3 : Incerttudes CHAPITRE 3 INCERTITUDES Lgnes drectrces 2006 du GIEC pour les nventares natonaux de gaz à effet de serre 3.1 Volume 1 : Orentatons générales et établssement des rapports Auteurs
Plus en détailMÉTHODES DE SONDAGES UTILISÉES DANS LES PROGRAMMES D ÉVALUATIONS DES ÉLÈVES
MÉTHODES DE SONDAGES UTILISÉES DANS LES PROGRAMMES D ÉVALUATIONS DES ÉLÈVES Émle Garca, Maron Le Cam et Therry Rocher MENESR-DEPP, bureau de l évaluaton des élèves Cet artcle porte sur les méthodes de
Plus en détailMontage émetteur commun
tour au menu ontage émetteur commun Polarsaton d un transstor. ôle de la polarsaton La polarsaton a pour rôle de placer le pont de fonctonnement du transstor dans une zone où ses caractérstques sont lnéares.
Plus en détailGENESIS - Generalized System for Imputation Simulations (Système généralisé pour simuler l imputation)
GENESS - Generalzed System for mputaton Smulatons (Système généralsé pour smuler l mputaton) GENESS est un système qu permet d exécuter des smulatons en présence d mputaton. L utlsateur fournt un ensemble
Plus en détailAssurance maladie et aléa de moralité ex-ante : L incidence de l hétérogénéité de la perte sanitaire
Assurance malade et aléa de moralté ex-ante : L ncdence de l hétérogénété de la perte santare Davd Alary 1 et Franck Ben 2 Cet artcle examne l ncdence de l hétérogénété de la perte santare sur les contrats
Plus en détailEn vue de l'obtention du. Présentée et soutenue par Elayeb Bilel Le 26 juin 2009
THÈSE En vue de l'obtenton du DOCTORAT DE L UNIVERSITÉ DE TOULOUSE Délvré par Insttut Natonal Polytechnque de Toulouse (INPT) Dscplne ou spécalté : Informatque Présentée et soutenue par Elayeb Blel Le
Plus en détailEditions ENI. Project 2010. Collection Référence Bureautique. Extrait
Edtons ENI Project 2010 Collecton Référence Bureautque Extrat Défnton des tâches Défnton des tâches Project 2010 Sasr les tâches d'un projet Les tâches représentent le traval à accomplr pour attendre l'objectf
Plus en détailCOMPARAISON DE MÉTHODES POUR LA CORRECTION
COMPARAISON DE MÉTHODES POUR LA CORRECTION DE LA NON-RÉPONSE TOTALE : MÉTHODE DES SCORES ET SEGMENTATION Émle Dequdt, Benoît Busson 2 & Ncolas Sgler 3 Insee, Drecton régonale des Pays de la Lore, Servce
Plus en détailEn vue de l'obtention du. Présentée et soutenue par Meva DODO Le 06 novembre 2008
THÈSE En vue de l'obtenton du DOCTORAT DE L UNIVERSITÉ DE TOULOUSE Délvré par l'unversté Toulouse III - Paul Sabater Spécalté : Informatque Présentée et soutenue par Meva DODO Le 06 novembre 2008 Ttre
Plus en détailInterface OneNote 2013
Interface OneNote 2013 Interface OneNote 2013 Offce 2013 - Fonctons avancées Lancer OneNote 2013 À partr de l'nterface Wndows 8, utlsez une des méthodes suvantes : - Clquez sur la vgnette OneNote 2013
Plus en détailFiche n 7 : Vérification du débit et de la vitesse par la méthode de traçage
Fche n 7 : Vérfcaton du débt et de la vtesse par la méthode de traçage 1. PRINCIPE La méthode de traçage permet de calculer le débt d un écoulement ndépendamment des mesurages de hauteur et de vtesse.
Plus en détailDES EFFETS PERVERS DU MORCELLEMENT DES STOCKS
DES EFFETS PERVERS DU MORCELLEMENT DES STOCKS Le cabnet Enetek nous démontre les mpacts négatfs de la multplcaton des stocks qu au leu d amélorer le taux de servce en se rapprochant du clent, le dégradent
Plus en détailLE RÉGIME DE RETRAITE DU PERSONNEL CANADIEN DE LA CANADA-VIE (le «régime») INFORMATION IMPORTANTE CONCERNANT LE RECOURS COLLECTIF
1 LE RÉGIME DE RETRAITE DU PERSONNEL CANADIEN DE LA CANADA-VIE (le «régme») INFORMATION IMPORTANTE CONCERNANT LE RECOURS COLLECTIF AVIS AUX RETRAITÉS ET AUX PARTICIPANTS AVEC DROITS ACQUIS DIFFÉRÉS Expédteurs
Plus en détailContrats prévoyance des TNS : Clarifier les règles pour sécuriser les prestations
Contrats prévoyance des TNS : Clarfer les règles pour sécurser les prestatons Résumé de notre proposton : A - Amélorer l nformaton des souscrpteurs B Prévor plus de souplesse dans l apprécaton des revenus
Plus en détailStéganographie Adaptative par Oracle (ASO)
Stéganographe Adaptatve par Oracle ASO Sarra Kouder, Marc Chaumont, Wllam Puech To cte ths verson: Sarra Kouder, Marc Chaumont, Wllam Puech. Stéganographe Adaptatve par Oracle ASO. CORESA 12: COmpresson
Plus en détailhal-00409942, version 1-14 Aug 2009
Manuscrt auteur, publé dans "MOSIM' 008, Pars : France (008)" 7 e Conférence Francophone de MOdélsaton et SIMulaton - MOSIM 08 - du mars au avrl 008 - Pars - France «Modélsaton, Optmsaton et Smulaton des
Plus en détailTerminal numérique TM 13 raccordé aux installations Integral 33
Termnal numérque TM 13 raccordé aux nstallatons Integral 33 Notce d utlsaton Vous garderez une longueur d avance. Famlarsez--vous avec votre téléphone Remarques mportantes Chaptres à lre en prorté -- Vue
Plus en détailSTATISTIQUE AVEC EXCEL
STATISTIQUE AVEC EXCEL Excel offre d nnombrables possbltés de recuellr des données statstques, de les classer, de les analyser et de les représenter graphquement. Ce sont prncpalement les tros éléments
Plus en détailSystème solaire combiné Estimation des besoins énergétiques
Revue des Energes Renouvelables ICRESD-07 Tlemcen (007) 109 114 Système solare combné Estmaton des besons énergétques R. Kharch 1, B. Benyoucef et M. Belhamel 1 1 Centre de Développement des Energes Renouvelables
Plus en détailCREATION DE VALEUR EN ASSURANCE NON VIE : COMMENT FRANCHIR UNE NOUVELLE ETAPE?
CREATION DE VALEUR EN ASSURANCE NON VIE : COMMENT FRANCHIR UNE NOUVELLE ETAPE? Boulanger Frédérc Avanssur, Groupe AXA 163-167, Avenue Georges Clémenceau 92742 Nanterre Cedex France Tel: +33 1 46 14 43
Plus en détailI. Présentation générale des méthodes d estimation des projets de type «unité industrielle»
Evaluaton des projets et estmaton des coûts Le budget d un projet est un élément mportant dans l étude d un projet pusque les résultats économques auront un mpact sur la réalsaton ou non et sur la concepton
Plus en détail1 Introduction. 2 Définitions des sources de tension et de courant : Cours. Date : A2 Analyser le système Conversion statique de l énergie. 2 h.
A2 Analyser le système Converson statque de l énerge Date : Nom : Cours 2 h 1 Introducton Un ConVertsseur Statque d énerge (CVS) est un montage utlsant des nterrupteurs à semconducteurs permettant par
Plus en détailContact SCD Nancy 1 : theses.sciences@scd.uhp-nancy.fr
AVERTISSEMENT Ce document est le frut d'un long traval approuvé par le jury de soutenance et ms à dsposton de l'ensemble de la communauté unverstare élarge. Il est soums à la proprété ntellectuelle de
Plus en détailPourquoi LICIEL? Avec LICIEL passez à la vitesse supérieure EPROUVE TECHNICITE CONNECTE STABILITE SUIVIE COMMUNAUTE
L og c el s de D agnos t c s I mmob l er s Cont ac t eznous 32BddeS t r as bougcs3010875468 Par scedex10tel. 0253354064Fax0278084116 ma l : s er v c e. c l ent @l c el. f r Pourquo LICIEL? Implanté sur
Plus en détailDes solutions globales fi ables et innovantes. www.calyon.com
Des solutons globales f ables et nnovantes www.calyon.com OPTIM Internet: un outl smple et performant Suv de vos comptes Tratement de vos opératons bancares Accès à un servce de reportng complet Une nterface
Plus en détailAnalyse des Performances et Modélisation d un Serveur Web
SETIT 2009 5 th Internatonal Conference: Scences of Electronc, Technologes of Informaton and Telecommuncatons March 22-26, 2009 TUNISIA Analyse des Performances et Modélsaton d un Serveur Web Fontane RAFAMANTANANTSOA*,
Plus en détailCalculer le coût amorti d une obligation sur chaque exercice et présenter les écritures dans les comptes individuels de la société Plumeria.
1 CAS nédt d applcaton sur les normes IAS/IFRS Coût amort sur oblgatons à taux varable ou révsable La socété Plumera présente ses comptes annuels dans le référentel IFRS. Elle détent dans son portefeulle
Plus en détailP R I S E E N M A I N R A P I D E O L I V E 4 H D
P R I S E E N M A I N R A P I D E O L I V E 4 H D Sommare 1 2 2.1 2.2 2.3 3 3.1 3.2 3.3 4 4.1 4.2 4.3 4.4 4.5 4.6 5 6 7 7.1 7.2 7.3 8 8.1 8.2 8.3 8.4 8.5 8.6 Contenu du carton... 4 Paramétrage... 4 Connexon
Plus en détailL enseignement virtuel dans une économie émergente : perception des étudiants et perspectives d avenir
L ensegnement vrtuel dans une économe émergente : percepton des étudants et perspectves d avenr Hatem Dellag Laboratore d Econome et de Fnances applquées Faculté des scences économques et de geston de
Plus en détailIntegral T 3 Compact. raccordé aux installations Integral 5. Notice d utilisation
Integral T 3 Compact raccordé aux nstallatons Integral 5 Notce d utlsaton Remarques mportantes Remarques mportantes A quelle nstallaton pouvez-vous connecter votre téléphone Ce téléphone est conçu unquement
Plus en détailCATALOGUE EXCLUSIF TOUCH MEDIA CATALOGUE DE SITES FORMATS GLOSSAIRE. Notre sélection de supports en représentation exclusive au Maroc
CATALOGUE EXCLUSIF Notre sélecton de supports en représentaton exclusve au Maroc CATALOGUE DE SITES FORMATS A PROPOS DE NOUS Make ordnary, Extraordnary Phlosophe Équpe Réactvté est la rége publctare web
Plus en détail1.0 Probabilité vs statistique...1. 1.1 Expérience aléatoire et espace échantillonnal...1. 1.2 Événement...2
- robabltés - haptre : Introducton à la théore des probabltés.0 robablté vs statstque.... Expérence aléatore et espace échantllonnal.... Événement.... xomes défnton de probablté..... Quelques théorèmes
Plus en détailGEA I Mathématiques nancières Poly. de révision. Lionel Darondeau
GEA I Mathématques nancères Poly de révson Lonel Darondeau Intérêts smples et composés Voc la lste des exercces à révser, corrgés en cours : Exercce 2 Exercce 3 Exercce 5 Exercce 6 Exercce 7 Exercce 8
Plus en détailPage 5 TABLE DES MATIÈRES
Page 5 TABLE DES MATIÈRES CHAPITRE I LES POURCENTAGES 1. LES OBJECTIFS 12 2. LES DÉFINITIONS 14 1. La varaton absolue d'une grandeur 2. La varaton moyenne d'une grandeur (par unté de temps) 3. Le coeffcent
Plus en détail1. Les enjeux de la prévision du risque de défaut de paiement
Scorng sur données d entreprses : nstrument de dagnostc ndvduel et outl d analyse de portefeulle d une clentèle Mrelle Bardos Ancen chef de servce de l Observatore des entreprses de la Banque de France
Plus en détailDirigeant de SAS : Laisser le choix du statut social
Drgeant de SAS : Lasser le chox du statut socal Résumé de notre proposton : Ouvrr le chox du statut socal du drgeant de SAS avec 2 solutons possbles : apprécer la stuaton socale des drgeants de SAS comme
Plus en détailCalcul de tableaux d amortissement
Calcul de tableaux d amortssement 1 Tableau d amortssement Un emprunt est caractérsé par : une somme empruntée notée ; un taux annuel, en %, noté ; une pérodcté qu correspond à la fréquence de remboursement,
Plus en détailQ x2 = 1 2. est dans l ensemble plus grand des rationnels Q. Continuons ainsi, l équation x 2 = 1 2
Exo7 Nombres complexes Vdéo parte. Les nombres complexes, défntons et opératons Vdéo parte. Racnes carrées, équaton du second degré Vdéo parte 3. Argument et trgonométre Vdéo parte 4. Nombres complexes
Plus en détailLes prix quotidiens de clôture des échanges de quotas EUA et de crédits CER sont fournis par ICE Futures Europe
Méthodologe CDC Clmat Recherche puble chaque mos, en collaboraton avec Clmpact Metnext, Tendances Carbone, le bulletn mensuel d nformaton sur le marché européen du carbone (EU ETS). L obectf de cette publcaton
Plus en détailÉconométrie. Annexes : exercices et corrigés. 5 e édition. William Greene New York University
Économétre 5 e édton Annexes : exercces et corrgés Wllam Greene New York Unversty Édton françase drgée par Dder Schlacther, IEP Pars, unversté Pars II Traducton : Stéphane Monjon, unversté Pars I Panthéon-Sorbonne
Plus en détailExercices d Électrocinétique
ercces d Électrocnétque Intensté et densté de courant -1.1 Vtesse des porteurs de charges : On dssout une masse m = 20g de chlorure de sodum NaCl dans un bac électrolytque de longueur l = 20cm et de secton
Plus en détailGénéralités sur les fonctions 1ES
Généraltés sur les fonctons ES GENERALITES SUR LES FNCTINS I. RAPPELS a. Vocabulare Défnton Une foncton est un procédé qu permet d assocer à un nombre x appartenant à un ensemble D un nombre y n note :
Plus en détailBTS GPN 2EME ANNEE-MATHEMATIQUES-MATHS FINANCIERES MATHEMATIQUES FINANCIERES
MATHEMATIQUES FINANCIERES I. Concepts généraux. Le référentel précse : Cette parte du module M4 «Acquérr des outls mathématques de base nécessares à l'analyse de données économques» est en relaton avec
Plus en détailPaquets. Paquets nationaux 1. Paquets internationaux 11
Paquets Paquets natonaux 1 Paquets nternatonaux 11 Paquets natonaux Servces & optons 1 Créaton 3 1. Dmensons, pods & épasseurs 3 2. Présentaton des paquets 4 2.1. Face avant du paquet 4 2.2. Comment obtenr
Plus en détailChapitre IV : Inductance propre, inductance mutuelle. Energie électromagnétique
Spécale PSI - Cours "Electromagnétsme" 1 Inducton électromagnétque Chaptre IV : Inductance propre, nductance mutuelle. Energe électromagnétque Objectfs: Coecents d nductance propre L et mutuelle M Blan
Plus en détailPrise en compte des politiques de transport dans le choix des fournisseurs
INSTITUT NATIONAL POLYTECHNIQUE DE GRENOBLE N attrbué par la bblothèque THÈSE Pour obtenr le grade de DOCTEUR DE L I.N.P.G. Spécalté : Géne Industrel Préparée au Laboratore d Automatque de Grenoble Dans
Plus en détailTABLE DES MATIERES CONTROLE D INTEGRITE AU SEIN DE LA RECHERCHE LOCALE DE LA POLICE LOCALE DE BRUXELLES-CAPITALE/IXELLES (DEUXIEME DISTRICT) 1
TABLE DES MATIERES CONTROLE D INTEGRITE AU SEIN DE LA RECHERCHE LOCALE DE LA POLICE LOCALE DE BRUXELLES-CAPITALE/IXELLES (DEUXIEME DISTRICT) 1 1. PROBLEMATIQUE 1 2. MISSION 1 3. ACTES D ENQUETE 2 4. ANALYSE
Plus en détailVIELLE Marc. CEA-IDEI Janvier 1998. 1 La nomenclature retenue 3. 2 Vue d ensemble du modèle 4
GEMINI-E3 XL France Un outl destné à l étude des mpacts ndustrels de poltques énergétques et envronnementales VIELLE Marc CEA-IDEI Janver 1998 I LA STRUCTURE DU MODELE GEMINI-E3 XL FRANCE 3 1 La nomenclature
Plus en détailRAPPORT DE STAGE. Approcher la frontière d'une sous-partie de l'espace ainsi que la distance à cette frontière. Sujet : Master II : SIAD
UFR SCIENCES ET TECHNOLOGIES DEPARTEMENT DE MATHEMATIQUES ET INFORMATIQUE 63 177 AUBIERE CEDEX Année 2008-2009 Master II : SIAD RAPPORT DE STAGE Sujet : Approcher la frontère d'une sous-parte de l'espace
Plus en détailBUREAU D'APPLICATION DES METHODES STATISTIQUES ET INFORMATIQUES
BUREAU DAPPLICATION DES METHODES STATISTIQUES ET INFORMATIQUES BAMSI REPRINT 04/2003 Introducton à l analyse des données Samuel AMBAPOUR BAMSSI I BAMSI B.P. 13734 Brazzavlle BAMSI REPRINT 04/2003 Introducton
Plus en détailPerformances de la classification par les Séparateurs à Vaste Marge (SVM): application au diagnostic vibratoire automatisé
4th Internatonal Conference on Coputer Integrated Manufacturng CIP 2007 03-04 Noveber 2007 Perforances de la classfcaton par les Séparateurs à Vaste Marge (SVM): applcaton au dagnostc vbratore autoatsé
Plus en détailUNIVERSITÉ DU QUÉBEC À MONTRÉAL L ASSURANCE AUTOMOBILE AU QUÉBEC : UNE PRIME SELON LE COÛT SOCIAL MARGINAL MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE
UNIVERSITÉ DU QUÉBEC À MONTRÉAL L ASSURANCE AUTOMOBILE AU QUÉBEC : UNE PRIME SELON LE COÛT SOCIAL MARGINAL MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE DE LA MAÎTRISE EN ÉCONOMIQUE PAR ERIC LÉVESQUE JANVIER
Plus en détailLe Prêt Efficience Fioul
Le Prêt Effcence Foul EMPRUNTEUR M. Mme CO-EMPRUNTEUR M. Mlle Mme Mlle (CONJOINT, PACSÉ, CONCUBIN ) Départ. de nass. Nature de la pèce d dentté : Natonalté : CNI Passeport Ttre de séjour N : Salaré Stuaton
Plus en détailLa Quantification du Risque Opérationnel des Institutions Bancaires
HEC Montréal Afflée à l Unversté de Montréal La Quantfcaton du Rsque Opératonnel des Insttutons Bancares par Hela Dahen Département Fnance Thèse présentée à la Faculté des études supéreures en vue d obtenton
Plus en détailPro2030 GUIDE D UTILISATION. Français
Pro2030 GUIDE D UTILISATION Franças Contents Garante... Introducton... 1 Artcle nº 605056 Rév C Schéma nº A605056 Novembre 2010 2010 YSI Incorporated. Le logo YSI est une marque déposée de YSI Incorporated.
Plus en détailEvaluation de performances d'ethernet commuté pour des applications temps réel
Evaluaton de performances d'ethernet commuté pour des applcatons temps réel Ans Koubâa, Ye-Qong Song LORIA-INRIA-INPL, Avenue de la Forêt de Haye - 5456 Vandoeuvre - France Emal : akoubaa@lorafr, song@lorafr
Plus en détailBe inspired. Numéro Vert. Via Caracciolo 20 20155 Milano tel. +39 02 365 22 990 fax +39 02 365 22 991
Ggaset SX353 / französsch / A31008-X353-P100-1-7719 / cover_0_hedelberg.fm / 03.12.2003 s Be nspred www.onedrect.fr www.onedrect.es www.onedrect.t www.onedrect.pt 0 800 72 4000 902 30 32 32 02 365 22 990
Plus en détailQualité de service 7. Ordonnanceurs de paquets. Contexte. Intégration de services. Plan. Multiplexage. FIFO/DropTail. Priorités
NE52 éseaux avancés Qualté de servce hrstophe Deleuze ESISA/INPG LIS 7 déc 24/3 jan 25 ontexte commutaton de crcuts partage statque solaton complète ex : vox gaspllage de la bande passante commutaton de
Plus en détailPrêt de groupe et sanction sociale Group lending and social fine
Prêt de roupe et sancton socale Group lendn and socal fne Davd Alary Résumé Dans cet artcle, nous présentons un modèle d antsélecton sur un marché concurrentel du crédt. Nous consdérons l ntroducton de
Plus en détailIDEI Report # 18. Transport. December 2010. Elasticités de la demande de transport ferroviaire: définitions et mesures
IDEI Report # 18 Transport December 2010 Elastctés de la demande de transport ferrovare: défntons et mesures Elastctés de la demande de transport ferrovare : Défntons et mesures Marc Ivald Toulouse School
Plus en détailRéseau RRFR pour la surveillance dynamique : application en e-maintenance.
Réseau RRFR pour la survellance dynamue : applcaton en e-mantenance. RYAD ZEMOURI, DANIEL RACOCEANU, NOUREDDINE ZERHOUNI Laboratore Unverstare de Recherche en Producton Automatsée (LURPA) 6, avenue du
Plus en détailImpôt sur la fortune et investissement dans les PME Professeur Didier MAILLARD
Conservatore atonal des Arts et Méters Chare de BAQUE Document de recherche n 9 Impôt sur la fortune et nvestssement dans les PME Professeur Dder MAILLARD Avertssement ovembre 2007 La chare de Banque du
Plus en détailREPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE. MEMOIRE Présentée à
REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE MEMOIRE Présentée à L Unversté de Batna Faculté des Scences Département de Physque
Plus en détailTD 1. Statistiques à une variable.
Danel Abécasss. Année unverstare 2010/2011 Prépa-L1 TD de bostatstques. Exercce 1. On consdère la sére suvante : TD 1. Statstques à une varable. 1. Calculer la moyenne et l écart type. 2. Calculer la médane
Plus en détailGUIDE D ÉLABORATION D UN PLAN D INTERVENTION POUR LE RENOUVELLEMENT DES CONDUITES D EAU POTABLE, D ÉGOUTS ET DES CHAUSSÉES
GUIDE D ÉLABORATION D UN PLAN D INTERVENTION POUR LE RENOUVELLEMENT DES CONDUITES D EAU POTABLE, D ÉGOUTS ET DES CHAUSSÉES Gude destné au mleu muncpal québécos NOVEMBRE 2013 Coordnaton : Martn Cormer,
Plus en détailSurveillance temps-réel des systèmes Homme-Machine. Application à l assistance à la conduite automobile
Survellance temps-réel des systèmes Homme-Machne. Applcaton à l assstance à la condute automoble Mguel Gonzalez-Mendoza To cte ths verson: Mguel Gonzalez-Mendoza. Survellance temps-réel des systèmes Homme-Machne.
Plus en détailParlons. retraite. au service du «bien vieillir» L Assurance retraite. en chiffres* 639 192 retraités payés pour un montant de 4,2 milliards d euros
Édton Pays de la Lore Parlons La lettre aux retratés du régme général de la Sécurté socale 2012 retrate L Assurance retrate en chffres* 12,88 mllons de retratés 17,58 mllons de cotsants 346 000 bénéfcares
Plus en détailSéparation de Sources par lissage cepstral des masques binaires
Séparaton de Sources par lssage cepstral des masques bnares Ibrahm Mssaou 1 Zed Lachr 1, 2 (1) École natonale d ngéneurs de Tuns, ENIT, BP. 37 Le Belvedere, 1002 Tuns, Tunse (2) Insttut natonal des scences
Plus en détailProfessionnel de santé équipé de Médiclick!
Professonnel de santé équpé de Médclck! Dosser Médcal Partagé en Aqutane Ce gude vous présente les prncpales fonctonnaltés réservées aux professonnels de santé membres du réseau AquDMP. Sommare Connexon
Plus en détailLes déterminants de la détention et de l usage de la carte de débit : une analyse empirique sur données individuelles françaises
Les détermnants de la détenton et de l usage de la carte de débt : une analyse emprque sur données ndvduelles françases Davd Boune Marc Bourreau Abel Franços Jun 2006 Département Scences Economques et
Plus en détailGrandeur physique, chiffres significatifs
Grandeur physque, chffres sgnfcatfs I) Donner le résultat d une mesure en correspondance avec l nstrument utlsé : S avec un nstrument, ren n est ndqué sur l ncerttude absolue X d une mesure X, on consdère
Plus en détailLa théorie classique de l information. 1 ère partie : le point de vue de Kolmogorov.
La théore classque de l nformaton. ère parte : le pont de vue de Kolmogorov. La sute de caractères comme outl de descrpton des systèmes. La scence peut être vue comme l art de compresser les données quelles
Plus en détailCorrections adiabatiques et nonadiabatiques dans les systèmes diatomiques par calculs ab-initio
Correctons adabatques et nonadabatques dans les systèmes datomques par calculs ab-nto Compte rendu du traval réalsé dans le cadre d un stage de quatre mos au sen du Groupe de Spectroscope Moléculare et
Plus en détailAPPROXIMATION PAR RÉSEAUX À FONCTIONS RADIALES DE BASE APPLICATION À LA DÉTERMINATION DU PRIX D ACHAT D UNE
APPROXIMATION PAR RÉSEAUX À FONCTIONS RADIALES DE BASE APPLICATION À LA DÉTERMINATION DU PRIX D ACHAT D UNE OPTION. A. Lendasse, J. Lee 2, E. de Bodt 3, V. Wertz, M. Verleysen 2 Unversté catholque de Louvan,
Plus en détailEcole Polytechnique de Montréal C.P. 6079, succ. Centre-ville Montréal (QC), Canada H3C3A7 lucas.greze@polymtl.ca robert.pellerin@polymtl.
CIGI 2011 Processus d accélératon de proets sous contrantes de ressources avec odes de chevaucheent LUCAS GREZE 1, ROBERT PELLERIN 1, PATRICE LECLAIRE 2 1 CHAIRE DE RECHERCHE JARISLOWSKY/SNC-LAVALIN EN
Plus en détailLes déterminants de la détention et de l usage de la carte de débit : une analyse empirique sur données individuelles françaises
Les détermnants de la détenton et de l usage de la carte de débt : une analyse emprque sur données ndvduelles françases Davd Boune a, Marc Bourreau a,b et Abel Franços a,c a Télécom ParsTech, Département
Plus en détailACTE DE PRÊT HYPOTHÉCAIRE
- 1 - ACTE DE PRÊT HYPOTHÉCAIRE 5453F QC FR-2010/01 Taux fxe Le. Devant M e, notare soussgné pour la provnce de Québec, exerçant à. ONT COMPARU : ET : (C-après parfos appelé dans le présent Acte l «emprunteur»
Plus en détailCHAPITRE 14 : RAISONNEMENT DES SYSTÈMES DE COMMANDE
HAITRE 4 : RAISONNEMENT DES SYSTÈMES DE OMMANDE RAISONNEMENT DES SYSTÈMES DE OMMANDE... 2 INTRODUTION... 22 RAELS... 22 alcul de la valeur ntale de la répone à un échelon... 22 alcul du gan tatque... 22
Plus en détailPour plus d'informations, veuillez nous contacter au 04.75.05.52.62. ou à contact@arclim.fr.
Régulaton Sondes & Capteurs Détente frgo électronque Supervson & GTC Humdfcaton & Déshu. Vannes & Servomoteurs Comptage eau, elec., énerge Ancens artcles Cette documentaton provent du ste www.arclm.eu
Plus en détailUNE ETUDE ECONOMÉTRIQUE DU NOMBRE D ACCIDENTS
BRUSSELS ECONOMIC REVIEW - CAHIERS ECONOMIQUES DE BRUXELLES VOL. 49 - N 2 SUMMER 2006 UNE ETUDE ECONOMÉTRIQUE DU NOMBRE D ACCIDENTS DANS LE SECTEUR DE L ASSURANCE AUTOMOBILE* MARÍA DEL CARMEN MELGAR**
Plus en détailPratique de la statistique avec SPSS
Pratque de la statstque avec SPSS SUPPORT Transparents ultéreurement amélorés et ms à jour sur le ste du SMCS LIENS UTILES Ste du SMCS (Support en Méthodologe et Calcul Statstque) : http://www.stat.ucl.ac.be/smcs/
Plus en détailThe new Art of Smart. Loewe Art. La nouvelle intelligence télévisuelle.
The new Art of Smart. Loewe Art. La nouvelle ntellgence télévsuelle. Desgn et technologe. My Perfect Entertanment. 1 Les nouveaux télévseurs Art allent le melleur de la technologe à un desgn mnmalste.
Plus en détailErP : éco-conception et étiquetage énergétique. Les solutions Vaillant. Pour dépasser la performance. La satisfaction de faire le bon choix.
ErP : éco-concepton et étquetage énergétque Les solutons Vallant Pour dépasser la performance La satsfacton de fare le bon chox. ErP : éco-concepton et étquetage énergétque Eco-concepton et Etquetage
Plus en détailCorrigé du problème de Mathématiques générales 2010. - Partie I - 0 0 0. 0.
Corrgé du problème de Mathématques générales 2010 - Parte I - 1(a. Sot X S A. La matrce A est un polynôme en X donc commute avec X. 1(b. On a : 0 = m A (A = m A (X n ; le polynôme m A (x n est annulateur
Plus en détailINTRODUCTION. Jean-Pierre MAGNAN Chef de la section des ouvrages en terre Département des sols et fondations Laboratoire central
Etude numérque de la consoldaton undmensonnelle en tenant compte des varatons de la perméablté et de la compressblté du sol, du fluage et de la non-saturaton Jean-Perre MAGNAN Chef de la secton des ouvrages
Plus en détail- Acquisition de signaux en sismologie large bande. - Acquisition de signaux lents, magnétisme, MT.
87 DUCAPTEURAUXEANQUESDEDONNEES. TECHNQUES D'NSTRUMENTATON EN GEOPEY8QUE. J:M. CANTN Unversté Lous Pasteur (Strasbourg 1) nsttut de Physque du Globe de Strasbourg Ecole et Observatore de Physque du Globe.
Plus en détailComparative performance for isolated points detection operators: application on surface defects extraction
Comparatve performance for solate ponts etecton operators: applcaton on surface efects extracton R. Seuln, G. Delcrox, F. Merenne Laboratore Le2-12, Rue e la Fonere - 71200 Le Creusot - FRANCE e-mal: ralph.seuln@utlecreusot.u-bourgogne.fr
Plus en détailFaire des régimes TNS les laboratoires de la protection sociale de demain appelle des évolutions à deux niveaux :
Réformer en profondeur la protecton socale des TNS pour la rendre plus effcace Résumé de notre proposton : Fare des régmes TNS les laboratores de la protecton socale de deman appelle des évolutons à deux
Plus en détailMEMOIRE. Présenté au département des sciences de la matière Faculté des sciences
REPUBLIQUE LERIEN DEMOCRTIQUE ET POPULIRE Mnstère de l ensegnement supéreur et de la recherche scentfque Unversté El-Hadj Lakhdar-BTN- MEMOIRE Présenté au département des scences de la matère Faculté des
Plus en détailGuide du divertissement de voiture 2002-2003
* Gude du dvertssement de voture 2002-2003 * le son. l mage. l émoton Osez aller de l'avant Poneer vous promet tout ce qu'l vous faut pour fler drot vers l'avenr. Lassez les nouveaux systèmes de navgaton
Plus en détailPREMIERS PAS en REGRESSION LINEAIRE avec SAS. Josiane Confais (UPMC-ISUP) - Monique Le Guen (CNRS-CES-MATISSE- UMR8174)
PREMIERS PAS en REGRESSION LINEAIRE avec SAS Josane Confas (UPMC-ISUP) - Monque Le Guen (CNRS-CES-MATISSE- UMR874) e-mal : confas@ccr.jusseu.fr e-mal : monque.leguen@unv-pars.fr Résumé Ce tutorel accessble
Plus en détail