Expansion sémantique de requêtes
|
|
- Jérémie Lepage
- il y a 8 ans
- Total affichages :
Transcription
1 Expansion sémantique de requêtes Orange Labs Jean-Léon Bouraoui, Emilie Guimier de Neef, Benoît Gaillard, Malek Boualem, Olivier Collin Mercredi 31 mars 2010
2 SOMMAIRE Problématique et état de l art Contribution principale Contributions complémentaires 2 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
3 Expansion de requête : enjeux En Recherche d'information, près d'1 terme de requête sur 5 est inadéquat! 20% de mots communs à deux personnes pour désigner un même concept (études de Bates (1986) et de Furnace (1987)) 10 à 25% des documents pertinents ne contiennent aucun terme d'une requête donnée (études sur TREC: Billerbeck (2005, p. 4)) Faible similarité entre l'espace des requêtes et l'espace des documents (Cui et al. (2002, p. 327) ) 3 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
4 Problématique Limitations possibles de la requête initiale: Générique VS spécifique Musique rock, rap ; sport football, basket, Sigles VS mots complets OM Olympique de Marseille; TV télévision Utilisation d'une seule forme lexicale chat chats, chattes Objectif: augmentation du nombre de réponses pertinentes modifier la requête de l'usager en proposant des mots voisins de ceux employés initialement 4 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
5 Expansion de requêtes: Avantages et risques Avantages: Augmentation du rappel et/ou précision Suggestion à l utilisateur de termes qu il ne connaissait pas Risque: "Query drift" : déviation par rapport à l intention initiale de l usager Exemple: java (programmation) java (île) = Indonésie, javanais, etc. 5 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
6 Expansion de requêtes: ne pas confondre avec Désambiguïsation : choisir le ou les concepts auquel réfère l'usager à partir des termes qu'il a entré. Interprétation de requêtes : déterminer les intentions de l usager, à partir des termes employés dans sa requête. Suggestion de termes : comme son nom l indique Différences: mode d obtention et d utilisation des termes 6 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
7 Principales approches Statistiques: corrélation entre les mots basée sur leurs cooccurences. Approche globale: à partir de l'ensemble des documents indexés Approche locale: à partir de documents résultants d'une première requête expansion aveugle, relevance feedback, etc. A partir de logs de requêtes: résultats de requêtes précédentes et similaires, ou requêtes elles-mêmes Linguistiques: ressources linguistiques: ontologies, thesaurus, relations syntaxiques ou morphologiques 7 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
8 Approches statistiques Approche locale: Relevance feedback: l'usager fait une première requête, et indique parmi les documents retournés lesquels sont le plus pertinents; à partir de ceux-ci des mots clés sont extraits afin de mener une deuxième requête "étendue". Expansion aveugle: même principe, mais la pertinence est basée sur le classement du moteur de recherche (d'où le terme "aveugle") Approche globale: terms clustering, matrice de similarité, PhraseFinder, Avantages Limites Robustesse Travail semi-automatique Dépendant de la taille des ressources Pas de sémantique associée Moins efficace pour les documents du Web "moderne" (informations parasites: cadres, publicités, etc. ) 8 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
9 Approches à partir de logs Plusieurs méthodes possibles: Calcul de similarité entre la requête courante et d'anciennes requêtes, puis approche statistique Association entre les requêtes et les documents retournés Considérer les requêtes précédentes comme des documents, puis techniques statistiques de relevance feedback ou d'expansion aveugle Avantages Adaptation aux requêtes Limites Nécessite de disposer d'une quantité importante de logs, de même type (public, thèmes) que le moteur cible 9 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
10 Approches linguistiques Ressources sémantiques: Wordnet, Lexique Génératif de Pustejovsky, ConceptNet, ontologies et réseaux sémantiques divers Parcours du réseau selon diverses modalités: relations sémantiques (hyperonymie, méronymie, synonymie, etc.), opérations logiques (inférences par exemple) Ressources lexico-syntaxiques: Voisinage distributionnel, variantes morphologiques, lemmes, etc. Avantages Expansions précises et adaptées à la requête initiale Limites Travail de préparation et d'étude en amont 10 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
11 Modes d'utilisation de l'expansion de requêtes Expansion de requêtes automatique: Formation automatique d'une deuxième requête à partir des expansions proposées Mode le plus ancien et le plus répandu Risque de bruit dans les résultats (query drift) Problématiques de la pondération des termes et/ou de l'utilisation de booléens Expansion de requêtes interactive: Proposition à l'utilisateur de choisir parmi les propositions d'expansions A priori, moins de risques de bruit Problématiques d'ergonomie 11 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
12 Exemples d'interfaces d'expansion de requêtes interactive Joho et al. (2004) White et al. (2006) 12 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
13 Utilisation dans des moteurs de recherche: Google 13 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
14 Utilisation dans des moteurs de recherche: Yahoo 14 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
15 Utilisation dans des moteurs de recherche: Exalead 15 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
16 SOMMAIRE Problématique et état de l art Contribution principale Principes Applications: moteur de recommandation Applications: CLIR Contributions complémentaires 16 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
17 Approche choisie Utilisation de ressources linguistiques Ressources existantes: Lexicales: lemmes Sémantiques: sens + informations transverses structurées Logicielles: plateforme TiLT (Heinecke et al. (2008)) Geonames: base de données géographiques (8 millions d'entrées, 20 champs descriptifs): 17 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
18 Axes d'expansion Flexions: joueur joueurs, joueuse, joueuses Synonymes: télévision télé, tv, petit écran, téléviseur Voisins sémantiques: football footballeur, entraîneur, goal Génériques-spécifiques: moto quad, trail. Sigles: JO Jeux Olympiques, Journal Officiel Géographie: Bretagne Côtes-d'armor, Finistère Finistère Anteren, Ar-veuzid 18 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
19 Autres caractéristiques Filtrage des expansions Termes de l application: à inclure Termes à supprimer Relations à supprimer Adaptation aux données de l application Intégration dans un moteur de recherche de contenus vidéos 19 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
20 Architecture 20 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
21 Evolutions souhaitées Optimisation du lexique Nettoyage Enrichissement Evaluation Ergonomie de la présentation des résultats Ajout de nouvelles fonctionnalités d expansion 21 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
22 SOMMAIRE Problématique et état de l art Contribution principale Principes Applications: moteur de recommandation Applications: CLIR Contributions complémentaires 22 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
23 Recommandation Intégration dans un module de recommandation de contenu Objectif: proposer à l utilisateur des contenus (vidéos) susceptibles de l intéresser. L expansion augmente le nombre de contenus pertinents Résultats à venir 23 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
24 SOMMAIRE Problématique et état de l art Contribution principale Principes Applications: moteur de recommandation Applications: CLIR (collab. B. Gaillard, Orange Labs) Contributions complémentaires 24 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
25 Cross Language Information Retrieval : principes Accéder à des documents pertinents pour la recherche, mais dans une autre langue que celle de la requêtes 2 approches: Traduction automatique des requêtes Traduction automatique des documents Cadre de travail: Moteur de recherche de contenus vidéos d'actualité Indexation des métadonnées Traduction des métadonnées 25 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
26 CLIR et défaut de couverture lexicale 26 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
27 Calcul du taux de défaut de couverture lexicale Méthodologie: Filtrage d un corpus de requêtes avec deux lexiques français élimination des Entités Nommées, urls, fautes d orthographes = mots différents Croisement avec le corpus de métadonnées 2800 mots absents 27 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
28 Expansion de requête : valeur ajoutée au CLIR Liens étroits entre CLIR et expansion de requêtes Tous les avantages "monolingues" de l'expansion de requêtes plus: Réduction du taux de défaut de couverture lexicale (cf. Bellachia et al. (2008), Gaillard et Bouraoui, à paraître) Désambiguïsation (Ballesteros et al. (1998)). Exemple; chocolate (espagnol) chocolate cocoa blood (anglais) Problématiques spécifiques: Quand intervient l'expansion: avant/après la traduction? Risque : Problème du "query drift" encore plus important 28 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
29 Expansion de requêtes: un pont vers le vocabulaire des contenus traduits 29 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
30 Expansion de requêtes et CLIR : architecture 30 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
31 Expansion de requêtes et CLIR : validation Réduction du silence: Moyenne de 124 documents retournés sans expansion, 193 avec hausse de près 50 % Maintien de la précision: Calcul sur les 400 requêtes les plus fréquentes du corpus Précision à 10 (P 10 ) Sans expansion P 10 = 59%; Avec expansion P 10 = 55%; 31 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
32 Conclusions et perspectives sur le CLIR Approche prometteuse et innovante Evaluer le rappel Améliorer l'expansion 32 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
33 SOMMAIRE Problématique et état de l art Contribution principale Contributions complémentaires Expansion encyclopédique Expansion sur l actualité 33 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
34 SOMMAIRE Problématique et état de l art Contribution principale Contributions complémentaires Expansion encyclopédique Expansion sur l actualité 34 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
35 Wikipédia: Une base pour l expansion? Objectif: proposer des expansions à partir de et vers des termes «encyclopédiques» : Entités Nommées, termes absents du thesaurus Moyen: utilisation de Wikipedia ressource multilingue, exhaustive, et libre 2 approches utilisant les catégories de Wikipédia (sur la base d un travail d O. Collin, Orange Labs): Directement, comme «descripteurs» Indirectement, dans des treillis de Galois 35 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
36 Wikipédia: utilisation directe des catégories 36 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
37 Wikipédia; utilisation des treillis de Gallois Principes généraux (T. Girault) Notions d'intension et d'extension: L extension est une énumération de l ensemble des membres d une même catégorie. L intension est l ensemble des propriétés partagées par les membres d une même catégorie Un nœud du treillis = un "concept formel", défini par son intension et son extension 37 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
38 Wikipédia; utilisation des treillis de Gallois Principes généraux (T. Girault) 38 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
39 Wikipédia; utilisation des treillis de Gallois Application pour l expansion Sous-ensemble consacré à l informatique pages Chaque page est représentée par un vecteur de catégories contenant l'ensemble de toutes ses catégories parentes atteignant la catégorie terminale Formalisme des treillis de Galois: Le nom d une page = une extension, Chaque élément du vecteur associé = une intension concepts formels 39 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
40 Wikipédia; utilisation des treillis de Gallois résultats Regroupements de pages partageant des catégories communes "Navigation" dans le treillis en fonction du nombre d'intensions et d'extensions des concepts formels Exemple avec "Ethernet" extensions associées: Chiffreur IP, RS-232, IEEE 802.3, Protocole réseau,informatique, Réseau informatique, Matériel informatique, IEEE 802, Segment de réseau,architecture informatique, Carrier Sense Multiple Access with Collision Detection, Medium Attachment Unit Utilisation de tout ou partie des extensions comme "termes voisins" 40 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
41 Wikipédia; utilisation des treillis de Gallois résultats Structuration des termes voisins en catégories plus génériques. Exemple pour les jeux vidéos : type de jeu, époque, etc. 41 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
42 SOMMAIRE Problématique et état de l art Contribution principale Contributions complémentaires Expansion encyclopédique Expansion sur l actualité 42 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
43 Expansion sur l'actualité Objectif: générer des expansions qui varient dynamiquement en fonction de l'actualité. Xynthia tempête, victimes, passage PSG match, supporteurs, Foot L1, Lens Moyens: Corpus de dépêches d'actualité Sélection de n-grammes comportant au moins une Entité Nommée (test de Student) 43 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
44 Conclusions et perspectives Approches variées de l'expansion sémantique de requêtes Les intégrer dans un seul module Les évaluer Utilisation de l'interprétation de requêtes en amont (désambiguïsation, identification des locutions) 44 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
45 Eléments de bibliographie Ballesteros L., Croft W. B. "Resolving ambiguity for cross language retrieval". Proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Melbourne, Australia, 6471, Billerbeck B., Efficient Query Expansion, PhD Thesis, Melbourne, Australie, September Cui H., Wen J.R., Nie J.Y, Ma W.Y, Probabilistic Query Expansion Using Query Logs, WWW2002, May 7-11, 2002, p , Honolulu, Hawaii, USA. Efthimiadis E., "Query Expansion", Williams, Martha E., ed. Annual Review of Information Systems and Technology (ARIST), v31, pp , Johannes Heinecke, Grégory Smits, Christine Chardenon, Emilie Guimier De Neef, Estelle Maillebuau, Malek Boualem, "TiLT : plateforme pour le Traitement Automatique des Langues Naturelles". In: TAL, 2008 Volume 49 Numéro 2. Joho, H., Sanderson, M. and Beaulieu, M. (2004) A study of user interaction with a concept-based interactive query expansion support tool. Advances in Information Retrieval : 26th European Conference on IR Research (ECIR 2004), Sunderland, UK, p , April 5-7, White R. Y., Marchionini G., A Study of Real-Time Query Expansion Effectiveness, Annual ACM Conference on Research and Development in Information Retrieval archive, Proceedings of the 29th annual international ACM SIGIR conference on Research and development in information retrieval, 2006, p Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
46 Publications sur ces travaux Bouraoui J.-L., Etat de l'art sur l'expansion de requêtes, Rapport interne Orange Labs, 2009 Olivier Collin, Benoît Gaillard, J.-L. Bouraoui, Thomas Girault, Semantic resource extraction from the Wikipedia category lattice, Article long, FLaReNet Acquisition Workshop, LREC 2010, Malte, Mai 2010, (accepté, à paraître) B. Gaillard, J.-L. Bouraoui, E. Guimier de Neef, M. Boualem Query Expansion for Cross Language Information Retrieval Improvement, Article long, Fourth International Conference on Research Challenges in Information Science (RCIS), Nice, Mai 2010, (accepté, à paraître) B. Gaillard, J.-L. Bouraoui, Expansion de requêtes pour l'optimisation de la recherche d'information multilingue basée sur la traduction des contenus, Article long, Septième édition de la COnférence en Recherche d'information et Applications (CORIA 2010), mars 2010, (accepté, à paraître) 46 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
47 MERCI 47 Orange Labs - Recherche & Développement Expansion de requête 31/03/2010
De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues
De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues Maud Ehrmann Joint Research Centre Ispra, Italie. Guillaume Jacquet Xerox
Plus en détailRecherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA
RÉCITAL 2005, Dourdan, 6-10 juin 2005 Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA Siham Boulaknadel (1,2), Fadoua Ataa-Allah (2) (1) LINA FRE
Plus en détailTRAITEMENT AUTOMATIQUE DES LANGUES. Licence d'informatique 2ème Année Semestre 1. Département d'informatique Université de Caen Basse-Normandie
TRAITEMENT AUTOMATIQUE DES LANGUES Licence d'informatique 2ème Année Semestre 1 Département d'informatique Université de Caen Basse-Normandie https://dias.users.greyc.fr/?op=paginas/tal.html Plan Définition
Plus en détailConcevoir sa stratégie de recherche d information
Concevoir sa stratégie de recherche d information Réalisé : mars 2007 Dernière mise à jour : mars 2011 Bibliothèque HEC Paris Contact : biblio@hec.fr 01 39 67 94 78 Cette création est mise à disposition
Plus en détailFormation à la recherche documentaire sur le web
Formation à la recherche documentaire sur le web Objectif : Savoir effectuer des recherches pertinentes sur Internet Savoir distinguer les informations fiables sur Internet Savoir effectuer des recherches
Plus en détailHervé Couturier EVP, SAP Technology Development
Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud
Plus en détailPrésentation générale du projet data.bnf.fr
Présentation générale du projet data.bnf.fr La Bibliothèque nationale a mis en œuvre un nouveau projet, qui a pour but de rendre ses données plus utiles sur le web. Ceci nécessite de transformer données
Plus en détailTable des matières. Préface...5. Introduction...9
Préface......................................................5 Introduction..................................................9 Chapitre 1 Diversité des besoins, diversité des contenus........................13
Plus en détailCognit Ive Cas d utilisation
Cognit Ive Cas d utilisation 96-98, rue de Montreuil - 75011 Paris _ opicot@ _ + 33 (0)1 40 09 71 55 Sommaire Présentation de la plateforme Cognit Ive SemanticMail : Traitement sémantique des mails Projets
Plus en détailN. Paparoditis, Laboratoire MATIS
N. Paparoditis, Laboratoire MATIS Contexte: Diffusion de données et services locaux STEREOPOLIS II Un véhicule de numérisation mobile terrestre Lasers Caméras Système de navigation/positionnement STEREOPOLIS
Plus en détailRecherche bibliographique
Séminaire «Maîtrise de l information scientifique» Recherche bibliographique Dernière mise à jour : 07/01/2015 - Auteur : Frédérique Flamerie Recherche bibliographique : méthode & outils La recherche bibliographique
Plus en détailStructuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe
Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax karima.dhouib@isets.rnu.tn,
Plus en détailTEXT MINING Tour d Horizon
TEXT MINING Tour d Horizon Media Campus WAN IFRA "Structurer, optimiser et valoriser son contenu éditorial : les outils de text mining" 24 novembre 2009, PARIS Philippe BONNY Cabinet de Conseil et d Etudes
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailRessources lexicales au service de recherche et d indexation des images
RECITAL 2011, Montpellier, 27 juin - 1er juillet 2011 Ressources lexicales au service de recherche et d indexation des images Inga Gheorghita 1,2 (1) ATILF-CNRS, Nancy-Université (UMR 7118), France (2)
Plus en détailGKR. Geological Knowledge Representation Base de connaissances métallogéniques
GKR Geological Knowledge Representation Base de connaissances métallogéniques Objets Organiser un ensemble d informations complexes et hétérogènes pour orienter l exploration minière aux échelles tactiques
Plus en détail1 Description générale. Résumé
Station Sensunique: une plateforme Web modulaire, collaborative et évolutive d acquisition assistée de ressources terminologiques et non terminologiques (orientée Langues Contrôlées) Izabella Thomas 1,
Plus en détailUn dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus
JEP-TALN 2004, Traitement Automatique de l Arabe, Fès, 20 avril 2004 Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus ZAAFRANI Riadh Faculté des Sciences Juridiques,
Plus en détailUne plate-forme open-source de recherche d information sémantique
Une plate-forme open-source de recherche d information sémantique Ines Bannour, Haïfa Zargayouna Laboratoire d Informatique de l université Paris-Nord (LIPN) - UMR 7030 Université Paris 13 - CNRS 99, avenue
Plus en détailExploitation de hiérarchies sémantiques construites à partir du Trésor de la Langue Française informatisé (TLFi) pour la recherche d images
Exploitation de hiérarchies sémantiques construites à partir du Trésor de la Langue Française informatisé (TLFi) pour la recherche d images Inga Gheorghita 1,2,3 (1) Université de Lorraine, ATILF UMR 7118,
Plus en détailOPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE
OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE «Journée Open Data» 5 Novembre 2013 Présenté par : Imen Megdiche Directeur de thèse : Pr. Olivier Teste (SIG-IRIT) Co-directeur de thèse : Mr. Alain
Plus en détailProblématiques de recherche. Figure Research Agenda for service-oriented computing
Problématiques de recherche 90 Figure Research Agenda for service-oriented computing Conférences dans le domaine ICWS (International Conference on Web Services) Web services specifications and enhancements
Plus en détailJe catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs
Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs Journée organisée par le CRFCB Midi-Pyrénées / Languedoc-Roussillon
Plus en détailInitiation à la recherche documentaire
Initiation à la recherche documentaire 1 Objectifs Cette séance est destinée à reprendre les principes de la démarche documentaire pour construire un parcours pertinent en terme de méthodologie et de résultats
Plus en détailÉvaluation d une architecture de stockage RDF distribuée
Évaluation d une architecture de stockage RDF distribuée Maeva Antoine 1, Françoise Baude 1, Fabrice Huet 1 1 INRIA MÉDITERRANÉE (ÉQUIPE OASIS), UNIVERSITÉ NICE SOPHIA-ANTIPOLIS, I3S CNRS prénom.nom@inria.fr
Plus en détailQuels apprentissages info-documentaires au collège?
Quels apprentissages info-documentaires au collège? Quel cadre? Quels apprentissages associés? 1983 : Éducation aux médias (EAM) 1986 : Initiation à la recherche documentaire (IRD) 2003 : Information-Documentation
Plus en détailISTEX, vers des services innovants d accès à la connaissance
ISTEX, vers des services innovants d accès à la connaissance Synthèse rédigée par Raymond Bérard, directeur de l ABES, à partir du dossier de candidature d ISTEX aux Initiatives d excellence et des réunions
Plus en détailACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES
ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES Techniques symboliques de traitement automatique du langage pour l indexation thématique et l extraction d information temporelle Thèse Défense publique
Plus en détailProposition des cadres d évaluation adaptés à un système de RI personnalisé
Proposition des cadres d évaluation adaptés à un système de RI personnalisé Mariam Daoud, Lynda Tamine-Lechani Laboratoire IRIT, Université Paul Sabatier 118 Route de Narbonne, F-31062 TOULOUSE CEDEX 9
Plus en détailTiLT : plate-forme pour le traitement automatique des langues naturelles
TiLT : plate-forme pour le traitement automatique des langues naturelles Johannes Heinecke * Grégory Smits ** Christine Chardenon * Emilie Guimier De Neef * Estelle Maillebuau * Malek Boualem * * Orange
Plus en détailVers une approche Adaptative pour la Découverte et la Composition Dynamique des Services
69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard
Plus en détailTYPO3 & Synomia 24.06.2013. Cédric Tempestini <ctempestini@archriss.com>
TYPO3 & Synomia Cédric Tempestini Qui suis je?! 8 années d expérience sur TYPO3! Certifié TYPO3 depuis 2009! Administrateur sur le forum typo3-fr.org! Intervenant depuis 7 ans
Plus en détailRecherche d'images par le contenu Application au monitoring Télévisuel à l'institut national de l'audiovisuel
Recherche d'images par le contenu Application au monitoring Télévisuel à l'institut national de l'audiovisuel Alexis Joly alexis.joly@inria.fr INRIA - IMEDIA Alexis Joly cours monitoring p. 1 Plan de l'exposé
Plus en détailIndexation sémantique au moyen de coupes de redondance minimale dans une ontologie
TALN 25, Dourdan, 6 1 juin 25 Indexation sémantique au moyen de coupes de redondance minimale dans une ontologie Florian Seydoux & Jean-Cédric Chappelier Faculté Informatique et Communications Ecole Polytechnique
Plus en détailQu'est-ce qu'un moteur de recherche. Moteur de recherche sur Internet
Initiation à la navigation sur Internet avec le moteur de recherches Google 1/ 5 Qu'est-ce qu'un moteur de recherche Moteur de recherche sur Internet Un moteur de recherche est un site Internet comme un
Plus en détailVue Générale et Cas d Usage
Vue Générale et Cas d Usage Avril 2014 PARTENAIRE 1 Semsoft en bref Solution Société Data Integration for Business Users : all external and internal data aggregated on demand as in one excel file No Data
Plus en détailLa recherche documentaire et la recherche d informations professionnelles. BU Sciences BIU Montpellier PPE 2012
La recherche documentaire et la recherche d informations professionnelles 1 Introduction : la pratique étudiante Où commencez vous habituellement votre recherche d information? 84% des étudiants de 1er
Plus en détailIntégration de la dimension sémantique dans les réseaux sociaux
Intégration de la dimension sémantique dans les réseaux sociaux Application : systèmes de recommandation Maria Malek LARIS-EISTI maria.malek@eisti.fr 1 Contexte : Recommandation dans les réseaux sociaux
Plus en détailLe bénéfice maximal de votre documentation
www.fluidtopics.com Le bénéfice maximal de votre documentation Manuels utilisateurs, guides techniques, notes d installation ou de maintenance, plaquettes marketing La documentation de vos produits est
Plus en détailLa recherche d'information sur Internet
La recherche d'information sur Internet Compétence du socle : Je sais utiliser les fonctions principales d'un outil de recherche sur le Web (moteur de recherche, annuaire...) CDI du collège Léon Cazeneuve
Plus en détailOASIS www.oasis-open.org/committees/xacml/docs/docs.shtml Date de publication
Statut du Committee Working Draft document Titre XACML Language Proposal, version 0.8 (XACML : XML Access Control Markup Language) Langage de balisage du contrôle d'accès Mot clé Attestation et sécurité
Plus en détailInitiation à la recherche documentaire LA RECHERCHE SUR INTERNET
Initiation à la recherche documentaire LA RECHERCHE SUR INTERNET Les Ressources d'internet Le web? Système hypermédia d accès à l information sous diverses formes, texte, son, image disponible sur Internet
Plus en détailD origine destiné à la conception de blog, WordPress est devenu l outil incontournable dans la liste des systèmes de gestion de contenus..
WordPress - CMS open-source Permet de créer simplement des sites internet ou de blogs. D origine destiné à la conception de blog, WordPress est devenu l outil incontournable dans la liste des systèmes
Plus en détailSécurisation du stockage de données sur le Cloud Michel Kheirallah
Sécurisation du stockage de données sur le Cloud Michel Kheirallah Introduction I Présentation du Cloud II Menaces III Exigences de sécurité IV Techniques de sécurisation 2 26/02/2015 Présentation du Cloud
Plus en détailAnalyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57
Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation
Plus en détailSélection d un moteur de recherche pour intranet : Les sept points à prendre en compte
Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte 1Les bases : vos objectifs 2 Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte
Plus en détailSemantic Web Inside Guillaume Érétéo Directeur R&D
Semantic Web Inside Guillaume Érétéo Directeur R&D Services de valorisation de données pour Structuration de fond documentaire pertinence Analyse de réseaux sociaux veille Animation de réseau sociaux audience
Plus en détailLEXIQUE DES TERMES DOCUMENTAIRES LES PLUS COURANTS
LEXIQUE DES TERMES DOCUMENTAIRES LES PLUS COURANTS Annuaire Ouvrage publié en principe chaque année ou selon une périodicité proche de l'année, qui donne une liste de noms de personnes ou d'organismes
Plus en détailAnalyses croisées de sites Web pour détecter les sites de contrefaçon. Prof. Dr. Olivier Biberstein
Analyses croisées de sites Web pour détecter les sites de contrefaçon Prof. Dr. Olivier Biberstein Division of Computer Science 14 Novembre 2013 Plan 1. Présentation générale 2. Projet 3. Travaux futurs
Plus en détailEcole Préparatoire SNV Université d Oran Semestre 02 2014/2015 Matière : Travaux d Initiative Personnelle Encadrés (TIPE) Prof. M. Z.
Ecole Préparatoire SNV Université d Oran Semestre 02 2014/2015 Matière : Travaux d Initiative Personnelle Encadrés (TIPE) Prof. M. Z. TALEB Avec quel outil? Comment? Trouvez-vous facilement l information?
Plus en détailEXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE
ème Colloque National AIP PRIMECA La Plagne - 7- avril 7 EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE Bruno Agard Département de Mathématiques et de Génie Industriel, École
Plus en détailDescription de Produit Logiciel. AMI News Monitor v2.0. SPD-AMINM-10 v1.0
Description de Produit Logiciel AMI News Monitor v2.0 SPD-AMINM-10 v1.0 Octobre 2010 Sommaire 1 Préambule... 3 2 Approbations... 3 3 Fonctionnalités... 4 3.1 Principes... 4 3.2 Sources d information...
Plus en détailStructure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données
Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques
Plus en détailSITE INTERNET BLOG SITE E-COMMERCE GRILLE D ANALYSE / AUDIT PREMIERE ANALYSE. Entreprises. o Public spécialisé o Etudiants o Enfants
PREMIERE ANALYSE Nom du site web : Url du site : Objectif du site / description (balise description) : Mots-clés du site (balise keywords) : Cible du site : o Entreprises o Public spécialisé o
Plus en détailUne proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes
303 Schedae, 2007 Prépublication n 46 Fascicule n 2 Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes Samya Sagar, Mohamed Ben Ahmed Laboratoire
Plus en détailIntelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com
Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines
Plus en détailUTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES
UTILISATION DU WEB COMME MEGA-BASE DE DONNÉES LINGUISTIQUE : APPLICATION À LA TRADUCTION DE COOCCURRENCES LEXICALES FRANÇAISES-ANGLAISES Chrystel Millon & Stéphanie Léon Equipe DELIC Université de Provence
Plus en détailRecherche d information textuelle
Recherche d information textuelle Recherche Web B. Piwowarski CNRS / LIP6 Université Paris 6 benjamin@bpiwowar.net http://www.bpiwowar.net Master IP - 2014-15 Cours et travaux pratiques basés sur les documents
Plus en détailApplication de K-means à la définition du nombre de VM optimal dans un cloud
Application de K-means à la définition du nombre de VM optimal dans un cloud EGC 2012 : Atelier Fouille de données complexes : complexité liée aux données multiples et massives (31 janvier - 3 février
Plus en détailEn 2010, on compte environ 1,65 milliard d utilisateurs d internet, Introduction
Introduction La nature, pour être commandée, doit être obéie.» Francis Bacon, peintre anglo-irlandais. En 2010, on compte environ 1,65 milliard d utilisateurs d internet, soit un quart de la population
Plus en détailLearning Object Metadata
Page 1 of 7 Learning Object Metadata Le LOM (Learning Object Metadata), est un schéma de description de ressources d enseignement et d apprentissage. Le LOM peut être utilisé pour décrire des ressources
Plus en détailCompte-rendu de Hamma B., La préposition en français
Compte-rendu de Hamma B., La préposition en français Badreddine Hamma To cite this version: Badreddine Hamma. Compte-rendu de Hamma B., La préposition en français. Revue française de linguistique appliquée,
Plus en détailMETTRE LE NUMÉRIQUE AU SERVICE D UN NOUVEAU MODÈLE DE BIBLIOTHÈQUE
1 METTRE LE NUMÉRIQUE AU SERVICE D UN NOUVEAU MODÈLE DE BIBLIOTHÈQUE Architectures Numériques d'informations. Usages, Contenus et Technologies. Paris, 2 juillet 2010 L emprunteur se fait rare 2 Evolution
Plus en détailVocabulaire juridique multilingue comparé. Caroline Reichling Direction générale de la Traduction Cour de justice de l Union européenne
Vocabulaire juridique multilingue comparé Caroline Reichling Direction générale de la Traduction Cour de justice de l Union européenne 22 novembre 2012 Vocabulaire juridique multilingue comparé La Cour
Plus en détailConstruction et maintenance d une ressource lexicale basées sur l usage
Construction et maintenance d une ressource lexicale basées sur l usage Laurie Planes 1, (1) Inbenta France, 164 route de Revel, 31400 TOULOUSE lplanes@inbenta.com Résumé. Notre société développe un moteur
Plus en détailBanque d outils d aide à l évaluation diagnostique
Banque d outils d aide à l évaluation diagnostique Url : http://www.banqoutils.education.gouv.fr/index.php Niveau : GS au Lycée Conditions d'utilisation : Pas d'inscription nécessaire. Format des ressources
Plus en détailDéfinition et diffusion de signatures sémantiques dans les systèmes pair-à-pair
Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair Raja Chiky, Bruno Defude, Georges Hébrail GET-ENST Paris Laboratoire LTCI - UMR 5141 CNRS Département Informatique et Réseaux
Plus en détailChapitre 1: Introduction générale
Chapitre 1: Introduction générale Roch Glitho, PhD Associate Professor and Canada Research Chair My URL - http://users.encs.concordia.ca/~glitho/ Table des matières Définitions et examples Architecture
Plus en détailOpen Data. Enjeux et perspectives dans les télécommunications
Open Data Enjeux et perspectives dans les télécommunications Orange Labs 28/09/2012 Patrick launay, Recherche & Développement, Orange Labs - Recherche & Développement Printemps de la Recherche EDF Open
Plus en détailLe signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype
Le signalement des acquisitions numériques à l échelle nationale Le rôle du hub de métadonnées scénarios et prototype Raymond BERARD, directeur de l ABES 0 Sommaire 1. La genèse du projet 2. Etude de faisabilité
Plus en détailwww.ambbn.com 04/05/2011 Amundi Liquidity A creative market introduction Date
www.ambbn.com 04/05/2011 Amundi Liquidity A creative market introduction Date 1 Notre cible : les Trésoriers d entreprise 2 Notre dilemne : à la fois leader et challenger! 3 Un marché trusté par les plus
Plus en détailSéminaire «Maîtrise de l information scientifique» Exploitation de l information : optimiser sa gestion documentaire
Séminaire «Maîtrise de l information scientifique» Exploitation de l information : optimiser sa gestion documentaire Dernière mise à jour : 01/09/2013 - Auteur : Frédérique Flamerie Programme Exploitation
Plus en détailPerspectives en matière de portails géographiques et de 3D
Perspectives en matière de portails géographiques et de 3D version du Géoportail de l IGN Aurélien Barbier-Accary (Atos Worldline) et Frédéric Rouas (Diginext) Un groupement d expertises Depuis 2006 et
Plus en détailUne approche pour l extraction automatique de structures sémantiques de documents XML
Une approche pour l extraction automatique de structures sémantiques de documents XML Salma Ben Mefteh*,**, Kaïs Khrouf*, Jamel Feki*, Maha Ben Kraiem*, Chantal Soulé-Dupuy** * Laboratoire MIR@CL, Université
Plus en détailRéseaux Locaux. Objectif du module. Plan du Cours #3. Réseaux Informatiques. Acquérir un... Réseaux Informatiques. Savoir.
Mise à jour: Mars 2012 Objectif du module Réseaux Informatiques [Archi/Lycée] http://fr.wikipedia.org/ Nicolas Bredèche Maître de Conférences Université Paris-Sud bredeche@lri.fr Acquérir un... Ressources
Plus en détailFiche méthodologique Rédiger un cahier des charges
Fiche méthodologique Rédiger un cahier des charges Plan de la fiche : 1 : Présentation de la fiche 2 : Introduction : les grands principes 3 : Contenu, 1 : positionnement et objectifs du projet 4 : Contenu,
Plus en détailEurateach labellisé par la région et le FAFIEC. Si vous remplissez les conditions suivantes : Votre entreprise compte moins de 250 salariés
> FORMATIONS CLES EN MAIN > FORMATIONS SUR MESURE Eurateach labellisé par la région et le FAFIEC Dans le cadre du Pacte Régional de Continuité Professionnelle signé par l Etat, la Région et les Partenaires
Plus en détailLabCom SMILK. Social Media Intelligence and Linked Knowledge. ISTE 2013 Keynote thumb wrestling
LabCom SMILK Social Media Intelligence and Linked Knowledge ISTE 2013 Keynote thumb wrestling un lab quoi? un Laboratoire de recherche Commun (LabCom) entre un organisme de recherche et une entreprise
Plus en détailApplication de la méthode QFD comme outil d'extraction des connaissances métier en conception intégrée
Application de la méthode QFD comme outil d'extraction des connaissances métier en conception intégrée Estelle FREY, Samuel GOMES, Jean-Claude SAGOT Laboratoire Systèmes et Transports Equipe ERgonomie
Plus en détailLa solution pour gérer vos connaissances techniques et scientifiques
La solution pour gérer vos connaissances techniques et scientifiques La solution pour gérer, sécuriser et réutiliser vos connaissances techniques et scientifiques TEEXMA est le premier outil collaboratif
Plus en détailMise à jour Stable Recrutement juin 2014 Mise à jour de la version stable St. Gallen 02.06.2014
Mise à jour Stable Recrutement juin 2014 Mise à jour de la version stable St. Gallen Explication des icones Dans chaque communication de mise à jour, les icones utilisés ont la signification suivante:
Plus en détailMémoire DEA Système d'information Management and Technology of Information Systems
Mémoire DEA Système d'information Management and Technology of Information Systems Titre : Expérience sur l'utilisation de conjonctions de termes et la prise en compte des dépendances entre termes d'indexation
Plus en détail«Innovation Intelligence» La valorisation des données massives au service des partenariats R&D. Expernova Université d été GFII 11-09-2014
«Innovation Intelligence» La valorisation des données massives au service des partenariats R&D Expernova Université d été GFII 11-09-2014 [Une tendance forte à l Open Innovation ] «Le monde est devenu
Plus en détailFaculté de Médecine Comité des thèses Année 2012 Séminaire-Atelier n 1
Faculté de Médecine Comité des thèses Année 2012 Séminaire-Atelier n 1 La recherche bibliographique La recherche bibliographique Temps essentiel Début de travail +++ Pendant la Rédaction Comparer son travail
Plus en détailLECTURE, RECHERCHE DOCUMENTAIRE ET INDEXATION
LECTURE, RECHERCHE DOCUMENTAIRE ET INDEXATION Séquence Lettres / Documentation / TICE Classe de 6è et club journal Collège Gabrielle Colette Puget sur Argens Académie de Nice Roxane Obadia CONSTAT INITIAL
Plus en détailUne méthode d apprentissage pour la composition de services web
Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia Soufiene.lajmi@ensi.rnu.tn,
Plus en détailEvolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014 pascal.dayre@enseeiht.
Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS IDS2014, Nailloux 26-28/05/2014 pascal.dayre@enseeiht.fr 1 MVC et le web 27/05/14 2 L'évolution des systèmes informatiques
Plus en détailFormula Negator, Outil de négation de formule.
Formula Negator, Outil de négation de formule. Aymerick Savary 1,2, Mathieu Lassale 1,2, Jean-Louis Lanet 1 et Marc Frappier 2 1 Université de Limoges 2 Université de Sherbrooke Résumé. Cet article présente
Plus en détailUn logiciel de contrôle parental, c est quoi?
LES LOGICIELS DE CONTROLE PARENTAL Ces dispositifs de protection des mineurs sur Internet proposent des fonctionnalités de plus en plus évoluées. Mais ils ne remplaceront jamais l action pédagogique des
Plus en détailContrôle parental NOTE AUX PARENTS. Vita avant d autoriser votre enfant à jouer. Régler le contrôle parental sur le système PlayStation
Contrôle parental NOTE AUX PARENTS Régler le contrôle parental sur le système Vita avant d autoriser votre enfant à jouer. 4-419-422-01(1) Le système Vita propose plusieurs fonctionnalités pour aider parents
Plus en détailMercredi 15 Janvier 2014
De la conception au site web Mercredi 15 Janvier 2014 Loïc THOMAS Géo-Hyd Responsable Informatique & Ingénierie des Systèmes d'information loic.thomas@anteagroup.com 02 38 64 26 41 Architecture Il est
Plus en détailGlossaire. www.themanualpage.org ( themanualpage.org) soumises à la licence GNU FDL.
Glossaire Ce glossaire contient les termes techniques et de spécialité les plus employés dans cette thèse. Il emprunte, pour certaines d entre elles, les définitions proposées par www.themanualpage.org
Plus en détailMéthode de classification des réponses d un moteur de recherche
SETIT 2005 3 rd International Conference: Sciences of Electronic, Technologies of Information and Telecommunications March 27-31, 2005 TUNISIA Méthode de classification des réponses d un moteur de recherche
Plus en détailLe mot de l équipe. Une Triple compétence pour nos intervenants AMOS. L alternance MANAGER DES ORGANISATIONS SPORTIVES
MANAGER DES ORGANISATIONS SPORTIVES Deportiva Sesión Valencia 2010 Le mot de l équipe AMOS a pour mission de former, dans le domaine des Organisations Sportives et des Entreprises liées au sport, des étudiants
Plus en détailCOMMUNICATEUR BLISS COMMANDE PAR UN SENSEUR DE POSITION DE L'OEIL
COMMUNICATEUR BLISS COMMANDE PAR UN SENSEUR DE POSITION DE L'OEIL J. TICHON(1) (2), J.-M. TOULOTTE(1), G. TREHOU (1), H. DE ROP (2) 1. INTRODUCTION Notre objectif est de réaliser des systèmes de communication
Plus en détailCatalogue des formations Edition 2015
Antidot - Formations Catalogue des formations Edition 2015 : catalogue_formation_2015 Révision du 06.01.2015 Sommaire!!"##$%&'( )! $*$+,(-'(."##'+.'&( /!,'.0+"1"2%'( /!!."3'( /! $(3&"3"!(-4(5(.$,$1"24'(-'!(6"&#$,%"+!(7('-%,%"+()89:(;(
Plus en détailBrève introduction à la recherche d!information sur le Web à base d!agents logiciels
Plan Brève introduction à la recherche d!information sur le Web à base d!agents logiciels Bernard ESPINASSE Université d!aix-marseille 2010 Rappels sur les agents logiciels Problématique de la RI sur le
Plus en détailStéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 25/12/2006 Stéphane Tufféry - Data Mining - http://data.mining.free.fr
1 Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 2 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data
Plus en détail