Introduction à la Recherche d information
|
|
|
- Claire Grenon
- il y a 10 ans
- Total affichages :
Transcription
1 Introduction à la Recherche d information M. Boughanem [email protected] Université Paul Sabatier de Toulouse Laboratoire IRIT 1
2 Plan Introduction à la Recherche d information (RI) Tour d horizon sur les techniques de RI Recherche d information sur le Web Où en sommes nous 2
3 Qu est ce que la RI? Recherche d information (RI) : Ensemble des méthodes et techniques pour l acquisition, l organisation, le stockage, la recherche et la sélection d information pertinente pour un utilisateur 3
4 Définition de wikipédia Information retrieval (IR) is the science of searching for documents, for information within documents, and for metadata about documents, as well as that of searching relational databases and the World Wide Web. IR is interdisciplinary, based on computer science, mathematics, library science, information science, information architecture, cognitive psychology, linguistics, statistics, and physics. Automated information retrieval systems are used to reduce what has been called "information overload". Many universities and public libraries use IR systems to provide access to books, journals and other documents. Web search engines are the most visible IR applications. 4
5 Exemples de Systèmes de RI 5
6 ... les moteurs de recherche traitent une petite partie de l information disponible Internet (web localisé par les moteurs) juste la partie visible de l iceberg (40 milliards de pages google) Intranet (entreprises, laboratoires, ) 6
7 Volume sans cesse croissant Gros volumes d informations (numériques) créées toutes les minutes 1% sur l Internet (localisé par les moteurs) 99% dans des Intranet (entreprises, laboratoires, ) 7
8 .. en perpétuelle croissance Exaoctets KiloOctets 10 3 MegaOctets 10 6 GigaOctets 10 9 Facteur de 10 en 5 ans! TeraOctets PetaOctets DVD RFID ExaOctets Digital TV ZettaOctets MP3 players Digital cameras Camera phones, VoIP Medical imaging, Laptops, Data center applications, Games Satellite images, GPS, ATMs, Scanners Sensors, Digital radio, DLP theaters, Telematics Peer-to-peer, , Instant messaging, Videoconferencing, CAD/CAM, Toys, Industrial machines, Security systems, Appliances Source: IDC,
9 .. produite par tout le monde.. L information (numérique) est disponible partout 9
10 10 google
11 11 google
12 dans tous les domaines d activités Domaines d application Internet (Web, Forum/Blog search, News) Entreprises Bibliothèques numériques «digital library» Domaine spécialisé (médecine, droit, littérature, ) Nos propres PC (Yahoo! Desktop search) 12
13 la RI a un coût Rechercher une information a un coût «On» passe (en moyenne) 35% de son temps à rechercher des informations Les managers y consacrent 17% de leur temps Les 1000 grandes entreprises (US) perdent jusqu à $2.5 milliards par an en raison de leur incapacité à récupérer les bonnes informations Nécessité de développer des systèmes automatisés efficaces permettant : Collecter, Organiser, Rechercher, Sélectionner 13
14 Contours de la RI Données, information et connaissance Tâches de recherche d information 14
15 Contours: Données-Information-Connaissance Système de gestion de Base de données Système de Recherche d information Données : Chaîne de caractères/valeurs associées à des objets, des personnes et des événements : (15) Information : Signification (explication/ description) des données, données intelligible (15 C - relevé à 18 h, sous abri, à XX) Connaissance : Information apprise, découverte, comprise et partagée par une communauté (étant donné qu on est à XX 15 C en avril c est plutôt froid) (information/data mining, fouille de données) 15
16 Contours : Tâches de recherche d information (1/2) Recherche adhoc (classique) Je cherche des infos (pages web) sur «veille économique» Requête «veille économique»à SRI à renvoie une liste de documents Classification /catégorisation (clustering) Regrouper les informations (documents) selon un ou plusieurs Question-réponses (Query answering) Chercher des réponses à des questions par exemple «qui est averroes?» «Quelle est la longueur du Nil?» 16
17 17
18 Contours : Tâches de recherche d information (2/2) Filtrage d information (filtering/recommendation) Dissémination sélective d information 18
19 Filtrage d information Sources Utilisateurs ayant des besoins définis au préalable = Profils d1 dn d1 d2 Flot de documents SFI/push Terminologie : Push Filtrage d information Recommandation Dissémination sélective d information Système d alerte 19
20 20
21 Contours : Tâches de recherche d information (2/2) Filtrage d information (filtering/recommendation) Dissémination sélective d information Croisement de langues (cross language) Rechercher des infos écrites dans une langue autre que celle de la requête Requête en français à retour documents en arabe Recherche d opinions (Opinion retrieval) (sentiment analysis) Pertinence(relevant) +subjective (opinionated) Polarité (Positive, négative et neutre) 21
22 La RI adhoc : concepts de base I=Besoin en information SRI NIST - TREC D D Documents Documents pertinents Sélectionner dans une collection les informations pertinentes répondant aux besoins en information des utilisateurs 22
23 Information Formes Texte, images, sons, vidéo, graphiques, etc. Exemples texte : web pages, , livres, journaux, publications, messages , blog, Word, Powerpoint, PDF, forum postings, brevets, etc. Hétérogénéité langage (multilingues) media (multimédia) structures 23
24 Besoin en information vs. requête Besoin en information est une expression mentale d un utilisateur I=Besoin en information Requête est une représentation possible du besoin en information Requête 24
25 Query intent à what s a query apple David J. Brenes, Daniel Gayo Avello, Kilian Pérez-González 25
26 Qu est c e qu il y a derrière une requête? Une même interface pour des besoins variés.. Deviner ce qui est caché derrière la requête Exemples : BBC à (site web de la BBC) 5+4 à calcul Air France 454 à Infos sur un vol 1kg en livres, 1 euro en dollars à Conversion dentiste Lyon à Adresse professionnelle 26
27 Quelle pertinence? Pertinence Pertinence Satisfaction utilisateur Pertinence utilisateur Pertinence système Topicality Relation (correspondance, ) entre un document et.. une requête ou..un besoin en information? Selon.. l utilisateur ou. le système? 27
28 Plusieurs pertinences Pertinence Algorithmique : mesure algorithmique dépendant du modèle de RI Pertinence thématique : relation entre le sujet exprimé dans la requête et le sujet couvert dans le document. Pertinence cognitive : relation entre l état de la connaissance de l utilisateur et l information sélectionnée. Pertinence situationnelle/contextuelle : relation entre la tâche, le problème posé par l utilisateur, la situation de l utilisateur et l information retrouvée. 28
29 Hypothèses «simplificatrices» en RI Besoin = requête Besoin confondu avec la requête utilisateur Document et requête Représentés par des termes (mots simples, groupes de mots, ) Pertinence Traduite par la similarité de vocabulaire entre la requête et le document 29
30 Tour d horizon sur les techniques de RI : Ouvrir la boîte noire I=Besoin en information Besoin SRI Traitement Traitement = Indexation Liste de mots Appariement Index (mots clés) Visualisation Fichier inverse 30
31 Tour d horizon sur les techniques de RI : Indexation Indexation Processus permettant de construire un ensemble d éléments «clés» permettant de caractériser le contenu d un document / retrouver ce document en réponse à une requête Approches : Statistique (distribution des mots) et/ou TALN (compréhension du texte) Approche courante est plutôt statistique avec des hypothèses simples Redondance d un mot marque son importance Cooccurrence des mots marque le sujet d un document 31
32 32
33 Tour d horizon sur les techniques de RI indexation Décomposer le texte Title: Information retrieval Corps du texte : IR is the science of searching of documents Décomposer les mots Information, retrieval, IR, is, the science, of,searching, of, documents Supprimer les mots communs Basé sur une short list the, and, or Information, retrieval, IR, science, searching, documents Radicaliser les mots Information, retrieval, IR, science, search, document Regrouper les mots Information 1, retrieval 1, IR 1, science 1, search 1, document 1 33
34 Organiser les termes et les documents dans un Fichier Inverse d1: So let it be with Caesar. The noble Brutus hath told you Caesar was ambitious d2: I did enact Julius Caesar I was killed i' the Capitol; Brutus killed me. Traitement = Indexation Term N docs Tot Freq Ptr ambitious be brutus capitol caesar did 1 1 enact 1 1 hath 1 1 I 1 2 i' 1 1 it 1 1 julius 1 1 killed 1 2 let 1 1 me 1 1 noble 1 1 so 1 1 the 2 2 told 1 1 you 1 1 was 2 2 with 1 1 Doc # Freq d1: So let it be with Caesar. The noble Brutus hath told you Caesar was ambitious d2: I did enact Julius Caesar I was killed i' the Capitol; Brutus killed me. d3: I did enact Julius Caesar I was killed i' d2: the Capitol; Brutus I d4: did enact killed Julius me. Caesar I did enact I was Julius killed i' Caesar d5: the Capitol; I was killed Brutus i' I did the enact Capitol; killed Julius me. Brutus Caesar killed I was me. killed i' the Capitol; Brutus d6: killed me. I did enact Julius Caesar I was killed i' the Capitol; Brutus d7: killed me. I did enact Julius Caesar I was killed i' the Capitol; Brutus d8: killed me. I did enact Julius Caesar I was killed i' the Capitol; Brutus d9: killed me. I did enact Julius Caesar I was killed i' the Capitol; Brutus killed me. 34
35 Répondre à une demande (requête) caesar Term N docs Tot Freq Ptr ambitious be brutus capitol caesar did 1 1 enact 1 1 hath 1 1 I 1 2 i' 1 1 it 1 1 julius 1 1 killed 1 2 let 1 1 me 1 1 noble 1 1 so 1 1 the 2 2 told 1 1 you 1 1 was 2 2 with 1 1 Doc # Freq d1: So let it be with Caesar. The noble Brutus hath told you Caesar was ambitious d2: I did enact Julius Caesar I was killed i' the Capitol; Brutus killed me. d3: I did enact Julius Caesar I was killed i' d2: the Capitol; Brutus I d4: did enact killed Julius me. Caesar I did enact I was Julius killed i' Caesar d5: the Capitol; I was killed Brutus i' I did the enact Capitol; killed Julius me. Brutus Caesar killed I was me. killed i' the Capitol; Brutus d6: killed me. I did enact Julius Caesar I was killed i' the Capitol; Brutus d7: killed me. I did enact Julius Caesar I was killed i' the Capitol; Brutus d8: killed me. I did enact Julius Caesar I was killed i' the Capitol; Brutus d9: killed me. I did enact Julius Caesar I was killed i' the Capitol; Brutus killed me. 35
36 Indexation dans d autres langues Pas d espaces en chinois et en japonais Ne garantit pas l extraction d un terme de manière unique Japonais encore plus compliqué avec différents alphabets フォーチュン500 社 は 情 報 不 足 のため 時 間 あた$500K( 約 6,000 万 円 ) Katakana Hiragana Kanji Romaji L utilisateur peut exprimer sa requête entièrement en Hiragana 36
37 Matching/appariement : modèles de RI Facteurs utilisés par la majorité des modèles Fréquence du terme dans le doument (tf), sa fréquence dans la collection (idf), sa position dans le texte(p), taille du document (dl)... Score ( D) = fonction( tf, idf, dl) Plusieurs modèles théoriques pour formaliser cette fonction 37
38 IR models 38 Théorie des ensembles : Boolean model (±1950) Algèbre Vector space model (±1970) Spreading activation model (±1989) LSI (Latent semantic Indexing)(± 1994) Probabilité Probabilistic model (±1976) Inference network model (±1992) Language model (±1998) DFR (Divergence from Randomness model) (±2002) Learning to rank
39 Facteurs utilisés par les moteurs pour trier des pages Plusieurs facteurs plus de 200 Classés selon deux groupes : dépendant /indépendant contenu de la page Facteurs dépendant du contenu de la page web (mots-clés dans la page web) Classement des pages dépend fortement de la localisation (position) des mots de la requête dans la page à Titre page, mots dans une ancre (anchor), domaine, URL, Meta 39
40 Pour plus de détails sur le «ranking» sur le web
41 Exemple top acteurs utilisés par Google pour trier les pages Mots dans le titre de la page (Keyword Use in Title Tag) Mots dans les liens ( anchor ) provenant de l extérieur (Keyword Focused Anchor Text from External Links) Popularité du site (PageRank ) Diversité des liens externes (Diversity of Link Sources) Fiabilité du domaine (fonction de la distance de votre site vis-à-vis d un site de confiance, cette liste est inconnue) Mots dans le nom du domaine ( (Keyword Use in the Root Domain Name ) Mots dans le nom du sous-domaine (mots.domaine.fr) (Keyword Use in the Root Domain Name ) 41
42 Exemples de Facteurs utilisés par les moteurs pour trier les pages Mots clés dans la balise H1 (Keyword Use in H1) Mots dans les balises H2, H3 Page URL Mots clés dans les Meta Description / Keywords Tags Mots dans le Body (Keyword Use in Body Text) HTML Validation 42
43 Facteurs utilisés par les moteurs pour trier les pages Top 5 facteurs négatifs Serveur souvent inaccessible Contenu similaire ou dupliqué (copie de site) Liens vers des pages de qualité douteuse (Spam) Liens provenant de sites (courtier/ Vendeurs de liens) Sur-utilisation de mots clés D après Amit Singhal (Architecte de Google) lors de sa conférence à ECIR 2008 Google utilise 263 facteurs 43
44 Plan Recherche d information (RI) Intérêt et contours Tour d horizon sur les techniques de RI Cas d étude: Recherche d information sur le Web Ou en sommes nous 44
45 Points clés dans l histoire de la RI 1952 Calvin N. Mooers invente le mot «IR» 1959 Luhn (RI-statistique) 1960 Cranfield I (démarche de validation) 1960 Maron and Kuhns (modèle probabiliste) 1961 (-1965) Smart (le modèle vectoriel) 1968 Premier livre de Salton 1975 Livre C van Rijsbergen (accessible sur le web, ver. 1979) 1977 Modèle probabiliste (PRP) S. Robertson 1978 Première conférence SIGIR 1983 Début d Okapi (modèle probabiliste) 45
46 Points clés dans l histoire de la RI 1985 RIAO-1 Grenoble 1986 Modèle logique («Keith» van Rijsbergen) 1990 (tout début du) Learning to rank (développement dans les années 2000) 1990 Modèle LSI (Dumais, Deerwester ), 1992 TREC Modèle de langue 1998 Google 2000 CLEF 2002 INEX 2004 CORIA (Conférence francophone en recherche d information) 46
47 États des lieux Plusieurs avancées : Techniques de pondération (luhn, BM25, modèle de langue) Plusieurs modèles Reformulation de requêtes (relevance feedback, expansion ) RI multilingue Évaluation des performances (métriques, benchmark) Architecture physique (inverted file) Constat : les techniques statistiques sont effectives en RI 47
48 Etat des lieux Ces techniques marchent aussi pour D autres langues, eg Chinois Cross-language: Englishß à chinese Les méthodes statistiques marchent D autres types de documents - eg homepages, links & URLs 48
49 Etat des lieux Les méthodes statistiques se basent sur la redondance Toutes les utilisations de la langue ont une redondance à Les techniques statistiques semblent être les outils de base pour le traitement de l information 49
50 Etat des lieux Plusieurs programmes d évaluation : TREC (Text REtrieval Conference)- DARPA,NIST,ARDA NTCIR (Evaluation campaign on Asian documents)- CLEF (Cross Language Evaluation Forum European Language) INEX (INitiative for the Evaluation of XML Retrieval ) Collections volumineuses (topics, documents, relevance judgments) plusieurs participants à comparaisons riches 50
51 Quelques remarques sur le domaine Relativement peu de théorie Très forte tradition d expérimentations Plusieurs problèmes et verrous à investir Domaine difficile : les méthodes intuitives ne sont pas forcément celles qui sont efficaces dans la pratique 51
52 Conférences et Journaux Conférences ACM SIGIR : Special Interest Group on Information Retrieval CIKM : Conference on Information and Knowledge Management ECIR : European Conference on Information Retrieval Research CORIA : Conférence Francophone en Recherche d Information et Applications SPIRE : String Processing and Information Retieval ECDL : European Conference on Digital Libraries ACM-SAC-IAR : Information Access and Retrieval (IAR) RIAO : Recherche d Information Assisté par Ordinateur Journaux JASIST : Journal of the American Society for Information Science and Technology IP&M : Information Processing & Management IJODL : International Journal on Digital Libraries JDOC : Journal of Documentation JIR : Journal of Information Retrieval ACM-TOIS : Transactions on Information Systems Foundations and Trends in Information Retrieval 52
53 Merci 53
Recherche d information : contours et bonnes pratiques
Recherche d information : contours et bonnes pratiques Pr. Mohand Boughanem [email protected] http://www.irit.fr/~mohand.boughanem Université Paul Sabatier de Toulouse Laboratoire IRIT, UMR5055 118 Route
Recherche d Information(RI): Fondements et illustration avec Apache Lucene. par Majirus Fansi @majirus
1 Recherche d Information(RI): Fondements et illustration avec Apache Lucene par Majirus Fansi @majirus Résumé Fondements de la Recherche d Information (RI) Noyau de toute application de RI Éléments à
Proposition des cadres d évaluation adaptés à un système de RI personnalisé
Proposition des cadres d évaluation adaptés à un système de RI personnalisé Mariam Daoud, Lynda Tamine-Lechani Laboratoire IRIT, Université Paul Sabatier 118 Route de Narbonne, F-31062 TOULOUSE CEDEX 9
http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines
Principales fonctionnalités de l outil Le coeur du service suivre les variations de position d un mot-clé associé à une URL sur un moteur de recherche (Google - Bing - Yahoo) dans une locale (association
RI sociale : intégration de propriétés sociales dans un modèle de recherche
RI sociale : intégration de propriétés sociales dans un modèle de recherche Ismail Badache 1 Institut de Recherche en Informatique de Toulouse, UMR 5505 CNRS, SIG 118 Route de Narbonne F-31062 Toulouse
Analyses croisées de sites Web pour détecter les sites de contrefaçon. Prof. Dr. Olivier Biberstein
Analyses croisées de sites Web pour détecter les sites de contrefaçon Prof. Dr. Olivier Biberstein Division of Computer Science 14 Novembre 2013 Plan 1. Présentation générale 2. Projet 3. Travaux futurs
TRAVAUX DE RECHERCHE DANS LE
TRAVAUX DE RECHERCHE DANS LE DOMAINE DE L'EXPLOITATION DES DONNÉES ET DES DOCUMENTS 1 Journée technologique " Solutions de maintenance prévisionnelle adaptées à la production Josiane Mothe, FREMIT, IRIT
Hervé Couturier EVP, SAP Technology Development
Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud
Recherche d information textuelle
Recherche d information textuelle Recherche Web B. Piwowarski CNRS / LIP6 Université Paris 6 [email protected] http://www.bpiwowar.net Master IP - 2014-15 Cours et travaux pratiques basés sur les documents
Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA
RÉCITAL 2005, Dourdan, 6-10 juin 2005 Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA Siham Boulaknadel (1,2), Fadoua Ataa-Allah (2) (1) LINA FRE
Cognit Ive Cas d utilisation
Cognit Ive Cas d utilisation 96-98, rue de Montreuil - 75011 Paris _ opicot@ _ + 33 (0)1 40 09 71 55 Sommaire Présentation de la plateforme Cognit Ive SemanticMail : Traitement sémantique des mails Projets
Pourquoi une stratégie de sites dédiés? Laurent-Pierre GILLIARD AEC 14/06/2007 Vincent MOREAU SYSTONIC 09/06/2006
Pourquoi une stratégie de sites dédiés? Laurent-Pierre GILLIARD AEC 14/06/2007 Vincent MOREAU SYSTONIC 09/06/2006 Pour répondre précisément aux attentes de vos publics cibles Pour répondre aux contraintes
Les datas = le fuel du 21ième sicècle
Les datas = le fuel du 21ième sicècle D énormes gisements de création de valeurs http://www.your networkmarketin g.com/facebooktwitter-youtubestats-in-realtime-simulation/ Xavier Dalloz Le Plan Définition
Big Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université
Introduction. M2206 Intégration web. Introduction. Introduction 20/01/2014
Introduction M2206 Intégration web http://www.atinternet.fr/ressources/ressources/etudespubliques/barometre-des-moteurs/ Référencement des sites web et moteurs de recherche Introduction Introduction http://www.go-gulf.com/blog/social-networking-user/
Jeudi 30 avril 2009. L art de bien référencer son site Internet
Jeudi 30 avril 2009 L art de bien référencer son site Internet Quelques chiffres 1.2 milliard d internautes dans le monde. 343 millions d internautes en Europe. (InternetworldStats, November 2007) 250
Forthcoming Database
DISS.ETH NO. 15802 Forthcoming Database A Framework Approach for Data Visualization Applications A dissertation submitted to the SWISS FEDERAL INSTITUTE OF TECHNOLOGY ZURICH for the degree of Doctor of
Big Data -Comment exploiter les données et les transformer en prise de décisions?
IBM Global Industry Solution Center Nice-Paris Big Data -Comment exploiter les données et les transformer en prise de décisions? Apollonie Sbragia Architecte Senior & Responsable Centre D Excellence Assurance
Bigdata et Web sémantique. les données + l intelligence= la solution
Bigdata et Web sémantique les données + l intelligence= la solution 131214 1 big data et Web sémantique deux notions bien différentes et pourtant... (sable et silicium). «bigdata» ce n est pas que des
Référencement naturel
Impression à partir du site https://offredeformation.picardie.fr le 04/09/2015. Fiche formation Référencement naturel - N : 13614 - Mise à jour : 23/03/2015 Référencement naturel Mentalworks Rue Robert
Kaizen Marketing Group Web Agency. Kaizen Marketing. - Stéphanie Héline-
Kaizen Marketing - Stéphanie Héline- 1 Référencement Web Paris 26 Juin 2013 Faire de la pub c est bien 12 Répondre à une requête c est mieux! 3 Comment recherchez-vous? Source : Google - 2012 Importance
Architecture client riche Evolution ou révolution? Thomas Coustenoble IBM Lotus Market Manager
Architecture client riche Evolution ou révolution? Thomas Coustenoble IBM Lotus Market Manager IBM Workplace : permettre aux personnes de communiquer, de partager l information, quel que soit le terminal
Le référencement naturel
Le référencement naturel Phases essentielles Choix des mots-clés Où se référencer : moteurs, annuaires Indexation des pages du site dans les moteurs Positionnement et trafic généré Optimisation des pages
I.1 Introduction. I.2 La recherche d information. I.2.1 Définitions
I.1 Introduction La Recherche d Information (RI) peut être définie comme une activité dont la finalité est de localiser et de délivrer un ensemble de documents à un utilisateur en fonction de son besoin
Marc SALLIERES CEO ALTIC [email protected]. www.altic.org
Marc SALLIERES CEO ALTIC [email protected] www.altic.org Présentation ALTIC Les projets ALTIC BI Open Source véritable alternative Spécialiste BI Open Source Présentation ALTIC 2009 Club Finance
MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril 2010 1 / 15
MapReduce Malo Jaffré, Pablo Rauzy ENS 16 avril 2010 Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril 2010 1 / 15 Qu est ce que c est? Conceptuellement Données MapReduce est un framework de calcul distribué
RAPID 3.34 - Prenez le contrôle sur vos données
RAPID 3.34 - Prenez le contrôle sur vos données Parmi les fonctions les plus demandées par nos utilisateurs, la navigation au clavier et la possibilité de disposer de champs supplémentaires arrivent aux
Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services
69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard
Technologies du Web. Ludovic DENOYER - [email protected]. Février 2014 UPMC
Technologies du Web Ludovic DENOYER - [email protected] UPMC Février 2014 Ludovic DENOYER - [email protected] Technologies du Web Plan Retour sur les BDs Le service Search Un peu plus sur les
Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013
Cube de textes et opérateur d'agrégation basé sur un modèle vectoriel adapté Text Cube Model and aggregation operator based on an adapted vector space model Lamia Oukid, Ounas Asfari, Fadila Bentayeb,
Introduction aux bases de données
Introduction aux bases de données Références bibliographiques Jeff Ullman,Jennifer Widom, «A First Course in Database systems», Prentice-Hall, 3rd Edition, 2008 Hector Garcia-Molina, Jeff Ullman, Jennifer
Dans cette définition, il y a trois notions clés: documents, requête, pertinence.
Introduction à la RI 1. Définition Un système de recherche d'information (RI) est un système qui permet de retrouver les documents pertinents à une requête d'utilisateur, à partir d'une base de documents
Big Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de
WordPress Référencement naturel (SEO) Optimiser. son référencement. Daniel Roch. Préface d Olivier Andrieu
Daniel Roch Optimiser son référencement WordPress Référencement naturel (SEO) Préface d Olivier Andrieu Groupe Eyrolles, 2013, ISBN : 978-2-212-13714-9 Index 404 Notifier (erreurs 404) 62 A Adwords 148
L identification par radio fréquence principe et applications
L identification par radio fréquence principe et applications Présentée par Abdelatif Bouchouareb École de technologie supérieure, Montréal Qc Novembre 2007 1 Les différents systèmes d identification 2
Panorama des CMS open sources. Sylvain Ferrand, CMAP École Polytechnique Journées Mathrice, Poitiers, 19 mars 2008
Panorama des CMS open sources Sylvain Ferrand, CMAP École Polytechnique Journées Mathrice, Poitiers, 19 mars 2008 Table des matières Qu'est ce qu'un CMS Pourquoi utiliser un CMS Des CMS génériques SPIP
Réussir. son. référencement. web. Olivier Andrieu. Groupe Eyrolles, 2008, ISBN : 978-2-212-12264-0
Réussir son référencement web Olivier Andrieu Groupe Eyrolles, 2008, ISBN : 978-2-212-12264-0 Table des matières CHAPITRE 1 Le référencement aujourd hui : généralités, définitions......................................
Recherche. Instructions d utilisation de ce Tutoriel. Suite d une action. Explication d un exemple, information supplémentaire. Avertissement. Astuce.
Instructions d utilisation de ce Tutoriel Suite d une action. Explication d un exemple, information supplémentaire. Avertissement. Astuce. Le SNDL propose à ses usagers deux modes de recherche: Recherche
Get Instant Access to ebook Cest Maintenant PDF at Our Huge Library CEST MAINTENANT PDF. ==> Download: CEST MAINTENANT PDF
CEST MAINTENANT PDF ==> Download: CEST MAINTENANT PDF CEST MAINTENANT PDF - Are you searching for Cest Maintenant Books? Now, you will be happy that at this time Cest Maintenant PDF is available at our
Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013
Les enjeux du Big Data Innovation et opportunités de l'internet industriel François Royer [email protected] Accompagnement des entreprises dans leurs stratégies quantitatives Valorisation de patrimoine
La rencontre du Big Data et du Cloud
La rencontre du Big Data et du Cloud Libérez le potentiel de toutes vos données Visualisez et exploitez plus rapidement les données de tous types, quelle que soit leur taille et indépendamment de leur
SEO & WordPress. Neil McCarthy GOODNESS CONSEIL EN WEBMARKETING & RÉFÉRENCEMENT. Bâtiment Enerpôle Technopôle Izarbel 64210 BIDART
GOODNESS CONSEIL EN WEBMARKETING & RÉFÉRENCEMENT Bâtiment Enerpôle Technopôle Izarbel 64210 BIDART 05 59 22 38 04 www.goodness.fr // [email protected] SEO & WordPress Neil McCarthy SEO et WordPress Programme
WordPress Référencement naturel (SEO) Optimiser. son référencement. Daniel Roch. Préface d Olivier Andrieu
Daniel Roch Optimiser son référencement WordPress Référencement naturel (SEO) Préface d Olivier Andrieu Groupe Eyrolles, 2013, ISBN : 978-2-212-13714-9 Table des matières AVANT-PROPOS... 1 Pourquoi ce
Table des matières. Préface...5. Introduction...9
Préface......................................................5 Introduction..................................................9 Chapitre 1 Diversité des besoins, diversité des contenus........................13
Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique
Big data et données géospatiales : Enjeux et défis pour la géomatique Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique Événement 25e anniversaire du CRG Université Laval, Qc, Canada 08 mai
BIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation
BIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation - définition - étapes - impacts La révolution en cours du big data - essai de définition - acteurs - priorités
20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars 2013. 20 ans du SIAD -"Big Data par l'exemple" -Julien DULOUT
20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars 2013 20 ans du SIAD -"BigData par l'exemple" -Julien DULOUT Qui a déjà entendu parler du phénomène BigData? Qui a déjà
BIG Data et R: opportunités et perspectives
BIG Data et R: opportunités et perspectives Guati Rizlane 1 & Hicham Hajji 2 1 Ecole Nationale de Commerce et de Gestion de Casablanca, Maroc, [email protected] 2 Ecole des Sciences Géomatiques, IAV Rabat,
CEST POUR MIEUX PLACER MES PDF
CEST POUR MIEUX PLACER MES PDF ==> Download: CEST POUR MIEUX PLACER MES PDF CEST POUR MIEUX PLACER MES PDF - Are you searching for Cest Pour Mieux Placer Mes Books? Now, you will be happy that at this
MANUEL MARKETING ET SURVIE PDF
MANUEL MARKETING ET SURVIE PDF ==> Download: MANUEL MARKETING ET SURVIE PDF MANUEL MARKETING ET SURVIE PDF - Are you searching for Manuel Marketing Et Survie Books? Now, you will be happy that at this
Eurateach labellisé par la région et le FAFIEC. Si vous remplissez les conditions suivantes : Votre entreprise compte moins de 250 salariés
> FORMATIONS CLES EN MAIN > FORMATIONS SUR MESURE Eurateach labellisé par la région et le FAFIEC Dans le cadre du Pacte Régional de Continuité Professionnelle signé par l Etat, la Région et les Partenaires
10. Base de données et Web. OlivierCuré [[email protected]]
10. Base de données et Web 313 Evolution de l'information Ordre de grandeur : 314 1Mo : 1 gros roman 200Mo : ce que mémorise un être humain dans sa vie. 900Mo : information contenue dans le génome d'une
Objectifs. Synthétiser. Moyens
Objectifs Cartographie des Controverses Introduction à l exploration du Web Sébastien Heymann Identifier les acteurs sur le Web leur position dans le sujet......et si possible au cours du temps. Synthétiser
demander pourquoi mon site n'apparaît pas sur google ou pourquoi mon site n'est pas référencé par les moteurs de recherche?
50 questions essentielles à vous poser avant la mise en ligne de votre site pour ne plus vous demander pourquoi mon site n'apparaît pas sur google ou pourquoi mon site n'est pas référencé par les moteurs
Focus sur : Comparatif de 3 logiciels de gestion des références bibliographiques
Focus sur : Comparatif de 3 logiciels de gestion des références bibliographiques Les logiciels de gestion des références bibliographiques : Il existe plusieurs dizaines de logiciels de gestion de références
Classification Automatique de messages : une approche hybride
RECIAL 2002, Nancy, 24-27 juin 2002 Classification Automatique de messages : une approche hybride O. Nouali (1) Laboratoire des Logiciels de base, CE.R.I.S., Rue des 3 frères Aïssiou, Ben Aknoun, Alger,
Comment bien référencer mes sites internet? Les 100 SECRETS EN VIDÉO
Comment bien référencer mes sites internet? Les 100 SECRETS EN VIDÉO éditions Page 2/14 A propos de l auteur... Souvent défini comme «sérial-créateur», Jean-Marie PÉRON est à l origine depuis 1992 d entreprises
THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.
École Doctorale d Informatique, Télécommunications et Électronique de Paris THÈSE présentée à TÉLÉCOM PARISTECH pour obtenir le grade de DOCTEUR de TÉLÉCOM PARISTECH Mention Informatique et Réseaux par
Glossaire. www.themanualpage.org ( themanualpage.org) soumises à la licence GNU FDL.
Glossaire Ce glossaire contient les termes techniques et de spécialité les plus employés dans cette thèse. Il emprunte, pour certaines d entre elles, les définitions proposées par www.themanualpage.org
Moteurs de recherche: origines, évolution et perspectives Aissam Mezhoud, Search Advertising Lead, Microsoft
Moteurs de recherche: origines, évolution et perspectives Aissam Mezhoud, Search Advertising Lead, Microsoft Internet fixe * (hors tablettes) Internet mobile ** (hors tablettes) Télévision connectée ***
4. Utilisation d un SGBD : le langage SQL. 5. Normalisation
Base de données S. Lèbre [email protected] Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :
Optimisation Web. Extra N 1 29.01.15
Optimisation Web Extra N 1 29.01.15 Extravaganza Communication digitale? Les Extras L optimisation web Optimisation technique Qu est-ce que c est? Optimiser les temps de chargement et d affichage des pages
FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES
1 FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES «Dans le concret, projets de transformation vers le BigData» V1-10/03/15 ABED AJRAOU CONNAISSEZ-VOUS PAGESJAUNES? CONNAISSEZ-VOUS PAGESJAUNES? LES MEGADONNEES RÉPONDENT
Utiliser une WebCam. Micro-ordinateurs, informations, idées, trucs et astuces
Micro-ordinateurs, informations, idées, trucs et astuces Utiliser une WebCam Auteur : François CHAUSSON Date : 8 février 2008 Référence : utiliser une WebCam.doc Préambule Voici quelques informations utiles
D origine destiné à la conception de blog, WordPress est devenu l outil incontournable dans la liste des systèmes de gestion de contenus..
WordPress - CMS open-source Permet de créer simplement des sites internet ou de blogs. D origine destiné à la conception de blog, WordPress est devenu l outil incontournable dans la liste des systèmes
Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation
Complex Event Processing Traitement de flux de données en temps réel Romain Colle R&D Project Manager Quartet FS Plan Génération et exploitation de données CEP et applications Flux de données et notifications
ETRE VISIBLE SUR INTERNET. Search Engine Optimisation (SEO)
ETRE VISIBLE SUR INTERNET Search Engine Optimisation (SEO) INTRODUCTION Définition Search Engine Marketing (SEM) : opérations consistant à générer du trafic par l achat de publicités sur les moteurs de
Application Form/ Formulaire de demande
Application Form/ Formulaire de demande Ecosystem Approaches to Health: Summer Workshop and Field school Approches écosystémiques de la santé: Atelier intensif et stage d été Please submit your application
Lieberman Software Corporation
Lieberman Software Corporation Managing Privileged Accounts Ou La Gestion des Comptes à Privilèges 2012 by Lieberman Software Corporation Agenda L éditeur Lieberman Software Les défis Failles sécurité,
Ne cherchez plus, soyez informés! Robert van Kommer
Ne cherchez plus, soyez informés! Robert van Kommer Le sommaire La présentation du contexte applicatif Le mariage: Big Data et apprentissage automatique Dialogues - interactions - apprentissages 2 Le contexte
Partie II Approche théorique
Partie II Approche théorique De nombreux phénomènes ont été mis en évidence lors des différentes enquêtes, nous amenant à diverses interrogations pouvant être résumées et transcrites en une problématique.
Performances. Gestion des serveurs (2/2) Clustering. Grid Computing
Présentation d Oracle 10g Chapitre VII Présentation d ORACLE 10g 7.1 Nouvelles fonctionnalités 7.2 Architecture d Oracle 10g 7.3 Outils annexes 7.4 Conclusions 7.1 Nouvelles fonctionnalités Gestion des
TEXT MINING. 10.6.2003 1 von 7
TEXT MINING 10.6.2003 1 von 7 A LA RECHERCHE D'UNE AIGUILLE DANS UNE BOTTE DE FOIN Alors que le Data Mining recherche des modèles cachés dans de grandes quantités de données, le Text Mining se concentre
Telecharger gratuitement convertisseur de fichier word en pdf
Telecharger gratuitement convertisseur de fichier word en pdf Cliquez sur le bouton pour tlcharger le convertisseur PDF en Word. online pour convertir des fichiers PDF en fichiers Word ditables (gratuit,
Face Recognition Performance: Man vs. Machine
1 Face Recognition Performance: Man vs. Machine Andy Adler Systems and Computer Engineering Carleton University, Ottawa, Canada Are these the same person? 2 3 Same person? Yes I have just demonstrated
QUI SOMMES-NOUS? Cette solution s adresse aussi bien aux PME/PMI qu aux grands groupes, disposant ou non d une structure de veille dédiée.
PRESENTATION QUI SOMMES-NOUS? La société VIEDOC, formée d ingénieurs expérimentés, conseille depuis 2004 les entreprises dans les domaines de la veille, de l intelligence économique et de l innovation.
Le réseau Internet. [email protected]
Le réseau Internet [email protected] Un réseau Définition : Un réseau est un ensemble d ordinateurs connectés et qui communiquent entre eux. Classification : Réseau local (LAN = Local
Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, [email protected]
Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE Contact : Mme Lapedra, [email protected] ISoft, éditeur de logiciels, est spécialisé dans l informatique décisionnelle et l analyse de données. Son expertise
Mémoire DEA Système d'information Management and Technology of Information Systems
Mémoire DEA Système d'information Management and Technology of Information Systems Titre : Expérience sur l'utilisation de conjonctions de termes et la prise en compte des dépendances entre termes d'indexation
TRAITEMENT AUTOMATIQUE DES LANGUES. Licence d'informatique 2ème Année Semestre 1. Département d'informatique Université de Caen Basse-Normandie
TRAITEMENT AUTOMATIQUE DES LANGUES Licence d'informatique 2ème Année Semestre 1 Département d'informatique Université de Caen Basse-Normandie https://dias.users.greyc.fr/?op=paginas/tal.html Plan Définition
Synodiance. SEO et Contenu 16/10/2013
Synodiance SEO et Contenu 16/10/2013 Présentation Synodiance Spécialiste du référencement naturel Agence indépendante créée en 1999 Search, Link et Performance 35 collaborateurs + de 100 clients Grands
Apprentissage Automatique
Apprentissage Automatique Introduction-I [email protected] www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Petite définition : Présentation :
Petite définition : Le Web 2.0 est une technologie qui permet la création de réseaux sociaux, de communautés, via divers produits (des sites communautaires, des blogs, des forums, des wiki ), qui vise
Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar [email protected]
Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar [email protected] Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines
Trends. Médias sociaux et SEO - la force du contenu
Trends Médias sociaux et SEO - la force du contenu Problématique Quel est le rôle du contenu dans son projet d optimisation de son site web? SEO : Search Engine Optimization L'optimisation pour les moteurs
Spécificités, Applications et Outils
Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala [email protected] http://chirouble.univ-lyon2.fr/~ricco/data-mining
Sécuristation du Cloud
Schémas de recherche sur données chiffrées avancés Laboratoire de Cryptologie Thales Communications & Security 9 Avril 215 9/4/215 1 / 75 Contexte Introduction Contexte Objectif Applications Aujourd hui
SEO > Grandes Tendances. 29/01/2015 > Digital Marketing Day
SEO > Grandes Tendances 29/01/2015 > Digital Marketing Day Synodiance Spécialiste du référencement naturel Agence indépendante créée en 1999 Search, Link et Performance 35 collaborateurs + de 100 clients
UE 8 Systèmes d information de gestion Le programme
UE 8 Systèmes d information de gestion Le programme Légende : Modifications de l arrêté du 8 mars 2010 Suppressions de l arrêté du 8 mars 2010 Partie inchangée par rapport au programme antérieur Indications
quicksite Bienvenue à ce séminaire «Optimiser votre contenu pour Google»
Bienvenue à ce séminaire «Optimiser votre contenu pour Google» Sylvain Moesching CEO Roger Schaad CTO développement Daniel Weber Chef de projets Alain Broillet Web designer Projets Daniel Thalmann Développeur
Atelier numérique Développement économique de Courbevoie
Atelier numérique Développement économique de Courbevoie Jeudi 24 octobre 2013 Comment positionner son site internet en haut de Google? Atelier numérique de Courbevoie Intervenants : Olivier CARTIERI Animateur
Une approche pour l extraction automatique de structures sémantiques de documents XML
Une approche pour l extraction automatique de structures sémantiques de documents XML Salma Ben Mefteh*,**, Kaïs Khrouf*, Jamel Feki*, Maha Ben Kraiem*, Chantal Soulé-Dupuy** * Laboratoire MIR@CL, Université
WINDEV MOBILE. ios SMARTPHONE SUPPORT: IOS, ANDROID, WINDOWS PHONE 8.
WINDEV MOBILE ios SMARTPHONE SUPPORT: IOS, ANDROID, WINDOWS PHONE 8. WINDOWS Mobile permet de créer des applications pour les smartphones, les tablettes et les terminaux mobiles. Les applications sont
Distinguer les requêtes pour améliorer la recherche d information XML
Lyon - France Distinguer les requêtes pour améliorer la recherche d information XML Kurt Englmeier ***, Gilles Hubert *, Josiane Mothe *,** *Institut de Recherche en Informatique de Toulouse Equipe SIG/EVI
Brève introduction à la recherche d!information sur le Web à base d!agents logiciels
Plan Brève introduction à la recherche d!information sur le Web à base d!agents logiciels Bernard ESPINASSE Université d!aix-marseille 2010 Rappels sur les agents logiciels Problématique de la RI sur le
