RECHERCHER L'INFORMATION SUR INTERNET
|
|
|
- Lucille Eliane Turgeon
- il y a 10 ans
- Total affichages :
Transcription
1 RECHERCHER L'INFORMATION SUR INTERNET Support rédigé pour les stages organisés par l ADBS en 2001 Document réalisé par Françoise Quaire pour le compte de l ADBS PREAMBULE Si, à première vue, il semble très facile de naviguer sur l'internet (pour certains, il suffit de quelques clics de souris!), on s aperçoit vite que cette facilité n est que bien relative dès qu il s agit de rechercher de l information à bon escient. L impression est fréquente de perdre son temps, voire de se perdre dans ce labyrinthe en perpétuelle évolution. Les repères spatiaux sont différents des documents papier, la construction hypertextuelle incite à des cheminements difficiles à mémoriser, et la quantité d informations
2 aussi hétérogènes rebute parfois les souhaits de pertinence et de fiabilité du documentaliste. 2 Il existe également un grand nombre d outils différents, spécialisés dans la recherche d informations sur l internet ; il n est pas question ici de tous les passer en revue. Mais plutôt de comprendre leur fonctionnement et leurs limites afin de les utiliser au mieux. C est donc une méthodologie de l usage de ces outils qui est présentée ici, ainsi qu un balisage général de la recherche des différents types d information sur le net. En fin de document, un glossaire de termes spécifiques à la recherche d information sur l internet et une bibliographie sélective complètent ce support de cours. Dans la mesure du possible, les adresses URL citées ont été vérifiées lors de l écriture du document, mais elles peuvent malheureusement se trouver modifiées par la suite et devenir alors obsolètes.
3 3 INTRODUCTION ou des spécificités de la recherche sur Internet L information est multiple et hétérogène Sur Internet, on trouve divers espaces d'information : Web, Newsgroups, listes de diffusion, bases de données gratuites ou payantes, etc. correspondant à différents types d informations (pages multimedia - conversations entre personnes - ensemble d informations structurées et organisées pour l interrogation par exemple). L information est multimédia et peut se présenter sous forme de texte, d image fixe ou animée (séquence vidéo ou animation de schéma), de son, de logiciel. La convivialité et l ouverture d Internet impliquent que tout internaute peut être producteur d information et diffuser ses propres données ; on y trouve donc aussi bien des documents d'initiative privée (sites personnels) que des documents à caractère officiel émanant de centres de recherche et d universités, de bibliothèques et centres de documentation, d entreprises, d organismes publics, parapublics, associatifs, d organes de presse, etc. L'information est abondante et en croissance exponentielle Bien que difficilement quantifiable, la taille du web, qui est estimée à environ 28 millions de serveurs web ( dépasse les 2 milliards de pages uniques accessibles. On sait aussi que la toile (surnom que les Québécois donne au web) s accroît de façon exponentielle d environ 50% par an. Si on considère également la structure réticulaire de l information, où chaque page web peut être liée à plein d autres pages stockées aux quatre coins de la planète, on imagine aisément l ampleur et la complexité de l outil qu on interroge. L information est mobile et évolutive Les informations présentes sur Internet ne sont pas archivées dans un but patrimonial. Des sites naissent, disparaissent ou changent de localisation donc d adresse (l instabilité des URL explique les fréquentes apparitions du message "404 not found"). Certaines pages modifient leur contenu constamment, en fonction de l actualité par exemple. Sur le web, la réactivité prime sur la permanence.
4 4 Toutes ces spécificités expliquent la différence profonde entre l information diffusée sur Internet et l information que les documentalistes pratiquent habituellement, qu elle soit sous forme papier ou électronique (banques de données, système de GED par exemple). En documentation, on estime qu une recherche est performante lorsqu'elle nous procure tous les documents recherchés et uniquement les documents recherchés. Selon ces critères, la recherche sur Internet comporte un tel taux de silence et de bruit qu'on ne peut la qualifier de performante. Il faut constamment se rappeler que sur le net, on ne peut pas avoir d idée claire : de la couverture du gisement d informations où la recherche est lancée il faut savoir abandonner le rêve d exhaustivité car il n existe pas ici ; ni de son indexation puisque jusqu à présent, si les documents en format HTML sont organisés en vue de leur présentation à l écran, ils ne sont pas structurés logiquement comme dans une base de données. Et si on parle d indexation sur le web (balise «keyword»), elle reste en langage naturel. ni du mode de fonctionnement précis de la recherche puisque chaque outil garde jalousement ses algorithmes, qui de plus évoluent avec le temps. L internet n est donc pas cette immense «bibliothèque virtuelle» présentée partout mais plutôt un gisement évolutif d informations hétérogènes où le pire côtoie le meilleur, où l on peut trouver aussi bien des informations prévisibles qu inattendues. Il faut également se rappeler qu historiquement Internet a été conçu pour diffuser et échanger de l information et non pour la chercher. Les outils de recherche sont apparus ultérieurement, de façon empirique et sans cohésion organisée. Finalement, sur Internet, on peut trouver de tout, ce qui ne veut surtout pas dire que tout y est! Pour trouver l information souhaitée, on recense actuellement trois schémas de recherche : l utilisation directe d adresses de site repérées soit hors du web (presse, réseau professionnel, etc.) soit déjà enregistrées en signet ou favori, la recherche navigationnelle qui consiste à explorer les liens existants depuis un site pertinent sur le sujet, l utilisation d outils spécialisés comme les moteurs, métamoteurs et répertoires, créés spécifiquement pour faciliter la recherche sur Internet.
5 5 Les différents outils généralistes Deux grandes familles de services se partagent la tâche de chercher de l'information sur Internet : les répertoires et les moteurs de recherche. D'apparence parfois similaire, ils se distinguent cependant par leur façon de recenser et d'organiser d'imposantes sommes d'informations. On tend désormais vers une intégration de ces différents outils sous un portail "mixte" d'où la confusion encore plus grande qui règne! Les répertoires ou annuaires (directories en anglais) = outils humains Ils sélectionnent, de façon plus ou moins stricte, les sites et les regroupent dans des catégories thématiques (finances, sports, tourisme, etc.). Souvent, un court résumé décrit le contenu des adresses référencées. Ce sont donc des inventaires thématiques de ressources organisées selon une classification. Les sites sont sélectionnés en fonction de leur qualité et de leur pertinence. Ces répertoires peuvent être "par soumission" : les créateurs de sites proposent leur web à l'équipe d'indexeurs (qui le refuse ou l'intègre) ou bien être constitués par le parcours systématique (mais jamais exhaustif) des indexeurs sur le web. Dans tous les cas, un répertoire ne recense que des adresses de site (et non les pages contenues dans ce site). L indexation se fait sur les termes présents dans le titre du site et dans la fiche descriptive communiquée par le webmaster, mais jamais sur le texte intégral du site. On pose ainsi une requête sur un index limité (d'où la confusion éventuelle avec les moteurs de recherche), mais on peut aussi naviguer dans l'arborescence de la classification qui s'affine progressivement. Avantages pour l'usager : l'intérêt majeur de cette approche est la valeur ajoutée humaine (contrôle, validation, organisation) qui limite ainsi le bruit des réponses. Le répertoire propose deux modes de recherche : soit en parcourant les différentes rubriques (recherche de type arborescente guidée) soit en entrant des mots-clés qui porteront sur les titres des sites et leur présentation. C est en quelque sorte une requête sur résumé de contenu, avec des fonctionnalités de recherche généralement limitées. Cette classification des ressources permet de répondre à des requêtes de type exploratoire sur une thématique ou bien d avoir une vue d ensemble d un thème ; elle permet également de trouver des sites ressources sur un sujet, ou encore d autres sites comparables à celui qui sert de repère. Points faibles : ce type d outil nécessite d entrer dans la logique de classification (ce qui n est pas compatible avec tous les types de recherche). La sélection humaine est forcément subjective. La couverture y est moins «exhaustive» que celle des outils automatiques de type robot avec une mise à jour généralement manuelle ; et il n y a guère de possibilité de recherche pointue et sophistiquée. Inconvénients
6 Un truc : si vous avez trouvé une adresse intéressante avec une recherche par mots-clés, cliquez sur la rubrique associée pour voir s'il existe des sites du même type. Les principaux annuaires de recherche francophones 6 Yahoo! France [ Clair et très riche, malgré son nom américain il recense uniquement des informations en français sur des sites francophones. Nomade [ Un annuaire par soumission. C'est l'un des premiers et des principaux guides francophones. Il est complémentaire de Yahoo sur certains sujets et offre une présentation plus détaillée des sites. Wanadoo [ Pour accéder directement à la partie «Guide» présente aussi sur le portail de recherche Voilà. Looksmart France [ La version française de cet annuaire américain date de Les principaux annuaires de recherche anglophones Yahoo! [ (Yet another hierarchical organized oracle) C est le plus ancien, le plus connu et le plus utilisé des annuaires. De nombreux sites organisés dans une liste hiérarchique très fine. Intéressant aussi pour les dépêches ; bon site grand public. Looksmart [ La version «mère» propose bien plus de sites et de catégories que la toute récente version française. Netguide [ Répertoire très US avec un système de guides thématiques spécialisés sur quelques sujets (synthèse). Il existe également des répertoires ou annuaires sélectifs, qui pour chaque rubrique ne présentent que les meilleurs sites (selon des critères spécifiques aux indexeurs), les «essentiels» en quelque sorte. Ces outils sont utiles pour repérer des sites de référence sur un sujet donné. BonWeb [ Guide en français qui recense les 10 meilleurs sites par catégorie ; avec des commentaires évaluatifs, il concerne surtout des thèmes pour le grand public. About.com [ Guide anglophone qui regroupe 500 sujets différents suivis par des experts de leur domaine. L'objectif visé est la qualité des liens et des articles proposés. Il existe enfin des répertoires ou annuaires contributifs, qui confient la responsabilité d une ou
7 7 plusieurs catégories à des internautes bénévoles dont la compétence a été vérifiée. Open Directory Project [ Cet outil s'appuie sur un grand nombre de volontaires bénévoles pour construire un gigantesque répertoire du web devenu désormais incontournable. Slogan : "humans do it better. Les moteurs ou robots (search engine ou "bots" en anglais) Le moteur indexe automatiquement (par le biais d'un robot qui sillonne inlassablement le réseau) un trés grand nombre de pages web mais ne les classe pas. C'est un système de collecte automatique suivie de l'indexation également automatique de ressources. L index du moteur de recherche contient donc tous les termes des pages web visitées (il ne reste pas au niveau du site). Tout robot est essentiellement composé de 3 parties : 1/ le module de collecte automatique des ressources (un logiciel : le spider visite de façon permanente des milliers de sites web et en stocke le contenu sous forme de copies de page). Il possède des algorithmes spécifiques pour examiner périodiquement des millions de pages sans tourner en boucle. 2/ le module d'indexation, au sens constitution de fichiers inverses (l'indexeur ou crawler analyse de façon plus ou moins fine l'information des millions de documents rapatriés et crée un fichier d'indexage. C'est ce fichier qui sera consulté lors de la recherche par mot-clé.) L'indexeur est propre à chaque robot et les contenus indexés sont très variables (contenu intégral des pages, titres html, premiers paragraphes ou liens). Cette indexation est associée à une pondération des mots qui tient compte à la fois de critères statistiques (parfois lexicaux) mais aussi de l'encodage html (balise méta ou meta-tags). 3/ le module de recherche d'information (le searcher) gérant aussi l'interface avec l'usager. L'usager pose une requête sous forme d'une liste de mots séparés par des opérateurs implicites ou choisis. Il y a très souvent 2 modes de recherche (simple et avancée). Pour autant, il ne faut pas croire que les robots peuvent "tout" récupérer : d'abord parce qu'ils ne peuvent par dénicher des informations à l'intérieur de bases de données organisées de type professionnelles (on parle alors du web invisible). ensuite parce que le web grossit actuellement plus vite que les capacités d'indexation des moteurs. Avantages pour l'usager : - La couverture plus exhaustive (mais toujours relative) de l'espace public Internet avec des documents très diversifiés, - la possibilité de récupérer des informations présentes dans les pages d'un site web donc de pouvoir faire des requêtes très précises et pointues, - et des options de recherche assez sophistiquées pour affiner une requête. Points faibles : - la grande hétérogénéité des réponses et le risque fréquent de doublons,
8 - le nombre souvent ingérable de réponses d où un bruit énorme, mais aussi du silence, - savoir qu en mode avancé, la syntaxe d'interrogation demande parfois un bon apprentissage pour être efficace, - et enfin, une mise à jour de plus en plus lente du fait de la croissance rapide du web. Un truc : on le sait, les moteurs n indexent au mieux qu un tiers du web ; il faut donc avoir conscience du silence possible et consulter différents robots car souvent ils se complètent. 8
9 9 Les principaux moteurs de recherche francophones Ecila [ Il n'indexe que les pages web françaises en cherchant dans le titre, la description et les mots-clés (balises méta) Voila [ Le principal portail français comme outil de recherche développé par France Télécom, il rassemble un guide et un moteur, et plein d outils de recherche spécialisés (annuaires tél, Paris en photo, etc.) AltaVista France [ Version française récente du célèbre moteur américain, qui ne concerne ici que des sites français. Les principaux moteurs de recherche anglophones Alta Vista [ ou [ Le plus connu des moteurs : il indexe le texte intégral des sites, propose la recherche dans de nombreux fichiers multimedia et offre des possibilités de sélection assez sophistiquées. HotBot [ Ce moteur présente une bonne palette d'options en recherche plus guidée que le précédent avec des menus déroulants. Northern Light [ Un moteur innovant qui classe les résultats dans des dossiers contextuels distincts et indexe aussi des sources rarement présentes sur Internet. Google [ Moteur récent qui privilégie les sites les plus cités dans les liens (indice de popularité). De plus, il indexe les fichiers en format PDF, et archive l'ensemble des pages qu'il indexe. Fast [ Moteur apparu en 99 qui affiche une grande rapidité et revendique la première place pour le nombre de pages indexées. Les méta-moteurs (ou méta-robots) Ils permettent l'interrogation simultanée à partir d une seule requête de plusieurs outils de recherche, moteurs ou annuaires. Ces possibilités d'interrogation multiples sont intéressantes dans le cas de recherche ciblées et spécialisées qui ne génèrent pas un trop grand nombre de réponses, mais ne sont guère opérantes sur des termes trop génériques. Si on gagne ainsi en couverture des index balayés, on perd parfois en rapidité et les requêtes doivent rester simples pour s'adapter à tous les outils. En effet, les méta-moteurs ne maintiennent pas eux-même de base de données, ils transmettent juste la requête à d autres outils mais grâce à l'efficacité de leur travail (interrogation en parallèle, élimination des doublons, présentation unique...), on les assimile parfois à une toute
10 10 première génération d'agents intelligents. Quelques méta-moteurs MetaCrawler [ Interrogation simultanée de moteurs ou de répertoires. Savvy Search [ Interrogation simultanée de 24 outils généraux de recherche, et des regroupements thématiques d'outils bien appréciables. Profusion [ Interrogation simultanée de 9 outils, et de sources sur le web invisible. Ixquick [ Puissant et rapide, il travaille sur les 10 meilleures réponses proposées par des outils francophones. Les méta-moteurs clients ou off-line Semblables dans leur fonctionnement aux outils ci-dessus, ce sont par contre des logiciels qui s'installent sur le disque dur de l ordinateur. Ils permettent d'une part d'effectuer une recherche sur internet et d'autre part de rapatrier les documents trouvés sur le poste de travail pour une consultation hors ligne. Les plus connus sont Copernic (pour PC) et Sherlock (pour Mac). Certains offrent des particularités comme Umap qui constitue un thésaurus à partir de l'indexation des pages trouvées (le corpus) et génère sur une carte la représentation graphique de l'ensemble des mots du thésaurus. Ces outils sont surtout utiles dans le cadre d une veille documentaire. La tendance actuelle des outils de recherche d information Devant la formidable expansion du web, les outils traditionnels ont beaucoup de mal à suivre cette croissance pour continuer à indexer une part raisonnable de l'ensemble des sites et de leur contenu. De plus, leur démarche marketing leur déconseille d afficher des résultats nuls pour certaines requêtes. Ils ont donc développé des stratégies d alliance afin d offrir un meilleur service, mais parfois de façon bien peu transparente pour l utilisateur. L alliance quasi-systématique répertoire / moteur Désormais, les principaux outils généralistes ont adopté les uns après les autres cette stratégie. Ainsi quand les répertoires ne trouvent dans leur index aucune réponse à la requête posée, ils affichent les réponses venant d un moteur (par exemple, Yahoo.fr relaye sur Google et Nomade sur Inktomi). A l inverse, un moteur intègre très souvent désormais les catégories d un répertoire, de façon visible ou plus discrète (comme AltaVista France qui utilise Looksmart et Google qui soustraite avec l Open Directory Project). Le portail combinant plusieurs outils de recherche L exemple le plus évident en France, est Voilà qui, en réponse à une requête affichera : - des données extraites de l Encyclopédie Hachette - des sites web venant du Guide (répertoire) - des pages web tirées du Moteur
11 11 A noter : Pour savoir quel type d outil vous répond, repérez vite si les résultats affichés sont des pages web (URL plus ou moins détaillée) ou des adresses de site avec leur rubrique indiquée. Des lieux pleins de ressources : les outils et portails spécialisés, les sites fédérateurs Devant la profusion des ressources évolutives sur le net, on assiste également à une tendance à la spécialisation avec des outils thématiques ou des démarches qui ne tentent plus d être encyclopédiques mais de circonscrire intelligemment et utilement des secteurs d information. Du côté des outils, on peut citer : Les répertoires thématiques Comme un annuaire, ils référencent des sites selon un thème, une région ou un axe particulier. En fonction de vos centres d intérêt, ce sont des repères à garder précieusement dans vos signets car ils sont souvent le point de départ conseillé pour une recherche de type navigationnelle intelligente. Exemples : Indexa [ pour les entreprises françaises avec un site web Les 2 savoies [ annuaire région Savoie Mont-Blanc Strategic Road [ info. économique et géopolitique Les moteurs spécialisés Ils ne recherchent que sur un corpus bien défini. (Voir aussi «pour chercher ailleurs que sur le web» infra). Exemples : Ditto [ pour les photos et images Orientation [ recherche par zone géographique Du côté des démarches, on peut citer : Les portails spécialisés En accès libre, ou après enregistrement pour certains, ces portails sont toujours thématiques et visent à faciliter l accès à nombre de services et ressources depuis une page d accueil synthétique. Exemples : Service Public [ pour l administration française Legifrance [ pour l info. juridique (codes, lois, JO) PlasticWay [ sur la plasturgie française Les sites fédérateurs ou de référence Ce sont des recensements de sites de référence ou de ressources Internet sur un thème ou visant un objectif précis. Parfois réputés et volumineux, parfois très pointus, ils sont souvent l'oeuvre
12 d'organismes, de documentalistes...ou tout simplement de passionnés d'un sujet. En fait, en les consultant, il faut partir du principe que quelqu'un a peut-être déjà collecté thématiquement des ressources sur le sujet recherché! Attention toutefois à rester attentif aux dates de mise à jour. 12 Quelques exemples L'ADBS propose un "guide thématique des Webs" qui recense plusieurs méta-pages francophones, par thèmes. [ Les Signets de la BnF [ Une sélection de plus de sites utiles ou de qualité. Entrée thématique + outils Internet. Sapristi! [ pour l'information Scientifique et Technique AlphaSearch [ recense en anglais des sites fédérateurs de qualités dans 35 disciplines universitaires. Pour chercher ailleurs que sur le web Pour explorer sur le net d autres espaces d information que le web, il y a des outils dédiés comme : Francopholistes [ pour les listes de diffusion francophones Liszt [ pour les listes de diffusion internationales Voila News [ pour les newsgroups francophones Ex-Deja (Google) [ pour les newsgroups anglophones Shareware [ pour les logiciels Tucows [ pour les logiciels Les listes d'outils de recherche Enfin, il existe des recensements, plus ou moins complets et à jour, des différents outils de recherche disponibles sur Internet. Exemples : Beaucoup [ 7alpha [ The Big Hub [ Un truc : pour découvrir, explorer et apprendre à connaître tous ces outils, voir la page récapitulative tenue à jour par Jean-Pierre Lardy et intitulée : "Vite, tous les outils " [ Ces quelques pistes ne sont données ici qu à titre indicatif car il ne s agit nullement de connaître tous les outils existants, mais plutôt d utiliser la catégorie d outils la plus efficace par rapport au
13 type d information recherchée. Une bonne pratique des outils de recherche principaux paraît préférable à une pratique moyenne de dizaine d outils différents. Il faut toujours chercher le bon point de départ, et ne pas oublier qu Internet peut parfois simplement contribuer à trouver la réponse à la question : Où trouver? 13
14 14 Méthodologie de la recherche d'informations "La recherche d'information est un art et non une science." Voici quelques clés indispensables à toute recherche d information. On peut ensuite bien évidemment les affiner en fonction des types et des niveaux de complexité des requêtes. Définir la demande et adapter la stratégie C est une étape indispensable. Il faut définir ce que l'on recherche pour sélectionner de façon pertinente les meilleurs outils en fonction de cette typologie. Une question est toujours dans un contexte et demandée par quelqu'un. Ex. adresse mail, dépêches d'agence, dossier de fond, noms de sociétés, cartes... Définir le sujet précisément (quoi?) sujet traité, thématique, quels mots-clé? Définir l'étendue et le contexte (pourquoi?) bien délimiter son sujet, voir son utilité Définir la forme (comment?) Texte ou images. Dépêches, article, documents, liens Il s agit ici d une analyse classique de la question, à laquelle il convient d ajouter une analyse spécifique au contexte Internet afin de définir une stratégie logique d action (quelle démarche adopter, quels outils utiliser?) Connaître les opérateurs et les requêtes en mode avancé Tout comme l'interrogation des banques de données classiques, les moteurs de recherche offrent souvent des possibilités d'interrogation selon deux modes : requête simple ou requête avancée. Savoir que lorsqu'on lance une requête, le moteur fait une équation de recherche de type BdD sans le montrer expressément. Seul problème, les syntaxes de requêtes avancées sont spécifiques à chaque moteur. Règles de base (valables sur la plupart des outils de recherche) Un mot est une chaîne de caractères alphanumériques, délimitée par un caractère de ponctuation, un blanc ou autre. Peu d'outils intègrent la reconnaissance lexicale (graphie inexacte, faute de frappe...) toujours vérifier l'exactitude des termes rentrés (Washinton au lieu de Washington ) Majuscules / minuscules Certains outils respectent la casse exacte des termes. Donc, pour récupérer le maximum d'informations, toujours penser à taper la requête en minuscules car le robot cherchera sur toutes les possibilités. En majuscules, il se conformera souvent à l'exacte copie du mot tel qu'il a été tapé. (Sauf si l'outil accepte les 2 indifféremment comme "Voila"). FRANCE = uniquement les sites avec FRANCE et non France France ou france = pourra sortir ces mêmes graphies + FRANCE Noter que certains outils (Hotbot) proposent une catégorie «nom de personne»
15 15 Les opérateurs Les plus connus sont les opérateurs booléens. Il s'agit de mots ou de signes (ET, OU, SAUF / AND, OR, NOT +, -) destinés à filtrer logiquement la recherche. Souvent en majuscules (et penser à l'anglais) Le ET permet de croiser des notions (intersection d'ensembles) Exemple : UE ET Suisse Le OU permet d'élargir des notions (synonymie souvent) Exemple : Suisse OU Confédération helvétique Le SAUF permet de retrancher des notions (exclusion) Exemple : UE SAUF France + et - (signe "plus" et "moins") Le signe + signale au robot que vous voulez que le mot figure obligatoirement dans les documents retrouvés. Toujours le coller au mot concerné. Exemple : +jazz +piano Le signe - revient à un SAUF : le terme est exclu de la recherche. Exemple : +café +boisson -bar Pour la troncature C'est souvent l'astérisque (*) qui symbolise la troncature (Joker ou wildcard) mais ses effets sont différents d'un moteur à l'autre et à utiliser donc avec prudence. Selon les cas, la troncature est limitée à un seul caractère (photo* = photo ou photos) ou bien à plusieurs caractères (photo* = aussi photographe, photographie ) un des usages les plus classiques : à l intérieur du terme Exemple : colo*r permet de récupérer tant color que colour Les expressions ("phrase" en anglais) L'usage des guillemets (quote) est de plus en plus répandu. Il est trés pratique pour indiquer qu'on recherche une expression complète et non un ensemble de termes dissociés. Exemples : "virtual library" - "journaux electroniques" - "vins de la loire" Les zones "champs" Il peut être utile de limiter sa recherche au champs titre (title: pour AltaVista) ou bien à l'adresse URL... Des recherches spécifiques peuvent êtres demandées sur certaines parties des documents. Le nom du champ doit être tapé en minuscule suivi de 2 points et du terme de la requête, le tout sans espace. Exemples : url:fr - link:adbs.fr - title:musique
16 Un truc : penser à consulter l'aide en ligne pour connaître la syntaxe exacte des opérateurs sur l'outil que vous utilisez. 16 Savoir EVALUER les sources L'utilisation croissante de l'internet comme outil ouvert de diffusion de l'information rend indispensable l'évaluation de la qualité de ce qui est trouvé. Il faut avoir un regard critique, ne pas croire à tout ce qu'on y lit et surtout bien repérer la nature des émetteurs d'informations. Voici quelques questions indispensables à se poser : qui sont les responsables? Y a t'il une affiliation institutionnelle? si oui, a t-on de l'information sur cette institution? L'auteur est-il bien identifié? Peut-on le contacter? (adresse ) Toujours penser à chercher la page d'accueil (homepage) quand on navigue avec les liens ou les moteurs de recherche qui renvoient directement sur des pages internes. quel contenu? L'information est-elle récente? Quelle en est la mise à jour? Les anciens documents sont-ils archivés? Y a t'il des liens vers des sites intéressants? quelle organisation de l'information? Y a t'il une table des matières? L'organisation est-elle logique? Peut-on se déplacer facilement dans le document? Les mises à jour sont-elles notées et facilement identifiables? Les pages sontelles datées? Mémoriser sa stratégie et enrichir son carnet Le net est tellement labyrinthique et inégal, qu'il nécessite des outils personnels de repérage de l'information pertinente. C'est à chacun de construire son propre carnet de signets ou favoris, de recenser les sites ressources les plus pertinents selon ses centres d'intérêts. Penser donc à systématiquement enregistrer un site intéressant en signet ou favori. L'opération est rapide et permet souvent d'éviter une recherche ultérieure identique. En contre-partie, il faut régulièrement faire du ménage dans ses signets et les avoir classés au bon endroit. Un truc : les liens hypertexte utilisés sont d'une couleur différente (possibilité de configuration de la couleur et du temps de sauvegarde dans les "Options"). C'est parfois pratique quand on est sur un sommaire ou une liste chargée de nombreux liens à explorer. CONCLUSION L'Internet n'est qu'une source d'information parmi d'autres qui peut être très utile pour certains sujets, presque inutile pour d'autres. Lors d'une recherche documentaire exhaustive, il faut la coupler avec d'autres outils. C'est aussi une ressource qui évolue vite et qu'il faut suivre
17 17 attentivement sous peine d'y perdre ses repères.
18 18 Pour en savoir encore plus! BIBLIOGRAPHIE Trouver l'info sur Internet / Olivier Andrieu - Eyrolles, mars p. Guide des sites internet pour l'entreprise / Armelle Thomas - Dunod, 1998 La recherche intelligente sur Internet / Henry Samier, Victor Sandoval Hermes, 1998 Recherche d'information sur Internet (Risi) / Jean-Pierre Lardy - ADBS, Coll. Sciences de l'information, série Recherches et documents, pages Des mises à jour de l ouvrage sont en ligne sur le site de l ADBS, Cf. infra LIEUX RESSOURCES francophones GIRI [ Guide d initiation à la recherche et guide des outils indispensables à cette recherche Sapristi! [ Guide méthodologique pour rechercher des pistes selon la typologie de l information RIsI [ Méthodologie de recherche et outils (Cf. le livre supra) Abondance [ Site consacré à l actualité des outils de recherche et au référencement (lettre hebdomadaire) LBQ [ La Lettre du Bibliothécaire Québécois est une revue électronique bimestrielle sur l actualité de la recherche d information dans le domaine I D et bibliothèque. anglophones Search Engine Watch [ Le site de référence sur l actualité des outils de recherche, avec une lettre mensuelle gratuite. Pandia [ Guide et actualité sur la recherche d information LISTES de DISCUSSION ADBS-INFO [ BIBLIO-FR [ Synthèses de ces 2 listes sur le site de l'enssib
19 19 [ l] GLOSSAIRE AGENT INTELLIGENT Logiciel visant à faciliter la recherche et la gestion de l'information sur l'internet. ALGORITHME DE PERTINENCE Relevancy algorithm : Méthode utilisée par un moteur de recherche ou un répertoire pour relier les mots-clés d'une requête avec le contenu de chaque page, de telle sorte que les pages Web trouvées correspondent bien aux termes utilisés dans la requête. Chaque outil de recherche est susceptible d'utiliser un algorithme différent et de le changer ou de l'améliorer. Voir aussi : critères de tri. ANNUAIRE Voir Répertoire APPLET JAVA Programme en langage Java, téléchargeable et exécutable sur n'importe quel type de processeur visant à améliorer l interactivité des pages. Les principaux navigateurs sont capables de lire et d'exécuter les applets Java. Il est possible que la présence de ce programme stoppe l'indexation d'une page par le robot d'un moteur de recherche. ARAIGNEE (traduction littérale de Spider) C'est la partie du moteur de recherche qui "surfe" sur le net, enregistre les URLs, classe les mots-clés et le texte de chaque page qu'il trouve. ASPIRATEUR DE SITE Outil permettant de copier un site Web à distance sur un disque dur ou CD Rom pour le relire ensuite en local. BRUIT Réponse(s) non pertinente(s) fournie(s) lors d'une recherche d'information. CADRE Voir Frame CGI Acronyme de Common Gateway Interface, logiciel qui facilite la communication entre un serveur Web et des programmes fonctionnant hors de ce serveur ; par exemple, des programmes qui traitent des formulaires interactifs ou qui recherchent des informations dans des bases de données sur le serveur, suite à la requête d'un utilisateur. CONTENU DYNAMIQUE Il s'agit de pages Web avec des informations qui changent ou sont changées automatiquement en fonction d'une base de données ou d'éléments provenant de l'utilisateur. (ex. suffixe.asp,.cfm,.cgi ou.shtml dans l'url). Voir aussi Page dynamique CRITERE DE TRI
20 Façon automatique de sélectionner les résultats retournés par le moteur de recherche, afin de présenter en début de liste ceux qui correspondent le mieux à la requête. On distingue généralement le tri par pertinence du tri par popularité. Voir aussi : algorithme de pertinence. CRYPTAGE Moyen de rendre secrète la communication informatique grâce à des logiciels d'encodage de données. Seul le possesseur de la clé de décodage peut interpréter le message. Aussi appelé "chiffrement". DENSITE DES MOTS CLES Une des propriétés qui permet d'indiquer l'importance de certains mots dans le texte d'une page Web. Certains outils de recherche utilisent cette propriété pour le tri. La formule de calcul = nombre d'occurrences du terme demandé / nombre de termes de la page en question, une fois éliminés les mots vides. DIRECTORY Voir Répertoire EN-TETE heading tags : ce sont les commandes qui se trouvent en tête des pages html. Certains moteurs de recherche donnent plus d'importance et de poids au texte qui s'y trouve. EQUATION DE RECHERCHE Formulation d'une question sous forme mots clés reliés par des termes logiques (ou opérateurs). Voir aussi opérateurs booléens. FRAME Synonymes : trame, cadre. Il s'agit d'une technique de programmation en html qui permet de diviser la fenêtre du navigateur en plusieurs zones, puis de charger une page web dans chacun des cadres obtenus, les documents agissants l'un sur l'autre à travers différentes sous-fenêtres. Les frames posent souvent de gros problèmes d'indexation aux moteurs de recherche. JAVA Langage multiplateforme, créé par Sun, capable de s'exécuter à l'intérieur d'une page Web. Souvent utilisé pour créer des applets. JAVASCRIPT Langage simple interprété qui permet d'exécuter des petites tâches au sein des pages html. KEYWORD Voir Mot-clé LIEN A L'ARRIVEE Un lien hypertexte vers une page particulière venant de quelque part et apportant du trafic à cette page. Les liens à l'arrivée sont souvent un instrument de mesure pour connaître la popularité d'une page. LIEN MORT Un lien qui ne mène plus à une page ou à un site, soit parce que le serveur est en panne, soit parce que la page a été déplacée ou bien n'existe plus. La plupart des outils de recherche ont 20
21 des techniques pour oter de telles pages de leur liste automatiquement. Mais l'internet continuant à croître quotidiennement, il leur devient de plus en plus difficile de contrôler régulièrement toutes ces pages. 21 META-MOTEUR ou METAMOTEUR Un outil qui, pour une même requête, interroge simultanément plusieurs moteurs de recherche et/ou répertoires et compile les résultats avant de les présenter. Parfois qualifiés d'agents "semi-intelligents". META TAG Construction placée dans l'en-tête html des pages Web, fournissant des informations qui ne sont pas visibles par les navigateurs. Les plus courants des meta-tags sont KEYWORDS et DESCRIPTION. MOT CLE ou key-word : Mot ou groupe de mot, éventuellement dans une forme lexicographique normalisée, choisi dans le titre, les meta tags ou le texte d'un document, caractérisé par le contenu et permettant la recherche de ce document. MOTEUR DE RECHERCHE ou Search Engine et chercheur au Québec : Programme qui indexe le contenu de différentes ressources Internet, et plus particulièrement de sites Web, et qui permet à l'internaute de rechercher de l'information selon différents paramètres, en se servant de mots clés, et d'avoir accès à l'information ainsi trouvée. Mode de fonctionnement : des robots logiciels (appelés crawlers ou spiders) scrutent le Web, vont de page en page et sauvegardent alors le contenu texte des pages rencontrées, constituant ainsi un "index", c'est-à-dire une collection plus ou moins grande de pages Web. Le robot logiciel repasse selon des délais plus ou moins fréquents sur les pages qu'il a indexées au préalable, pour en sauvegarder une version plus récente. On dit alors qu'il "rafraîchit sa base (ou son index)". Lorsque l'internaute saisit un mot clé dans le formulaire proposé, le moteur va en rechercher les occurrences dans son index, i.e. dans le contenu texte des pages Web sauvegardées au préalable. Une fois le "lot" de pages contenant le terme demandé identifié, le moteur classe les pages par ordre de pertinence, selon un ordre et un algorithme spécifique. (voir algorithme de pertinence et aussi critère de tri). A tort, le terme "moteur de recherche" est souvent utilisé tant pour un répertoire que pour un vrai moteur. Voir aussi : outil de recherche. MOTEUR THEMATIQUE Synonyme : moteur spécialisé : Il procède par catégorisation automatique de pages, généralement à partir de catégories prédéfinies et de mots-clés préétablis. OPERATEUR BOOLEEN Pour effectuer une recherche par mots clés, on couple souvent une suite de mots grâce à des opérateurs booléens. Venant du nom de George Boole (mathématicien britannique) ces opérateurs permettent d'élargir ou de restreindre la recherche en combinant certains mots et en en excluant d'autres. Il existe plusieurs opérateurs booléens : le ET (les deux mots saisis figurent obligatoirement dans la réponse), le OU (la réponse comporte soit l'un des mots saisis, soit l'autre, soit les deux) et le SAUF (qui exclue le terme en question de la réponse).
22 OUTIL DE RECHERCHE Terme générique pour tout service de recherche d'information sur le Web, combinant bien souvent désormais les procédés d'un répertoire et ceux d'un moteur de recherche, plus parfois de moteurs spécialisés. 22 P to P Point to Point, Peer to Peer ou encore People to People. Type de connexion qui met en communication deux interlocuteurs, et seulement deux. Des applications comme Napster ou Gnutella emploient cette technique et permettent à des utilisateurs de permuter, d'échanger des fichiers directement entre eux, sans passer par un serveur d'hébergement. PAGE DYNAMIQUE Page HTML dont le contenu n'est pas situé dans un fichier enregistré sur le serveur mais générées "à la volée" par une application informatique à partir d'un modèle de document HTML en accédant à des informations situées dans une (ou des) base(s) de données. Les techniques utilisées sont variables : - CGI, - langage de script, - API propriétaires permettant de créer un lien entre la base de données et le serveur HTTP. PAGE STATIQUE Page HTML dont le contenu est situé dans un fichier figé, enregistré sur le serveur Web. POPULARITE Synonyme : notoriété. Mesure le nombre et la qualité des liens pointant vers une page particulière. Plusieurs moteurs de recherche utilisent de plus en plus ce procédé dans le processus de tri. PORTAIL Terme générique pour désigner un site qui sert de point d'entrée sur l'internet pour un nombre important d'utilisateurs. Un site portail offre une multitude de services différents depuis la page d'accueil. POSITIONNEMENT ou Ranking : Processus de classement des sites, des pages Web dans un moteur de recherche ou un répertoire afin que les sites les plus pertinents apparaissent en premier sur la page résultat lors d'une requête. REGROUPEMENT ou Cluster? Affichage d'une seule adresse pour chaque site Web sur la page des résultats d'un outil de recherche. Cette méthode permet d'éviter qu'un petit nombre de sites occupe toutes les premières positions de résultats et en facilite la lecture pour l'utilisateur. REPERTOIRE Synonymes : catalogue, index thématique, liste thématique. Synonyme communément utilisé à tort : annuaire (un répertoire n'est pas annuel!). Liste de sites Web classés dans des catégories thématiques. Le classement est effectué et géré par des personnes physiques en fonction de diverses informations soit fournies au moment du
23 référencement par le concepteur du site, soit déduites après la visite du site par les indexeurs du répertoire. L'unité de classement est le site et non la page. La valeur ajoutée d'un répertoire tient en la qualité de son système de classification et à l'insertion éventuelle de commentaires et descriptions enrichies pour chaque site référencé. La plupart des répertoires proposent une recherche par mot-clé sur le titre des sites, les mots de la description, et les catégories concernées. On peut distinguer plusieurs types de répertoires : Cf. infra. 23 REPERTOIRE GENERALISTE Répertoire ayant vocation à indexer tous les sites et qui n'effectuent une censure que sur la base de principes prédéfinis (par exemple, sont exclus des sites manifestement illégaux ou dont le référencement cherche à induire l'internaute en erreur). Exemple : Yahoo, Nomade REPERTOIRE SPECIALISE Répertoire dont les sites répertoriés relèvent tous d'un domaine ou d'un secteur particulier (le vin, le tourisme, le sport, l'agriculture, etc.). Un répertoire spécialisé peut, par exemple, ne prendre en compte que les entreprises d'un secteur, ou les produits d'un domaine. Ne pas confondre avec un moteur thématique. Exemple : Qualisteam.com dans le domaine bancaire et financier. REPERTOIRE SELECTIF Répertoire dont les gestionnaires privilégient les sites de meilleure qualité et excluent les sites qu'ils n'estiment pas suffisament intéressants (exemple : bonweb.com). REPERTOIRE CONTRIBUTIF Synonymes : répertoire ouvert,- open directory : Répertoire dont l'enrichissement est effectué par différentes équipes d'internautes. Ces répertoires confient la responsabilité d'une ou plusieurs catégories soit à des internautes experts reconnus dans leur domaine et rémunérés pour leur prestation (exemple : About.com), soit à des internautes bénévoles dont la compétence dans le domaine couvert par cette catégorie a été vérifiée. Ces internautes reçoivent alors les demandes de référencement de leur catégorie, décident ou non de référencer les sites et, le cas échéant, rédigent eux-même la description du site (exemple : dmoz - Open Directory Project). REPERTOIRES D'OUTILS DE RECHERCHE Synonymes : listes de listes, répertoires de répertoires - Répertoires spécialisés dans le référencement de répertoires et d'outils de recherche (moteurs de recherche, méta-moteurs, etc.). REQUETE Synonymes : query, terme recherché. Mot, expression ou groupe de mots employés pour interroger un outil de recherche afin de localiser des pages sur le sujet recherché. ROBOT Programmes de navigation qui suivent les liens hypertextes des pages Web mais qui ne sont par directement sous contrôle humain. Exemples : les spiders ou araignées des moteurs de recherche.
24 ROBOTS.TXT Fichier texte déposé dans le répertoire principal d'un site Web pour interdire l'accès aux robots de certaines pages ou sous-répertoires du site. SILENCE Désigne l'ensemble des documents pertinents non retrouvés lors d'une recherche. 24 SITE FEDERATEUR Synonymes : site de référence, portail spécialisé Site spécialisé sur un thème précis (ex. le vin) proposant plusieurs types de ressources. Par exemple : répertoire spécialisé, liens vers des répertoires ou pages de liens spécialisées, articles en texte intégral ou bibliographie en ligne, actualités du secteur, événements du secteur, accès à base(s) de données, etc. Le fin du fin d'un site fédérateur consiste à créer une communauté autour de lui (via forums, newsletters, etc) pour devenir le point de référence du domaine. SPAMDEXING Création ou modification d'un document avec l'intention de tromper un répertoire ou un système de classement automatique. Toute technique visant à augmenter la position potentielle d'un site aux dépens de la qualité du corpus de l'outil de recherche peut également être considérée comme du spamdexing. SPIDER Voir Araignée TECHNIQUES DE POSITIONNEMENT Stratégies qui consistent pour le concepteur d un site ou le référenceur à modifier sa page Web afin que les moteurs de recherche traitent la page comme la plus appropriée pour une requête spécifique, ou un ensemble de requêtes. TRI PAR PERTINENCE Méthode de classement automatique des résultats retournés par le moteur de recherche qui s'appuie sur le calcul d'un score pour chaque réponse. La pertinence est alors basée sur des facteurs comme : - le poids d'un mot déterminé par sa place dans le document - la densité : fréquence d'occurrence dans un document par rapport à la taille du document - le poids d'un mot dans la base et sa fréquence d'occurrence dans toute la base - la correspondance d'expression : similarité entre l'expression de la requête et l'expression correspondante dans un document - relation de proximité : proximité des termes de la requête entre eux et dans le document. Cette technique est apparue avec la 1ére génération de moteurs de recherche (depuis 1994) et présente l'inconvénient d'être facile à détourner par les référenceurs peu scrupuleux (Cf. Spamdexing). Elle est utilisée par des moteurs comme AltaVista, Excite, Inktomi, Voila... TRI PAR POPULARITE Méthode de classement automatique des résultats retournés par le moteur de recherche qui
25 s'appuie soit sur le principe de citation soit sur la mesure de l'audience. Dans le premier cas, l'importance d'une page est évaluée en fonction des liens hypertexte qui pointent vers elle et en fonction de la nature du document qui la cite. Le tri est alors indépendant du contenu, mais les documents récents ou peu cités par les autres sont défavorisés. Google avec son système de PageRank en est l'exemple le plus connu. Dans le second cas, l'importance d'une page est fonction du nombre de visites reçues lors d'une requête sur un moteur de recherche. C'est l'analyse du comportement de l'internaute qui détermine la popularité d'une page par rapport à un mot-clé. Solution DirectHit utilisée par HotBot et LookSmart par exemple. 25 URL Uniform Resource Locator : adresse d'un site Web. WEB (ou WWW ou Web) "Toile d'araignée mondiale" : outil logiciel multimédia et hypertexte permettant d'effectuer des recherches de tous types sur le réseau, l'accès à l'information recherchée et sa visualisation. Cet interface graphique, accessible via Netscape ou Internet Explorer, a permis l'explosion actuelle d'internet. Les utilisateurs peuvent y créer, y éditer ou y rechercher des documents. La taille du Web est en constante augmentation, dépassant allègrement le milliard de sites. WEB INVISIBLE Expression qui sous-entend "la part du Web invisible pour les moteurs de recherche" : l'ensemble des pages non localisables et/ou non indexables par ces outils. Le Web invisible correspond à plusieurs types de ressources : Documents dans des formats différents du html (par exemple pdf, word, etc. ). Pages situées à l'intérieur d'une frame (cadre). Pages dont les caractéristiques techniques rendent difficiles, sinon impossible l'indexation par les moteurs : javascrips modifiant le contenu, technologies propriétaires (par exemple flash, active X, java) Pages qui n'ont fait l'objet ni d'un référencement direct, ni d'aucun lien d'une autre page. Pages nécessitant une identification de la part de l'internaute Pages dont le contenu indique aux moteurs qu'ils ne doivent pas l'indexer Page produite à partir de bases de données ou d'applications, et dont l'url comporte des paramètres non exploitables par la plupart des moteurs. Page produite à partir de données saisies par l'utilisateur via un formulaire html. Exemple : les résultats de l'interrogation d'une base de données avec des critères de recherche entrés par l'utilisateur. XML Pour extensible Markup Language : langage de description et d'échange de documents structurés. Il est le résultat de la coopération d'entreprises et de chercheurs partenaires du World Wide Web Consortium (W3C) dont l'objectif a été de définir un formalisme permettant de regrouper les concepts d'hypertextes, de bases de données, de formats d'échange et de publication.
26 26 *** Ces définitions ne sont pas normatives. Pour certaines, elles sont issues de discussions passionnées échangées entre les formateurs Internet de l ADBS. Elles visent avant tout à éclaircir un vocabulaire spécialisé et encore fluctuant.
Recherche d'information dans Internet Introduction
1 Journées annuelles de santé publique 2001 Le monde de la santé publique au bout des doigts Moteurs de recherche, répertoires et métamoteurs présenté par Christine Dufour Recherche d'information dans
Formation à la recherche documentaire sur le web
Formation à la recherche documentaire sur le web Objectif : Savoir effectuer des recherches pertinentes sur Internet Savoir distinguer les informations fiables sur Internet Savoir effectuer des recherches
Répondre à un courrier - Transférer un courrier 20
avec Présentation de l'écran d'internet Explorer 5 3 Se connecter sur un site distant à partir de l'adresse URL du site Se connecter sur un site distant en utilisant les favoris 5 6 Enregistrer un site
Réussir. son. référencement. web. Olivier Andrieu. Groupe Eyrolles, 2008, ISBN : 978-2-212-12264-0
Réussir son référencement web Olivier Andrieu Groupe Eyrolles, 2008, ISBN : 978-2-212-12264-0 Table des matières CHAPITRE 1 Le référencement aujourd hui : généralités, définitions......................................
COMMENT AMELIORER LA VISIBILITE DE SON SITE WEB?
Le grand nombre d utilisateurs d Internet, «professionnels», «particuliers», et le développement du haut débit, transforment la vision des sites Internet. De par sa couverture mondiale, de l étendue de
COMMENT AMÉLIORER LA VISIBILITÉ DE SON SITE WEB?
COMMENT AMÉLIORER LA VISIBILITÉ DE SON SITE WEB? Sommaire Le trafic sur son site web Le référencement naturel Comment marche un moteur de recherche? Le positionnement Mise en garde Pour aller plus loin
16 septembre 2013. Lundi de l Economie l. rencement. Foix. CCI Ariège
Lundi de l Economie l Numérique 16 septembre 2013 Lundi de l Economie l Numérique Le référencementr rencement Foix CCI Ariège Définition Référencement naturel Le référencement (SEO, Search Engine Optimization)
!" #$%&'(&)'*'+,--./&0'1&23,+2.)$4$%52'&%'6.%&2'
Évaluer un site web, cours de descriptions de controverses i Dans le cadre du cours Description des controverses, le repérage des acteurs et la connaissance de leurs positions passent largement par l identification
LEXIQUE DES TERMES DOCUMENTAIRES LES PLUS COURANTS
LEXIQUE DES TERMES DOCUMENTAIRES LES PLUS COURANTS Annuaire Ouvrage publié en principe chaque année ou selon une périodicité proche de l'année, qui donne une liste de noms de personnes ou d'organismes
Ecole Préparatoire SNV Université d Oran Semestre 02 2014/2015 Matière : Travaux d Initiative Personnelle Encadrés (TIPE) Prof. M. Z.
Ecole Préparatoire SNV Université d Oran Semestre 02 2014/2015 Matière : Travaux d Initiative Personnelle Encadrés (TIPE) Prof. M. Z. TALEB Avec quel outil? Comment? Trouvez-vous facilement l information?
LA RECHERCHE DOCUMENTAIRE
LA RECHERCHE DOCUMENTAIRE Introduction I. Les étapes de la recherche d'information II. Méthodologie spécifique 2.1 Bibliothèque 2.2 Internet Conclusion INTRODUCTION Lorsque on débute une réflexion sur
Initiation à la recherche documentaire
Initiation à la recherche documentaire 1 Objectifs Cette séance est destinée à reprendre les principes de la démarche documentaire pour construire un parcours pertinent en terme de méthodologie et de résultats
demander pourquoi mon site n'apparaît pas sur google ou pourquoi mon site n'est pas référencé par les moteurs de recherche?
50 questions essentielles à vous poser avant la mise en ligne de votre site pour ne plus vous demander pourquoi mon site n'apparaît pas sur google ou pourquoi mon site n'est pas référencé par les moteurs
Initiation à la recherche documentaire LA RECHERCHE SUR INTERNET
Initiation à la recherche documentaire LA RECHERCHE SUR INTERNET Les Ressources d'internet Le web? Système hypermédia d accès à l information sous diverses formes, texte, son, image disponible sur Internet
INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)
CS WEB Ch 1 Introduction I. INTRODUCTION... 1 A. INTERNET INTERCONNEXION DE RESEAUX... 1 B. LE «WEB» LA TOILE, INTERCONNEXION DE SITES WEB... 2 C. L URL : LOCALISER DES RESSOURCES SUR L INTERNET... 2 D.
Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques
Guide de recherche documentaire à l usage des doctorants Partie : Exploiter les bases de données académiques Sylvia Cheminel Dernière mise à jour : décembre 04 PANORAMA DES SOURCES DOCUMENTAIRES ACADEMIQUES...
Introduction. Internet : Moteur de recherche : Google, Yahoo, Forum
VIELLE TECHNOLOGIQUE SUR INTERNET Mr Mounir GRARI 2007/2008 Plan 2 Enjeux de la veille Spécificités des moteurs de recherche Les agents intelligents Elaborer une stratégie de recherche Extraire l information
En quoi consiste le REFERENCEMENT de votre site?
1 En quoi consiste le REFERENCEMENT de votre site? Ce document se propose de vous éclairer sur les enjeux du référencement et les solutions proposées par MediaPro DX pour y faire face. MediaPro DX est
Référencement naturel & E-tourisme. Pau 02/10/2008
Référencement naturel & E-tourisme Pau 02/10/2008 Enjeux de la visibilité de votre site e-tourisme Principe de fonctionnement d un moteur de recherche Evaluer la qualité de référencement de son site internet
Petite définition : Présentation :
Petite définition : Le Web 2.0 est une technologie qui permet la création de réseaux sociaux, de communautés, via divers produits (des sites communautaires, des blogs, des forums, des wiki ), qui vise
SOMMAIRE. 1. Comprendre les bases - référencement, indexation et positionnement - comment fonctionne Google pour indexer et référencer un site?
SOMMAIRE 1. Comprendre les bases - référencement, indexation et positionnement - comment fonctionne Google pour indexer et référencer un site? 2. Comment définir une stratégie de référencement? - connaître
Référencement de votre site Web Google et autres moteurs de recherche (4ième édition)
Chapitre 1 : Introduction A. Google, l incontournable... 15 B. Référencement : Panda et Penguin sont passés par là... 16 C. SEO/SMO 17 D. Propos du livre 18 E. Avant de commencer 19 F. Notre exemple d'illustration
PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées
PRODIGE V3 Manuel utilisateurs Consultation des métadonnées Pour plus d'information sur le dispositif : à remplir par chaque site éventuellement 2 PRODIGE V3 : Consultation des métadonnées SOMMAIRE 1.
Le référencement de mon site
Le référencement de mon site C est parti!!! mardi 17 décembre 2013 Offices de Tourisme de BARBOTAN, EAUZE, CASTELNAU d AUZAN, GONDRIN et NOGARO Animateur Numérique de Territoire = Huggy les Bons Tuyaux
Gestion de contenu d un site web avec TYPO3 Manuel de l administrateur
Gestion de contenu d un site web avec TYPO3 Manuel de l administrateur 1. Présentation de Typo3... 2 2. Rôle de l administrateur... 2 3. Configuration du site Web... 3 3.0 Que faire si les changements
Gestion collaborative de documents
Gestion collaborative de documents ANT box, le logiciel qui simplifie votre GED Les organisations (entreprises, collectivités, associations...) génèrent chaque jour des millions de documents, e-mails,
Travail collaboratif à distance
UNIVERSITE ABDELMALEK ESSAADI FACULTE POLYDISCIPLINAIRE LARACHE 2012-2013 Travail collaboratif à distance P r o f e sse u r A z iz M A B ROU K P r. a z i z. m a b r o u k. f p l @ g m a i l. c o m S.E.G
1. Cliquez sur dans le coin supérieur gauche de l'écran 2. Sélectionnez la Langue de l'interface désirée 3. Cliquez sur
NOTIFICATIONS GUIDE Le module Notifications permet de retrouver des notifications en utilisant les champs spécifiques de la base de données du Registre central des notifications (RCN). Il comporte une
Les Enjeux du Référencement de Sites Internet. Un livre blanc réalisé par Benchmark Group pour Netbooster
Les Enjeux du Référencement de Sites Internet Un livre blanc réalisé par Benchmark Group pour Netbooster Pourquoi un livre blanc sur le référencement de sites? Alors qu au niveau mondial, on dénombre sur
Table des matières. Préface...5. Introduction...9
Préface......................................................5 Introduction..................................................9 Chapitre 1 Diversité des besoins, diversité des contenus........................13
Référencement et visibilité sur Internet Comment améliorer la visibilité de son site internet sur les principaux moteurs de recherche?
9 Référencement et visibilité sur Internet Comment améliorer la visibilité de son site internet sur les principaux moteurs de recherche? Le trafic d un site internet Le référencement naturel Les freins
INTERNET, C'EST QUOI?
INTERNET, C'EST QUOI? Internet, c'est quoi? «Internet est le réseau informatique mondial qui rend accessibles au public des services variés comme le courrier électronique, la messagerie instantanée et
FORMATION PcVue. Mise en œuvre de WEBVUE. Journées de formation au logiciel de supervision PcVue 8.1. Lieu : Lycée Pablo Neruda Saint Martin d hères
FORMATION PcVue Mise en œuvre de WEBVUE Journées de formation au logiciel de supervision PcVue 8.1 Lieu : Lycée Pablo Neruda Saint Martin d hères Centre ressource Génie Electrique Intervenant : Enseignant
Comment réussir son référencement
Internet Comment réussir son référencement Sept clés pour définir et mettre en œuvre un plan d action efficace pour bien positionner ses contenus web dans les pages de résultats des moteurs, et particulièrement
GUIDE PRATIQUE DU REFERENCEMENT NATUREL
GUIDE PRATIQUE DU REFERENCEMENT NATUREL Auteur Walid Gabteni, Consultant SEO édition du 20 Juin 2015 Source officielle du guide pratique du référencement naturel : https://upload.wikimedia.org/wikipedia/commons/f/f3/guide_pratique_du_référencem
Chapitre 1 : Introduction aux bases de données
Chapitre 1 : Introduction aux bases de données Les Bases de Données occupent aujourd'hui une place de plus en plus importante dans les systèmes informatiques. Les Systèmes de Gestion de Bases de Données
Le référencement naturel
Le référencement naturel Phases essentielles Choix des mots-clés Où se référencer : moteurs, annuaires Indexation des pages du site dans les moteurs Positionnement et trafic généré Optimisation des pages
Communiqué de Lancement
Direction du Marketing Produits Sage - Division Mid Market Communiqué de Lancement Rapprochement Bancaire 1000 Produit : Rapprochement Bancaire 1000 Bases de Données : Oracle - MS/SQL Server Microsoft
Guide de création de site web optimisé
Guide de création de site web optimisé Vous trouverez ci-après un résumé des différents points à prendre en compte pour créer un site web optimisé pour les moteurs de recherche en termes de code HTML et
Documentation Honolulu 14 (1) - 0209
Documentation Honolulu 14 (1) - 0209 Honolulu 14 3 Sommaire Honolulu 14 le portail Intranet / Internet de votre entreprise PARTIE 1 -MANUEL UTILISATEUR 1. LE PORTAIL HONOLULU : PAGE D ACCUEIL 8 1.1 Comment
Les modes de recherche sur le Web 2.0
Les modes de recherche sur le Web 2.0 1 Sommaire 1. Contexte 2. Le collaboratif : les moteurs thématiques 3. La syndication des résultats de recherche 4. Les connaissances : des moteurs 2 1 1. Moteurs
Éditeur Koninklijke Brill Langue(s) Multilingue
Brill Type Périmètre d'abonnement Articles des archives de revues scientifiques en texte intégral La totalité des archives des revues de Brill jusque 2012 Domaine Public Sciences humaines et sociales,
Maîtrisez votre Navigateur
Qu est-ce que Surfer ou Naviguer sur Internet? C est l action, à l aide d un navigateur internet, de suivre les liens hypertexte qui relient les pages Web les unes aux autres. La navigation Web C est une
Chapitre 3 : outil «Documents»
Chapitre 3 : outil «Documents» L outil «Documents» fonctionne comme le gestionnaire de fichiers de votre ordinateur. Vous pouvez y transférer des documents de tous types (html, Word, Powerpoint, Excel,
Glossaire. www.themanualpage.org ( themanualpage.org) soumises à la licence GNU FDL.
Glossaire Ce glossaire contient les termes techniques et de spécialité les plus employés dans cette thèse. Il emprunte, pour certaines d entre elles, les définitions proposées par www.themanualpage.org
Utiliser Access ou Excel pour gérer vos données
Page 1 of 5 Microsoft Office Access Utiliser Access ou Excel pour gérer vos données S'applique à : Microsoft Office Access 2007 Masquer tout Les programmes de feuilles de calcul automatisées, tels que
Premiers pas sur e-lyco
Premiers pas sur e-lyco A destination des parents, ce document présente les premiers éléments pour accéder aux services de l'ent e-lyco d'un lycée. Que signifient ENT et e-lyco? ENT = Espace ou Environnement
claroline classroom online
de la plate-forme libre d'apprentissage en ligne Claroline 1.4 Manuel Révision du manuel: 06/2003 Créé le 07/09/2003 12:02 Page 1 Table des matières 1) INTRODUCTION...3 2) AFFICHER LA PAGE DE DEMARRAGE...3
iil est désormais courant de trouver sur Internet un document
Matériels et systèmes L Acrobat qui cherche dans les PDF Michel NARCY - Formateur TICE et Médialog Bulletin officiel, programmes d enseignement, articles de quotidiens ou de revues scientifiques... De
MEDIAplus elearning. version 6.6
MEDIAplus elearning version 6.6 L'interface d administration MEDIAplus Sommaire 1. L'interface d administration MEDIAplus... 5 2. Principes de l administration MEDIAplus... 8 2.1. Organisations et administrateurs...
«Un site non référencé est un site qui n existe pas» «Faire un site c est bien, mais s il n apparaît pas en première page, ca ne sert à rien!
«Un site non référencé est un site qui n existe pas» «Faire un site c est bien, mais s il n apparaît pas en première page, ca ne sert à rien!» Escale-Formation-NTIC 2010 Nouvelles Technologies d Information
Les documents primaires / Les documents secondaires
Les documents primaires / Les documents secondaires L information est la «matière première». Il existe plusieurs catégories pour décrire les canaux d information (les documents) : - Les documents primaires
Manuel de SQUIRRELMAIL à l'usage des étudiants.
Manuel de SQUIRRELMAIL à l'usage des étudiants. SQUIRRELMAIL 1 est une interface Web (Webmail) utilisée pour traiter le courrier électronique à travers le réseau Internet. Un avantage d'une telle méthode
WordPress Référencement naturel (SEO) Optimiser. son référencement. Daniel Roch. Préface d Olivier Andrieu
Daniel Roch Optimiser son référencement WordPress Référencement naturel (SEO) Préface d Olivier Andrieu Groupe Eyrolles, 2013, ISBN : 978-2-212-13714-9 Table des matières AVANT-PROPOS... 1 Pourquoi ce
Partie II Approche théorique
Partie II Approche théorique De nombreux phénomènes ont été mis en évidence lors des différentes enquêtes, nous amenant à diverses interrogations pouvant être résumées et transcrites en une problématique.
Memento de la recherche documentaire en santé
Memento de la recherche documentaire en santé Optimiser ses recherches - Se procurer les documents Rédiger sa bibliographie 1. QUELQUES CONSEILS DE METHODE Avant toute chose, bien choisir ses mots-clés
PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées
PRODIGE V3 Manuel utilisateurs Consultation des métadonnées Pour plus d'information sur le dispositif : à remplir par chaque site éventuellement 2 PRODIGE V3 : Consultation des métadonnées SOMMAIRE 1.
Référencement naturel
Référencement naturel 1er novembre 2011 Pour optimiser votre positionnement dans les moteurs de recherche, renforcer votre visibilité en ligne et améliorer le contenu de votre site web pour le référencement
Comment créer vos propres pages web?
Comment créer vos propres pages web? Vous voulez vous aussi devenir acteur et présenter vos passions et vos envies aux yeux du monde. Présentez-les sur le WEB. Pour cela, il vous suffit de créer vos "pages
Intégrer des notices de MoCCAM-en-ligne dans BCDI abonnement
Intégrer des notices de MoCCAM-en-ligne dans BCDI abonnement MoCCAM-en-ligne (http://www.moccam-en-ligne.fr/) est un service libre et gratuit de récupération en ligne de notices UNIMARC. Le site Moccam
Bibliothèque Esparron en livres. www.esparron-en-livres.com
Les réseaux sociaux Chapitre 1 : Les réseaux sociaux Chapitre 2 : 14 moyens pour être plus visible sur Facebook Chapitre 3 : Comment créer un compte Facebook Chapitre 4 : Statistiques en France Les réseaux
Solutions en ligne Guide de l utilisateur
Solutions en ligne Guide de l utilisateur Décembre 2009 Informations générales... 1 Configuration minimale requise... 1 Connexion... 1 Page d accueil des Solutions en ligne... 2 Utilisation de la table
La recherche documentaire et la recherche d informations professionnelles. BU Sciences BIU Montpellier PPE 2012
La recherche documentaire et la recherche d informations professionnelles 1 Introduction : la pratique étudiante Où commencez vous habituellement votre recherche d information? 84% des étudiants de 1er
Alfresco Guide Utilisateur
Alfresco Guide Utilisateur ATELIER TECHNIQUE DES ESPACES NATURELS - 1 Table des matières Alfresco Guide Utilisateur...1 Accéder à la GED de l'aten...3 Via un client FTP...3 Onglet Général...3 Onglet Avancé...3
Prise en main du BusinessObjects XI R2 Service Pack 2/ Productivity Pack
Prise en main du BusinessObjects XI R2 Service Pack 2/ Productivity Pack A propos de ce guide A propos de ce guide Ce guide contient des informations de prise en main du BusinessObjects XI R2 Service Pack
ORGANISER LA RECHERCHE D'INFORMATIONS À L'ÈRE DU NUMÉRIQUE
ORGANISER LA RECHERCHE D'INFORMATIONS À L'ÈRE DU NUMÉRIQUE Nathalie DENOS Karine SILINI Hervé HOCQUARD Plan 2 D4.1 - Rechercher de l'information avec une démarche adaptée. D4.2 - Évaluer les résultats
NAVIGATION SUR INTERNET EXPLORER
Centres d accès communautaire Internet des Îles NAVIGATION SUR INTERNET EXPLORER Table des matières Introduction 1- Les barres d outils 1.1 La barre d adresse 2 5 min. 1.2. Les boutons de navigation 2
Kaizen Marketing Group Web Agency. Kaizen Marketing. - Stéphanie Héline-
Kaizen Marketing - Stéphanie Héline- 1 Référencement Web Paris 26 Juin 2013 Faire de la pub c est bien 12 Répondre à une requête c est mieux! 3 Comment recherchez-vous? Source : Google - 2012 Importance
Langage HTML (2 partie) <HyperText Markup Language> <tv>lt La Salle Avignon BTS IRIS</tv>
Langage HTML (2 partie) «Je n'ai fait que prendre le principe d - hypertexte et le relier au principe du TCP et du DNS et alors boum! ce fut le World Wide Web!» Tim Berners-Lee
Comment faire pour créer ses propres pages html?
. Comment faire pour créer ses propres pages html? Insérer une vidéo Pour ajouter une vidéo de votre choix, il vous faut insérer, dans un premier temps, un tableau dans lequel vous placerez un mot, par
Optimiser le référencement naturel de son site web
Rodez, le 15 avril 2011 Les moteurs de recherche Les moteurs utilisés dans le monde Les moteurs utilisés en Europe Où clique un internaute? Référencement «payant» 35-40% des clics sur Google Référencement
Catalogue de formations
Conseil et formation en Marketing Web /////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// Catalogue de
DUT GEA. Informatique D après le document de Laurent GILI / Lycée Prévert
DUT GEA. Informatique D après le document de Laurent GILI / Lycée Prévert «Google n est un moteur de recherche, c est un système de gestion de la réputation» Leslie Gaines-Ross Auteure de «Corporate Reputation»
Jeudi 30 avril 2009. L art de bien référencer son site Internet
Jeudi 30 avril 2009 L art de bien référencer son site Internet Quelques chiffres 1.2 milliard d internautes dans le monde. 343 millions d internautes en Europe. (InternetworldStats, November 2007) 250
Encyclopaedia Universalis Guide d utilisation
Encyclopaedia Universalis Guide d utilisation Ouverture d une session... 2 Écrans de recherche.. 2 Opérateurs logiques et booléens. 3 Affichage et consultation des résultats... 5 Impression.... 7 TABLE
Caruso33 : une association à votre service
Caruso33 : une association à votre service Le b-a ba sur le réseau Internet Comment vous trouver facilement sur Internet Pourquoi un portail des associations? Les modalités pour figurer sur le portail
C r é a t i o n D e S i t e s. P o l C R O V A T T O
C r é a t i o n D e S i t e s P o l C R O V A T T O 2 / 10 Avant-propos 3 Définition d'internet? 3 Fournisseur Accès Internet: FAI 4 Définition d'un site Internet 5 Site web ou site 5 Liens hypertextes
OSIRIS/ Valorisation des données PORTAIL BO MANUEL UTILISATEUR
OSIRIS/ Valorisation des données PORTAIL BO MANUEL UTILISATEUR HISTORIQUE DES VERSIONS Vers. Date Rédacteur Objet de la modification 1.00 Juillet 2007 GTBO_AGRI Création du document 1.01 Février 2009 SAMOA
Recherche bibliographique
Séminaire «Maîtrise de l information scientifique» Recherche bibliographique Dernière mise à jour : 07/01/2015 - Auteur : Frédérique Flamerie Recherche bibliographique : méthode & outils La recherche bibliographique
Introduction. M2206 Intégration web. Introduction. Introduction 20/01/2014
Introduction M2206 Intégration web http://www.atinternet.fr/ressources/ressources/etudespubliques/barometre-des-moteurs/ Référencement des sites web et moteurs de recherche Introduction Introduction http://www.go-gulf.com/blog/social-networking-user/
DES OUTILS DE RECHERCHE À VOTRE MESURE, LA SUITE JURIBISTRO MD DU CAIJ : COMMENT MIEUX EXPLOITER CES OUTILS? PLAN DE FORMATION
OBJECTIFS GÉNÉRAUX DES OUTILS DE RECHERCHE À VOTRE MESURE, LA SUITE JURIBISTRO MD DU CAIJ : COMMENT MIEUX EXPLOITER CES OUTILS? PLAN DE FORMATION Découvrir les principales fonctionnalités des outils de
Rokhaya BARRY Fondatrice de ROKBARRY CREATIONS & SERVICES @RokBarry [email protected]. Documents Propriétaire : RokBarry
Rokhaya BARRY Fondatrice de ROKBARRY CREATIONS & SERVICES @RokBarry [email protected] 1 RokBarry Creations & Services www.rokbarry.com Stratégie emarketing Gestion Webmarketing Optimisation pour les
Jeudi 10 juillet 2014 I Nanterre Rendez-vous de l UD 92 OT SImple Club Numérique OT d Seine Jeudi 10 juillet 2014 I Nanterre OT Simple : Point d étape Mise à disposition Aux OT SI d Ile-de-France Par le
Table des matières. 1 À propos de ce manuel...5 1.1 Icônes utilisées dans ce manuel... 5. 1.2 Public visé... 5. 1.3 Commentaires...
Manuel utilisateur Table des matières 1 À propos de ce manuel...5 1.1 Icônes utilisées dans ce manuel... 5 1.2 Public visé... 5 1.3 Commentaires... 5 2 Généralités sur les applications web... 7 3 Module
CRÉER, ROUTER ET GÉRER UNE NEWSLETTER, UN E-MAILING
CRÉER, ROUTER ET GÉRER UNE NEWSLETTER, UN E-MAILING Durée : 3J / 21H Formateur : Consultant expert en PAO et Web-marketing. Groupe de : 4 max Formation au web marketing Objectifs : Mettre en oeuvre des
TEXT MINING. 10.6.2003 1 von 7
TEXT MINING 10.6.2003 1 von 7 A LA RECHERCHE D'UNE AIGUILLE DANS UNE BOTTE DE FOIN Alors que le Data Mining recherche des modèles cachés dans de grandes quantités de données, le Text Mining se concentre
Audit de site web. Accessibilité
Accessibilité 1. Est- ce que le contenu est structurellement séparé des éléments de navigation? 2. Est- ce que le site est compatible avec tous les navigateurs? 3. Le site est- il compatible avec les normes
et de la feuille de styles.
Feuilles de style / mars 2007 Manuel d'utilisation du modèle enssib et de la feuille de styles. Writer Open Office Service des produits documentaires Contact : Richard Grenier 2e étage enssib Tél : 04
Evaluation et analyse de la fréquentation d un site
cterrier.com 15/06/09 1 / 5 Cours Informatique commerciale Auteur : C. Terrier ; mailto:[email protected] ; http://www.cterrier.com Utilisation : Reproduction libre pour des formateurs dans un cadre
Institut Supérieure Aux Etudes Technologiques De Nabeul. Département Informatique
Institut Supérieure Aux Etudes Technologiques De Nabeul Département Informatique Support de Programmation Java Préparé par Mlle Imene Sghaier 2006-2007 Chapitre 1 Introduction au langage de programmation
Architectures web/bases de données
Architectures web/bases de données I - Page web simple : HTML statique Le code HTML est le langage de base pour concevoir des pages destinées à être publiées sur le réseau Internet ou intranet. Ce n'est
Guide et conseils généraux pour optimiser le référencement d un site internet
Guide et conseils généraux pour optimiser le référencement d un site internet Novembre 2010 1 Introduction Le référencement de votre site internet vous permet d être présent dans les différents moteurs
Manuel d utilisation email NETexcom
Manuel d utilisation email NETexcom Table des matières Vos emails avec NETexcom... 3 Présentation... 3 GroupWare... 3 WebMail emails sur internet... 4 Se connecter au Webmail... 4 Menu principal... 5 La
