LA RECHERCHE DOCUMENTAIRE SUR INTERNET



Documents pareils
Formation à la recherche documentaire sur le web

Initiation à la recherche documentaire LA RECHERCHE SUR INTERNET

Ecole Préparatoire SNV Université d Oran Semestre /2015 Matière : Travaux d Initiative Personnelle Encadrés (TIPE) Prof. M. Z.

!" #$%&'(&)'*'+,--./&0'1&23,+2.)$4$%52'&%'6.%&2'

La recherche d'information sur Internet

Répondre à un courrier - Transférer un courrier 20

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques

METHODOLOGIE DOCUMENTAIRE

Table des matières. Préface...5. Introduction...9

Recherche bibliographique

Les nouveaux sites documentaires de l IRD

Memento de la recherche documentaire en santé

DES OUTILS DE RECHERCHE À VOTRE MESURE, LA SUITE JURIBISTRO MD DU CAIJ : COMMENT MIEUX EXPLOITER CES OUTILS? PLAN DE FORMATION

La recherche documentaire et la recherche d informations professionnelles. BU Sciences BIU Montpellier PPE 2012

LES MOTEURS DE RECHERCHE SUR INTERNET

LEXIQUE DES TERMES DOCUMENTAIRES LES PLUS COURANTS

Panorama des contenus

La recherche documentaire en français

Manuel d utilisation

Mes citations. Guide Google Scholar

Guide de l utilisateur. Faites connaissance avec la nouvelle plateforme interactive de

Les documents primaires / Les documents secondaires

Recherche. Instructions d utilisation de ce Tutoriel. Suite d une action. Explication d un exemple, information supplémentaire. Avertissement. Astuce.

ORGANISER LA RECHERCHE D'INFORMATIONS À L'ÈRE DU NUMÉRIQUE

La documentation en CIO

Premiers pas sur e-lyco

LISTES DE DISTRIBUTION GÉRÉES PAR SYMPA DOCUMENT EXPLICATIF DE L'INTERFACE WEB À L'INTENTION DES ABONNÉS

Édu-groupe - Version 4.3

Administration du site

Zotero est une extension du navigateur Firefox. Il est possible de télécharger Firefox gratuitement sur le site:

La recherche d information

Solutions en ligne Guide de l utilisateur

ZOTERO Un outil gratuit de gestion de bibliographies

Recherche et veille documentaire scientifique

Publication dans le Back Office

MANUEL DE PROCÉDURE POUR LA MISE À JOUR DU SITE DE FIDAFRIQUE. Documentation utilisateur Octobre 2005

MODE D EMPLOI WORDPRESS

Référencement Vendredi 4 Juillet Ile Degaby

GUIDE D'UTILISATION DE L'ANNÉE PHILOLOGIQUE SUR INTERNET

demander pourquoi mon site n'apparaît pas sur google ou pourquoi mon site n'est pas référencé par les moteurs de recherche?

Gestion de références bibliographiques

Savoir mener une recherche documentaire et dresser une bibliographie

Repérer et utiliser différents types de documents

BIEN NAVIGUER SUR INTERNET. 2. Les moteurs de recherche. Ligue Libérale des Pensionnés asbl

Table des matières ENVIRONNEMENT

Guide utilisateur i-milo >> Décisionnel

Constituer et gérer une bibliographie avec le logiciel zotero. Support de cours et liens utiles

Un outil open source de gestion de bibliographies

Recherche d'information dans Internet Introduction

Documentation RBS Change E-Commerce Core

Optimiser le référencement naturel de son site web

LA RECHERCHE DOCUMENTAIRE

Qu'est-ce qu'un moteur de recherche. Moteur de recherche sur Internet

Formation Administrateur de Données Localisées (Prodige V3.2) Recherche et consultation des métadonnées

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

Concevoir sa stratégie de recherche d information

Méthodologie de la recherche documentaire : principes clés. Service Formation des Publics

Climat Scolaire - Manuel utilisateur - Chapitre 2 : «Créer, Editer et suivi d un texte»

L. Granjon, E. Le Goff, A. Millereux, L. Saligny MSH Dijon

INITIATION AUX OUTILS DE RECHERCHE DOCUMENTAIRE AUTOMNE 2012

CAHIER DES CHARGES DU SITE WEB POUR LA RÉALISATION. Nom du commanditaire : Dossier suivi par : Date de réalisation : Date de mise à jour :

Guide et conseils généraux pour optimiser le référencement d un site internet

10 points clés pour bien démarrer votre projet web

OSIRIS/ Valorisation des données PORTAIL BO MANUEL UTILISATEUR

Je sais utiliser. Logiciel gratuit de gestion des photos. Étude en 5 parties

Créer et partager des fichiers

Initiation à la recherche documentaire

Manuel d utilisation de Form@Greta

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

GUIDE MEMBRE ESPACE COLLABORATIF. Février 2012

Domaine D4 KARINE SILINI UNIVERSITÉ DU LITTORAL CÔTE D'OPALE --LICENCE CREATIVE COMMONS : PATERNITÉ - PAS D'UTILISATION COMMERCIALE - PARTAGE

Dans cette Unité, nous allons examiner

Projet en nouvelles technologies de l information et de la communication

claroline classroom online

Espace FOAD IRTS Guide de l étudiant Septembre 2009

Description de Produit Logiciel. AMI News Monitor v2.0. SPD-AMINM-10 v1.0

Mai Médiathèque «Les Trésors de Tolente»

Création - Impression - Internet

CONTACT EXPRESS 2011 ASPIRATEUR D S

ATELIER : Ressources juridiques. Formations doctorales BU

Manuel utilisateur. des. listes de diffusion. Sympa. l'université Lille 3

Documentation Analyse SEM

3 logiciels «gratuits» pour gérer sa bibliographie

Le Web et Internet. A. Historique : B. Définitions : reliés entre eux via un système d interconnexion.

Pourquoi une stratégie de sites dédiés? Laurent-Pierre GILLIARD AEC 14/06/2007 Vincent MOREAU SYSTONIC 09/06/2006

PRISE EN MAIN RAPIDE

Manuel d utilisation du site web de l ONRN

Zotero : petit guide d installation et d utilisation

Animation numérique. de territoire. Créer son site Internet avec un outil gratuit. Mardi 4 novembre Cédric ARNAULT OT Lourdes

Une ergonomie intuitive

Le logiciel de création de site internet IZISPOT est un outil très puissant et qui est assez simple après quelques temps d utilisation.

1. Ouvrir Internet Explorer Faire défiler une page Naviguer dans un site Internet Changer d adresse Internet (URL) 2

Cliquez pour du modifier titre le style

Numérique. Mon Université.

Bibliothèque Esparron en livres.

Les Enjeux du Référencement de Sites Internet. Un livre blanc réalisé par Benchmark Group pour Netbooster

CCI DE SAÔNE-ET-LOIRE - ATELIER ENP 18 MAI La création de sites internet

Transcription:

LA RECHERCHE DOCUMENTAIRE SUR INTERNET Objectifs du TD : Comprendre le fonctionnement d Internet Connaître les outils de recherche sur Internet : annuaires, signets, portails, moteurs et métamoteurs de recherche Evaluer et sélectionner des informations valides et pertinentes sur le web. 1

INTRODUCTION Qu est-ce que le Web? Une des applications d internet (entre autres : courrier électronique, messagerie instantanée ) Web = ensemble de pages et de sites Inventé plusieurs années après internet, mais c est le Web qui a rendu le grand public attentif à internet Par extension, dans ce cours Internet = Web. Les problèmes de la recherche de documents sur le web 1. Le web est énorme La difficulté provient en partie de la taille du Web et du nombre considérable de documents qui s y trouvent hébergés, répartis sur de nombreux sites. Il est impossible de connaître le nombre exact de ces sites et de ces documents, qui augmentent de façon exponentielle. Voici quelques chiffres valables en sept. 2005. : Nombre de sites Web : 70 millions. Nombre de "pages" Web : 20 milliards. L abondance des ressources sur Internet ne facilite pas la recherche documentaire : il est facile de s y perdre, de ne pas trouver ce que l on cherche ou de trouver des informations erronées. 2. Le Web n est pas une bibliothèque! Internet n est pas un ensemble organisé et structuré comme une bibliothèque Les moteurs de recherche ne sont pas des catalogues Les sites n ont pas tous une caution intellectuelle ou scientifique 3. Le Web est invisible Une grande partie des documents Web existants ne sont pas accessibles par l intermédiaire des moteurs de recherche. Tous ces documents font partie de ce qu on appelle le Web invisible (ou Web profond). Une étude a évalué que le Web profond pouvait contenir 500 fois plus de ressources que le Web indexé par les moteurs de recherche. Le Web invisible : le contenu de cette importante source d informations qu est le Web est donc d un volume considérable, mais mal organisé et difficile d accès. Heureusement nous disposons d outils spécialisés pour y effectuer nos recherches. 2

I. Les outils de recherche sur Internet Trois grands outils permettent d effectuer des recherches sur Internet : les annuaires, les moteurs de recherche et les métamoteurs. 1. Annuaires de recherche = Répertoires de sites = Signets Historiquement, les annuaires sont les plus anciens des outils de recherche. Cet outil recense des sites web. Il est constitué de rubriques (ou catégories), elles-mêmes subdivisées en sous-rubriques. A l intérieur de ces sous-rubriques, nous trouvons des listes de sites web : Catégorie Sous-rubrique Sous-sous rubrique Listes de sites web On circule dans ces catégories et rubriques en développant des ARBORESCENCES Un annuaire est libre de prendre ou de refuser un site. Une condition d efficacité de l annuaire est sa taille, c est à dire le nombre de sites référencés dans son index. L annuaire peut s utiliser de deux façons : soit l internaute consulte les catégories : il navigue alors de rubriques en sousrubriques jusqu aux sites soit il effectue sa recherche grâce à des mots clefs. Avantage : Cet outil de recherche permet une navigation simple et l internaute est guidé par un fil conducteur. De plus, les sites de l annuaire ont été sélectionnés. Ils fournissent des réponses de qualité. Inconvénient : Le gros inconvénient de l annuaire, c est qu il est construit manuellement. De ce fait, sa taille est réduite, il est difficile de le tenir à jour. Enfin, les sujets très spécifiques et très pointus sont difficiles à localiser : ne pas être trop précis dans les termes de recherche car ce sont des catégories qui sont indexées, pas des sites. Contrairement à un moteur de recherche qui cherche sur le Web tous les sites qu il pourra trouver sur un sujet, un répertoire de sites contient une liste de sites présélectionnés et classés par catégorie ou par thème. Ces répertoires sont en général mis à jour par des équipes qui passent en revue les sites qui demandent leur inscription, les évaluent et les classent. 3

Outil de recherche qui recense des sites web Constitué de rubriques sub-divisées en catégories Avantages : sélection humaine de sites pertinents Inconvénients : nombre restreint de sites A. L annuaire généraliste Dmoz (http://dmoz.org) Ce répertoire est géré par une vaste communauté d éditeurs bénévoles. Il répertorie 5.017.206 (dont 247.105 en français) adresses Internet classées dans plus de 1 million de catégories Sélectionner la version en français Exercices découverte sur Dmoz 1. Choisissez la version «française» de Dmoz. Dans la catégorie Sciences, développer les arborescences pour retrouver la sous-catégorie «géographie». Combien de sites sont signalés? Combien en démographie? Repérez le site population.data pour trouver des statistiques sur votre sujet d étude. 4

2. Utilisez la recherche par mots pour repérer des sites sur votre sujet de recherche. Vous noterez les différences de résultats lorsque les termes sont entre guillemets (expression exacte), ou lorsque vous limitez la recherche à «Uniquement dans World/français» B. Les signets spécialisés de la BnF (http://signets.bnf.fr) La Bibliothèque nationale de France propose sur son site un répertoire de 7000 ressources mises à jour et contrôlées régulièrement : les sites recommandés sont peu nombreux mais d une très grande qualité. La navigation s effectue également dans l arborescence thématique. Il est également possible d effectuer une recherche de sites par mots-clefs. Pour une recherche par mots 5

Exercices découverte sur les signets de la BnF 3. Repérez les ressources sur les pays et les aires géoculturelles. Quels sont leur chemin d accès? Pour une étude sur les pays d Amérique latine, quelles sont les ressources en français que vous pourriez utiliser? Repérez la bibliothèque Pierre Monbeig de l Institut des Hautes Etudes de l Amérique Latine et sa collection des bases de données sur Internet. Elargissez et approfondissez vos recherches aux pays que vous étudiez actuellement. 4. Trouvez des signets sur la «population» grâce au classement alphabétique : quel mot clé est utilisé? Quels sont les signets en français que vous trouvez? 5. Classement alphabétique : trouvez des sites en français sur l Urbanisme. 6

Que signifie «Urbamet»? De quand date la fiche résumé de ce site? Sur Urbamet, retrouvez des documents en texte intégral sur les métropoles mondiales C. Les signets de l Université (http://www.signets-universites.fr) Ces signets sont accessibles également via le portail de l Université. C est une sélection d adresses Internet de référence réalisée par le Centre de Ressources et d Information sur les Multimédias pour l Enseignement supérieur (CERIMES). Ce classement suit la logique Dewey. Exercices Découverte sur les signets du Cerimes 6. Grâce à l arborescence (sur la page d accueil), trouvez les sites recommandés en géographie. Combien y en a t-il? Relevez des sites plus spécifiquement orientés vers la cartographie 7. Trouvez des signets sur l urbanisme grâce à l onglet «rechercher». 7

Repérez en particulier le contenu du portail Crévilles D. Les annuaires de la Bibliothèque de la Sorbonne (Paris 1): CADIST en géographie : http://www.univ-paris1.fr/index.php?id=227707 La bibliothèque de géographie de Paris I recense également une série de ressources spécialisées en libre accès : Ressources en accès libre 8

Exercices Découverte sur les signets de Paris I 8. Retrouvez un site spécialisé sur les statistiques dans les pays européens. Grâce à ce site, retrouvez un tableau comparatif des espérances de vie à la naissance pour chacun des pays européens. Dans quel pays l espérance de vie des hommes est-elle la plus grande en 2010? et la plus faible? 9. Repérez le site de la Bibliographie Géographie Internationale (BGI). Avec le formulaire de recherche avancée, repérez des références bibliographiques pour votre sujet de recherche. E. Les Archives ouvertes 9

Définition : «( ) un réservoir où sont déposées des données issues de la recherche scientifique et de l enseignement et dont l accès se veut ouvert, c est-à-dire sans barrière.» (source : http://openaccess.inist.fr/spip.php?mot12) Quelques adresses de sites : - Open doar : http://www.opendoar.org/ (répertoire des sites par sujet) - DOAJ : http://www.doaj.org/ (répertoire des journaux et revues en libre accès) - ORBI : http://orbi.ulg.ac.be/simple-search?query=bolivie (Université de Lièges) - ULB : http://difusion.academiewb.be/ (université de Bruxelles) - DIAL : http://dial.academielouvain.be/ (université de Louvain) - SPIRE : http://spire.sciences-po.fr/ (Science-Po Paris) - HAL-SHS : http://halshs.archives-ouvertes.fr/ (archives ouvertes en sciences de l homme et de la société) Exercices Découverte des Archives Ouvertes 10. Retrouvez des adresses de sites français en géographie grâce au répertoire Open Doar 10

11. Sur le site HAL-SHS, faites une recherche par discipline. Dans Démographie, repérez les textes intégraux que vous pourriez utiliser pour votre devoir. Poursuivez vos recherches en fonction de votre sujet d étude 2. Les moteurs de recherche Les moteurs de recherche sont des robots (également appelés spiders ou crawlers) qui indexent automatiquement des millions de pages web, sans intervention humaine (ce qui les distingue des annuaires). Contrairement aux annuaires, les moteurs permettent de trouver sur le web une quantité considérable de sites Internet, mais dont la qualité et la fiabilité n est jamais contrôlée ni vérifiée. La recherche s effectue uniquement par mots-clés (pas d arborescence). Celle-ci peut être simple ou avancée. Toutefois, la couverture du web par les moteurs de recherche reste parcellaire : seulement 20% du web est indexé par les robots. Toute la partie du Web qui n est pas indexée par les robots s appelle le WEB INVISIBLE (par exemple, les cours mis en ligne sur le portail e-bulco ne sont pas indexés par les moteurs de recherche). Chaque moteur de recherche a son propre robot et fonctionne donc à sa manière : c est pourquoi les résultats peuvent être différents pour une même requête selon le moteur utilisé. A. Les moteurs de recherche généralistes : Google 11

Google est le moteur de recherche généraliste le plus connu et le plus performant en terme de pages indexées. Nous avons la possibilité d effectuer une recherche simple ou avancée. Le critère de classement des résultats se fait par rapport à la popularité du site : Page-Rank. Construit sur le principe du «Page Rank» = l indice de popularité d une page Page Rank Page Rank : calcule le nombre de fois qu un site X est cité par d autres sites A, B, C, D Mais il prend aussi en compte la popularité des sites A, B, C, D: être cité par des sites qui sont eux mêmes populaires augmente la popularité de X Inconvénient : des sites récents n apparaîtront pas tout de suite (pas le temps d être cités) Astuce : «J ai de la chance» ouvre tout de suite le premier site Source : http://eduscol.education.fr/dossier/competences/rechercher/methodologie/outils Utiliser les filtres de Google : Quitte à utiliser Google, autant bien le faire! Liste des filtres : Ces filtres apparaissent à gauche du formulaire de recherche, une fois la requête lancée. Ils permettent de filtrer les résultats selon un certain nombre de critères. Les fonctionnalités proposées permettent ainsi d'affiner la recherche. Lancez une recherche sur Google : Sur la page de résultats, une liste à gauche permet de trier les résultats par : type de documents : Images - Maps - Vidéos - Blogs, par nature des informations : Actualités - Livres - Shopping. En cliquant sur Plus, d'autres tris apparaissent : Adresses - Discussions (questions/réponses, forum) - Applications. par langue : Rechercher les pages en Français par date : Moins d'une heure - Moins de 24 heures - Moins d'une semaine - Moins d'un mois - Moins d'un an - Période personnalisée. par type de discussions : Forums - Questions/Réponses Utiliser les «bons» mots clés : Comment les choisir? 12

Au préalable : Une prise de notes s'avère très utile > ne pas naviguer au hasard > clarifier les concepts > trouver les termes les plus pertinents > définir sa stratégie, éventuellement la modifier Des mots suffisamment précis sur les moteurs - éviter les termes trop généraux qui risquent de générer trop de "bruit" dans les réponses, - choisir de préférence des termes spécifiques quitte à élargir par la suite votre requête. Des mots suffisamment larges sur les annuaires - pour trouver facilement les catégories et pour identifier les sites fédérateurs traitant du sujet, quitte à préciser ensuite avec des termes plus précis. La langue : éviter les mots d'une langue autre que celle du moteur. Le type de mots - choisir de préférence des noms, - utiliser les autres mots (verbes, adjectifs, adverbes, pronoms) plutôt dans les expressions entre guillemets. Le nombre de mots - plus il y a de mots, plus la question se restreint : un seul mot peut suffire! - essayer de ne pas dépasser 3 mots au départ. L'ordre des mots : joue parfois un rôle sur certains moteurs : - quels mots-clés sont prioritaires? : commencer par les mots les plus importants (voir aussi la syntaxe propre à chaque moteur). Les bons opérateurs : ET / OU / SAUF Il ne suffit pas de trouver les bons mots-clés, encore faut-il les utiliser avec les bons opérateurs, et réajuster sa requête avec les bons opérateurs. Une saisie correcte : Faut il saisir la requête - en minuscules ou en majuscules? - avec des lettres accentuées ou non accentuées? - au singulier ou au pluriel? (utiliser la troncature) Aide en ligne des outils : Se référer à l'aide en ligne de l'outil utilisé. Réajuster sa requête en fonction du "bruit" et du "silence" Trop de réponses -> restreindre la question - affiner avec des termes plus pointus, - exclure les mots générateurs de bruit (avec "SAUF" : souvent très efficace), - préciser éventuellement le pays et/ou la langue Pas assez de réponses -> élargir la question élargir avec des termes plus larges - utiliser des synonymes (avec OU) - voire des antonymes (avec OU) B. Les moteurs de recherche spécialisés 13

Les avatars de Google : Google maps/ earth : cartes et localisations satellites Google images / video : recherches d images et de documents audiovisuels présents dans les pages qui contiennent le mot recherché Google books (Google Livres) : ouvrages numérisés Numérisation d un grand nombre d ouvrages de plusieurs grandes bibliothèques (Harvard, Oxford, BM Lyon) Ouvrages dans le domaine public en entier Ouvrages encore sous droits partiellement disponibles (sommaire, introduction) Options de recherche avancée Google scholar : moteur de recherche spécialisé sur les documents scientifiques et académiques. Il existe une grande variété de documents : articles, livres, thèses, rapports Le domaine des sciences techniques et médicales est mieux couvert que celui des sciences sociales et humaines. Outil de recherche de travaux universitaires en ligne : thèses, articles, rapports de recherche Recherche dans le texte intégral, même si le texte intégral n est pas accessible à tout le monde Indique entre crochets le type de résultat : citation, livre Cet article de1859 est cité 4 fois [Livre] : Il s agit de la référence d un livre Exercice découverte Google Scholar 14

http://scholar.google.fr/ 12. Recherchez des documents sur Google Scholar en lien avec votre sujet de recherche. Repérez comment sont signalés les différents types de document, leur nombre de citations. 15

3. Les métamoteurs de recherche Les métamoteurs sont des outils qui interrogent plusieurs moteurs de recherche simultanément. Ce sont en quelque sorte les «moteurs de moteurs». Ils n ont pas d index propre mais utilisent les index des moteurs de recherche qu ils interrogent : lors de l affichage des résultats ils éliminent les doublons. Avantages La recherche est plus rapide car elle interroge simultanément plusieurs moteurs de recherche à la fois. La recherche est plus exhaustive car une plus grande couverture du web est couverte. Inconvénients Ils filtrent moins qu un seul moteur de recherche généraliste Les recherches sont moins pointues. Exercices Découvertes sur les métamoteurs 13. Connectez-vous sur http://fr.findloo.com/fr/. Recherchez des documents sur Yves Lacoste. Comment sont présentés les résultats? Quels sont les moteurs de recherche utilisés? 14. Toujours sur ce métamoteur, recherchez les définitions de la «rurbanisation». 15. Connectez-vous à http://www.ixquick.com/fra/. Recherchez des documents sur Yves Lacoste. Quels sont les moteurs de recherche utilisés? 16

Annuaires, moteurs, métamoteurs Distinguer les annuaires (portails) et les moteurs Beaucoup d internautes ont tendance à utiliser de la même manière les annuaires (Ex. : Open Directory) et les moteurs de recherche (comme Google). Ces deux types d outils sont pourtant de nature différente. ANNUAIRES Indexation de sites - par des documentalistes Recherche - sur des sites - et des catégories Avantages - choix des informations - classement raisonné par catégories et sous-catégories Inconvénients - moins d'exhaustivité, - mise à jour moins rapide A retenir L exploration des catégories s avère souvent plus fructueuse que celle des sites. Indexation de mots - par des robots Recherche - en texte intégral - sur des pages web MOTEURS Avantages - plus d'exhaustivité, - mise à jour plus rapide Inconvénient - capture de pages web sans classement raisonné A retenir La recherche par mots clés donne de meilleurs résultats sur les moteurs Distinguer les moteurs et les métamoteurs Les métamoteurs utilisent simultanément plusieurs moteurs et annuaires. Répétition de la requête sur chaque moteur MOTEURS Avantage une syntaxe spécifique (résultats plus précis) Inconvénient temps de réponse plus long METAMOTEURS 1 seule requête simultanée sur plusieurs moteurs et annuaires Avantage gain de temps Inconvénient pas de syntaxe commune (résultats moins précis) Source : http://eduscol.education.fr/dossier/competences/rechercher/methodologie/outils Quel outil de recherche privilégier pour ses requêtes? Vous pouvez choisir l annuaire pour débuter une recherche ou pour vous faire une idée des sites existants dans un domaine que vous découvrez. De plus, l annuaire permet de repérer des ressources du web invisible. Vous privilégierez le moteur de recherche pour la taille de son index et la rapidité de mise à jour. Le moteur de recherche va vous servir a effectuer une recherche pointue à partir de mots clefs précis ou d élargir la portée de votre requête à une grande partie du web. Mieux vaut dans ce cas privilégier la recherche avancée. 17

II. La sélection d informations pertinentes et valides : les critères d évaluation Toute information doit répondre à 2 exigences : Pertinence : une information pertinente est celle qui répond à la question que vous vous posez. Validité : une information validée est une information exacte. Internet est un espace «ouvert». On y trouve une multitude d informations qui ne sont pas contrôlées ni vérifiées. N importe qui peut publier un document. En effet, contrairement à un espace «fermé» (la bibliothèque par exemple), il n y a aucune sélection a priori des documents qui s y trouvent. Bouleversements du Web Le Web permet de s auto-publier L étape de validation de l écrit par un éditeur n est plus nécessaire L anonymat couvre parfois les auteurs Généralisation du copié-collé et des références dont on n évoque pas les sources Il est difficile d identifier un document et sa source. Les compétences de l éditeur et celle de l auteur sont mélangées car l auteur est son propre éditeur. Les genres documentaires sont également mélangés, ce qui peut mener à des confusions. Ainsi, la surabondance d informations (des dizaines de milliards de pages web) conduit à la désinformation (médiocrité de l information). Alexandre Serres parle d «info-pollution». Comment lutter contre cette désinformation? Par des moyens techniques (anti-spams), juridiques (responsabilité des hébergeurs) et humains (il faut réfléchir, faire appel à sa culture générale et à son esprit critique pour évaluer l information que l on trouve). Sur un sujet qu on ne connaît pas, il faut appliquer des critères d évaluation. Une information validée est une information identifiée, fiable, précise, exacte et exhaustive, d actualité, structurée. 18

EVALUER UN SITE INTERNET : 6 critères de validité Critères d évaluation Questions Astuces 1. Identifier la nature du Est-ce une page web ou un site entier? Est-ce un article de document périodique, un compte-rendu, un brevet, une thèse, un blog, 2. Identifier la date du document 3. Identifier la fonction du document 4. Identifier la nature de l organisme «éditeur» 5. Identifier l auteur de la page Web une information circulante (forum)? Quelle est sa date de création, sa date de mise à jour? La période correspond-elle à vos besoins? Les liens sont-ils toujours à jour? A qui le document s adresse-t-il et à quoi sert-il? Est-ce un document scientifique, politique, de vulgarisation, d expression, commercial, universitaire, personnel? Le site est-il personnel ou commercial? Quel est le public visé? Vous devez décrypter l adresse URL qui se décompose en trois éléments : - nom du protocole (http://, news:// ) - nom de domaine (c est l adresse du serveur hébergeant la ressource) - chemin d accès à la ressource (il s agit du nom du fichier et des sous-fichiers, et son emplacement). La structure de base d'une URL est celle-ci : protocole://nom-du-serveur.nom-dudomaine/répertoire/nom-du-fichier Les extensions de domaine fournissent des informations très précises sur le document. Il existe des extensions thématiques et des extensions géographiques. Quelques exemples d extensions thématiques -.gouv :site du gouvernement -.com : site commercial -.org : pour les organisations et les associations -.net : pour les réseaux -.info : site d information -.ac,.edu : site d éducation Quelques exemples d extensions géographiques : -.fr : France -.be : Belgique -.ca : Canada Attention! Les noms de domaine ou des serveurs ne sont pas toujours des indications directes sur la localisation et la source de l'information : On peut donner n'importe quel nom à son serveur; et il est possible d'enregistrer des noms de domaine qui donnent de fausses impressions Qu a écrit l auteur du document? Est-il un spécialiste du domaine? Quel est son point de vue, ses motivations? L'identification de l'auteur d'un site est souvent essentielle, pour pouvoir identifier clairement la nature du site, et évaluer la fiabilité de l'information. Cette opération n'est pas toujours aisée. 1. Bien explorer le site : pied de page de la page d'accueil, pages dédiées ("A propos", "Copyright"...), adresse électronique... 2. Vérifier l'adresse d'un lien pointant vers une adresse e-mail, en passant le curseur de la souris sur le lien (certains liens pointent en fait vers des pages HTML) 3. Remonter ou descendre l'arborescence pour trouver d'autres informations sur l'auteur 4. Consulter les métadonnées, qui contiennent des éléments de description du document, notamment parfois la mention de 19

6. Identifier la notoriété du site Ce site est-il référencé par d autres sites? Par des sites de qualité? responsabilité, le nom de l'auteur, voire son adresse électronique. Pour afficher les métadonnées : menu "Afficher la source" (par le bouton droit de la souris) 5. Utiliser les outils de recherche généralistes et spécialisés. Après avoir trouvé le nom de l'auteur ou du propriétaire du site, faire une recherche sur les moteurs généralistes (Google...) ou les moteurs de personnes (123 People), pour trouver des informations sur cette personne. Utiliser Google recherche avancée, la fonction «Liens» pour voir quels sites pointent la page étudiée. Trouver la page d'accueil d'un site web La page d'accueil est la première page d'un site web - l'équivalent de la couverture d'un livre - et comme telle, fournit beaucoup d'informations comme le titre, le nom de l'auteur et une présentation sommaire de l'objectif du site. Souvent, les hyperliens vous entraînent au beau milieu d'un site par opposition à la page d'accueil. Il est ainsi difficile de savoir où l'on est. C'est une bonne habitude de regarder la page d'accueil d'un site avant de l'utiliser, tout simplement pour vérifier ce que vous regardez. Les URL vous aident sur ce point - la racine d'une URL vous emmènera souvent sur la page d'accueil. Ca ne marchera pas toujours - mais essayez d'effacer le nom du fichier et celui des répertoires à droite de l'adresse, puis appuyez sur la touche Entrée (assurez-vous que la nouvelle URL se termine par une barre oblique / ou html ou htm). Ceci vous emmènera vraisemblablement à la page d'accueil. Ceci est surtout utile lorsque vous regardez les réponses données par un moteur de recherche; celles-ci vous entraînent souvent loin à l'intérieur des sites plutôt que sur les pages d'accueil. Le tilde ~ Dans certaines URL vous verrez le tilde qui s'écrit ainsi: ~ (Par exemple: http://www.ilrt.bris.ac.uk/~cmpac/) La plupart des serveurs web utilisent le ~ pour indiquer qu'il s'agit de répertoires personnels. Ceci ne signifie pas, cependant, que l'information soit de mauvaise qualité. Par exemple la page suivante contient un tilde : http://www.ilrt.bris.ac.uk/~cmpac/ : Cette page est hébergée sur le serveur de l'université de Bristol, mais n'est PAS une page officielle de l'université - c'est la page personnelle d'un membre du personnel. 20

EXERCICES EVALUTION INTERNET Appliquez les critères d évaluation pour chacun des sites suivants. Cherchez à repérer en particulier : l auteur, la date, la fiabilité et la pertinence des documents 13. Pour un exposé sur les volcans, pouvez-vous utiliser cette référence? http://www2.brgm.fr/volcan/mus%c3%a9e%20volcano.htm 14. Ce document vous semble t il utilisable pour une étude sur le climat? http://la.climatologie.free.fr/turbulance-atm/turbatmosphere.htm 15. Ce site http://www.ecologie-et-progres.com/ est-il utilisable pour un exposé de niveau universitaire? 16. Quelle est la validité de ce site? http://www.scouts-europe.org/grandir/eclaireurs/1-aventures/scoutismenautique/legislation-cours-deau.shtml#mixte 21

EVALUER UN SITE INTERNET Critères de pertinence Source : http://www.educnet.education.fr/dossier/rechercher/methodologie/evaluation/information Quelques principes Exercer son sens critique est utile en toute occasion Se poser des questions préalables aide à établir les critères d'évaluation Savoir déchiffrer les noms de domaine renseigne déjà sur la nature des sites et le pays d'origine. Des questions au minimum pour évaluer : Le site est-il fiable? L'information est-elle intéressante? Est-ce bien ce que je cherchais? QUI? QUOI? QUAND? auteur, organisme qualité de l'information, du document, du site origine de l'information, limites géographiques Qui est l'auteur du document? L'auteur est-il identifié? Peut-on le contacter? Est-ce un spécialiste du domaine? S'exprime-t-il au nom d'une institution? A titre personnel? Quelle est la nature du site? S'agit-il s'un site institutionnel? d'un site associatif? d'un site commercial? Sa compétence sur le sujet et/ou sa fiabilité sont-elles reconnues? Pointe-il vers des sites fiables? Les sites fiables pointent-ils vers lui? Quelle est la pertinence des informations? Est-ce bien le type d'informations dont j'ai besoin? Le niveau des informations est-il adapté? Est-il suffisamment simple ou au contraire suffisamment approfondi? Quel est l'intérêt du document? Le document est-il vraiment intéressant? Qu'apporte-t-il de nouveau? De quelle période s'agit-il? La période traitée correspond-elle à mes besoins? Quelle est la date du document? La date du document est-elle indiquée? Le document nécessite-t-il une actualisation? Si oui, quelle est la date de mise à jour? OÙ? période traitée, date du document D'où provient l'information? S'agit-il d'un site français? S'agit-il d'un site francophone? européen? autre? Quelles sont les limites géographiques de l'information? L'information concerne-t-elle un pays particulier? Cela me convient-il? L'information vautelle ailleurs? POURQUOI? objectif(s) du document, du site Quel sont les objectifs? Dans quel but le document a-t-il été réalisé? Quel est le public visé? Quels sont les objectifs du site? Quel est le public visé? COMMENT? structure du document, navigation dans le site Comment se présente le document? L'information est-elle rédigée clairement? Le document est-il bien structuré? Les sources sont-elles bien indiquées? Comment accède-t-on à l'information? L'information est-elle gratuite ou payante? La navigation du site est-elle aisée? Les pages sont-elles rapides à charger? 22