Atelier recherche d information 1
Le principe d un annuaire Un annuaire est un outil de recherche qui recense des sites Chaque site est inscrit dans une ou plusieurs catégorie(s) ou rubriques. Les annuaires permettent : d obtenir un aperçu général pour une requête large Sont utiles pour commencer une recherche sur un thème donné et identifier des sites ressources (liste de favoris) les plus connus sont www.yahoo.fr 140 000 fiches (partie française) www.dmoz.fr environ 350 000 catégories (internautes volontaires) Doc : 2
http://fr.search.yahoo.com Doc : 3
Yahoo.fr Doc : 4
yahoo.fr Doc : 5
Annuaire : dmoz Doc : 6
Annuaire : dmoz Doc : 7
Annuaire : dmoz Doc : 8
dmoz Doc : 9
Le principe d un moteur de recherche Le robot collecte le contenu des pages et constitue une base de données Ces pages sont stockées dans un index qui contient tous les mots significatifs Interrogation de l index : Lors d une requête par mot clé, le moteur va en rechercher les occurrences dans son index Une fois identifiées les pages contenant le mot clé demandé, le moteur classe les pages par ordre de pertinence, selon un ordre établi par algorithme. Le moteur effectue ses recherches sur des pages Web, alors que l annuaire vous proposera des sites Web Avantages et inconvénients Permet de gérer des recherches complexes (par rapport à un annuaire) Beaucoup d informations Doc : 10
Des moteurs de recherche Google www.exalead.fr Doc : 11
Exalead.fr Doc : 12
Exalead : recherche avancée Doc : 13
Un moteur de recherche : Google Quelques chiffres il attire 80% des internautes français 8 milliards (janvier 2005) de pages indexées 880 millions d images, 845 millions de messages (forums de discussion) des blogs 4000 sources d information pour les actualités Sur les sites d e-tourisme 30% du CA vient des moteurs de recherche Ses principaux atouts : Pertinence des résultats : Qui s appuie sur la notion d indice de popularité des pages (IPP) «Page Rank» Rapidité : le moteur n indexe pas l intégral de toutes les pages, pour certaines seul l URL est prise en compte Doc : 14
Classement des moteurs de recherche Doc : 15
Répertoire des moteurs Les répertoires de moteurs Search Engine Colossus http://www.searchenginecolossus.com liste des outils de recherche par pays Doc : 16
Le principe d un méta moteur Outil qui, pour une même requête, interroge plusieurs moteurs de façon simultanée Ne sélectionnent que les 10 premiers sites pour chaque moteur (pas d exhaustivité) Utiles pour des recherches simples (pas d opérateurs booléens) et très précises, sur des mots clés rares (personnes, marques, terme technique ) Doc : 17
Ariane6 : choix des moteurs de recherche Doc : 18
Ithaki.net : choix dans la langue et le pays Doc : 19
turboscout Doc : 20
Turboscout : automatisation de la requête Doc : 21
Clusty : résultats classés par thème Techno de clustering : analyse des résultats classés par thème, affinage intéressant Doc : 22
scirus et infomine : des sources scientifiques Des ressources académiques et scientifiques Doc : 23
surfwax : un résumé du contenu Résumé de la page Doc : 24
Kartoo : une représentation graphique des résultats Sites reliés entre eux par des concepts Doc : 25
Connaître le web invisible : des documents mal ou non indexées par les moteurs de recherche Son volume Environ 350 000 bases de données disponibles représentant 550 milliards de pages, 500 fois la surface du web visible Une partie du web est non accessible pour plusieurs raisons: Le web involontairement invisible Les bases de données sont trop volumineuses pour être entièrement indexées ex: PubMED et beaucoup de bases de données professionnelles Les pages dynamiques : réponses à des requêtes (il n existe pas d URL) Le web volontairement invisible Les pages sont protégées par l auteur (balise meta stop le robot du moteur) les pages accessibles après abonnement Ce web n est pas invisible mais difficilement accessible : on parle de web profond Doc : 26
Typologie du web invisible Les portails sectoriels: sites de référence d un secteur ou d un domaine ex : Plasticway pour la plasturgie Les bases de données spécialisées Chimie, médicales, brevets, infos sociétés Littérature grise : rapports, thèses, papiers de recherche et publication La qualité du web profond est estimée supérieure au web visible La majeure partie du web invisible est constitué d informations validées par des experts ou des professionnels Doc : 27
Le portail Le portail regroupe l information et les ressources relatives à un secteur d activités ou à une profession. Il est construit autour d un annuaire thématique avec des services annexes : comparatifs de produits, annuaires de fournisseurs, articles de presse spécialisée, forum de discussion Le portail horizontal concerne une activité transversale (le droit, marketing). Le portail vertical (ou vortail, vortal) cible une communauté professionnelle et donc un secteur d'activité (l'agriculture, l'aéronautique) Doc : 28
Le portail : s informer sur un secteur Pour identifier des portails sectoriels : www.enfin.fr http://www.objectifgrandesecoles.com/pro/secteurs/index.htm Un recensement de 1000 meilleurs portails www.yahoo.fr Dans guide web Je rentre «portail» B2B/portails et annuaires/localisation géographique/france/pour les professionnels http://www.lesannuaires.com/ : annuaire des annuaires http://www.portail2.com (rubrique B2B) www.portailpme.fr http://www.indexa.fr répertoire des professionnels et des entreprises présents sur le marché français Astuces : taper «annuaire et le thème dans un moteur Doc : 29
Un portail Doc : 30
Trouver un portail Doc : 31
Comment trouver les bases de données spécialisées Annuaires de banques de données http://www.bnf.fr/pages/liens/index.htm www.ccip.fr/rime http://www.iae-paris.org/internautie/searchlinks.php4 Doc : 32
Les banques de données : http://www.iae-paris.org Doc : 33
Veille concurrentielle Etude de cas Société SEDAT basée à Irigny dans le Rhône qui fabrique des appareils médico chirurgicaux (seringue, consommable médical) Chercher son Chiffre d affaire et son capital social (2005) Chercher le nom de son dirigeant Doc : 34
Infos sur les sociétés Les sites de référence : www.cofacerating.fr Raison sociale, adresse, téléphone, libellé code activité + infos sur l environnement de l entreprise Indice de risque par type de fabrication (étude de marché) Nbre de créations et défaillance par département et par secteur d activité www.lyon.cci.fr Capital social, CA (2005) www.societe.com Capital social, CA (2005), cartographie des dirigeants www.manageo.fr www.bottin.fr www.kompass.fr Doc : 35
Des infos sur les sociétés : cofacerating.fr Doc : 36
Societe.com Doc : 37
Doc : 38
Cofacerating : l environnement de l entreprise Doc : 39
cofacerating Doc : 40
cofacerating Doc : 41
cofacerating Doc : 42
cofacerating Doc : 43
Bottin.fr : les professionnels de proximité Doc : 44
Bottin.fr Doc : 45
Bottin.fr Doc : 46
Manageo.fr : des infos complètes Doc : 47
Manageo.fr : densité concurrentielle Doc : 48
Lyon.cci : les entreprises lyonnaises Doc : 49
Lyon.cci Doc : 50
Lyon.cci Doc : 51
Lyon.cci Doc : 52
Kompass.fr : les produits et les marques 1,8 millions d entreprises mondiales Manque : artisants, professions libérales et commerçants Doc : 53
Kompass.fr Doc : 54
Kompass.fr Doc : 55
Les grandes banques de données financières Les grandes banques de données financières fournissent un fichier d entreprises + information à valeur ajoutée (prévention risques clients, cotation) Dun & Bradstreet 1ère agence spécialisée dans le renseignement commercial Base de données mondiale qui contient 100 millions d entreprises Coface Scrl Intègre le fichier INSEE + 500 journaux d annonces légales 5,5 millions d entreprises françaises (SA, artisans, professions libérales) 13 millions d entreprises européennes Intervient en recouvrement des créances Analyse les risques commerciaux à l étranger Rachat ORT et Euridile Bil (base d informations légales) Base de données des entreprises françaises En plus du fichier Coface : établissements publics, associations, agriculteurs Sous licence avec l INSEE(Sirene), l INPI et le Bodacc Doc : 56
Dun : pilier du risk management : inforisk.com 100 millions d entreprises Doc : 57
Evaluer le risque Doc : 58
Evaluer le risque Doc : 59
Se renseigner à la source : infogreffe.fr Bdd des 185 greffes des tribunaux de commerce Kbis Etat d endettement Doc : 60
Des infos venant de sources institutionnelles www.oseo.fr des bilans sectoriels http://entreprises.insee.fr/ Observation des prix de l'industrie et des services aux entreprises Doc : 61
Infos sectorielles : Alisse Doc : 62
Des infos sectorielles : Alisse Doc : 63
Doc : 64
Alisse : résultats comptables Doc : 65
alisse Doc : 66
Doc : 67
alisse Doc : 68
alisse Doc : 69
Doc : 70
Alisse : indice des prix Doc : 71
Alisse Doc : 72
Recherche avancée Google Doc : 73
Comment dénicher la littérature grise : le nom de domaine Doc : 74
Google : recherche avancée : format Trouver des documents travaillés et «sérieux» ou des docs récapitulatifs d un domaine tel que les livres blancs Aider à réaliser votre présentation ppts Trouver des business plan Calculs de mensualités de prêts «calcul prêt» Embaucher une personne pouvant s occuper du référencement de votre site CV référencement Doc : 75