TER Référencement. Université de Montpellier II Année Universitaire 2005/2006 Master 2 Informatique Parcours IDI



Documents pareils
Réussir. son. référencement. web. Olivier Andrieu. Groupe Eyrolles, 2008, ISBN :

En quoi consiste le REFERENCEMENT de votre site?

Guide de création de site web optimisé

Référencement et visibilité sur Internet Comment améliorer la visibilité de son site internet sur les principaux moteurs de recherche?

WEBSEMINAIRE INTRODUCTION AU REFERENCEMENT

16 septembre Lundi de l Economie l. rencement. Foix. CCI Ariège

Qu est ce que le référencement web?

Référencement naturel & E-tourisme. Pau 02/10/2008

Introduction. M2206 Intégration web. Introduction. Introduction 20/01/2014

Référencement naturel

COMMENT AMELIORER LA VISIBILITE DE SON SITE WEB?

LE REFERENCEMENT NATUREL D UN SITE WEB1

COMMENT AMÉLIORER LA VISIBILITÉ DE SON SITE WEB?

DUT GEA. Informatique D après le document de Laurent GILI / Lycée Prévert

Référencement Vendredi 4 Juillet Ile Degaby

Le référencement naturel

«Un site non référencé est un site qui n existe pas» «Faire un site c est bien, mais s il n apparaît pas en première page, ca ne sert à rien!


VIS MA VIE D EXPERT COMPTABLE. Comment sortir la tête de l eau?

Référencement de votre site Web Google et autres moteurs de recherche (4ième édition)

Optimiser le référencement naturel de son site web

demander pourquoi mon site n'apparaît pas sur google ou pourquoi mon site n'est pas référencé par les moteurs de recherche?

Rokhaya BARRY Fondatrice de ROKBARRY CREATIONS & services@rokbarry.com. Documents Propriétaire : RokBarry

Jeudi 30 avril L art de bien référencer son site Internet

Kaizen Marketing Group Web Agency. Kaizen Marketing. - Stéphanie Héline-

SOMMAIRE. 1. Comprendre les bases - référencement, indexation et positionnement - comment fonctionne Google pour indexer et référencer un site?

WordPress Référencement naturel (SEO) Optimiser. son référencement. Daniel Roch. Préface d Olivier Andrieu

INU Information et sites Web 10 avril 2015 SEO. Dominic Forest, Ph.D.

Mesurer le retour sur investissement

RAPPORT D'OPTIMISATION DU SITE INTERNET

1.1 Des concepts et termes techniques à maîtriser La formule magique du référencement Tricher ou non en référencement

Le référencement de mon site

GUIDE DE RÉFÉRENCEMENT POUR VOTRE SITE INTERNET

Audit de site web. Accessibilité

E-Commerce à Orthez E-Commerce : Se lancer - Générer des commandes - Se positionner : Explications et témoignages Orthez 15 mai 2008

Référencement Naturel ou SEO Search Engine Optimization

Optimiser son référencement naturel avec e-majine

Offre SEO/SMO. Le référencement au cœur de votre stratégie web marketing. Tous droits réservés Emencia

Atelier numérique Développement économique de Courbevoie

Être visible sur internet - Améliorez votre référencement

1. Pourquoi? Les avantages d un bon référencement

Guide pratique du référencement de web consultant eu. Commençons par l optimisation de vos pages, ou on page

Référencement & Positionnement

NOS SERVICES NOTRE METHODOLOGIE

Référencement & Positionnement sur le WEB

Créateur de Visibilité

WordPress Référencement naturel (SEO) Optimiser. son référencement. Daniel Roch. Préface d Olivier Andrieu

Offre SEO/SMO. Le référencement au cœur de votre stratégie web marketing. Tous droits réservés Emencia

Guide et conseils généraux pour optimiser le référencement d un site internet

Livre Blanc Guide pratique pour un bon référencement Internet.

Evaluation et analyse de la fréquentation d un site

Les premières étapes d une présence adéquate sur le Web

Kit Madrileno. Auteur : Olivier ODORIZZI. Version 1.1. Kit Madrileno réalisé par Olivier ODORIZZI Site Internet : (Consultant SEO)

SEO On-page. Avez-vous mis toutes les chances de votre côté pour le référencement de votre site?

Est-il possible d'être sur la 1ère page de Google?

Eurateach labellisé par la région et le FAFIEC. Si vous remplissez les conditions suivantes : Votre entreprise compte moins de 250 salariés

ARIA Languedoc-Roussillon. Atelier Internet «Le référencement et les autres outils webmarketing»

RAPPORT AUDIT SEO. Élaboré à l'attention de : Monsieur Greber Élaboré par : Cédric Peinado

Créer et animer une boutique en ligne avec Wordpress (environnement PC et MAC)

D UN BON REFERENCEMENT

10 astuces pratiques pour obtenir un bon positionnement dans les moteurs de recherche

Recherche d information textuelle

Comment réussir son référencement

Logiciels de référencement

Les outils de création de sites web

La publicité multimédia (internet)

David BEDOUET, WebSchool Orleans. Cosmina TRIFAN, WebSchool Orleans

Petite définition : Présentation :

INTERNET est un RESEAU D ORDINATEURS RELIES ENTRE EUX A L ECHELLE PLANETAIRE. Internet : interconnexion de réseaux (anglais : net = réseau)

Pourquoi une stratégie de sites dédiés? Laurent-Pierre GILLIARD AEC 14/06/2007 Vincent MOREAU SYSTONIC 09/06/2006

LES PHOTOGRAPHES ET LE REFERENCEMENT INTERNET..: Module 1 : Le référencement :. Bienvenue à tous!

ETRE VISIBLE SUR INTERNET. Search Engine Optimisation (SEO)

Bien acheter son référencement Leila Couaillier-Moumeni LSFinteractive

Google AdWords ou référencement naturel Comment choisir?

Proposition commerciale étude de référencement

RÉFÉRENCEMENT NATUREL RENCONTRE DEVELOPR6 14 JUIN 2013

Les facteurs de référencement d un site internet

Atelier 2 : Les clés du référencement sur Google

Optimisez vos contenus. Guide pour des éditeurs de sites web

Fiche pratique : REPORTING SEARCH

10 points clés pour bien démarrer votre projet web

Programme Type de Formation SEO

WEBSITEBURO. Agence Media Internet. Stratégies publicitaires on-line

SEO & WordPress. Neil McCarthy GOODNESS CONSEIL EN WEBMARKETING & RÉFÉRENCEMENT. Bâtiment Enerpôle Technopôle Izarbel BIDART

Formation. La boite à Outils du Web

Jeudi 10 avril 2014 Analyse et Référencement

Note sur l'auteur. Référencer son site internet - Yann KERVAREC

COMMENT OPTIMISER MA VISIBILITÉ SUR LE WEB? AMÉLIORER MON RÉFÉRENCEMENT

Comment bien référencer mes sites internet? Les 100 SECRETS EN VIDÉO

20 techniques et bonnes pratiques d un positionnement visible gratuit et durable sur Internet

Guide de réalisation d une campagne marketing

Atelier E-TOURISME Optimiser la visibilité de son site sur les moteurs de recherche. ecotourismepro.jimdo.com

Noms de domaine et référencement

Bibliothèque Esparron en livres.

Créer du contenu en ligne avec WordPress

Transcription:

Université de Montpellier II Année Universitaire 2005/2006 Master 2 Informatique Parcours IDI TER Référencement Responsable de formation et tuteur : M. POMPIDOR Auteurs de l étude : Elizabeth MUNOZ & William GARCIA

Remerciements Nous souhaitons remercier M. Pompidor, qui nous a confié cette étude, pour son encadrement. Nous tenons également à remercier l ensemble des webmestres et des personnes avec qui nous avons pu échanger sur le thème du référencement.

Table des matières 1 Introduction 5 1.1 Histoire des outils de recherche 4 1.1.1 L hypertexte 4 1.1.2 La naissance des moteurs de recherche et annuaires 4 1.2 Types d'outils de recherche et fonctionnements 6 1.2.1 Les moteurs de recherche 6 1.2.2 Les méta-moteurs 8 1.2.3 Les annuaires 8 1.3 La domination de Google 9 1.3.1 Chiffres clés 9 1.3.2 Le concept de recherche par Google 10 1.4 Objectifs d'un bon référencement 11 1.5 Les acteurs du référencement 12 1.5.1 Les organismes d études et association 12 1.5.2 Les sites d information spécialisés 12 1.5.3 Les forums et groupes de discussions 12 1.5.4 Les conférences et séminaires professionnels 13 2 Referencement utilisant des techniques d optimisation 14 2.1 Définition (SEO: Search Engine Optimization) 14 2.2 Contenu 14 2.2.1 Production d'un contenu qualitatif 14 2.2.2 Mise à jour régulière du contenu 15 2.3 Mots-clés 15 2.3.1 Où placer les mots-clés? 15 2.3.2 Comment choisir les mots-clés? 19 2.4 Stratégie de liens 22 2.4.1 Stratégie de liens internes 22 2.4.2 Stratégie de liens externes 24 2.5 Le fichier robots.txt 25 2.6 Architecture du site 25 2.7 Stratégie de publication 26 3 Référencement payant 27 3.1 Annuaires et soumission payante 27 3.2 Moteurs de recherche et insertion payante 28

3.3 Le positionnement payant : l'exemple de Google AdWords 28 4 Pratique non recommandées 30 4.1 Pratiques limitatives 30 4.1.1 Utilisation exclusive de Flash ou Java 30 4.1.2 Utilisation exclusive de Javascript 31 4.1.3 Page non valide 31 4.1.4 Les sites dynamiques 31 4.1.5 Les sites utilisant des cadres (frames) 32 4.1.6 Autres pratiques limitatives 32 4.2 Pratiques agressives 33 4.2.1 Pénalisations prévues en cas d'abus 33 4.2.2 Cloaking 34 4.2.3 Page Jacking 34 4.2.4 Pages Doorway ou Gateway 35 4.2.5 Dissimulation de mots-clés ou de contenu 35 4.2.6 Abus de mots clef (ou keyword stuffing) 35 4.2.7 Echanges et Ventes de liens 36 5 Outils d'intérêt pour un référencement 37 5.1 Outils de soumission / vérification de référencement 37 5.1.1 SiteMap de Google 37 5.1.2 Autres outils 37 5.2 Outils de suivi de positionnement 38 5.3 Outils d analyse statistiques 38 5.3.1 Outils analysant l activité des robots d indexation sur un site 38 5.3.2 Outils de mesure d'audience 39 6 Mise en pratique : tests avec un site factice 40 6.1 Le site test 40 6.2 Techniques de référencement utilisées 40 6.3 Suivi du référencement 41 6.4 Suivi du positionnement 42 6.5 Comment améliorer le test? 43 7 Conclusion 44 8 ANNEXE : Glossaire des termes du référencement 46 9 ANNEXE : Bilan du sorcier glouton 52 10 ANNEXE : Ressources Web utilisées 56 Remarque : Les mots écrits en gras dans l étude renvoient vers des définitions inclues dans l annexe : «Glossaire des termes du référencement».

1 INTRODUCTION 1.1 Histoire des outils de recherche 1.1.1 L hypertexte Inventé par Tim Berners-Lee, l hypertexte est un concept simple mais à la fois ingénieux : de la même façon que des autoroutes sont reliées entre elles aujourd hui pour acheminer des automobilistes, l hypertexte permet de relier différents documents entre eux pour acheminer un internaute dans sa pensée. L hypertexte permet donc de passer d une page Web à une autre sans nécessité d en connaître l URL, mécanisme transparent et naturel aux yeux d un internaute. Toutefois depuis les débuts de l Internet il y a environ 30 ans, l information véhiculée au sein de chaque page Web est devenue si importante qu il a été nécessaire d imaginer des systèmes automatisés capables d assister l internaute dans sa recherche d information. 1.1.2 La naissance des moteurs de recherche et annuaires Loins d imaginer la portée qu'aurait leur projet, deux étudiants de l'université Standford (Californie Etats-Unis), Jerry Yang et David Filo, ont été précurseurs dans ce domaine. En 1994, ils créèrent un site Internet nommé le «Jerry's Guide to World Wide Web» recensant diverses adresses Web en relation avec leurs travaux de l époque. A leur surprise, le site fut rapidement visité par des centaines d internautes. Un an plus tard, ils surent développer un modèle économique autour de leur annuaire Web et fondèrent Yahoo!. Le projet acquit donc de la maturité dans le domaine de la recherche généraliste d informations et fit même une entrée spectaculaire en bourse en 1996 (2,6 millions d'actions à 13 dollars l'unité). 4

Cependant avant l existence de Yahoo, d autres personnes eurent l idée de mettre au point des outils de recherche : Date de Lancement Moteur de recherche 1989 Le Wide Area Information Servers (WAIS) permet déjà de récupérer des informations dans des bases de données réparties dans le monde. 1993 Clearinghouse3, élaboré par des personnes indépendantes et spécialisées dans un domaine spécifique, devient également le premier guide gratuit des meilleures ressources du Web. 1995 Ecila, Lycos, Excite, Lokace, Infoseek, Alta Vista. Durant cette année, AltaVista s impose comme le plus puissant et avancé des outils : le moteur génère plus de 300 000 visiteurs par jour dès sa mise en ligne, recense six mois plus tard 30 millions de pages Web sur 225 000 serveurs et 14 000 groupes de discussion, et gère 12 millions de requêtes quotidiennes. 1996 et 1997 Nomade et Voilà 1999 Google puis All The Web Tableau 1 : Bref historique des outils de recherche 5

1.2 Types d'outils de recherche et fonctionnements 1.2.1 Les moteurs de recherche Les moteurs de recherche fonctionnent à l aide de robots. Ceux-ci : parcourent régulièrement Internet à la recherche de nouvelles pages incluent de manière automatisée ces pages dans leurs bases de données Bien que les robots soient censés réaliser automatiquement ce travail d'indexation, il arrive qu'ils ne parcourent pas un site, c'est pourquoi il est possible en complément de soumettre directement un site auprès d'un moteur. L'objectif est d'accélérer le processus d'indexation par le robot. A titre d'exemple, Google propose aux webmestres deux méthodes pour soumettre directement un site : la rubrique Pour ajouter ou mettre à jour l'url d'un site dans laquelle il suffit de fournir l'url de la page d'accueil du site et un commentaire http://www.google.fr/addurl/?continue=/addurl l'outil en ligne Google Sitemap qui permet de soumettre non plus une seule mais plusieurs URL pour un même site (cf. 6. Outils d'intérêt pour un référencement). Lors d'une soumission manuelle d'url auprès d'un moteur, il faut constater que peu d'informations sont demandées : ceci est du au fait que les moteurs sont capables, pour classer une page, d'en lire son contenu et d'en extraire les données utiles automatiquement. Après lecture, le robot associe la page à une série de critères (très dépendants et sans cesse changeants pour chaque moteur de recherche). Le poids affecté à chacun de ces critères permet alors d'ordonner les pages dans un index. Lorsqu'un internaute cherche une information à partir de mots clés, le moteur de recherche et non plus d'indexation propose des résultats déjà ordonnés dans son index. De même, lorsqu'un robot parcoure une page, il est capable d'en suivre les liens internes, c'est aussi pourquoi seule l'url de la page d'accueil est demandée lors d'une soumission manuelle. Enfin, les robots peuvent également revenir postérieurement sur des pages avec pour objectif de disposer de la dernière version actualisée. 6

Il existe deux principales techniques d'indexation 1 : l'indexation par lot et le crawler incrémental. L indexation par lot (ou batch crawling) Le robot récupère dans un fichier des URLs de départ à parcourir. Il indexe (ou crawl) ensuite ces URLs. Il récupère les liens contenus dans ces URLs et les met dans une sorte de liste d'attente, c'est-à-dire un nouveau fichier d'urls qu'il parcourra ultérieurement. L'inconvénient de cette méthode concerne la fraîcheur des pages indexées : en effet une indexation par lot peut s'avérer relativement longue. Certaines des URLs stockées dans le fichier à parcourir peuvent être mises à jour ou supprimées avant même que le robot n'est finalisé sont indexation : ce phénomène était encore très présent il y a 3 ou 4 années, lorsque certains moteurs renvoyaient des résultats de recherche obsolètes (erreurs HTTP 404). Aujourd'hui, il arrive encore de rencontrer ce phénomène, c'est pourquoi les moteurs associent à chaque résultat de recherche un lien vers la page telle qu'elle était au moment de son indexation (par exemple, lien En cache de Google) Le crawler incrémental Le crawler incrémental contourne le problème des pages Internet non mises à jour : celui-ci ne s'arrête en effet jamais, contrairement à l'indexation par lot. Surtout, son objectif n'est plus de recenser toutes les URLs existantes sur Internet mais plutôt de trouver celles susceptibles de changer, et le cas échéant de déterminer leur fréquence de mise à jour. Cette technique optimise donc la période de passage d'un robot sur chaque site. Les moteurs de recherche se démarquant à l'heure actuelle sont Google et MSN Search. 1 Les techniques évoluées d indexation dans les moteurs de recherche (http://www.webmasterhub.com/publication/article76.html) 7

1.2.2 Les méta-moteurs Les méta-moteurs n'ont pas de base de données : pour une recherche donnée, ils combinent les résultats de recherche de quelques moteurs de recherche et annuaires. Le méta-moteur le plus connu est Kartoo (il propose une visualisation graphique de l'information). Il n'existe aucune procédure permettant de s'enregistrer manuellement auprès d'un méta-moteur de recherche. 1.2.3 Les annuaires Les annuaires organisent par catégories les pages Web inclues au sein de leur base de données. A l'intérieur de chaque catégorie, on y trouve des pages Web dédiées à un thème spécifique et unique. Les annuaires sont maintenues par des humains, chargés de visiter les sites et d'assurer leur bonne relation avec la catégorie à laquelle ils ont été attribués. Pour enregistrer un site, il faut le soumettre aux administrateurs humains de l'annuaire, en spécifiant généralement : la catégorie dans laquelle le site doit apparaître une description du site le nom du site Sous réserve d'acceptation du site, certains annuaires procèdent en retour à un mécanisme de validation par mail de la soumission afin de s'assurer que le site a bien été soumis par son auteur (Mirti par exemple). Les principaux annuaires existants à ce jour sont Yahoo, DMOZ, Voilà et AOL. 8

1.3 La domination de Google 1.3.1 Chiffres clés Voici la part de trafic généré par quatre principaux moteurs en 2005 : Google 81,21 % Yahoo! 5,04 % Voilà 4,63 % MSN Search 3,69 % TOTAL 95,00% Tableau 2 : baromètre XiTi/1ère Position de novembre 2005 Disponible en version française depuis avril 2000, Google se place déjà en tête au niveau national : Google 30.1 % Yahoo! 23,30 % Voilà 18,10 % Tableau 3 : baromètre XiTi/1ère Position de septembre 2001 En gagnant ainsi progressivement en satisfaction auprès des internautes, Google a su progresser constamment : 54,83% en septembre 2002, 64,19% en septembre 2003, 73,98% en septembre 2004. Cette bonne réputation que s est forgée Google est sans aucun doute due d une part à la sobriété de son interface et à sa simplicité d utilisation, mais surtout à la pertinence et à la rapidité de ses résultats. Selon les dernières études Nielsen/Netratings, 45% des recherches dans le monde sont faites sur Google, soit deux fois plus que sur Yahoo! et quatre fois plus que sur MSN. Google répond à environs 250 millions de requêtes par jour (en moins d'une demi-seconde par requête). 9

1.3.2 Le concept de recherche par Google Le succès de Google tient en premier lieu au concept clé du moteur de recherche : la notion de classement des informations en fonction de la notoriété des sites sur Internet. Ce concept basé à la fois sur la pertinence de l information et la popularité d'un site a été inventé en 1998, par les fondateurs de Google, à l'époque étudiants : Larry Page et Sergey Brin (provenant comme les fondateurs de Yahoo! de l'université de Standford). Google met aujourd'hui ce concept en pratique à travers son algorithme déposé dit algorithme du PageRank 2. De fait, pour parcourir systématiquement à intervalles réguliers, relever, étudier et répertorier le contenu de pages Web, un robot d'indexation se base sur des critères prédéfinis. Le PageRank fait partie de ces critères mais il en existe d'autres 3 (localisation d'une page au sein de l'architecture du site, nombre de liens externes pointant vers une page Web, évaluation sémantique,...). Il existe des algorithmes similaires à l'algorithme du PageRank (l'algorithme HITS 4 par exemple), toutefois l'algorithme du PageRank est jugé le plus efficace pour déterminer arbitrairement quelles sont les pages Web répondant le mieux à la requête d'un internaute. Cet algorithme, bien gardé par Google, étudie à la fois le contenu et la structure des liens d une page Web. Il attribue à chaque page une note de 0 à 10 en fonction de son importance sur Internet. Figure 1 : Google Toolbar (http://toolbar.google.com/firefox/t3/intl/fr/index.html) Cette popularité est donc gagnée ou perdue à travers un système démocratique : le vote par la communauté internaute, ce qui dans l'esprit des fondateurs de Google est synonyme de pertinence de l'information. 2 L'algorithme du PageRank expliqué Sept. 2003 (http://www.webmaster-hub.com/publication/article16.html) 3 Google Ranking Factors (http://www.vaughns-1-pagers.com/internet/google-ranking-factors.htm) 4 L'algorithme HITS et le projet CLEVER (http://www.webmaster-hub.com/publication/article82.html) 10

1.4 Objectifs d'un bon référencement Un site Internet peut constituer un formidable vecteur de communication comparable à une presse locale et même s'il n'a pas de vocation commerciale, il doit générer de l'audience. Pour tout annonceur disposant d un site Web, le référencement s avère être une opération indispensable. Voici quelques-uns des objectifs poursuivis par un bon référencement : Annonceur Objectif Organisations à but lucratif (sociétés) Organisations à but non lucratif (chercheurs / communautés OpenSource) particuliers Informer mettre en avant des compétences rendre des travaux accessibles mettre en avant des compétences Communiquer communiquer avec d'autres entreprises autour de son activité échanger avec d'autres échanger chercheurs, laboratoires, développeurs,... organisations commerciales non,... avec d'autres particuliers, experts, ou Se démarquer Augmenter visibilité la véhiculer l'image de l'entreprise montrer la valeur ajoutée d'un produit Générer du trafic pour attirer des clients potentiels, trouver de nouveaux prospects introduire sur Internet des standards, des normes,... susciter l'intérêt d'un large public pour un projet donné Générer du trafic Tableau 4 : Objectifs d un bon référencement Ce tableau n'est évidemment pas exhaustif : un référencement dépend fortement de la stratégie Web du site Internet. 11

1.5 Les acteurs du référencement «Il n existe pas en France d institution connue concernant le référencement. Certaines organisations tentent toutefois d organiser la pratique et le métier du référencement.» 1.5.1 Les organismes d études et association Il existe un certains nombre d organismes d études chargés de réaliser des statistiques relatives à différents domaines de l Internet. Leur technique de sondage repose souvent sur des panels d internautes. Xiti, Nielsen NetRating en sont les principaux représentants. D autre part, la SEMA7 (Search Engine Marketing Association : http://www.sema7.org), créée en décembre 2003 est la principale association dédiée au référencement au niveau national. Elle opère dans différents axes en : fournissant un espace de discussion aux référenceurs incitant au respect d une charte déontologique en sensibilisant les entreprises à l importance du référencement en tentant de résoudre des litiges professionnels L association a également pour projet de fournir des stages de formation pour les référenceurs. 1.5.2 Les sites d information spécialisés Il s agit de sites spécialisés dans le référencement et la recherche d information. Parfois nés d initiatives personnelles de référenceurs, ces sites se sont fait «un nom» dans le domaine au fil d années d expérience. En France, les plus connus sont les sites www.abondance.com (d Olivier Andrieu), www.webrankinfo.com et le Blog Google. 1.5.3 Les forums et groupes de discussions Les forums et les groupes de discussions sont des lieux d échanges entre acteurs du référencement de tout bord (référenceurs professionnels ou amateurs, représentants de sociétés productrices d outils de recherche). Ces rencontres permettent d établir des échanges sur des problématiques sensibles, d ouvrir de nouvelles réflexions. Les plus connus sont le Yahoo!Groupe (http://fr.groups.yahoo.com/group/referencement/) et le forum du site WebRankInfo (http://www.webrankinfo.com/forums/). 12

1.5.4 Les conférences et séminaires professionnels Les entreprises spécialistes en dans les domaines du référencement et des outils de recherche organisent ou participent à des conférences et séminaires qui tentent de coordonner des acteurs majeurs nationaux ou européens. Ces rencontres ne débouchent cependant pas sur des publications communes et l accès y est payant. Le blog PR Weaver (http://www.prweaver.fr/blog/) propose quelques annonces de séminaires sur le référencement. Voir aussi sur le site de la CCIP le séminaire «Comment optimiser son référencement sur Google?» (http://www.cyber.ccip.fr/imitiki-referencement-google-a.htm). 13

2 REFERENCEMENT UTILISANT DES TECHNIQUES D OPTIMISATION 2.1 Définition (SEO: Search Engine Optimization) Les techniques d'optimisation d'un site permettent d'obtenir gratuitement et naturellement le classement le plus élevé possible dans les résultats d'une recherche d'un ou plusieurs moteurs de recherche. Dans cette partie, nous fournirons une liste de recommandations à suivre pour référencer un site : celles-ci peuvent paraître assez simples mais s'avèrent relativement efficaces si appliquées toutes ensembles et au pied de la lettre. 2.2 Contenu 2.2.1 Production d'un contenu qualitatif Il est bon de rappeler que la large majorité des moteurs de recherche se basent sur des algorithmes complexes pour constituer leurs index de pages Web. Pour sélectionner les pages qui figureront ou non dans l'index, ils utilisent des techniques avancées combinant de nombreux critères de façon à s'approcher le plus possible du mode de jugement d'un être humain. Il s'agit donc de déterminer quels sont les contenus d'intérêts et ceux peu pertinents. Tenter d'obtenir une audience solide ne consiste pas seulement à générer du trafic mais aussi à fidéliser des visiteurs, qui pourront eux-mêmes recommander le site à d'autres visiteurs. Voici quelques pratiques à suivre pour obtenir un contenu de qualité : l'originalité : ne pas se contenter de référencer l'information disponibles sur d'autres sites, mais produire l'information ; un thème déterminé : l'idée est que le contenu du site soit attaché à un thème déterminé. Ce thème peut être large mais ce qui importe est son unicité, de façon à ce que les internautes identifie clairement l'objectif du site. Ceci permet au site de vivre tout en étant reconnu de sa cible mais aussi d'autres sites (réseaux de sites). 14

2.2.2 Mise à jour régulière du contenu Il existe des instructions de revisit-after pour demander à un robot d'indexation de passer sur site à une fréquence donnée (en HTML, par exemple la méta-balise revisit-after). Malheureusement ces instructions sont ignorées par la quasi-totalité des robots. Il est donc important d actualiser un site pour proposer aux robots de nouvelles informations et pages à indexer. Bien que cette fréquence reste mystérieuse en fonction de chaque robot5, une mise à jour du contenu permet d'assurer la reconduction du passage du robot. 2.3 Mots-clés Les mots-clés sont des mots choisis en relation avec le contenu du site. Ce sont ces mots qui devront permettre au mieux à un internaute de trouver notre site et à un robot de nous indexer. 2.3.1 Où placer les mots-clés? La balise HTML TITLE y faire apparaître les mots clés utiliser des titres concis * (tant en nombre de mots qu'en nombre de caractères) utiliser corrects syntaxiquement éviter la répétition d'un même mot (au risque de passer pour du spam pour un robot d'indexation) éviter les caractères spéciaux * Concernant la longueur des titres, il est plutôt difficile de se prononcer, c'est pourquoi nous ne donnons que des chiffres maximum indicatifs : 10 mots et 70 caractères 5 Liste de robots, Script d'identification, autorisation et blocage de robots (http://danzcontrib2.free.fr/pieges.php#capturer) 15

Sans surprise Google.fr accorde toujours une très forte importance au contenu de cette balise. 71% des pages classées par Google dans les 100 premiers résultats ont un titre de document optimisé. Seul le moteur d'aol France (technologie Exalead) peut donner beaucoup de crédibilité à cette information, seuls 40% des documents présentés ont un titre correspondant à la syntaxe saisie. Le moteur de Microsoft de classe avant dernier, le contenu du titre reste une valeur sure. 89% des pages analysées contenaient une balise titre renseignée, le taux de titres précisément optimisés est donc très significatif. Etude @Position issue de la revue du Référencement (http://www.revuereferencement.com/etudes/0410-balises-meta.htm) L'attribut ALT de la balise HTML IMG Au-delà d'être imposé par le standard W3C (pour des raisons d'accessibilité des déficients visuels), l'attribut ALT est pris en compte par une majorité de moteurs de recherche (par exemple, Google), en particulier lorsque l'image est un lien vers une autre page. Les balises HTML META Nous ne décrivons ici que les méta-balises keywords et description, qui sont quasiment les seules à être prises en compte par les moteurs de recherche. 16

Google a la réputation de ne pas en tenir compte du tout : pourtant, il se sert de la méta-balise description (ou snippet) pour décrire chaque résultat de recherche. Figure 2 : extrait d une recherche (le snippet commence par CV William ) 17

Le classement est très similaire à celui observé pour la balise méta keywords Voila est ici aussi le moteur de recherche qui accorde le plus d'importance à ce résumé. Tout semble indiquer que cette balise peut vous aider pour vos campagnes de référencement sur cet outil. AOL et MSN semblent très peu sensibles à cette optimisation. Etude @Position issue de la revue du Référencement (http://www.revuereferencement.com/etudes/0410-balises-meta.htm) * Concernant la longueur des descriptions, il est plutôt difficile de se prononcer, c'est pourquoi nous ne donnons que des chiffres maximum indicatifs : 20 mots et 120 caractères 65% des pages analysées contiennent une balise méta keywords, preuve que cette balise est encore fortement utilisée par les référenceurs et les Webmasteurs. Voila est l'outil de recherche qui accorde le plus d'importance à cette méthode d'optimisation, 50% des pages présentées par Voila contiennent au moins un des mots recherchés dans la liste des mots clefs de la page. AOL/Exalead et MSN sont les moteurs de recherche qui pondèrent le moins fortement cette balise. Cette étude ne permet pas de déterminer si les pages sont pénalisées pour sur-optimisation lorsqu'elles utilisent cette méthode d'optimisation. Google, pourtant réputé pour ne pas lire les balises méta, présente 44% de pages optimisées avec une balise keywords. Il faut voir là des pages optimisées de manière générique pour plusieurs outils de recherche. Etude @Position issue de la revue du Référencement (http://www.revuereferencement.com/etudes/0410-balises-meta.htm) 18

URL Nous supposons que les moteurs de recherche donnent un certain poids aux mots clés contenus dans l'url, c'est pourquoi nous recommandons d'y placer des mots clés. Exemples : pour une page parlant de champagnes français, il conviendra de lui donner un nom de fichier tel que champagne.htm. Le nom champagne-francais.htm serait à éviter car trop long et contenant des caractères spéciaux. si possible, il est aussi préférable de situer le mot champagne dans le nom de domaine du site à savoir www.champagne.fr Balises HTML Les moteurs de recherche donnent une grande importance à certaines balises inclues dans le contenu d'une page, en particulier les balises permettant de mettre en valeur du texte. C'est le cas des balises fermantes <H1></H1>, <Hx></Hx>,.. (sous titrage), <B></B> (caractère gras) et <I></I> (italique). 2.3.2 Comment choisir les mots-clés? Il n'existe pas de méthode miracle pour définir de bons mots si ce n est un audit sémantique. Nous proposons ici quelques outils en ligne simple d'utilisation aidant au choix de mots-clés. S'inspirer des mots clés les plus recherchés Site Mots clés proposés Buzz Index Top Yahoo! Web Searches (http://buzz.yahoo.com/) Zeitgeist Google (http://www.google.com/press/intlzeitgeist.html#fr) Jeeves IQ (Interesting Queries)(http://sp.ask.com/docs/abo ut/jeevesiq.html) Lycos 50 Daily Report (http://50.lycos.com/) Mots clés les plus recherchés sur Yahoo! classés par catégories (top des recherches cinéma, télévision,...) Mots clés les plus recherchés sur Google par mois et par pays depuis 2001. Mots clés les plus recherchés sur Teoma classés par catégories (top des recherches dans l'actualité,...) Mots clés les plus recherchés sur Lycos 19

Figure 3 : Zeitgeist Google - résultats France Novembre 2005 Utiliser des outils de suggestion de mots clef Site Fonction KeywordSandbox (https://adwords.google.com/select/ KeywordSandbox) Outil Google en ligne. Fournit des mots clés s'approchant de celui recherché (outil proposé comme aide pour le programme Google AdWords). MIVA(http://www.miva.com/fr/conte nt/advertiser/landing1.asp) Fournit des mots clés s'approchant de celui recherché ainsi que le nombre de fois où ils ont été recherchés sur les moteurs Keyword Selector Tool (http://inventory.overture.com/d/se archinventory/suggestion/) 7Search (http://conversion.7search.com/scrip ts/advertisertools/keywordsuggestion.aspx) Demande un mot clé et fournit le nombre de fois où il a été recherché Fournit des mots clés s'approchant de celui recherché, le nombre de fois où ils ont été recherchés sur les moteurs, ainsi qu'une estimation de leurs coûts pour être positionnés en 1er dans les résultats Calculer la densité des mots clés pour une page donnée (poids du mots clés par rapport au reste du contenu, nombre de fois où il est répété,...) Il existe une manière simple de comprendre comment optimiser cette densité : il suffit de noter l'url du premier résultat de Google pour un mot clé donné et de saisir cette URL dans des outils de calcul de densité tel que Keyword Density Analyzer v1.3 (http://www.searchengineworld.com/cgibin/kwda.cgi). 20

Exemple : cherchons sur Google de l'information sur le mot clé chef de projet. Le premier résultat renvoyé est une page du site Chefs-de-projets.enlignefr.com : il ne correspond pas forcément à ce que nous recherchons avec le mot clé chef de projet mais nous jugerons ici ce site pertinent. Calculons à présent la densité des mots clés de ce site : pour cela nous utiliserons le Keyword Density Analyzer v1.3. Voici le résultat obtenu : Title: Confiez mission chef projet chefs-de-projets-enligne.com portail emplois, missions stages chefs projets MetaKeywords chef projet, chefs projets, chefs-de-projets, expert, experts, consultant, consultants, enligne, ligne, line, online, portail, portails, chef projet, directeur projet, AMO, MOA, projet, projets, chefs projets, directeurs projets, portail recrutement, indépendants, annuaire, enligne, ligne, portail, réseau, indépendant, MetaDescription service chefs-de-projets-enligne vous permet trouver chefs projets leur confier mission Mots clés simples Nombre d'occurrences Mot clé trouvé Densité 447 enligne 9.83% 180 8226 3.96% 178 projet 3.91% 140 chef 3.08%. Mots clés composés de 2 mots Nombre d'occurrences Mot clé trouvé Densité 128 chef projet 7.55% 44 8226 chef 2.6% 40 8226 consultant 2.36% 20 mise place 1.18% 19 enligne enligne 1.12% 21

Mots clés composés de 3 mots Nombre d'occurrences Mot clé trouvé Densité 41 8226 chef projet 5.7% 13 chef informatique projet 1.81% 12 assistance ouvrage trise 1.67% 12 consultant projet chef 1.67% 6 8226 consultant chef 0.83% 6 8226 directeur projet 0.83% Nous observons finalement que les mots chef et projet ont une très forte densité sur la page http://www.chefs-de-projets.enligne-fr.com/experts.php. Pour obtenir un bon résultat de positionnement avec chef de projet sur Google en créant une page, tenter de s'approcher des résultats de densité du site Chef de Projet en Ligne serait une bonne technique. 2.4 Stratégie de liens 2.4.1 Stratégie de liens internes Cette méthode consiste à optimiser la navigabilité interne d'un site, autrement dit ses liens entre pages. Typiquement, la plupart des liens internes entre pages doivent être regroupés au sein du/des menu(s) de navigation. Cette structure a pour objectifs d'offrir à l'internaute une navigation conviviale mais surtout de simplifier le scannage des liens par les robots d'indexation. D'une part, il est recommandé de créer des liens internes comportant des combinaisons de mots-clés : 22

<a href="http://www.mon-site.com/pages.html">libellé du lien contenant si possible le principal mot-clef définissant la page liée</a> Il est évidemment possible de placer ces liens dans le corps de la page (à l'intérieur de la balise HTML Body). D'autre part, lorsque l'on crée des liens internes dans un site, il est indispensable que toutes les pages du site soient reliées entre elles : le but est de permettre au robot une indexation plus profonde du site. Les robots apprécient particulièrement les pages internes renvoyant vers de nouvelles pages internes mais au contraire n'apprécient guère les liens morts (qui peuvent provoquer leur départ, ou diminuer leur fréquence de passage). Il existe des outils permettant de simuler la manière dont les robots d indexation voit une page. A titre d exemple, nous avons utiliser l outil en ligne Sim Spider (http://www.searchengineworld.com/cgi-bin/sim_spider.cgi) et voici le résultat obtenu pour la page http://wgarcia.f2g.net/index.html Figure 4 : Sim Spider - simulation de passage d un robot Dans la partie «Spider Text», nous constatons que le robot prend en compte 23