Optimiser son référencement naturel avec e-majine Le présent document ne prétend pas porter votre site en première position des pages de résultats des moteurs de recherche! Le référencement naturel concerne un ensemble de pratiques destinées à s'assurer que les robots des moteurs de recherche puissent et viennent parcourir le contenu de vos pages afin d'en extraire les termes importants. 1/ Une partie très importante de ces bonnes pratiques concerne la base technologique, optimisée avec la solution e-majine. Reste à en tirer le meilleur parti! 2/ Une deuxième partie concerne l'aspect éditorial et se base sur l'originalité des thèmes ainsi que sur des informations textuelles en volume minimum et de qualité. C'est la partie qui doit être prise en charge par votre client. 3/ Une dernière partie concerne les réseaux de liens établis par vos soins et qui dirigent vers le site à promouvoir. Le référencement est un métier. Négliger un seul des trois aspects ci-dessus peut remettre en cause le référencement «de base» de votre site. Bonnes pratiques A chaque projet son thème : certains projets de clients sont trop concurrentiels pour qu'une agence creuse la différence avec simplement une optimisation du référencement naturel proposée par e-majine. Il en est de même pour les sites qui utilisent du référencement payant (liens sponsorisés et autres techniques de webmarketing. Le contenu est primordial : attention aux fautes et aux lieux-communs. Faites preuve d'originalité et de créativité dans la rédaction. Optimisez chaque média pour l'accessibilité (balise alt="" pour les images, contenu alternatif descriptif pour les média flash, contrepartie <noscript> pour les sites qui ont recours au JavaScript, etc..) Deux modes d'optimisation pour le référencement naturel sont proposés : global et par rubriques. Tout ce que vous allez renseigner en global sera appliqué par défaut à toutes les rubriques : il est donc conseillé, au minimum, de remplir ces champs génériques. Générez et publiez votre sitemaps et le fichier robots.txt. Paramétrez votre page d'erreur 404. 1
Associez vos noms de domaines et vos domaines par langue. Faites remonter les éléments qui vous intéressent dans l'url (article, annuaire, forum, catalogue...). E-majine compose, par défaut, les URL avec le nom des rubriques de l'arborescence saisies dans le «Manage». Il est possible de ré-écrire individuellement ces adresses pour les rubriques. La page d'accueil : étape 1 La page d'accueil est primordiale. Toujours avoir un maximum de liens de la page d'accueil vers les pages internes d'un site. Si un site doit présenter une page d'accueil "originale", il faut utiliser le module d'article préformaté qui permet toute apparence graphique, et ne choisir d'afficher que ce qui est retenu au moyen des CSS. Ainsi, le code est toujours présent dans la page et les liens sont bien suivis par les moteurs de recherche. Une page d'accueil ne comportant pas (ou peu) de liens vers les pages internes est une impasse pour les robots des moteurs de recherche, qui ne pourront pas deviner ce qu'il y a derrière (les pages intérieures). Nom des rubriques : étape 2 Optimiser le nom des rubriques (puisque les noms des rubriques sont repris dans les URL). Si le site vend des piscines par exemple, quel est le meilleur nom de rubrique entre "nos produits" et "les piscines d'extérieur Piscinier"? Rédaction des titres : étape 3 Rédiger des titres éloquents et pertinents, en rapport avec les thèmes présentés. Faire du "mono-thème" autant que possible. Chaque page publie un contenu rédactionnel pointu. (éviter les pages "fourre-tout" qui parle à la fois de casseroles de cuisine et de lampadaires d'éclairage public).(astuce donnée par Sébastien Billard lors de la Convention d'été : cf le site communautaire ) Faites en sorte que le titre des rubrique reprenne des mots-clé contenus dans le nom des rubriques! Les mots-clés : étape 4 Travailler sur des dictionnaires (thésaurus) de mots-clés qui seront repris dans les balises META. Décliner les termes importants en masculin/féminin, singulier/pluriel, groupes de mots, etc.. Adapter chaque rubrique avec SES mots-clés et sa description. Faites en sorte que description et mots-clés reprennent les thèmes des mots-clé contenus dans le nom et le titre des rubriques! MAIS à chaque rubrique sa liste de mots-clés différents qui doivent décrire précisément le contenu visible de la page. 2
Noms de pages / ré-écriture d'url : étape 5 Optimiser au besoin les noms de pages avec la ré-écriture d'url Voir détail pour l'optimisation de la ré-écriture : http://communaute.medialibs.com/support/astuces/1298-la-reecriture-d-url-url-rewriting-avec-e-majine.html Si on utilise un catalogue, passer en paramètre dans l'url certains mots-clés importants. Pourquoi recourir à la réécriture d'url? D'un point de vue purement pratique, cela permet d'afficher l'arborescence que l'on souhaite voir apparaitre dans la barre d'adresse. C'est également beaucoup plus explicite pour l'internaute (qui n'a plus besoin de nommer ses favoris/bookmarks puisque le contenu est dans l'url). Pour le référencement Internet, les robots des moteurs de recherche collectent les adresses des pages web (URL) et y associent des champs lexicaux : Une URL de type http://www.e-majine.com/gerer-son-site-avec-e-majine-manage/ et qui comprend dans le contenu visible de la page des mots liés à la gestion de site, va être mieux prise en compte par le moteur de recherche, puisque les mots-clé associés au thème de la page sont repris dans l'adresse, qu'une URL de forme http://www.e-majine.com/1435423.html. De la même façon que l'écriture pour le web requiert un travail adapté (on appelle cette tâche optimisation des contenus), vous déclarez les règles que vous souhaitez voir appliquées à cette ré-écriture en signifiant à e-majine les paramètres à intégrer dans l'url. Voici les différentes possibilités qui vous sont fournies pour faire du sur-mesure, sans connaissance particulière : - Nom de la page : c'est la partie finale de l'url, placée donc à l'extrémité droite et qui comporte l'extension du fichier. Il vous est ainsi possible d'associer à votre page un nom et une extension de votre choix (.html,.html,.php,.txt...) - Titre de la page : c'est la balise html <title> dont le contenu est affiché dans la barre du navigateur. C'est une balise primordiale dans le cadre du référencement naturel. - Pour le catalogue e-commerce, depuis la V1 d'e-majine, il est possible de choisir un certain nombre de paramètres des fiches produits qui seront remontés dans l'adresse : Libellé, Référence, Propriété(s) additionnelle(s), Variante(s) de produits Il en va de même pour les fiches du module annuaire. Il est ainsi possible de choisir parmi les noms de catégories, et les noms des fiches. Par exemple : /liens/category-3-sites-de-salles-de-concerts.html L'accès à la fiche de l'annuaire permet de remonter le titre de l'entrée dans le <title> de la page. Utilisée conjointement avec la ré-écriture d'url de l'arborescence dans e-majine, vous allez ainsi obtenir des URL dites "propres", c'est à dire dont la syntaxe comprend des mots explicites et signifiants, sans caractère 3
spécial (encodage, sigles, etc) qui pourrait en gêner la lisibilité. Le même principe est décliné aux articles (de type actualités, évènements, en multi-publication...). Le forum hérite quant à lui du passage des titres et de la description au niveau de la balise <title> et de la balise meta description. La ré-écriture d'url est également la méthode utilisée dans e-majine pour gérer les exceptions, comme la fameuse page 404 ("page not found", page non trouvée sur le serveur), que vous pouvez choisir de diriger vers une page/rubrique spéciale (un plan du site?), ou bien de ramener au niveau d'arborescence parent. Comparateur des prix : étape 6 Si le site a un catalogue, faire un export de catalogue pour les comparateurs de prix. Robots.txt et sitemap : étape 7 Publier un fichier robots.txt sur-mesure et un sitemap circonstancié. Mettre à jour ce fichier sitemap régulièrement suivant la mise à jour du contenu et le recharger à chaque fois. Les conseils prodigués ci-après vous permettront d'avoir le maximum de cartes en mains pour suivre et optimiser le référencement naturel de vos sites avec e-majine. Le sitemap, qu'est-ce que c'est? Le Sitemap est un fichier au format XML le plus souvent (il peut aussi être au format : txt) qui liste les pages de votre site. Le sitemap est depuis fin 2006 un standard informatique, dont on peut lire les spécifications sur le site sitemaps.org. Il a longtemps été associé au moteur de recherche Google (d'où le terme lu un peu partout de "Google Sitemaps") puisque c'est ce dernier qui a contribué à le rendre populaire. Il peut être généré par des programmes ou des applications en ligne, et la V1 d'e-majine vous permet de le publier et de le paramétrer selon vos besoins. A quoi cela me sert-il? Le sitemap ("plan du site" en anglais) est destiné à indiquer aux robots des moteurs de recherche en un endroit toutes les pages de votre site, sans notion de hiérarchie ou d'arborescence. Les adresses absolues (déclaration de type : http://www.votresite.com/index.php ou http://www.votresite.com/rubrique2/sous-rubrique2/mon-fichier.php) se succèdent les unes à la suite des autres au sein de balises XML. Le sitemap est alors un autre plan du site? Oui, il est destiné aux "non-humains". Il est à différencier du plan du site "traditionnel" qui lui est destiné à être lu par vos internautes dans le but de leur faciliter l'accès aux rubriques et aux contenus parfois 4
nombreux et imbriqués. Le plan du site qui vous est proposé comme méthode de publication avec e-majine vous permet ainsi de délimiter le niveau d'imbrication de vos rubriques ainsi que la rubrique de départ afin de proposer éventuellement plusieurs plans pour des publics différents. A qui s'adresse t-il? Les moteurs de recherche listés ci-dessous et leur robots adhèrent au standard sitemap et sont donc capables de lire et parcourir votre fichier afin d'en extraire les liens : - Google - Yahoo! - Ask - MSN/Windows LiveSearch - Exalead (Cette liste est donc susceptible de croître puisque le sitemap répond à un standard pouvant être utilisé par tous.) Quel bénéfice puis-je en tirer? Le robot qui arrive sur votre site n'a pas à parcourir toute l'arborescence de vos pages avant de pouvoir les indexer, puisque vous lui en fournissez la liste au moyen de ce fichier. Cela vous permet donc d'optimiser votre référencement naturel en conférant une visibilité à toutes les pages désirées, même si la citation d une url de page dans un sitemap ne garantit pas son indexation par le moteur! De même, les pages énumérées ne sont pas immédiatement indexées (le robot procède par étapes et il est généralement constaté que l'affichage au sein des pages de résultat de recherche se fait progressivement, par petits groupes de pages). Comment procéder? Une fois que l'arborescence de votre site est faite, et que vous commencez à publier des contenus, vous avez la possibilité de générer le sitemap de façon automatique avec e-majine depuis la version 1 de l'interface Manage : Manage > Référencement > Sitemap. N'oubliez pas de supprimer de la liste ainsi générée les URL que vous ne souhaitez pas faire connaître (rubriques invisibles par exemple). Le sitemap généré par e-majine est compressé afin d'optimiser l'espace disque : sitemap.xml.gz (qui est parfaitement décompressé par les robots). Vous devez maintenant faire connaître l'existence de l'adresse de ce plan aux principaux intéressés, à savoir les moteurs de recherche. Pour ce faire, il existe plusieurs méthodes. La plus simple est d'ajouter cette adresse au sein d'un autre fichier pouvant être également généré par e-majine, le fichier robots.txt Ce dernier faisant partie d'un protocole plus ancien et connu de tous les développeurs d'agents utilisateurs, il est demandé et lu par tous les robots lorsque ceux-ci accèdent à votre site par la racine. Depuis l'apparition du sitemap le standard a été modernisé afin que le robots.txt puisse également servir à faire connaître l'adresse du sitemap (faire d'une pierre deux coups.) 5
La déclaration se fait de la manière suivante dans votre fichier robots.txt : Plan sitemap : "emplacement_sitemap" Ce qui peut donner : Plan sitemap : http://www.medialibs.com/sitemap.xml.gz Plus d'informations sur le protocole d'exclusion de robots : http://www.robotstxt.org/ Si vous souhaitez aller plus loin et obtenir des informations des moteurs de recherche en retour, il va vous falloir vous créer un compte (gratuit) sur certains de ces moteurs. Le plus connu, Google, propose depuis 2006 un service baptisé "outils pour webmasters" qui permet de suivre l'évolution de la présence des pages de son site sur son index, ainsi que des conseils basés sur les principes du référencement naturel. De même pour le sitemap, le service susnommé de Google va vous indiquer s'il a bien été pris en compte par son robot, s'il ne comporte pas d'erreurs, et quand il a été parcouru pour la dernière fois. Et après? Soyez un minimum patients... Progressivement les pages de votre site (celles indiqués sur votre sitemap) devraient être indexées par les robots, et donc ressortir sur les pages de résultats de moteurs de recherche par rapport à leurs contenus. Au fur et à mesure de la vie de votre site, de nouvelles rubriques vont sûrement voir le jour, ainsi que de nouvelles publications de contenus. Des mises à jour du sitemap sont donc à prévoir, puisque par défaut e-majine ne peut décider pour vous ce qui doit-être référencé par les robots. «PINGer» Une fois que vous avez généré votre nouveau sitemap, il faut penser à signaler aux robots qu'il a été mis à jour, afin que ceux-ci prennent en compte les modifications (le plus rapidement possible, en sachant que vous n'avez aucune - ou très peu d'influence sur le délai ni les fréquences de passage des robots sur votre site). Pour ce faire le Manage vous propose d'envoyer une requête à Google pour qu'il soit averti que vous avez mis vos pages à jour. Cette opération s'appelle "PINGer" (prononcez "Pineguer"). Dans le cas de figure où vous avez également créé un compte sur d'autres sites de moteur, n'hésitez pas à reproduire l'opération pour leurs robots! Voici les adresses à utiliser, notez bien qu'il vous faut changer les noms de domaine indiqués (www.emajine.com) par celui de votre site! Certaines adresses doivent également être encodées. - Ask.com: http://submissions.ask.com/ping?sitemap=http://www.e-majine.com/sitemap.xml - Google: http://www.google.com/webmasters/sitemaps/ping?sitemap=http://www.emajine.com/sitemap.xml - Yahoo: http://search.yahooapis.com/siteexplorerservice/v1/updatenotification? appid=yahoodemo&url=http://www.e-majine.com/sitemap.xml 6
- Exalead : http://www.exalead.fr/search/submityoursitepage -MSN / LiveSearch : http://webmaster.live.com/ping.aspx?sitemap=http://www.emajine.com/sitemap.xml Plan de site : étape 8 Publier un plan du site qui liste toutes les pages du site, même celles qui sont cachées et ne sont pas accessibles depuis le menu géré par e-majine (utile pour les moteurs qui ne savent pas lire le sitemap). Mise à jour régulière : étape 9 Mettre à jour le site régulièrement : plus le contenu change et croît, plus les robots des moteurs de recherche vont venir visiter le site et le classer comme un site "actif" dans leur base. Importance des liens : étape 10 Faire des liens entre les différents sites faits par l'agence (cf. signature "Propulsé par e-majine") et faire une page portfolio de référence sur votre site pour y mentionner les sites réalisés. Soumission du site : étape 11 Soumettre son site auprès des moteurs de recherche (voir les principaux dans mon billet de blog sur le sitemap) et auprès des principaux sites (annuaires, sites thématiques, blogs...). Vous retrouvez toutes les informations sur le site : www.medialibs.com 7