SEO Campus 2009 : Pagerank et optimisation



Documents pareils
Trends. Médias sociaux et SEO - la force du contenu

Introduction. M2206 Intégration web. Introduction. Introduction 20/01/2014

Recherche d information textuelle

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

Resolution limit in community detection

1. Pourquoi? Les avantages d un bon référencement

Recherche et Diffusion de l Information dans les Réseaux. Philippe Robert. Le 8 avril 2014

Jeudi 30 avril L art de bien référencer son site Internet

D UN BON REFERENCEMENT

Pourquoi une stratégie de sites dédiés? Laurent-Pierre GILLIARD AEC 14/06/2007 Vincent MOREAU SYSTONIC 09/06/2006

Algorithmes de Transmission et de Recherche de l Information dans les Réseaux de Communication. Philippe Robert INRIA Paris-Rocquencourt

Référencement & Positionnement sur le WEB

Evaluation et analyse de la fréquentation d un site

Kaizen Marketing Group Web Agency. Kaizen Marketing. - Stéphanie Héline-

Web Science. Master 1 IFI. Andrea G. B. Tettamanzi. Université de Nice Sophia Antipolis Département Informatique andrea.tettamanzi@unice.

Référencement Google en 2013, faisons un point!

La campagne de netlinking ou comment améliorer son indice

Le référencement naturel

Chaînes de Markov au lycée

David BEDOUET, WebSchool Orleans. Cosmina TRIFAN, WebSchool Orleans

Principes d AdWords. Quelques mots de présentation. Une audience large : les réseaux de ciblage. Réseau de recherche

Détection d utilisateurs malveillants dans les réseaux sociaux

Référencement naturel

De l Encyclopédie aux moteurs de recherche

COMMENT FONCTIONNE GOOGLE?

Big Data et Graphes : Quelques pistes de recherche

SEO & WordPress. Neil McCarthy GOODNESS CONSEIL EN WEBMARKETING & RÉFÉRENCEMENT. Bâtiment Enerpôle Technopôle Izarbel BIDART

Cours de Recherche Opérationnelle IUT d Orsay. Nicolas M. THIÉRY. address: Nicolas.Thiery@u-psud.fr URL:

Référencement naturel

Analyse des requêtes. Achat appartement. rédéric Baron Expert SEO - contact : seoseo.fr@gmail.com - - 1/8

Référencement naturel & E-tourisme. Pau 02/10/2008

Programme Type de Formation SEO

VIS MA VIE D EXPERT COMPTABLE. Comment sortir la tête de l eau?

Big Data et Graphes : Quelques pistes de recherche

Référencement de votre site Web Google et autres moteurs de recherche (4ième édition)

Netlinking : obtenir des liens de qualité pour améliorer sa visibilité - Abondance.com - Mars Les Guides Abondance

AGENCE WEB 360 acteur du web depuis 8 ans en collaboration avec ses partenaires, déploie son. offre SEO

Support Google Analytics - 1 / 22 -

Lois de probabilité. Anita Burgun

Comment rendre un site d e-commerce intelligent

Programme de la formation en référencement LYON/PARIS 2015

Réussir son référencement web

FaceBook aime les Maths!

COMMENT OPTIMISER SON RÉFÉRENCEMENT NATUREL?

LE REFERENCEMENT NATUREL D UN SITE WEB1

E-Commerce à Orthez E-Commerce : Se lancer - Générer des commandes - Se positionner : Explications et témoignages Orthez 15 mai 2008

REFERENCEMENT NATUREL


WordPress Référencement naturel (SEO) Optimiser. son référencement. Daniel Roch. Préface d Olivier Andrieu

Yves Vandeuren. Services : Conseils en Marke'ng // Digital Ges'on de projets Web Forma'on, organisa'on de conférences

N.B. Cette thèse a été financée par France Télécom Division R&D et préparée au sein de France Télécom Division R&D en collaboration avec le LRI.

4 Exemples de problèmes MapReduce incrémentaux

10 astuces pratiques pour obtenir un bon positionnement dans les moteurs de recherche

Introduction aux algorithmes MapReduce. Mathieu Dumoulin (GRAAL), 14 Février 2014

Atelier numérique Développement économique de Courbevoie

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

SOMMAIRE 1 UNE INTRODUCTION : QU EST-CE QUE GOOGLE ANALYTICS? 3 2 LES PRE-REQUIS AVANT UTILISATION 3 3 ACCEDER A VOS STATISTIQUES 3

Les sites de presse en ligne et le moteur Google

Comment évaluer et améliorer l'efficacité de mon site web? Croissance assurée. 8 mai Michel D Urso

Référencement Vendredi 4 Juillet Ile Degaby

Pourquoi l apprentissage?

Noms de domaine et référencement

Rencontre French IT Club. Présenté par Hadrien Brassens

ETRE VISIBLE SUR INTERNET. Search Engine Optimisation (SEO)

Surveillance et maintenance prédictive : évaluation de la latence de fautes. Zineb SIMEU-ABAZI Univ. Joseph Fourier, LAG)

Sommaire. Introduction. I. Notions de routage a) Technologies actuelles b) Avantages et désavantages

Du référencement naturel au social marketing. Janvier 2010 Salon e-marketing

Les capitalistes sociaux sur Twitter : détection via des mesures de similarité

Eurateach labellisé par la région et le FAFIEC. Si vous remplissez les conditions suivantes : Votre entreprise compte moins de 250 salariés

10 points clés pour bien démarrer votre projet web

DIGITAL MINDS. Chapitre 6, Le référencement naturel. 12 Clés pour Développer votre Business sur le Web WSI. All rights reserved.

Agence web en Suisse romande CH-1260 Nyon

Qu est ce que le référencement web?

Formation Découverte du Web

Livre Blanc Guide pratique pour un bon référencement Internet.

Atelier 2 : Les clés du référencement sur Google

Le cas Google : Un ensemble de Business Models. "To organize the world's information and make it universally accessible and useful"

Recherche d Information(RI): Fondements et illustration avec Apache Lucene. par Majirus

DUT GEA. Informatique D après le document de Laurent GILI / Lycée Prévert

Big Graph Data Forum Teratec 2013

Formation Communiquer et être vu sur Internet - Webcomm

Création intuitive des éléments d un paysage

«Un site non référencé est un site qui n existe pas» «Faire un site c est bien, mais s il n apparaît pas en première page, ca ne sert à rien!

Où êtes-vous positionnés?

Académie Google AdWords. Lille le 19 janvier 2012

quicksite Bienvenue à ce séminaire «Optimiser votre contenu pour Google»

Académie Google AdWords

L évolution des modes de communication, comment adapter les enquêtes en population générale? L expérience de l enquête KABP VIH/sida 2010

Le référencement de mon site

Synodiance. 10 tendances SEO & SEA 19/02/2014

WordPress Référencement naturel (SEO) Optimiser. son référencement. Daniel Roch. Préface d Olivier Andrieu

Optimisez les profits de vos sites web. Intégrez la performance à votre projet de création

demander pourquoi mon site n'apparaît pas sur google ou pourquoi mon site n'est pas référencé par les moteurs de recherche?

Transcription:

SEO Campus 2009 : Pagerank et optimisation Sylvain Peyronnet http://sylvain.berbiqui.org http://www.kriblogs.com/syp 04/02/2009 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 1 / 21

PageRank : la vision classique v1 c*pr(v1) c*pr(v4)/3 v4 v2 c*pr(v2) u c*pr(v5) v3 c*pr(v3)/2 v5 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 2 / 21

PageRank : la vision classique v1 c*pr(v1) c*pr(v4)/3 v4 v2 c*pr(v2) u c*pr(v5) v3 c*pr(v3)/2 v5 (1-c)/N 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 3 / 21

PageRank : la vision classique v1 c*pr(v1) c*pr(v4)/3 v4 v2 c*pr(v2) u c*pr(v5) v3 c*pr(v3)/2 v5 (1-c)/N Initialisation : u PR(u) = 1/N Calcul itératif : PR(u) = (1 c) N + c. v u PR(v) #liens(v) Concept classique : Mark (1988), Bray (1996), Marchiori (1997), Brin et Page (1998), Kleinberg (1999)... 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 4 / 21

PageRank : la vision classique A retenir : u 0 < PageRank(u) < 1 PageRank(u) = 1 Le PageRank est intéressant car c est une notion simple et facile à calculer Relation au Toolbar PageRank (TPR) : 0... 1 0 < PageRank < 0,8 TPR = 1 0,8 < PR < 0,96 TPR = 2 etc. 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 5 / 21

PageRank : le surfeur aléatoire Considérons le comportement suivant d un internaute : 1. Tirer une page web au hasard 2. Tirer un nombre p entre 0 et 1 3. Si p > c alors choisir une nouvelle page au hasard 4. si p < c choisir au hasard un lien de la page web et aller à la page linkée par ce lien (si pas de lien : goto 1) La probabilité que cet internaute se trouve en une page donnée à un moment donné est égale au PageRank de cette page. En conséquence : fort PageRank = forte probabilité d être visité 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 6 / 21

Maximiser le PR d une page Pourquoi maximiser le PR d une page? Un moteur de recherche = 2 tâches Pertinence (Salton, tf*idf etc.) Classement global (PageRank, filtres) 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 7 / 21

Maximiser le PR d une page Pourquoi maximiser le PR d une page? Un moteur de recherche = 2 tâches Pertinence (Salton, tf*idf etc.) Classement global (PageRank, filtres) Classement sur une requête R : Classement(R) = Pertinence(R) Classement global + - Classement global Pertinence pour R 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 8 / 21

Maximiser le PR d une page Notion de ferme de liens (spam farm) : Zoltán Gyöngyi, Hector Garcia-Molina. Link Spam Alliances. 31st International Conference on Very Large Data Bases (VLDB), 2005. Donne la structure optimale pour maximiser le PageRank d une page cible. Structure classique (non optimale) 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 9 / 21

Maximiser le PR d une page k pages dans la ferme k pages dans la ferme apport extérieur apport extérieur Structure simple PR=p PageRank multiplié par 3,6 (c=0,85) PR=q Structure optimale PR( )=p PR( )=q=3,6 * p 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 10 / 21

Maximiser le PR d une page k pages dans la ferme apport extérieur Boosting page PageRank multiplié par 3,6 (c=0,85) PR=q Structure optimale bis Accessibilité difficile! au final PR plus faible (indexation) PR( )=q=3,6*p 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 11 / 21

Maximiser le PR d une page Optimalité : 1. Toutes les pages de la ferme pointent sur la cible (et pas ailleurs) 2. Le PR détourné pointe la cible (et pas ailleurs) 3. il y a des liens de la cible vers une ou plusieurs pages de la ferme intuition : guider le surfeur aléatoire et le garder dans notre circuit. Stabilité : Structure relativement stable à la pertubation 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 12 / 21

Maximiser le PR d une page Jouer en couple, ou plus... k pages dans la ferme PageRank multiplié par 6,7 (c=0,85) k pages dans la ferme A plus : la stratégie de liens entre les cibles est importante et certaines fermes peuvent y perdre. 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 13 / 21

Maximiser le PR d une page Est-ce detectable? Detecter la présence d une ferme de liens au sein du web est un problème NP-complet. Cela signifie qu il n existe pas d algorithme efficace pour detecter exactement la structure de ferme de liens. Détecter toutes les fermes de 50 pages : 2 mois sur Roadrunner Détecter toutes les fermes de 100 pages : 100 milliards de milliards d années (Roadrunner) Des tentatives : Saito et al (2007), Bechetti et al (2008) ainsi que tous les algorithmes à base de Trust/Spam Rank. 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 14 / 21

Maximiser le PR d un site Qu est ce que le PageRank d un site? C est une notion qui n a pas de sens mathématique à l origine La croyance populaire : c est le PageRank de la page principale d un site Pour le théoricien : PageRank(site) = PageRank(pages du site) 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 15 / 21

Maximiser le PR d un site Pourquoi c est important pour le SEO? Il faut penser au pauvre surfeur aléatoire... Le PageRank c est la probabilité de passage du surfeur aléatoire, dont le comportement est celui du visiteur crétin. fort PR = forte proba de passage Le PageRank d un site est donc la probabilité de passage sur le site (toutes pages confondues) 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 16 / 21

Maximiser le PR d un site Problème très étudié 1. Monica Bianchini, Marco Gori, Franco Scarselli: Inside PageRank. ACM Trans. Internet Techn. 5(1): 92-128 (2005) 2. Konstantin Avrachenkov, Nelly Litvak, Decomposition of the Google PageRank and optimal linking strategy, 2004. 3. Konstantin Avrachenkov, Nelly Litvak, The effect of new links on Google PageRank,Stoch. Models, 22 (2) (2006) 4. Amy N. Langville, Carl D. Meyer, Deeper inside PageRank, Internet Math. 1 (3) (2004) 335 380. Mais problème réglé C. de Kerchove, L. Ninove and P. Van Dooren. Maximizing PageRank by some Outlinks. Journal of Linear Algebra and its Application, vol. 429, September 2008. 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 17 / 21

Maximiser le PR d un site cas 1 : trivial C est le cas où il n y a pas nécessairement de liens vers l extérieur. Dans ce cas on fait un graphe complet entre les pages du site et c est gagné. On peut obtenir cela en mettant tous les liens vers l extérieur en nofollow. cas 2 : difficile Chaque page doit avoir un accès à l extérieur. Cas très complexe, accès = un chemin qui mène à l extérieur. L intuition va être de faire cycler au maximum le surfeur aléatoire. 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 18 / 21

Maximiser le PR d un site Structure optimale Structure optimale (5 noeuds) 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 19 / 21

Maximiser le PR d un site Remarques : 1. La stabilité n est pas claire (non stable selon Lempel et Moran, 2005) 2. Pour minimiser la fuite de PageRank, la page de sortie doit être celle avec le plus faible PageRank (= celle avec le moins de liens entrants?). 3. Est-ce que cette structure est admissible pour un site? (je laisse les webmasters répondre) 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 20 / 21

Questions? 04/02/2009 SEO Campus 2009 : Pagerank et optimisation 21 / 21