Objectifs Cartographie des Controverses Introduction à l exploration du Web Sébastien Heymann Identifier les acteurs sur le Web leur position dans le sujet......et si possible au cours du temps. Synthétiser les oppositions rhétoriques et argumentatives le lien arguments / acteurs. 26 mars 2013 3/58 Délivrable Moyens Fouille de documents et d identités sur le Web 15 avril : sitographie et carte acteurs / arguments 22 avril : cartographie complète et temporelle (rapport PDF 8 pages max). outils d aide à la navigation outils d aide à la collecte d informations mesure et indicateurs techniques de design de l information. 4/58 5/58
Organisation Aujourd hui C est quoi le Web? Que font les gens sur le Web? Que chercher sur le Web? Comment chercher sur le Web? C est quoi le Web? Prochaine séance C est quoi une cartographie? A quoi ça sert? Comment en faire une? ref : http ://knowyourmeme.com/photos/29441 advanced level : cartographie des réseaux. 6/58 7/58 Comparaison Internet Web Internet Réseau de machines identifiées par leurs adresses IP qui échangent des paquets IP via le protocole TCP/IP. Origines : J.C.R. Licklider (MIT), 1962 Galactic Network concept. ARPANET naît en 1969 (US DoD). 8/58 9/58
Comparaison Les débuts Internet Réseau de machines identifiées par leurs adresses IP qui échangent des paquets IP via le protocole TCP/IP. Origines : J.C.R. Licklider (MIT), 1962 Galactic Network concept. ARPANET naît en 1969 (US DoD). Web Application sur internet où des fichiers sont assemblés en pages web sur des terminaux via un navigateur web. Origines : Vannevar Bush Memex, 1945 Tim Berners-Lee (CERN) créé le 1er navigateur et la 1re page web en 1990. 10/58 11/58 Requête page web Chiffres Internet nb routes =? nb machines =? nb utilisateur 1 milliard Web nb URL uniques > 1 trillion en 2008 nb pages web = nb utilisateur =? 12/58 13/58
(Espace d )écriture Lien hypertexte <a href= URL >.. </a> standard HTML écriture hypertexte plusieurs URL possibles pour une ressource Web lien mort : erreur HTTP 404 not found ou 410 lien unique sur les blogs : le permalien raison de la citation? autorité, complémentarité, critique, satire... nature juridique? 14/58 15/58 (Espace d )écriture Espace (d écriture) standard HTML écriture hypertexte couche interactive (Javascript, Flash, HTML5) lecture et écriture faire sens et donner à agir 16/58 exploration des documents distance et profondeur de navigation indexation (Altavista, Yahoo!, Google) souscription (RSS, réseaux sociaux). 17/58
Evolution du Web Que font les gens sur le Web? ref : https ://evolutionofweb.appspot.com/ ref : Vidberg 18/58 19/58 Web 1.0 Des sites perso pour tous... distances = nb liens entre documents on se déplace dans l espace des contenus unité de sens : la page web documents statiques (sites perso, forums) temporalité lente (durée de vie d un lien : qq mois) rêve d une bibliothèque d Alexandrie (savoir partagé universel). 20/58 21/58
...et pour tous les goûts! Forums 22/58 23/58 Web 2.0 distances = nb liens entre individus on reçoit et on fait circuler des contenus via et à ses voisins fragmentation de l unité de sens et recontextualisation des contenus Une évolution ne chasse pas l autre, mais la complète! espaces participatifs dynamiques (blogs, plateformes de réseaux sociaux) temporalité rapide (durée de vie d un lien sur Twitter < 3h) l interaction est reine, la page web devient coquille vide (espace de saisie d informations, de remplissage temps réel). 24/58 25/58
Exemples de réseaux sociaux Des identités numériques Création distribuée : MySpace, YouTube, FlickR Veille partagée : Delicious, Twitter (dépend des usages dans différent pays) Mise en média de soi : Hi5, Facebook Emergence du LOL : 4chan. ref : D. Cardon Le design de la visibilité : un essai de typologie du web 2.0 26/58 27/58 L enjeu de la visibilité Modes de navigation ref : D. Cardon Le design de la visibilité : un essai de typologie du web 2.0 ref : D. Cardon Le design de la visibilité : un essai de typologie du web 2.0 28/58 29/58
Twitter Facebook 30/58 31/58 4chan Un modèle du Web ref : F.Ghitalla 32/58 33/58
Des contenus? Que chercher sur le Web? sites web, pages web, liens hypertextes éléments média (vidéo, audio, photo...) documents écrits (doc, pdf) données (accès BDD, CSV, RDF...). ref : https ://lisagoldresearch.wordpress.com/2009/04/01/my-peeps/ 34/58 35/58 Des individus? Problèmes acteurs, organisations véracité (sources douteuses ou inexistantes, rumeurs, censure et propagande, marketing) discours, argumentations, interactions sociales => traces numériques => questions éthiques. degré de visibilité ( profondeur du Web, indexation, ranking et SEO, diffusion des liens, duplication des contenus) temporalité (error 404 bookmark problem, informations périmées). 36/58 37/58
Particularités des controverses Exemple : référendum TCE, 2005 acteurs différents des autres média la société s empare des controverses de manière différentes (autres questions, arguments, références) liens avec d autres controverses (lanceurs d alerte). ref : http ://fr.linkfluence.net/insights-2-0/atlas/ 38/58 39/58 Besoins recouper les informations, multiplier les sources rechercher le contexte d énonciation prendre du recul sur ce que l on trouve. Comment chercher sur le Web? ref : https ://xkcd.com/386/ 40/58 41/58
Moteurs de recherche crawl du Web hors restrictions d accès, ne référence pas les BDD professionnelles requête booléennes (AND, OR, EXCLUDE, date d indexation) Aternatives à Google? classement par pertinence (ex. PageRank) mais impératifs commerciaux (publicité, rentabilité) cas de censures ( Tiananmen dans Google chinois) et de détournements (mots-clés achetés par l UMP en 2005). 42/58 43/58 Microsoft Bing Exalead 44/58 45/58
DuckDuckGo et les moteurs spécialisés? 46/58 47/58 Technorati (blogs) Twitter Search 48/58 49/58
LinkedIn et les moteurs de personnes? 50/58 51/58 Whozat Pipl 52/58 53/58
Le doxing Autres outils collecter les traces laissées anonymement par un individu sur le Web traces : nom, sexe, date d anniversaire, profession, age, site web perso, email, profils réseaux sociaux, ville/pays (pagesjaunes.fr), adresse IP (who-is) Digital Methods Initiative : censorship explorer, GeoIP, Issuecrawler... demoscience.org puis utiliser les moteurs de recherche pour trouver la cible sur les réseau sociaux DMI Spheres : comparer des indexations si visible publiquement -> bingo, sinon enregistrer un faux profil de femme et faire une demande d ami. :-) 54/58 55/58 Objectif pour le prochain cours prochain cours : le 8 avril sur la cartographie questions : sebastien.heymann@gephi.org Réaliser une bonne sitographie license de ce document : Creative Commons BY-NC-SA 56/58 57/58
Références Brief History of the Internet, Internet Society V. Bush As we may think, 1945 History of the Internet, Wikipedia We knew the Web was big, Google D. Boullier, F. Ghitalla, Le Web ou l utopie d un espace documentaire, 2004 F. Ghitalla, L espace du document numérique, 2000 http://www.flickr.com/photos/75843788@n08/6855404573/ Cuneiform, Wikipedia Les 5 moments de l écriture en réseau, affordance.info F. Pfaender and M. Jacomy Explorer et Appréhender le web, 2006 You just shared a link. How long will people pay attention?, Bitly, 2011 D. Cardon, Le design de la visibilité : un essai de typologie du web 2.0, 2008 M. Bernstein et al, 4chan and /b/ : An Analysis of Anonymity and Ephemerality in a Large Online Community, ICWSM 11 La bataille du non pour le TCE (2005), Linkfluence Lanceurs d alerte, Fondation Sciences Citoyennes Doxing A way of tracing anonymous people Google (moteur de recherche), Wikipedia 58/58