COURS SYRRES RÉSEAUX SOCIAUX. Jean-Loup Guillaume



Documents pareils
COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION. Jean-Loup Guillaume

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche

Chaînes de Markov au lycée

Contributions à l expérimentation sur les systèmes distribués de grande taille

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Towards realistic modeling of IP-level topology dynamics

Introduction au datamining

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

MABioVis. Bio-informatique et la

Communications collectives et ordonnancement en régime permanent pour plates-formes hétérogènes

FaceBook aime les Maths!

Web Science. Master 1 IFI. Andrea G. B. Tettamanzi. Université de Nice Sophia Antipolis Département Informatique andrea.tettamanzi@unice.

Ebauche Rapport finale

INF6304 Interfaces Intelligentes

Métrologie réseaux GABI LYDIA GORGO GAEL

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Conception de Médicament

INTERNET, C'EST QUOI?

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Modélisation multi-agents - Agents réactifs

Qu est ce qu un réseau social. CNAM Séminaire de Statistiques Appliquées 13/11/2013. F.Soulié Fogelman 1. Utilisation des réseaux sociaux pour le

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)

Polytech Montpellier IG PROJET C Réseaux sociaux : recherche de composantes fortement connexes

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

TSTI 2D CH X : Exemples de lois à densité 1

Recherche et Diffusion de l Information dans les Réseaux. Philippe Robert. Le 8 avril 2014

Partie 1. La structure des réseaux sociaux

Théorie des Graphes Cours 3: Forêts et Arbres II / Modélisation

FOTO - L OMNIBUS MENSUEL DE CROP LE NOUVEAU CROP-EXPRESS

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Apprentissage Automatique

TP N 57. Déploiement et renouvellement d une constellation de satellites

Théorie des Jeux Et ses Applications

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Réseaux sociaux et recrutement : Quand, Pourquoi, Comment? présentation : Patrick Debray tél info@dmd.ch

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Les mathématiques du XXe siècle

Conception des systèmes répartis

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

Rotary et réseaux sociaux. Districts

Accédez au test ici

Resolution limit in community detection

Plan. Programmation Internet Cours 3. Organismes de standardisation

Un concept multi-centre de données traditionnel basé sur le DNS

Exemples de problèmes et d applications. INF6953 Exemples de problèmes 1

Intégration de la dimension sémantique dans les réseaux sociaux

Parallélisme et Répartition

Modèles et simulations informatiques des problèmes de coopération entre agents

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Projet ANR. Bruno Capra - OXAND. 04/06/2015 CEOS.fr - Journée de restitution (Paris) B. CAPRA

K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre Palaiseau

Annexe commune aux séries ES, L et S : boîtes et quantiles

Les apports de l informatique. Aux autres disciplines

demander pourquoi mon site n'apparaît pas sur google ou pourquoi mon site n'est pas référencé par les moteurs de recherche?

Cryptologie. Algorithmes à clé publique. Jean-Marc Robert. Génie logiciel et des TI

Un radar pour Internet

ECOLE NATIONALE SUPERIEURE DE COGNITIQUE. Paul Bui- Quang & Joachim Yerusalmi 03/01/2011

Algorithmes de Transmission et de Recherche de l Information dans les Réseaux de Communication. Philippe Robert INRIA Paris-Rocquencourt

Introduction à la théorie des files d'attente. Claude Chaudet

UFR de Mathématiques et Informatique Année 2009/2010. Réseaux Locaux TP 04 : ICMP, ARP, IP

Rétablissement d un réseau cellulaire après un désastre

Introduction au Data-Mining

FIMA, 7 juillet 2005

Situation actuelle : Sommaire d une recommandation Page 1 de 5

EXERCICE 2 : SUIVI CINETIQUE D UNE TRANSFORMATION PAR SPECTROPHOTOMETRIE (6 points)

BACCALAUREAT GENERAL MATHÉMATIQUES

Dossier justificatif des travaux de R&D déclarés au titre du CIR

Hypervision et pilotage temps réel des réseaux IP/MPLS

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Sillage Météo. Notion de sillage

UE 8 Systèmes d information de gestion Le programme

MODÈLE CROP DE CALIBRATION DES PANELS WEB

Rapport : Base de données. Anthony Larcher 1

FICHE UE Licence/Master Sciences, Technologies, Santé Mention Informatique

Introduction au maillage pour le calcul scientifique

Item 169 : Évaluation thérapeutique et niveau de preuve

1. Les types d enquêtes

Prénom : MATHÉMATIQUES. 120 minutes Compas, règle métrique, rapporteur, équerre, calculatrice non programmable

Conception de réseaux de télécommunications : optimisation et expérimentations

Pair-à-Pair: Architectures et Services

Organisation du parcours M2 IR Les unités d enseignements (UE) affichées dans la partie tronc commun sont toutes obligatoires, ainsi que le stage et

Correction du baccalauréat ES/L Métropole 20 juin 2014

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

Puissances d un nombre relatif

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Configurer le Serveur avec une adresse IP Statique (INTERFACE :FastEthernet) : et un masque

Une nouvelle approche de détection de communautés dans les réseaux sociaux

Peut-on imiter le hasard?

Dynamiques des réseaux sociaux en ligne

Antoine Morel Ingénieur Commercial DVI

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.

Mesure agnostique de la qualité des images.

COR-E : un modèle pour la simulation d agents affectifs fondé sur la théorie COR

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Atelier Transversal AT11. Activité «Fourmis» Pierre Chauvet.

Intégrer mesure, métrologie et analyse pour l étude des graphes de terrain dynamiques

Transcription:

COURS SYRRES RÉSEAUX SOCIAUX Jean-Loup Guillaume

Le cours http://jlguillaume.free.fr/www/teaching/syrres/

Exemple 1 : Expérience de Milgram Objectif faire transiter une lettre depuis les Nebraska à un agent de change de Boston Une personne initie la chaine. Transitions de la main à la main par des personnes que l on connait.

Expérience de Milgram (1967) Résultats : 44 lettres arrivent sur 160. Chemins avec 5 intermédiaires en moyenne. Remarques : Chemin interrompu Il n existe pas de chemin. Chemin de longueur x Il n existe pas de chemin de longueur <x Conclusions : Il existe des chemins courts. Les intermédiaires arrivent à les trouver sans connaissance globale du réseau.

Modélisation Objectif : formaliser l expérience de Milgram Initialement une grille (amis proches). On ajoute q voisins quelconques à chaque sommet (amis lointains).

Modélisation Un sommet connait : Sa position, celle de ses voisins, celle de la destination. Il envoie le message à son voisin le plus proche de la destination.

Modélisation Un seul lien supplémentaire pour chaque sommet u. La destination choisie avec une probabilité dépendant de sa distance à u. Dans la majorité des cas, pas de chemins courts.

Exemple 2 : Kevin Bacon Game Graphe des acteurs : Deux acteurs sont reliés s ils ont joué dans un même film. Distance entre acteurs? http://oracleofbacon.org/ Distance entre Tom Cruise et Clint Eastwood? Distance entre Mickey Mouse et Omar Sy?

Réponses (pas évidentes) Clint Eastwood et Tom Cruise? Clint Eastwood / Morgan Freeman Million dollar baby (2004) Morgan Freeman / Tom Cruise La guerre des mondes (2005) Mickey Mouse et Omar Sy? Mickey avec Leonid Kinskey Hollywood party (1934) Leonid Kinskey avec Mickey Rooney Manhattan Melodrama (1934) Mickey-Rooney/Jean-Guy Fechner Bons baisers de Hong Kong (1975) Jean-Guy Fechner / Omar Sy Le carton (2004)

Modélisation Graphe des acteurs simple à construire : http://www.imdb.com/interfaces Ensuite il ne reste qu à faire des calculs de plus courts chemins.

Circle of friends on boards.ie boards.ie Community detection: an overview 09/03/2007

Community detection: an overview Relationship between key recovery agencies after Katrina thinknola.com and orgnet.com 09/03/2007

Community detection: an overview 09/03/2007

Beaucoup d autres réseaux Réseaux d'échanges pair-à-pair Graphes d'appels téléphoniques Internet Graphes du Web Graphes d interactions entre protéines Et bien d autres (sociologie, linguistique, transport, finance, etc.) Caractéristique commune : grande taille, mais pas seulement

Objectifs «Comprendre le comportement d'entités qui interagissent par des lois gouvernant le système.» On cherche à comprendre la structure de ces graphes leur évolution les phénomènes agissant sur ces réseaux

Quelques applications Informatique : Réseaux : routage, protocoles, sécurité P2P : conception de systèmes, déviances Web : indexation, moteurs de recherche Dessin de graphes, etc. Sociologie : Diffusion d'innovations, rumeurs Identification de communautés Epidémiologie : Diffusion de virus, vaccination

Méthodologie Utilisation d outils formels Théorie des graphes Analyse statistique Modélisation probabiliste Études expérimentales Simulation Utilisation de données réelles Étudier des applications Comprendre en profondeur certains réseaux Extraction de concepts généraux

Dans ce cours Présentation du domaine et des problématiques : Métrologie, analyse, modélisation, algorithmique Détection de communautés (beaucoup) Les concepts La modularité Survol des différents algorithmes La dynamique Réputation, innovations et leaders (un peu)

Projet Construire des graphes à partir des données déjà utilisées (Jester jokes) : Utilisation de seuils pour la similarité. Autres techniques? Tester un algorithme de détection de communauté : Comparer tout ça, essayer de comprendre des choses et essayer de l expliquer.

COURS SYRRES GRAPHES DE TERRAIN PRÉSENTATION GÉNÉRALE Jean-Loup Guillaume

Les quatre axes Métrologie : Comment mesurer les réseaux réels? Analyse : A quoi ressemblent-ils? Modélisation : Peut-on créer des réseaux artificiels similaires? Algorithmique : Comment calculer des choses sur ces grands graphes?

Métrologie Pour étudier un réseau réel il faut le mesurer, mais : Qui a fait la mesure? Quelle proportion de l objet a été mesurée? Combien de temps la mesure a duré? Y-a-t il des contraintes spécifiques? Technologiques, biologiques, La mesure peut-elle être reproduite? Ces questions sont rarement abordées.

Métrologie Étude du biais introduit par l observation Que dire de l objet réel à partir de l observation? Nouveaux protocoles de mesures, etc. observation G G Évaluer la représentativité des «cartes»?

Métrologie du web Processus de mesure : Parcours en largeur depuis plusieurs sources. Réseau : orienté, non connexe, dynamique.

Métrologie du web Processus de mesure : Parcours en largeur depuis plusieurs sources. Réseau : orienté, non connexe, dynamique.

Métrologie du web Processus de mesure : Parcours en largeur depuis plusieurs sources. Réseau : orienté, non connexe, dynamique.

Métrologie de l internet Processus de mesure : Traceroute ~ (plus courts) chemins de plusieurs sources vers plusieurs destinations. Réseau : (non) orienté, pondéré (RTT, )

Métrologie de l internet Processus de mesure : Traceroute ~ (plus courts) chemins de plusieurs sources vers plusieurs destinations. Réseau : (non) orienté, pondéré (RTT, )

Métrologie de l internet Processus de mesure : Traceroute ~ (plus courts) chemins de plusieurs sources vers plusieurs destinations. Réseau : (non) orienté, pondéré (RTT, )

Métrologie des réseaux sociaux Processus de mesure : Réseaux égocentrés. Listes de diffusion, communautés, Réseau : orienté ou pas.

Métrologie des réseaux sociaux Processus de mesure : Réseaux égocentrés. Listes de diffusion, communautés, Réseau : orienté ou pas.

Métrologie des réseaux d échanges Processus de mesure : Trafic passant par un sommet. Réseau : orienté, pondéré.

Métrologie des réseaux d échanges Processus de mesure : Trafic passant par un sommet. Réseau : orienté, pondéré.

Métrologie des réseaux d échanges Processus de mesure : Trafic passant par un sommet. Réseau : orienté, pondéré.

Métrologie des réseaux d échanges Processus de mesure : Trafic passant par un sommet. Réseau : orienté, pondéré.

Les quatre axes Métrologie : Comment mesurer les réseaux réels? Analyse : A quoi ressemblent-ils? Modélisation : Peut-on créer des réseaux artificiels similaires? Algorithmique : Comment calculer des choses sur ces grands graphes?

Analyse Objectifs de l analyse (statistique) : Description (statistique). Obtenir de l information pertinente. Interprétation des résultats obtenus. Comment? Propriétés connues. Définition de propriétés (statistiques) pertinentes. Corrélations entre ces propriétés. Comparaison avec des graphes aléatoires. Observation de la croissance des graphes,

Propriétés étudiées Distance moyenne : À quelle distance les sommets sont les uns des autres?

Propriétés étudiées Distance moyenne Clustering : Les amis de mes amis / densité locale

Propriétés étudiées Distance moyenne Clustering (densité locale) Distribution des degrés (nombre de voisins) : Taille ou salaire des individus?

Propriétés étudiées Distance moyenne Clustering (densité locale) Distribution des degrés Autres propriétés : Centralité Nombre de plus courts chemins passant par un sommet, etc. Corrélations entre propriétés Degré-degré Degré-clustering Taille des cliques, cliques biparties, etc.

Propriétés communes aux GdT Faible densité Fort clustering (forte densité locale) Faible distance moyenne Distribution des degrés très hétérogène Tous les graphes ne partagent pas ces propriétés

Les quatre axes Métrologie : Comment mesurer les réseaux réels? Analyse : A quoi ressemblent-ils? Modélisation : Peut-on créer des réseaux artificiels similaires? Algorithmique : Comment calculer des choses sur ces grands graphes?

Générer des graphes réalistes Pour en faire quoi? Simuler des phénomènes (attaques, diffusion, ) Évaluer des protocoles, des algorithmes, Comprendre. Prévoir.

Tout aléatoire Créer n sommets. Ajouter m liens au hasard. Donne une distance moyenne courte mais rien de plus.

Coefficient de clustering Mélanger un graphe très rigide. Donne du clustering et une distance moyenne courte.

Distribution de degrés Attachement préférentiel (rich get richer) : Ajout de sommets un à un. Ajout de lien vers des sommets déjà connectés.

Application : robustesse Étude des phénomènes visant des sommets : Internet : pannes ou attaques sur routeurs. Réseaux sociaux : maladies, rumeurs, Échanges d e-mails : virus informatiques. Deux types d atteintes Pannes : aléatoires. Attaques : ciblées. But : Comprendre ces phénomènes pour pouvoir : Prédire. Construire des stratégies d attaque/défense.

Impact d'une panne/attaque Critères : Basés sur la distance. Tailles des composantes connexes.

Application : robustesse Pannes = suppression aléatoire. Attaque = suppression ciblée (degré). Question : qui vacciner pour limiter une épidémie?

Les quatre axes Métrologie : Comment mesurer les réseaux réels? Analyse : A quoi ressemblent-ils? Modélisation : Peut-on créer des réseaux artificiels similaires? Algorithmique : Comment calculer des choses sur ces grands graphes?

Besoin d algorithmes spécifiques? Gros problème = taille : Internet = Millions de sommets (routeurs). Facebook = 350 millions d utilisateurs actifs. Web = Google connait plus de 1000 milliards d URL distinctes (pas de pages distinctes). Les algorithmes classiques ne sont pas utilisables : Diamètre. Compter les triangles d un graphe (clustering). Sans parler des problèmes NP-complet! Utilisation d algorithmes spécifiques ou approchés : Détection de communautés.