Réseaux complexes: d Internet aux pandémies



Documents pareils
COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION. Jean-Loup Guillaume

Introduction au datamining

Annexe commune aux séries ES, L et S : boîtes et quantiles

Recherche et Diffusion de l Information dans les Réseaux. Philippe Robert. Le 8 avril 2014

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

FaceBook aime les Maths!

Chaînes de Markov au lycée

Resolution limit in community detection

Programme TechDay Romandie

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

Modélisation multi-agents - Agents réactifs

Algorithmes de Transmission et de Recherche de l Information dans les Réseaux de Communication. Philippe Robert INRIA Paris-Rocquencourt

Introduction à la métrologie

Formation GISEH Module rédacteur 7, 9 juin 5, 12 juillet 2011

Epidémiologie appliquée aux sciences vétérinaires DES DAOA DES - DEA

2.0 Interprétation des cotes d évaluation des risques relatifs aux produits

Web Science. Master 1 IFI. Andrea G. B. Tettamanzi. Université de Nice Sophia Antipolis Département Informatique andrea.tettamanzi@unice.

Journée SITG, Genève 15 octobre Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique

Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations

GENIE STATISTIQUE GESTION DES RISQUES ET INGENIERIE FINANCIERE MARKETING QUANTITATIF ET REVENUE MANAGEMENT

Atelier sur l Analyse des Réseaux Madagascar

La Chaire Accenture Strategic Business Analytics de l ESSEC

La théorie des trois systèmes (the three systems theory)

données en connaissance et en actions?

Big Data et Graphes : Quelques pistes de recherche

Conseil économique et social

Administration des ressources informatiques

Cours n 12. Technologies WAN 2nd partie

Contributions à l expérimentation sur les systèmes distribués de grande taille

Rétablissement d un réseau cellulaire après un désastre

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

SEO On-page. Avez-vous mis toutes les chances de votre côté pour le référencement de votre site?

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

Université Paris Saclay De quoi parle t-on?

Big Data et Graphes : Quelques pistes de recherche

Chapitre 02. Gestion de l'information

Traitement bas-niveau

LE MARKETING WEB ET LES RÉSEAUX SOCIAUX : LES NOUVEAUX LEVIERS DE BUSINESS PROXIMEETING AIXE SUR VIENNE

Evaluation et analyse de la fréquentation d un site

Big Data et Marketing : les competences attendues

TerrOïko : JEU en collaboration avec la SEEM

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

FICHE UE Licence/Master Sciences, Technologies, Santé Mention Informatique

AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES

Efficacité énergétique des réseaux de cœur et d accès

Régionalisation des régimes de perturbations et implications pour l aménagement dans un contexte de changement climatique

Internet haute vitesse - Guide de l utilisateur. Bienvenue. haute vitesse

Le Mastère Spécialisé Big Data de Télécom ParisTech

Gestion de la crise sanitaire grippe A

Enjeux mathématiques et Statistiques du Big Data

Sur Internet. tout se sait Sachez-le Vos données personnelles : quels sont vos droits?

Connaissez-vous vraiment les réseaux sociaux?

Apprentissage Automatique

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

Master 2. Mention : «Ecosciences, Microbiologie» Domaine : Sciences Technologies Santé Responsable : F. Menu

Qu est ce que le Cloud Computing?

ATELIER : Développer ses réseaux un atout pour votre recherche de stage ou d emploi

Environmental Research and Innovation ( ERIN )

Les Maladies Tropicales, la Société de Pathologie Exotique. et l Institut Pasteur

Recherche et veille documentaire scientifique

Plan du Travail. 2014/2015 Cours TIC - 1ère année MI 30

L utilisation du lidar terrestre en foresterie. Richard Fournier Département de géomatique appliquée

INTERNET, C'EST QUOI?

Modélisation et simulation du trafic. Christine BUISSON (LICIT) Journée Simulation dynamique du trafic routier ENPC, 9 Mars 2005

Appel à communication

MARS La mise en place d un réseau informatique facilite la communication interne d une entreprise. # #

Plan. Programmation Internet Cours 3. Organismes de standardisation

Assemblée générale Aristote

Théorie des Graphes Cours 3: Forêts et Arbres II / Modélisation

Les mathématiques du XXe siècle

L utilisation d un réseau de neurones pour optimiser la gestion d un firewall

Informatique et mathématiques

Introduction à la théorie des files d'attente. Claude Chaudet

A propos de l enseignant Introduction aux réseaux sociaux

Les données massives de Copernicus : vers un nouveau paradigme. Hervé Jeanjean Cnes

Le travail collaboratif et l'intelligence collective

LES DÉFIS DE L EXPANSION

DNSSEC. Introduction. les extensions de sécurité du DNS. Les dossiers thématiques de l AFNIC. 1 - Organisation et fonctionnement du DNS

SEO Campus 2009 : Pagerank et optimisation

1. Définition : 2. Historique de l internet :

MISE À JOUR SUR L ÉVOLUTION DE LA SITUATION CONCERNANT

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Pair-à-Pair: Architectures et Services

Nouvelles opportunités pour les données fortement interconnectées : La base de graphe Neo4j

16 septembre Lundi de l Economie l. rencement. Foix. CCI Ariège

QUELLE EST LA SITUATION ACTUELLE

«Marketing viral ou ramdam marketing» BUZZ MARKETING

MAP 553 Apprentissage statistique

Emergence du Big Data Exemple : Linked Open Data

Jeudi 16 octobre 2014

Réussir. son. référencement. web. Olivier Andrieu. Groupe Eyrolles, 2008, ISBN :

Direction des bibliothèques. Sondage Ithaka S+R. Questionnaire français Université de Montréal

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Qu est-ce qu une probabilité?

Chapitre 5 : Flot maximal dans un graphe

L assurance en ligne au cœur d une stratégie multi-canal réussie. Analyse et retour d expérience CNIA SAADA 18/04/2013

BIG DATA et DONNéES SEO

Une meilleure approche de la protection virale multiniveau

BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS

Traits fonctionnels : concepts et caractérisation exemples des prairies Marie-Laure Navas, Eric Garnier, Cyrille Violle, Equipe ECOPAR

Transcription:

Réseaux complexes: d Internet aux pandémies Marc Barthelemy CEA, Institut de Physique Théorique, Saclay, France EHESS, Centre d Analyse et de Mathématiques sociales, Paris, France marc.barthelemy@cea.fr www.quanturb.com

Programme Les (grands) réseaux complexes Les réseaux sont partout Comment caracteriser les réseaux Petit-mondes Réseaux sans-échelle: 2 grandes classes Que se passe t il sur les réseaux? Propagation d épidémies Comment fonctionne Google

Qu est-ce qu un réseau? Réseau=graphe: ensemble de noeuds connectés entre eux par des liens - représentation très abstraite et très générale - utile pour décrire de nombreux systèmes - les liens peuvent avoir une direction (réseaux dirigés) ou un poids (réseaux valués ou pesés)

Graphes et réseaux: un peu d histoire Théorie des graphes (7 ponts de Koenigsberg, Euler 1707-1783) Jusqu au 20 ème siècle: mathématiciens et ingénieurs, sociologues A partir de 1999, les physiciens entrent en scene: En 1999: Watts-Strogatz (petit-mondes) En 2000: Barabasi-Albert (réseaux sans-échelles) Depuis: effort interdisciplinaire, applications dans de nombreux domaines: Sociologie Epidemiologie Sciences de la communication Urbanisme.

Réseaux, physique et emergence La plupart des réseaux intéressants sont: Complexes Très grands - Outils statistiques nécessaire - Emergence de propriétés à grande échelle => Importance de la physique statistique

Ubiquité des réseaux Ecosystèmes Technologie de l information Biologie Réseaux complexes Urbanisme Epidemiologie Réseaux de transport

Réseaux sociaux Support de beaucoup de processus dynamiques: Propagation de maladies infectieuses Propagation de rumeurs Formation d opinions Phénomènes coopératifs On n a pu obtenir que très recemment des informations quantitatives sur ces réseaux

Réseaux sociaux Noeuds: individus Liens: amis Réseau facebook (réseau valué inter-villes)

Réseau des acteurs N = 212,250 acteurs k = 28.78 Noeuds: acteurs Liens: dans le meme casting http://www.cs.virginia.edu/oracle/star_links.html John Carradine Distance? The Sentinel (1977) The story of Mankind (1957) Ava Gardner Groucho Marx distance(ava, Groucho)=2

Réseaux et épidemiologie Flirt au lycée www.umich.edu/~mejn Noeuds: filles et garcons Liens: flirt

Technologie de l information Importance de l Internet et du web Congestion Propagation de virus informatiques Phénomènes sociaux (communautés, propagation de rumeurs, etc.).

Internet: réseau physique Noeuds = serveurs, routeurs, Liens = connexions physiques (cables) Image: www.energie-services.org

Cartographier Internet croit et évolue continuellement hétérogénéité intrinsèque auto-organisation Propriétés et topologie largement inconnues Beaucoup de projets de cartes (topologie et performances): CAIDA, NLANR, RIPE,

Internet Visualisation à grande échelle Noeuds: routeurs, serveurs, ordinateurs Liens: cables

Carte de l Internet Luminosit=degré

WWW: World Wide Web Noeuds: documents et sites Liens: hyperliens (URL) Réseau virtuel permettant de trouver et de partager des informations ROBOT: collecte toutes les URL trouvées dans un document et les suit recursivement Plusieurs milliards de documents

Réseau virtuel permettant de trouver et de partager des informations Plusieurs milliards de documents Courbe:http://www.webdevelopersnotes.com/

Réseaux en biologie Extraire de l information utile a partir de la masse croissante de données (génome, etc.) Au niveau des espèces: stabilité des ecosystèmes, biodiversité,

Réseaux trophiques (food webs) Noeuds: especes Liens: se nourrit de N. Martinez

Réseau neuronal Noeuds: neurones Liens: axones

Réseaux de transport Transport d énergie, de biens et d individus - congestion - optimisation - propagation d épidemies - formation des villes (economie spatiale)

Réseaux de transport

Réseaux des routes Noeuds: intersections Liens: segments de route Evolution de ce réseau -> evolution des villes Barthelemy et al, Nature Scientific Reports (2013)

Comment caractériser un grand graphe? 1. Distance moyenne 2. Distribution des degrés

Caractérisation des grands graphes Est necessairement statistique Sert à modéliser Sert à comprendre les processus dynamiques sur ces réseaux

Plus court chemin sur un graphe Le plus court chemin entre i et j: chemin avec un nombre minimum de liens j distance i Diamètre d un graphe: Plus court chemin moyen: Comment varie avec le nombre de noeuds N?

Réseaux sociaux: l experience de Milgram (1967) Milgram, Psych Today 2, 60 (1967) Dodds et al., Science 301, 827 (2003)

Les petit-mondes: Milgram (1967) Plus court chemin moyen aux USA: Six degrees of separation

Les petit-mondes: Milgram (1967) Plus généralement: = Petit-monde (Small-World) Cette propriété s avère vraie pour de nombreux réseaux Exemple: Si N=1million - petit-monde: - réseau regulier: Comportement de avec N permet de decrire le réseau

Les petit-mondes: Milgram (1967) Watts-Strogatz (1998) Importance des liens à longue portée

Comment caractériser un grand graphe? 1. Distance moyenne 2. Distribution des degrés

Degré d un noeud Combien d amis avez-vous? k>>1: Hubs

Caractérisation statistique Liste des degrés k 1,k 2,,k N Pas très utile! Degré moyen <k> Pas suffisant! Histogramme: N k = nombre de noeuds de degré k Distribution: P(k)=N k /N=probabilité qu un noeud choisi au hasard a un degré égal à k La queue de la distribution (k très grand) est importante: elle nous renseigne sur l abondance de hubs:

2 grandes familles de grands réseaux P(k) pour k grand (abondance des hubs): 1er cas: P(k>>1) est très petit : - les fluctuations de degré sont faibles - tous les noeuds ont un degré pas trop éloigné du degré moyen 2nd cas: P(k) décroit lentement pour k grand: réseaux sans-échelle Ces réseaux: - possèdent donc une grande diversité de noeuds - les fluctuations sont énormes; la moyenne n a pas de sens - plusieurs échelles - résultent de phénomènes auto-organisés - évoluent constamment - résistent aux attaques et peuvent donc etre qualifié de complexes

Les réseaux sans-échelle sont partout! Jusqu en 1999 on pensait que les réseaux étaient à faible fluctuation de degré Internet, WWW, Acteurs, réseaux sociaux, citations, appels télephoniques, etc. sont des réseaux sanséchelle!

Applications/illustrations 1. Google 2. Propagation d épidémies 3. Propagation de pandémies

Google (principe) Le web est une vaste mer d informations: il faut des moteurs de recherche Pour une thématique donnée (un mot-clé) on veut classer les sites selon leur pertinence Les anciens moteurs classaient les sites selon leur densité de mot-clés Larry Page et Sergey Brin ont proposé une autre classification basée sur la topologie du web: PageRank mesure le nombre de liens entrant sur un site Un lien venant d un site important compte plus

Propagation d épidémie dans un réseau de contact - noeuds: individus - lien: possibilité de transmettre un virus

Réseaux et épidémiologie High School dating www.umich.edu/~mejn Noeuds: filles et garçons Liens: flirt

Le réseau des contacts sexuels Liljeros et al., Nature (2001) De nombreux réseaux de contact sont sans-échelle!

Réseaux de contact sans-échelle: conséquences (mauvaises nouvelles) D autant plus facile que le réseau est hétérogène:une maladie meme faiblement contagieuse peut se propager D autant plus rapide que le réseau est hétérogène Cascade de propagation: graine hubs intermédiaires petits degrés

Réseau de contact sans-échelle: quelle stratégie de vaccination? Stratégie uniforme Il faut vacciner une très grande proportion d individus pour etre efficace Il faut trouver les hubs! Vaccination des connaissances : Par definition un hub a beaucoup de connexions (i) prendre une personne au hasard (ii) lui demander le nom d une connaissance (iii) vacciner cette tierce personne (!)

Propagation de pandémies Autre échelle: - noeuds: zones urbaines - liens: existence de vols directs

Epidemiologie: passé et présent Mouvements humains et propagation de maladies infectieuses Peste noire (modèle de diffusion spatiale) Nov. 2002 Mar. 2003 Maintenant: Importance des réseaux

Réseau mondial des aéroports Noeuds: aéroports Liens: vols directs - Noeuds: 3863 aéroports - Liens: 18807 connexions - Poids w ji =w ij : # de fauteuils passagers C est un réseau sans-échelle avec différents niveaux d hétérogénéités: (i) degrés, (ii) populations, (iii) nombre de passagers

Modèle de metapopulation Chaque noeud: zone urbaine avec une structure interne Liens: transport/trafic A l échelle mondiale, on considère le réseau des aéroports City a City i City j

Restrictions de voyage Colizza, Barrat, Barthelemy, Valleron, Vespignani. PLoS Medicine (2007)

Conclusions et perspectives Les grands réseaux se classent en deux grandes familles 1.Les réseaux avec faible fluctuations de degré 2. Les réseaux à forte fluctuation: les réseaux sans-échelle Les réseaux sans-échelle sont courants Pour ces réseaux il y a beaucoup de hubs. Leur présence impacte les processus dynamiques sur ces réseaux (epidémies, moteur de recherche etc)-les différences entre les deux familles sont qualitatives.

Merci pour votre attention. marc.barthelemy@cea.fr www.quanturb.com