AT41 - «Métropoles et réseaux» Une approche par la théorie des graphes
Plan Problématiques Quelques définitions Théorie des graphes: 1. Partitionnement de graphe : ex. les communautés 2. Analyse des réseaux : ex. la popularité 2
Plan Problématiques Quelques définitions Théorie des graphes: 1. Partitionnement de graphe : ex. les communautés 2. Analyse des réseaux : ex. la popularité 3
Problématique Les flux domicile-travail, un graphe à analyser d aires urbaines 2010 (sommets) ayant des liens entre elles (domicile travail 2009 Entrants + sortants) 4
Problématique À partir d une base de flux, Quelles sont les relations préférentielles? Existent ils des sous réseaux? Qui est(sont) pôle(s) d échange? La zone est elle centralisée autour d un pôle? 5
Problématique : 1ère réponse grâce à la théorie des graphes 6
Autre utilisation avec les bassins de vie Au-delà de l optimal : - Bretagne : reliée ensuite - Aquitaine également - Perpignan avec MP - Pays de la Loire Poitou Charentes - 7
Plan Problématiques Quelques définitions Théorie des graphes: 1. Partitionnement de graphe : ex. les communautés 2. Analyse des réseaux : ex. la popularité 8
Quelques définitions: Graphe et réseau On parle de réseau (origine : web) et de sa représentation symbolique le graphe. Pour nous, un réseau est représenté par une matrice communale de flux dans laquelle chaque sommet (ou nœud) est une commune, les arêtes reliant les sommets sont les flux. Un graphe est orienté si les flux de A vers B et de B vers A sont différenciés. Une partition du réseau est une décomposition en communautés (sous réseaux). 9
Quelques définitions: caractéristiques du graphe Degré C'est le nombre de liens à partir d'un sommet. À partir de cette notion, nous pouvons définir plusieurs indicateurs comme le degré de centralisation, de centralité ou d intermédiarité. 10
Quelques définitions: caractéristiques du graphe La centralité d intermédiarité (betweenness centrality) mesure l utilité d un sommet dans la transmission de l information au sein du réseau. Un sommet est d autant plus central qu il est situé sur beaucoup de plus courts chemins entre d autres paires de sommets. 11
Quelques définitions: caractéristiques du graphe La centralité d intermédiarité d un point i vis-à-vis de deux autres points j et k est sa capacité à contrôler la communication entre j et k. Elle dépend donc du nombre total de géodésiques contenant i entre j et k noté g jik et du nombre de géodésiques entre j et k g jk : CI i = n n i= 1 j= 1 g g jik jk 12
Quelques définitions : La modularité La modularité est une mesure de la qualité d'un partitionnement des nœuds d'un graphe, en communautés. Elle est basée sur l idée intuitive que les réseaux aléatoires ne possèdent pas de structure communautaire. Ainsi, elle est égale à: la somme des flux internes d une communauté - la somme des flux reliant les mêmes communes dans un modèle de graphe aléatoire ayant le même nombre de sommets et la même distribution des degrés. 13
Plan Problématiques Quelques définitions Théorie des graphes: 1. Partitionnement de graphe : ex. les communautés 2. Analyse des réseaux : ex. la popularité 14
Détection des communautés et théorie des graphes Plusieurs types d approche: - L approche classique Exemple : Clustering de données ACP, CAH - Les approches issues de la théorie des graphes - L approche séparative ou divisive L'algorithme de Girvan et Newman basé sur la centralité d'intermédiarité - L approche agglomérative ou gloutonne L'algorithme d'optimisation de la modularité proposé par Newman - L approche utilisant la marche aléatoire Markov Cluster Algorithm 15
Le partitionnement de graphe L approche divisive, on part d une communauté unique, les divisions successives devront améliorer la modularité. Cette approche supprime les arêtes de plus forte centralité d'intermédiarité de lien tant qu'il y a un gain de modularité. 16
Le partitionnement de graphe L approche divisive, on part d une communauté unique, les divisions successives devront améliorer la modularité. Cette approche supprime les arêtes de plus forte centralité d'intermédiarité de lien tant qu'il y a un gain de modularité. 17
Le partitionnement de graphe L approche divisive, on part d une communauté unique, les divisions successives devront améliorer la modularité. Cette approche supprime les arêtes de plus forte centralité d'intermédiarité de lien tant qu'il y a un gain de modularité. 18
Le partitionnement de graphe A l inverse, l approche gloutonne fusionne de manière récursive des communautés atomiques à la première étape. 19
Le partitionnement de graphe Afin de maximiser la modularité, l'algorithme glouton proposé fusionne à chaque étape les communautés permettant d'avoir la plus grande augmentation de la modularité. Une méthode heuristique permettant de réduire considérablement les temps de calcul sera privilégiée lors de l utilisation de grand graphe. 20
Le partitionnement de graphe 21
Le partitionnement de graphe 22
Le partitionnement de graphe 23
Le partitionnement de graphe 24
Le partitionnement de graphe 25
Plan Problématiques Quelques définitions Théorie des graphes: 1. Partitionnement de graphe : ex. les communautés 2. Analyse des réseaux : ex. la popularité 26
Analyse des réseaux Quel indicateur permet de définir le territoire moteur des échanges d une zone? La réponse facebook est : «Le plus populaire est celui qui a le plus d amis les plus populaires». Traduction pour les territoires, le territoire central est celui qui est connecté aux territoires les plus connectés. Quelques exemples d indicateurs, popularité, «potentiel de popularité», émissivité ou réceptivité. 27
Analyse des réseaux Degré de Centralisation Cette mesure permet de déterminer la forme du réseau (mono ou polycentrique). i= 1 ( D max D Deg Centralisation = ( n 1)( n 2) n i ) Un réseau fortement polarisé a un degré de centralisation proche de 1 à l opposé un réseau polycentrique est proche de 0. 28
Analyse des réseaux La popularité La popularité correspond au pouvoir de connectivité du territoire : il correspond à l ensemble des flux non orientés de mon territoire avec les autres territoires, pondérés par la probabilité qu un individu travaillant à l extérieur de mon territoire vienne y travailler et vice-versa. Le potentiel de popularité Cependant, la popularité occulte l «importance» des échanges (les liens indirects). Le potentiel de popularité est la probabilité chainée qu un individu travaillant à l extérieur de mon territoire vienne y travailler et vice-versa. 29
Analyse des réseaux L émissivité (Autorité) La réceptivité correspond aux connexions (liens, sans tenir compte de l importance des liens que sont les valeurs des flux) des autres territoires vers mon territoire. L autorité centralise les flux. La réceptivité (Hub) L émissivité correspond aux connexions (liens, sans tenir compte de l importance des liens que sont les valeurs des flux) de mon territoire vers les autres territoires. Le hub distribue les flux. 30
Analyse des réseaux 31
Analyse des réseaux
Analyse des réseaux
Approche de la théorie des réseaux Merci de votre attention! Contact M. Eusebio Pascal Tél. : 04 91 17 58 21 Courriel : pascal.eusebio@insee.fr Insee 18 bd Adolphe-Pinard 75675 Paris Cedex 14 www.insee.fr Informations statistiques : www.insee.fr / Contacter l Insee 09 72 72 4000 (coût d un appel local) du lundi au vendredi de 9h00 à 17h00