Introduction Plan 2006
Introduction Plan Introduction
Introduction Plan Introduction Point de départ : un graphe et des sous-graphes. But : quantifier le fait que les sous-graphes choisis sont des modules. Modularité : compare le nombre d arcs dans les sous-graphes avec le nombre de liens d un graphe aléatoire de même taille, avec même répartition des degrés.
Introduction Plan Introduction Point de départ : un graphe et des sous-graphes. But : quantifier le fait que les sous-graphes choisis sont des modules. Modularité : compare le nombre d arcs dans les sous-graphes avec le nombre de liens d un graphe aléatoire de même taille, avec même répartition des degrés.? Problème : trouver tous les modules d un graphe maximiser la modularité?
Introduction Plan Résultats Démonstration formelle de la non équivalence. Limites de la modularité. Application à des graphes de terrain.
Introduction Plan Plan 1 Préliminaires Module Modularité 2 Résolution limite Problème Méthode 3 Exemples Graphe générique Graphes de terrain
Préliminaires Première partie I Préliminaires
Préliminaires Module Définition du module Un sous-graphe S est un module si : nombre de liens dans S degre total des noeuds dans S ( ) l 2 s L ds > 0 2L nombre de liens dans le reseau
Préliminaires Module Exemple l s = 8, d s = 18, L = 16 ( ) l 2 s L ds = 47 2L 256 > 0
Préliminaires Module Autre expression On pose l out s = al s, a 0. On obtient alors la condition suivante : l s < 4L (a + 2) 2 Cette condition est satisfaite si l s < L et a < 2. Remarque : cela dépend de L, donc de la taille du réseau.
Préliminaires Modularité Définition Rappel : S module si l ( ) 2 s L ds > 0. 2L Point de départ : graphe G et m sous-graphes de G qui forment une partition Modularité associée : Q = m s=1 ( ( ) ) l 2 s L ds 2L
Préliminaires Modularité Exemple Q = 47 128
Préliminaires Modularité Problème posé 10 cliques de taille 3 (m = 3) : Q isolées = 0, 650 Q appariées = 0, 675
Résolution limite Deuxième partie II Résolution limite
Résolution limite Problème Rappels On a vu sur un contre-exemple que trouver tous les modules d un graphe maximiser la modularité. Est-ce généralisable?
Résolution limite Problème Cas plus général (1/2) l int = a 1 l 1 = a 2 l 2 l1 out = b 1 l 1, l2 out = b 2 l 2 Cadre de travail : a 1 + b 1 < 2, a 2 + b 2 < 2, l 1 < L/4, l 2 < L/4
Résolution limite Problème Cas plus général (2/2) Deux partitions : A : M 1 et M 2 sont deux modules séparés ; B : M 1 et M 2 forment un seul module. Q = Q B Q A Q < 0 l 2 > 2La 1 (a 1 + b 1 + 2)(a 2 + b 2 + 2) Rappel : a 1 + b 1 < 2, a 2 + b 2 < 2, l 1 < L/4, l 2 < L/4
Résolution limite Problème Résultats Dans de nombreux cas, Q > 0. Risque de ne pas repérer la structure à petite échelle. Maximiser la modularité ne permet pas d obtenir toute la structure en une seule fois.
Résolution limite Méthode Amélioration de l algorithme Principe : utiliser l algorithme d optimisation de la modularité récursivement. 1 appliquer l algorithme d optimisation de la modularité ; 2 pour chaque sous-graphe obtenu, regarder si c est un module ; 3 si ce n est pas le cas, retourner au point 1 Test sur des graphes de terrain.
Résolution limite Méthode Idées Repérer rapidement lorsqu un sous-graphe est séparable en deux modules (les auteurs donnent une condition suffisante). Utiliser d autres algorithmes sur les petits sous-graphes.
Exemples Conclusion Troisième partie III Exemples
Exemples Conclusion Graphe générique Illustration Si p m, les deux petites cliques sont réunies en un seul module. Plus généralement, tendance à regrouper les petits modules.
Exemples Conclusion Graphes de terrain Résultats Réseau Après une étape (Q max ) Total (Q) Yeast 9 (0,7396) 57 (0,6770) E. Coli 27 (0,7519) 76 (0,6615) Circuit électr. 11 (0,6701) 70 (0,6401) Social 10 (0,6079) 21 (0,5316) C. elegans 4 (0,4022) 57 (0,3613)
Exemples Conclusion Conclusion Cette définition de la modularité ne convient pas pour résoudre le problème de la détection de communautés. Cela est dû aux compromis qui sont faits dans le calcul de la modularité (somme), à l hétérogénéité des partitions. Q dépend de la taille totale du réseau... modularité plutôt locale?
Exemples Conclusion Remarques Mise en évidence des problèmes posés. Trop de calculs? Étude sur les graphes de terrain très succincte.
Exemples Conclusion Merci! Des questions?