Resolution limit in community detection



Documents pareils
Cours de Master Recherche

Pourquoi l apprentissage?

Exemples de problèmes et d applications. INF6953 Exemples de problèmes 1

Eteindre. les. lumières MATH EN JEAN Mme BACHOC. Elèves de seconde, première et terminale scientifiques :

Représentation d un entier en base b

introduction Chapitre 5 Récursivité Exemples mathématiques Fonction factorielle ø est un arbre (vide) Images récursives

Théorie des Graphes Cours 3: Forêts et Arbres II / Modélisation

Algorithmes de recherche

Correction du baccalauréat ES/L Métropole 20 juin 2014

Nombre dérivé et tangente

Big Data et Graphes : Quelques pistes de recherche

La NP-complétude. Johanne Cohen. PRISM/CNRS, Versailles, France.

Big Data et Graphes : Quelques pistes de recherche

SEO Campus 2009 : Pagerank et optimisation

Communications collectives et ordonnancement en régime permanent pour plates-formes hétérogènes

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)

Jade. Projet Intelligence Artificielle «Devine à quoi je pense»

Chapitre V : La gestion de la mémoire. Hiérarchie de mémoires Objectifs Méthodes d'allocation Simulation de mémoire virtuelle Le mapping

Introduction à la théorie des graphes. Solutions des exercices

Théorèmes de Point Fixe et Applications 1

Peut-on imiter le hasard?

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Mise en place d'une solution libre de gestion d'entreprise. Maurice MORETTI Directeur associé

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Cours d Analyse. Fonctions de plusieurs variables

FaceBook aime les Maths!

Arbres binaires de recherche

Utilisation des tableaux sémantiques dans les logiques de description

Module Planification

Programmation linéaire

CHAPITRE 5. Stratégies Mixtes

Une nouvelle approche de détection de communautés dans les réseaux sociaux

Web Science. Master 1 IFI. Andrea G. B. Tettamanzi. Université de Nice Sophia Antipolis Département Informatique andrea.tettamanzi@unice.

Chp. 4. Minimisation d une fonction d une variable

TP3 : Manipulation et implantation de systèmes de fichiers 1

Accéder à la plateforme d assistance de la Direction Informatique de l Université Paris-Sud 11. via

La nouvelle planification de l échantillonnage

Intelligence Artificielle Planification

Deux disques dans un carré

Panorama de la cryptographie des courbes elliptiques

Notice d Utilisation du logiciel Finite Element Method Magnetics version 3.4 auteur: David Meeker

Plus courts chemins, programmation dynamique

Probabilités Loi binomiale Exercices corrigés

Sujet 4: Programmation stochastique propriétés de fonction de recours

Évaluation et implémentation des langages

Cours 1 : Qu est-ce que la programmation?

Rupture et plasticité

Travaux pratiques. Compression en codage de Huffman Organisation d un projet de programmation

Algorithmes récursifs

Analyse empirique et modélisation de la dynamique de la topologie de l Internet

Continuité d une fonction de plusieurs variables

Les structures de données. Rajae El Ouazzani

Cours de Recherche Opérationnelle IUT d Orsay. Nicolas M. THIÉRY. address: Nicolas.Thiery@u-psud.fr URL:

Les capitalistes sociaux sur Twitter : détection via des mesures de similarité

Cours de Probabilités et de Statistique

Ordonnancement. N: nains de jardin. X: peinture extérieure. E: électricité T: toit. M: murs. F: fondations CHAPTER 1

HELPDESK IMAGINLAB GUIDE UTILISATION POUR IMAGINEURS. : Guide HelpDesk pour les Imagineurs-v1.2.docx. Date :

Ordonnancement robuste et décision dans l'incertain

Apprentissage. Intelligence Artificielle NFP106 Année Plan. Apprentissage. Apprentissage

INFO-F-425 Modèles mathématiques et algorithmes pour l ordonnancement. Bernard Fortz

Exclusion Mutuelle. Arnaud Labourel Courriel : arnaud.labourel@lif.univ-mrs.fr. Université de Provence. 9 février 2011

GPA770 Microélectronique appliquée Exercices série A

Couples de variables aléatoires discrètes

Théorie des Jeux Et ses Applications

Exercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA

Déploiement générique d applications sur plates-formes hétérogènes distribuées

Application de K-means à la définition du nombre de VM optimal dans un cloud

Atelier Transversal AT11. Activité «Fourmis» Pierre Chauvet.

Les arbres binaires de recherche

Fonction inverse Fonctions homographiques

Eléments de Théorie des Graphes et Programmation Linéaire

Chap. 3: Le modèle de données entité-association (E.A.)

FIMA, 7 juillet 2005

Calcul différentiel. Chapitre Différentiabilité

Formula Negator, Outil de négation de formule.

Veille - recherche enrichissement. Veille sur les technologies et pratiques émergentes Recherche :

Chapitre VI- La validation de la composition.

Conclusions de la session 1. L informatique, une discipline à part entière! Culture, fondamentaux et usages

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

DISQUE DUR. Figure 1 Disque dur ouvert

Generic deployment of applications on heterogeneous distributed platforms

Entraînement au concours ACM-ICPC

Cours de Génie Logiciel

Programmation Par Contraintes

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Gestion mémoire et Représentation intermédiaire

Guide démonstratif CIH Mobile v2

Fondements de l informatique Logique, modèles, et calculs

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Conception et contrôle des SMA tolérants aux fautes

Francis BISSON ( ) Kenny CÔTÉ ( ) Pierre-Luc ROGER ( ) IFT702 Planification en intelligence artificielle

Chapitre 5 : Flot maximal dans un graphe

Grammaires d unification

Équations non linéaires

Initiation au trading automatique et semi-automatique avec Metatrader 4. Nicolas ALEKSY

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

BACCALAUREAT GENERAL MATHÉMATIQUES

Sécuristation du Cloud

BOURSE DE RECHERCHE QUICK : SECURITE ET HYGIENE ALIMENTAIRE

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Transcription:

Introduction Plan 2006

Introduction Plan Introduction

Introduction Plan Introduction Point de départ : un graphe et des sous-graphes. But : quantifier le fait que les sous-graphes choisis sont des modules. Modularité : compare le nombre d arcs dans les sous-graphes avec le nombre de liens d un graphe aléatoire de même taille, avec même répartition des degrés.

Introduction Plan Introduction Point de départ : un graphe et des sous-graphes. But : quantifier le fait que les sous-graphes choisis sont des modules. Modularité : compare le nombre d arcs dans les sous-graphes avec le nombre de liens d un graphe aléatoire de même taille, avec même répartition des degrés.? Problème : trouver tous les modules d un graphe maximiser la modularité?

Introduction Plan Résultats Démonstration formelle de la non équivalence. Limites de la modularité. Application à des graphes de terrain.

Introduction Plan Plan 1 Préliminaires Module Modularité 2 Résolution limite Problème Méthode 3 Exemples Graphe générique Graphes de terrain

Préliminaires Première partie I Préliminaires

Préliminaires Module Définition du module Un sous-graphe S est un module si : nombre de liens dans S degre total des noeuds dans S ( ) l 2 s L ds > 0 2L nombre de liens dans le reseau

Préliminaires Module Exemple l s = 8, d s = 18, L = 16 ( ) l 2 s L ds = 47 2L 256 > 0

Préliminaires Module Autre expression On pose l out s = al s, a 0. On obtient alors la condition suivante : l s < 4L (a + 2) 2 Cette condition est satisfaite si l s < L et a < 2. Remarque : cela dépend de L, donc de la taille du réseau.

Préliminaires Modularité Définition Rappel : S module si l ( ) 2 s L ds > 0. 2L Point de départ : graphe G et m sous-graphes de G qui forment une partition Modularité associée : Q = m s=1 ( ( ) ) l 2 s L ds 2L

Préliminaires Modularité Exemple Q = 47 128

Préliminaires Modularité Problème posé 10 cliques de taille 3 (m = 3) : Q isolées = 0, 650 Q appariées = 0, 675

Résolution limite Deuxième partie II Résolution limite

Résolution limite Problème Rappels On a vu sur un contre-exemple que trouver tous les modules d un graphe maximiser la modularité. Est-ce généralisable?

Résolution limite Problème Cas plus général (1/2) l int = a 1 l 1 = a 2 l 2 l1 out = b 1 l 1, l2 out = b 2 l 2 Cadre de travail : a 1 + b 1 < 2, a 2 + b 2 < 2, l 1 < L/4, l 2 < L/4

Résolution limite Problème Cas plus général (2/2) Deux partitions : A : M 1 et M 2 sont deux modules séparés ; B : M 1 et M 2 forment un seul module. Q = Q B Q A Q < 0 l 2 > 2La 1 (a 1 + b 1 + 2)(a 2 + b 2 + 2) Rappel : a 1 + b 1 < 2, a 2 + b 2 < 2, l 1 < L/4, l 2 < L/4

Résolution limite Problème Résultats Dans de nombreux cas, Q > 0. Risque de ne pas repérer la structure à petite échelle. Maximiser la modularité ne permet pas d obtenir toute la structure en une seule fois.

Résolution limite Méthode Amélioration de l algorithme Principe : utiliser l algorithme d optimisation de la modularité récursivement. 1 appliquer l algorithme d optimisation de la modularité ; 2 pour chaque sous-graphe obtenu, regarder si c est un module ; 3 si ce n est pas le cas, retourner au point 1 Test sur des graphes de terrain.

Résolution limite Méthode Idées Repérer rapidement lorsqu un sous-graphe est séparable en deux modules (les auteurs donnent une condition suffisante). Utiliser d autres algorithmes sur les petits sous-graphes.

Exemples Conclusion Troisième partie III Exemples

Exemples Conclusion Graphe générique Illustration Si p m, les deux petites cliques sont réunies en un seul module. Plus généralement, tendance à regrouper les petits modules.

Exemples Conclusion Graphes de terrain Résultats Réseau Après une étape (Q max ) Total (Q) Yeast 9 (0,7396) 57 (0,6770) E. Coli 27 (0,7519) 76 (0,6615) Circuit électr. 11 (0,6701) 70 (0,6401) Social 10 (0,6079) 21 (0,5316) C. elegans 4 (0,4022) 57 (0,3613)

Exemples Conclusion Conclusion Cette définition de la modularité ne convient pas pour résoudre le problème de la détection de communautés. Cela est dû aux compromis qui sont faits dans le calcul de la modularité (somme), à l hétérogénéité des partitions. Q dépend de la taille totale du réseau... modularité plutôt locale?

Exemples Conclusion Remarques Mise en évidence des problèmes posés. Trop de calculs? Étude sur les graphes de terrain très succincte.

Exemples Conclusion Merci! Des questions?