Traverses minimales d un hypergraphe :



Documents pareils
La NP-complétude. Johanne Cohen. PRISM/CNRS, Versailles, France.

Théorie des Graphes Cours 3: Forêts et Arbres II / Modélisation

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Programmation linéaire

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)

Chapitre 5 : Flot maximal dans un graphe

ALGORITHMIQUE II NOTION DE COMPLEXITE. SMI AlgoII

Exemples de problèmes et d applications. INF6953 Exemples de problèmes 1

Cours de Master Recherche

Communications collectives et ordonnancement en régime permanent pour plates-formes hétérogènes

Chap 4. La fonction exponentielle Terminale S. Lemme : Si est une fonction dérivable sur R telle que : = et 0! = 1 alors ne s annule pas sur R.

Cours Optimisation Partie Optimisation Combinatoire. Année scolaire Gérard Verfaillie ONERA/DCSD/CD, Toulouse

Big Data et Graphes : Quelques pistes de recherche

Ordonnancement. N: nains de jardin. X: peinture extérieure. E: électricité T: toit. M: murs. F: fondations CHAPTER 1

Big Data et Graphes : Quelques pistes de recherche

Programmation linéaire

Définitions. Numéro à préciser. (Durée : )

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Intégration et probabilités TD1 Espaces mesurés

Fondements de l informatique Logique, modèles, et calculs

Exercice 1 Trouver l équation du plan tangent pour chaque surface ci-dessous, au point (x 0,y 0,z 0 ) donné :

Annexe 6. Notions d ordonnancement.

Bases de données Cours 5 : Base de données déductives

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Problèmes de Mathématiques Filtres et ultrafiltres

FIMA, 7 juillet 2005

Plus courts chemins, programmation dynamique

Programmation Par Contraintes

Une introduction aux codes correcteurs quantiques

LES MÉTHODES DE POINT INTÉRIEUR 1

Intégration et probabilités TD1 Espaces mesurés Corrigé

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Chaînes de Markov au lycée


Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Chapitre 7. Récurrences

Année 2014/ er septembre Version de Anca Muscholl, issue du poly de Marc Zeitoun. 1/143

Baccalauréat ES Amérique du Nord 4 juin 2008

ARBRES BINAIRES DE RECHERCHE

Représentation des Nombres

Optimisation Discrète

Géométrie discrète Chapitre V

Algorithmes de recherche d itinéraires en transport multimodal

Nombres premiers. Comment reconnaître un nombre premier? Mais...

Jean-Philippe Préaux

Premier ordre Expression de la fonction de transfert : H(p) = K

Relation d ordre. Manipulation des relations d ordre. Lycée Pierre de Fermat 2012/2013 Feuille d exercices

BACCALAUREAT GENERAL MATHÉMATIQUES

MIS 102 Initiation à l Informatique

Quelques tests de primalité

Contradicting Beliefs and Communication. J.-M. Tallon, J.-C. Vergnaud, & S. Zamir CNRS-EUREQua

FONDEMENTS MATHÉMATIQUES 12 E ANNÉE. Mathématiques financières

Audition pour le poste de Maître de conférence INSA Lyon distributed Robotics avec aectation au CITI. Guillaume Lozenguez.

Cours 1 : Qu est-ce que la programmation?

Simulation de variables aléatoires

Complexité. Licence Informatique - Semestre 2 - Algorithmique et Programmation

Algorithmique, graphes et programmation dynamique Notes de Cours Rapport de Travaux Pratiques. Laurent Canet

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION. Jean-Loup Guillaume

Chapitre VI - Méthodes de factorisation

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

Visualisation en Fouille de Données

Resolution limit in community detection

nos graphiques font leur rentrée!

Programme de la classe de première année MPSI

Foire aux questions (FAQ)

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

INF 232: Langages et Automates. Travaux Dirigés. Université Joseph Fourier, Université Grenoble 1 Licence Sciences et Technologies

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

Les apports de l informatique. Aux autres disciplines

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Programmation linéaire et Optimisation. Didier Smets

Cours des Méthodes de Résolution Exactes Heuristiques et Métaheuristiques

Processus aléatoires avec application en finance

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

LES TYPES DE DONNÉES DU LANGAGE PASCAL

La mesure de Lebesgue sur la droite réelle

Model checking temporisé

Calcul fonctionnel holomorphe dans les algèbres de Banach

Mesure agnostique de la qualité des images.

Équations non linéaires

Trouver un vecteur le plus court dans un réseau euclidien

COURS EULER: PROGRAMME DE LA PREMIÈRE ANNÉE

Eteindre. les. lumières MATH EN JEAN Mme BACHOC. Elèves de seconde, première et terminale scientifiques :

Approximation diophantienne uniforme et dimension de Hausdorff

Rétablissement d un réseau cellulaire après un désastre

Application de K-means à la définition du nombre de VM optimal dans un cloud

U.F.R. Sciences Fondamentales et Appliquées. pour obtenir. le grade de Docteur en Sciences. Spécialité : informatique

Théorie et codage de l information

CHAPITRE I INTRODUCTION

enquête pour les fautes sur le fond, ce qui est graves pour une encyclopédie.

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Moments des variables aléatoires réelles

Circuits RL et RC. Chapitre Inductance

Parallélisme et Répartition

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

Cryptographie et fonctions à sens unique

Transcription:

Traverses minimales d un hypergraphe : Applications et Analyse Céline Hébert Alain Bretto Loïck Lhote GREYC, Université de Caen Basse-Normandie ALEA 2007, Marseille ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 1 / 19

Hypergraphe Hypergraphe H = (V, E) où V est l ensemble des sommets et E 2 V est l ensemble des hyperarêtes h 1 s 1 s 2 s 3 s 4 s 5 s 6 s 7 h 3 h 2 h 2 0 1 1 1 1 0 0 s 1 s 2 s 3 s 4 s 5 s 6 s 7 h 1 1 1 1 0 0 0 0 h 3 0 0 0 0 1 1 1 Les hypergraphes généralisent les graphes ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 2 / 19

Traverses minimales Traverse = ensemble de sommets qui intersecte toutes les hyperarêtes Traverse minimale= traverse minimale au sens de l inclusion h 1 s 1 s 2 s 3 s 4 h 2 s 5 s 6 s 7 h 3 Exemples : {s 1, s 7 } n est pas une traverse {s 1, s 3, s 5 } est une traverse non-minimale {s 1, s 5 } est une traverse minimale Problèmes : Etant donné un hypergraphe H, peut-on générer toutes ses traverses minimales T (H)? Si oui, comment et à quel coût? ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 3 / 19

Applications ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 4 / 19

Application en Intelligence Artificielle Contexte : ajouter une nouvelle connaissance p à un base de connaissances B premier cas : p n est pas en contradiction avec B on ajoute p à B deuxième cas : p est en contradiction avec B on enlève un ensemble R B de connaissances tel que p ne peut plus être inférée de B\R Hébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 5 / 19

Application en Intelligence Artificielle Contexte : ajouter une nouvelle connaissance p à un base de connaissances B premier cas : p n est pas en contradiction avec B on ajoute p à B deuxième cas : p est en contradiction avec B on enlève un ensemble R B de connaissances tel que p ne peut plus être inférée de B\R B B 1 B 2 B 3 Propriété 1. au moins une connaisance de chaque ensemble B i doit être supprimée Propriété 2. on veut faire le minimum de changements Hébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 5 / 19

Application en Logique Problème MSAT. Etant donnée une CNF F = C 1... C p telle que toutes les clauses sont soit positives, soit négatives. F est-elle satisfaisable? C est un problème NP-complet. Exemple sur les variables X = {x 1, x 2, x 3, x 4 } : x 1 (x 2 x 4 ) ( x 2 x 4 ) x 3 ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 6 / 19

Application en Logique Problème MSAT. Etant donnée une CNF F = C 1... C p telle que toutes les clauses sont soit positives, soit négatives. F est-elle satisfaisable? C est un problème NP-complet. Exemple sur les variables X = {x 1, x 2, x 3, x 4 } : x 1 (x 2 x 4 ) ( x 2 x 4 ) x 3 On définit deux hypergraphes H + = (X, E + ) et H = (X, E ) avec E + = {{x 1 }, {x 2, x 4 }}, E = {{x 2, x 4 }, {x 3 }} Pour deux hypergraphes H et H, on écrit H H si toute hyperarête de H contient une hyperarête de H : e E, e E t.q. e e. Hébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 6 / 19

Application en Logique Problème MSAT. Etant donnée une CNF F = C 1... C p telle que toutes les clauses sont soit positives, soit négatives. F est-elle satisfaisable? C est un problème NP-complet. Exemple sur les variables X = {x 1, x 2, x 3, x 4 } : x 1 (x 2 x 4 ) ( x 2 x 4 ) x 3 On définit deux hypergraphes H + = (X, E + ) et H = (X, E ) avec E + = {{x 1 }, {x 2, x 4 }}, E = {{x 2, x 4 }, {x 3 }} Pour deux hypergraphes H et H, on écrit H H si toute hyperarête de H contient une hyperarête de H : e E, e E t.q. e e. Propriété : Une instance F de MSAT n est pas satisfaisable ssi T (H + ) H Exemple : T (H + ) = {{x 1, x 2 }, {x 1, x 4 }} H Hébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 6 / 19

Application en Fouille de données s 1 s 2 s 3 s 4 s 5 s 6 s 7 1 1 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 1 1 1 Motif fréquent = ensemble de colonnes qui sont présentes en même temps dans plusieurs lignes. Exemple {s 1, s 4 } n est pas un motif fréquent {s 2, s 3 } est un motif fréquent ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 7 / 19

Application en Fouille de données s 1 s 2 s 3 s 4 s 5 s 6 s 7 1 1 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 1 1 1 Motif fréquent = ensemble de colonnes qui sont présentes en même temps dans plusieurs lignes. Exemple {s 1, s 4 } n est pas un motif fréquent {s 2, s 3 } est un motif fréquent Bordure négative = ensemble des motifs non-fréquents dont tous les sous-motifs sont fréquents. Exemple {s 1, s 4 } est un motif de la bordure négative {s 4, s 5, s 6 } n est pas dans la bordure négative car {s 4, s 6 } n est pas un motif fréquent ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 7 / 19

Treillis des motifs s1 s2 s3 s4 s5 s6 s7 s1s2 s6s7 Intérêts de la bordure négative : représentation condensée des motifs fréquents Complexité algorithmes par niveaux Nb de motifs fréquents + taille de la bordure négative ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 8 / 19

Treillis des motifs Motifs fréquents Motifs non fréquents Bordure positive Bordure négative Intérêts de la bordure négative : représentation condensée des motifs fréquents Complexité algorithmes par niveaux Nb de motifs fréquents + taille de la bordure négative ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 8 / 19

Treillis des motifs Motifs fréquents Motifs non fréquents Bordure positive Bordure négative Intérêts de la bordure négative : représentation condensée des motifs fréquents Complexité algorithmes par niveaux Nb de motifs fréquents + taille de la bordure négative ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 8 / 19

Bordure négative et traverses minimales Base s 1 s 2 s 3 s 4 s 5 s 6 s 7 1 1 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 1 1 1 T (H) est en bijection avec la bordure négative > < Base opposée s 1 s 2 s 3 s 4 s 5 s 6 s 7 0 0 0 1 1 1 1 1 0 0 0 0 1 1 1 1 1 1 0 0 0 = Hypergraphe s 1 s 2 s 3 s 4 s 5 s 6 s 7 0 0 0 1 1 1 1 1 0 0 0 0 1 1 1 1 1 1 0 0 0 Hébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 9 / 19

Analyse en moyenne ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 10 / 19

Nombre de traverses minimales Difficulté théorique s 1 s 3 s 2n 1 s 2 s 4 s 2n s 1 s 3 s n T (H) = 2 n T (H) = 1 Taille de la plus grande traverse s 1 s 3 s n s1 s 3 s n max = n max = 1 Bonne notion de complexité : fait intervenir la taille de la sortie Question ouverte : générer les traverses minimales est-il un problème de complexité polynomiale en la taille de la sortie (output-polynomial)? ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 11 / 19

Nombre de traverses minimales Difficulté théorique s 1 s 3 s 2n 1 s 2 s 4 s 2n s 1 s 3 s n T (H) = 2 n T (H) = 1 Taille de la plus grande traverse s 1 s 3 s n s1 s 3 s n max = n max = 1 Bonne notion de complexité : fait intervenir la taille de la sortie Question ouverte : générer les traverses minimales est-il un problème de complexité polynomiale en la taille de la sortie (output-polynomial)? Hébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 11 / 19

Algorithmes Fredman et Khachiyan (Dual, 1996) pour étudier la complexité théorique du problème de dualisation d une DNF complexité : O(T log T ) si T est la taille combinée de l entrée et de la sortie C. Hébert et A. Bretto (MT-Miner, 2005) algorithme par niveaux utilise des règles d élagages Règle 1 : tout sur-ensemble d une traverse ne peut être une traverse minimale. Règle 2 : si un ensemble de sommets E contient un sous-ensemble qui intersecte le même nombre d hyperarêtes, alors E et tout ses sur-ensembles ne peuvent être des traverses minimales. complexité : O(T 2 max ) avec T la taille combinée de l entrée et de la sortie et max la taille de la plus grande traverse minimale Question : quel est le meilleur algorithme? Hébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 12 / 19

Algorithmes Fredman et Khachiyan (Dual, 1996) pour étudier la complexité théorique du problème de dualisation d une DNF complexité : O(T log T ) si T est la taille combinée de l entrée et de la sortie C. Hébert et A. Bretto (MT-Miner, 2005) algorithme par niveaux utilise des règles d élagages Règle 1 : tout sur-ensemble d une traverse ne peut être une traverse minimale. Règle 2 : si un ensemble de sommets E contient un sous-ensemble qui intersecte le même nombre d hyperarêtes, alors E et tout ses sur-ensembles ne peuvent être des traverses minimales. complexité : O(T 2 max ) avec T la taille combinée de l entrée et de la sortie et max la taille de la plus grande traverse minimale Question : quel est le meilleur algorithme? Hébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 12 / 19

Expériences Modèle aléatoire de Erdös-Rényi : nombre de sommets : 50 nombre d hyperarêtes : 1000 probabilité d appartenir à une hyperarête : p p 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 Dual 326 fail fail fail fail fail fail fail 59 MT-Miner 0.25 4 48 530 fail fail fail fail fail T (H) 26939 339372 2634205 16237137???? 4396 max 3 5 7 8????? Modèle aléatoire pour les analyses : nombre de sommets : n nombre d hyperarêtes : m = α n, α R + probabilité d appartenir à une hyperarête : p Question : est-ce un bon modèle? Hébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 13 / 19

Expériences Modèle aléatoire de Erdös-Rényi : nombre de sommets : 50 nombre d hyperarêtes : 1000 probabilité d appartenir à une hyperarête : p p 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 Dual 326 fail fail fail fail fail fail fail 59 MT-Miner 0.25 4 48 530 fail fail fail fail fail T (H) 26939 339372 2634205 16237137???? 4396 max 3 5 7 8????? Modèle aléatoire pour les analyses : nombre de sommets : n nombre d hyperarêtes : m = α n, α R + probabilité d appartenir à une hyperarête : p Question : est-ce un bon modèle? Hébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 13 / 19

Première formule s 1 s 2 s j k 1 1 que des 0 k 2 1 0 ou 1 k j que des 0 1 au moins deux 1 par ligne Nombre moyen de traverses minimales de longueur j ( ) m n ( n N j = j k 1,..., k j k 1 +... + k j = j k i 1 ) (pq j 1 ) k1+...+k j (1 q j jpq j 1 ) n (k1+...+k j ) ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 14 / 19

Formule intégrale On peut écrire Lemme F (X, Y ) = N j = ( ) m F (pq j 1, 1 q j jpq j 1 ) avec j ( ) n X k1+...+k j Y n (k1+...+k j ) k 1 +... + k j = j k i 1 k 1,..., k j La fonction F vérifie la formule intégrale n! F (X, Y ) = (Y + t 1 +... + t j ) n j dt 1... dt j (n j)! [0,X ] j ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 15 / 19

E[ T (H) ] = Nombre moyen de traverses minimales m j=1 ( ) m n! (1 q j t 1... t j ) n j dt 1... dt j j (n j)! [0,pq j 1 ] j On sépare la somme en deux parties : j log q < 0.75 log n et j log q 0.75 log n Théorème Le nombre moyen de traverses minimales dans un hypergraphe à m sommets, n hyperarêtes et sous le modèle d Erdös et Rényi de paramètre p = 1 q est asymptotiquement ( ) m E[ T (H) ] w j0 + w j0+1 avec w j = (1 e npqj 1 ) j. j et j 0 = 1 (log n + log log n log log log n + O(1)) log q Plus simplement log n/ log E[ T (H) ] = O (n q ) ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 16 / 19

Taille moyenne de la plus grande traverse Théorème La taille moyenne de la plus grande traverse minimale dans un hypergraphe à m sommets, n hyperarêtes et sous le modèle d Erdös et Rényi de paramètre p = 1 q est asymptotiquement E[max] = 1 (2 log n log log n) + O(log log log n) log q ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 17 / 19

Fredman et Khachiyan (1996) Complexité : Comparaison des algorithmes O(T log T ) Asymptotique : C. Hébert et A. Bretto Complexité : Asymptotique : si T est la taille combinée de l entrée et de la sortie O O ( ) exp log4 n log q 2 O(T 2 max ) ( ) exp log2 n log q ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 18 / 19

Conclusion Résultats la taille de la plus grande traverse est logarithmique en le nombre d hyperarêtes le nombre de traverses minimales est sous exponentiel on peut faire des comparaisons d algorithmes Améliorations autres modèles probabilistes améliorer les complexités données résultats qui mélangent pire des cas et en moyenne ébert, Bretto, Lhote (GREYC, Université de Caen Basse-Normandie) Traverses minimales d un hypergraphe 19 / 19