Automates hyper-minimaux



Documents pareils
Notes de révision : Automates et langages

Chapitre 2 Le problème de l unicité des solutions

STI2D Logique binaire SIN. L' Algèbre de BOOLE

LANGAGES - GRAMMAIRES - AUTOMATES

Synthèse de cours (Terminale S) Calcul intégral

Théorème de Poincaré - Formule de Green-Riemann

Algorithmes sur les mots (séquences)

ANALYSE NUMERIQUE NON-LINEAIRE

Correction de l épreuve CCP 2001 PSI Maths 2 PREMIÈRE PARTIE ) (

Module 2 : Déterminant d une matrice

semestre 3 des Licences MISM annnée universitaire

Séquence 8. Probabilité : lois à densité. Sommaire

COURS D ANALYSE. Licence d Informatique, première. Laurent Michel

Université Paris-Dauphine DUMI2E. UFR Mathématiques de la décision. Notes de cours. Analyse 2. Filippo SANTAMBROGIO

LICENCE DE MATHÉMATIQUES DEUXIÈME ANNÉE. Unité d enseignement LCMA 4U11 ANALYSE 3. Françoise GEANDIER

Techniques d analyse de circuits

L'algèbre de BOOLE ou algèbre logique est l'algèbre définie pour des variables ne pouvant prendre que deux états.

Chapitre 11 : L inductance

Tout ce qu il faut savoir en math

/HVV\VWqPHVFRPELQDWRLUHV

SYSTEME DE TELEPHONIE

Intégrale et primitives

Turbine hydraulique Girard simplifiée pour faibles et très faibles puissances

ANALYSE : FONCTIONS D UNE VARIABLE RÉELLE

Licence M.A.S.S. Cours d Analyse S4

Chapitre VI Contraintes holonomiques

LITE-FLOOR. Dalles de sol et marches d escalier. Information technique

Introduction à la modélisation et à la vérication p. 1/8

Chapitre 1 : Fonctions analytiques - introduction

Statuts ASF Association Suisse Feldenkrais

Cours d Analyse IV Suites et Séries de fonctions

Probabilités sur un univers fini

3- Les taux d'intérêt

Influence du milieu d étude sur l activité (suite) Inhibition et activation

Thèse Présentée Pour obtenir le diplôme de doctorat en sciences En génie civil Option : structure

Guide des bonnes pratiques

Conseils et astuces pour les structures de base de la Ligne D30

Toyota Assurances Toujours la meilleure solution

Pour développer votre entreprise LES LOGICIELS EN LIGNE, VOUS ALLEZ DIRE OUI!

Sommaire. 6. Tableau récapitulatif Sophos NAC intégré Vs. NAC Advanced - 17 Février

Classeur courtier d assurance. Comment organiser son activité et se préparer à un contrôle

Avant d utiliser l appareil, lisez ce Guide de référence rapide pour connaître la procédure de configuration et d installation.

Partie 4 : La monnaie et l'inflation

Compte rendu de la validation d'un observateur cascade pour la MAS sans capteurs mécaniques sur la plate-forme d'essai de l'irccyn

Magister en : Génie Mécanique

Guide d'utilisation Easy Interactive Tools Ver. 2

Pour développer votre entreprise. Compta LES LOGICIELS EN LIGNE, VOUS ALLEZ DIRE OUI!

AUTOUR D UN MÉMOIRE INÉDIT : LA CONTRIBUTION D HERMITE AU DÉVELOPPEMENT DE LA THÉORIE DES FONCTIONS ELLIPTIQUES. Bruno BELHOSTE (*)

Le canal étroit du crédit : une analyse critique des fondements théoriques

Université Paris-Dauphine DUMI2E 1ère année, Applications

NEWS PRO ACTIV. [Juillet 2015] Ce mois-ci on vous parle de. L arrêté est applicable à compter du 1er Juillet 2015.

La pratique institutionnelle «à plusieurs»

INFORMATIONS TECHNIQUES

ManSafe. pour les Utilitiés. La Protection antichute pour les Industries de l'energie. Français. TowerLatch LadderLatch

Commencer DCP-7055W / DCP-7057W /

LOGICIEL FONCTIONNEL EMC VNX

INSTRUCTIONS POUR L INSTALLATION ET LE FONCTIONNEMENT DES SERRURES À POIGNÉE BÉQUILLE

Baccalauréat S Asie 19 juin 2014 Corrigé

Réalisation de sites Internet PME & Grandes entreprises Offre Premium. Etude du projet. Webdesign. Intégration HTML. Développement.

Groupe symétrique. Chapitre II. 1 Définitions et généralités

Le produit semi-direct

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

1 Définition et premières propriétés des congruences

Transfert. Logistique. Stockage. Archivage

Problèmes de Mathématiques Filtres et ultrafiltres

- Phénoméne aérospatial non identifié ( 0.V.N.I )

Exercices - Polynômes : corrigé. Opérations sur les polynômes

La mesure de Lebesgue sur la droite réelle

Programmation linéaire et Optimisation. Didier Smets

Définitions. Numéro à préciser. (Durée : )

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Guide de l'utilisateur

Santé et sécurité psychologiques en milieu de travail

FONDATION CLEMENTINE ET MAURICE ANTILLE

Chapitre 2 Le problème de l unicité des solutions

Dualité dans les espaces de Lebesgue et mesures de Radon finies


Chapitre 5 : Flot maximal dans un graphe

Calcul fonctionnel holomorphe dans les algèbres de Banach

Théorème du point fixe - Théorème de l inversion locale

TOUT CE QU IL FAUT SAVOIR POUR LE BREVET

La plateforme Next Generation Mini guide

Modification simultanée de plusieurs caractéristiques d un bien hédonique : une nouvelle méthode de calcul de la variation de bien-être des ménages

Electrovanne double Dimension nominale Rp 3/8 - Rp 2 DMV-D/11 DMV-DLE/11

Eteindre. les. lumières MATH EN JEAN Mme BACHOC. Elèves de seconde, première et terminale scientifiques :

Portiers audio et vidéo ABB-Welcome et ABB-Welcome M

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

INSTALLATION DE DETECTION INCENDIE

III- Raisonnement par récurrence


Sciences Industrielles Précision des systèmes asservis Papanicola Robert Lycée Jacques Amyot

Première partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015

CCP PSI Mathématiques 1 : un corrigé

Proposition. Si G est un groupe simple d ordre 60 alors G est isomorphe à A 5.

Régression multiple : principes et exemples d application. Dominique Laffly UMR CNRS Université de Pau et des Pays de l Adour Octobre 2006

Intégration et probabilités TD1 Espaces mesurés Corrigé

Calcul différentiel. Chapitre Différentiabilité

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

Transcription:

Université derouen UFR des sciences et techniques Projet nnuel de mster 1 Encdrnts : Pscl Cron et Ludovic Mignot Automtes hyper-minimux Jen-Bptiste PRIEZ Rouen, le 20 mi 2011

Résumé Deux lngges sont f-équivlents si leur différence symétrique est finie. Nous étudierons les résultts issus de l rticle de A. Bdr, V. Geffert et I. Shipmn ynt puliés l rticle de référence sur l hyper-minimistion[4]. Ce rpporte porte ussi sur l crctéristion du nomre d erreurs engendré pr l construction des utomtes hyper-minimux étudié dns l rticle de A. Mletti[2]. Enfin, nous présenterons des lgorithmes efficces de construction d hyper-minimux et hyper-optimux issus des rticles précédents et de l rticle de M. Holzer et A. Mletti[9]. Mots-clés : théorie des lngges, utomte fini déterministe, hyperminimistion, lgorithme efficce

Tle des mtières Introduction 5 I Définitions préliminires et rppels 6 I.1 Notions élémentires......................... 6 I.2 Automtes.............................. 7 II Propriétés élémentires de l hyper-minimlité 11 II.1 L F-équivlence........................... 12 II.2 Noyu, nneu et critèresdefusion................. 16 II.3 Hyper-minimlité........................... 20 II.4 Minimistion du nomre d erreurs................. 25 IIIAlgorithmes d hyper-minimistion 34 III.1 Algorithme de Bdr, Geffert et Shipmn........... 34 III.2 Algorithme en O(n 2 )......................... 36 III.3 Algorithme en O(m log n)...................... 40 III.4 Algorithme de fusion vec un minimum d erreurs......... 42 Conclusion 46 Annexe 47 Déroulement de l lgorithme 1...................... 47 Biliogrphie 52 4

Introduction L hyper-minimistion est une technique de réduction du nomre d étts d un utomte. Cette technique construit un utomte plus petit reconnissnt un lngge dont l différence symétrique est finie pr rpport u lngge reconnu pr l utomte d origine. L hyper-minimistion est une suite ux recherches sur l minimistion. L minimistion été indépendmment étudiée pr Myhill et Nérode[11, 3] qui ont crctérisé l minimlité. Moore[7] ou encore Hopcroft[10] ont utilisé ses crctéristiques pour construire différents lgorithmes de minimistion. L minimistion construit un utomte unique (à un isomorphisme près) ; contrrio l étude de l hyper-minimlité v montrer qu il n y ps d unicité dns les utomtes hyper-minimux. Nous commencerons pr effectuer quelques rppels sur les utomtes et l minimistion. Dns une seconde prtie, nous présenterons les propriétés d hyper-minimistion issues de l rticle de référence de Andrew Bdr, Vilim Geffert et In Shipmn[4]. Au sein de cette prtie, nous introduirons les techniques permettnt de dénomrer le nomre d erreurs potentiellement engendrées pr l construction d un utomte hyper-miniml[2]. Cette prtie v permettre d introduire une nouvelle ctégorie d utomte : les utomtes hyper-optimux. Nous étudierons ensuite plusieurs lgorithmes permettnt l construction des utomtes hyper-minimux et hyper-optimux. Ces derniers permettent d otenir un lgorithme d hyper-minimistion performnt en O(m log n). 5

I Définitions préliminires et rppels Dns cette prtie, on définit les nottions et les outils que l on v utiliser tout u long du document. I.1 Notions élémentires Soient A et{ B deux ensemles, une fonction f : A B est une ijection si et f(x) =f(y) x = y (f injective) seulement si y B x A : f(x) =y (f surjective) Soient A, B C trois ensemles. L différence symétrique de A et B est l ensemle AΔB =(A B) (A B) où X désigne le complémentire de X dns l ensemle C. Soient X un ensemle, et T une reltion sur X. L reltion T est une reltion d équivlence sur X lorsque les propriétés suivntes sont vérifiées : T (T réflexive),, c X : T T (T symétrique) T T c T c (T trnsitive) L ensemle du projet implique de mnipuler des notions issues de l théorie des lngges. Pour ce fire, nous utiliserons les ojets mthémtiques suivnts : Un lphet Σ est un ensemle fini de symole : Σ = {,,...}. Un mot sur Σ est une suite finie ( 1, 2,..., n )d éléments de Σ, que l on note pr simple juxtposition 1 2... n. L ensemle des mots est noté Σ.Onnote w l longueur du mot w Σ et ε le mot vide (de longueur 0). Soient α, β Σ, l concténtion (notée ) α β est le mot αβ. L ensemle des mots muni de l opértion de concténtion forme un monoïde lire. L étoile de Kleene[14] : L = n N L n où L n définit inductivement l extension de l concténtion sur les lngges (L n = L n 1 L) etl 0 = {ε}. Nous nous intéresserons essentiellement ux lngges rtionnels, c est-à-dire ux ensemles pouvnt être définis comme suit sur l lphet Σ : soit le lngge vide, noté. soit les singletons {} vec Σ. soit les lngges L 1 L 2 vec L 1,L 2 deux lngges rtionnels. soit les lngges L 1 L 2 vec L 1,L 2 deux lngges rtionnels. soit les lngges L 1 vec L 1 un lngge rtionnel. Nous noterons E le crdinl d un ensemle E ; et noterons E < si le crdinl est fini et E = sinon. 6

I.2 Automtes Un utomte fini (noté pr l suite NFA) M est un 5-uplets (Σ,Q,I,F,δ ), vec Σ un lphet, Q l ensemle fini d étts, I Q l ensemle des étts initiux, F Q l ensemle des étts finux, et, δ l fonction de trnsition : δ : Q Σ P(Q) (l ensemle des prties de Q). Un NFA M =(Σ,Q,I,F,δ)estditdéterministe (ppelé DFA)sietseulement si : 1. I =1 2. Σ, q Q δ(q, ) 1. On note lors un DFA M comme le quintuplet (Σ,Q,i,F,δ)veci l unique étt initil et δ : Q Σ Q. Les DFA et les NFA ont le même pouvoir de représenttion[12]. On définit L(M) le lngge reconnu pr le NFA M =(Σ,Q,I,F,δ ):L(M) = {w i Iδ (i, w) F }. Etonprlerd ccepttion pr l utomte M d un mot w le résultt suivnt : i Iδ (i, w) F. Exemple 1 Trois utomtes équivlents reconnissnt le même lngge {,,,,}, les deux premiers sont des NFA et le troisième un DFA. A D, E B C F B A, C, D 7

B A, D C Les lngges reconnus pr un utomte sont les lngges reconnissles. Le théorème de Kleene[14] nous permet de confondre l notion de lngges rtionnels et lngges reconnissles : Théorème I.2.1[14] Les lngges rtionnels sont les lngges reconnissles. Un DFA M est miniml si et seulement s il n existe ps de DFA vec moins d étts reconnissnt le même lngge. L construction d un utomte miniml l propriété de construire un DFA unique (à un isomorphisme près). L notion d ccessiilité d un DFA nous ser utile pour construire certines preuves. Soit M =(Σ,Q,i,F,δ)unDFA.Unétt q Q est dit : inccessile si et seulement si w Σ : δ(i, w) q. ccessile si et seulement si w Σ : δ(i, w) =q. co-ccessile si et seulement si w Σ : δ(q, w) F. Pour l même rison, nous introduirons l notion de lngges droits et guches ssociés ux étts d un DFA : Soient M =(Σ,Q,i,F,δ)unDFAetq Q, le lngge guche de q est L q = w Σ q = δ(i, w)}. le lngge droit de q est L q = {w Σ δ(q, w) F }. On ppeller étt puit un étt ccessile et non co-ccessile. Ces étts sont générlement utilisés pour compléter les DFA des trnsitions mnquntes. 8

Ces définitions nous permettent d introduire les propriétés suivntes : Lemme I.2.2 L(M) = q Q L q L q Corollire I.2.3 L(M) = q I L q = q F L q Nous utiliserons ussi certines notions issues de l théorie des grphes comme l fermeture trnsitive ou encore l notion de tri topologique. L fermeture trnsitive d un grphe G consiste à clculer l reltion trnsitive R entre tous les étts :, deux étts du grphe, R si est ccessile depuis. Un tri topologique d un grphe cyclique est une reltion d ordre O (réflexive, trnsitive et nti-symétrique (O O = )) prtielle sur les étts en considérnt leur ordre d pprition (cf fig. I.2). 3 1 4 2 Figure 1 Clcul d un tri topologique pour le grphe sns-cycle G =< S,A> où S = {1, 2, 3, 4} et A = {(1, 2), (1, 3), (2, 4), (3, 4)}. Un tri topologique de G peut-être 1, 2, 3, 4ouencore1, 3, 2, 4. L construction d un utomte hyper-miniml utilise l construction d un utomte miniml. L utomte miniml peut se construire en utilisnt les propriétés de Myhill et Nérode[11, 3] (p Q est équivlent à q Q, noté p q, si et seulement si L p = L q ). Lemme I.2.4 [11, 3] L reltion de Myhill-Nérode est une reltion d équivlence. 9

Un utomte miniml peut se construire pr l lgorithme de Moore[7] en O(n 2 ) ou encore l lgorithme de Hopcroft[10] en O(n log n) dns le cs générl du DFA. B E, F A, C D {B} {D,E}, {F} {A}, {C} Figure 2 Minimistion du premier utomte en le second. Les étts D et E du premier utomte sont équivlents, ils ont donc été fusionnés dns le second (L D = L E ). Toute utre notion est extrite soit de l rticle de référence [4], soit du livre [5]. Après ces rppels, nous pouvons mintennt introduire les propriétés élémentires de l hyper-minimlité. 10

II Propriétés élémentires de l hyper-minimlité Nous développerons dns cette prtie les définitions et les propriétés qui permettent l construction d un utomte hyper-miniml. Lesprochinespropriétés sont extrites de l rticle de référence écrit pr Andrew Bdr, Vilim Geffert et In Shipmn[4] qui introduit pour l première fois l notion d hyper-minimlité insi que de l rticle de Andres Mletti[2] qui s intéresse à l minimistion du nomre d erreurs engendrées pr l construction d un utomte hyper-miniml. Définition II.0.5 Un DFA M est dit hyper-miniml s il n existe ps de DFA M tel que L(M)ΔL(M ) <. F J M Q B E I L P R A D C H G, Figure 3 L utomte qui servir à illustrer les propriétés présentées dns les prochines sections. Cet utomte est miniml. Les premières notions que l on v introduire vont définir l f-équivlence. Cette f-équivlence v être utile pour distinguer une prtition d étts équivlents. Lessecondesvontdéfinir des critères de fusion d étts en clculnt une prtition sur les étts du noyu et ceux de l nneu. Ces deux étpes nous permettront dns l prtie suivnte de construire les lgorithmes permettnt d hyper-minimiser un utomte. 11

Nous verrons ensuite que l construction d utomte hyper-miniml engendre plus ou moins d erreurs suivnt les fusions effectuées. L rticle [2] v permettre de compter le nomre d erreurs potentiels et insi légitimer certines fusions plutôt que d utres. L ojectif de ces notions v être de minorer le crdinl de l différence symétrique entre l utomte d origine et l utomte hyper-miniml. II.1 L F-équivlence Dns cette section, nous llons étudier une reltion d équivlence entre les étts. Cette reltion v permettre de créer une prtition d étts de l utomte. À l différence de l reltion de Myhill-Nérode[11, 3] qui permet de clculer une prtition d étts ynt le même lngge droit, l reltion de f-équivlence v tolérer que l différence symétrique des lngges droits soit finie. C est-à-dire qu il y it un nomre fini de mots différents reconnus pr les deux lngges. Définition II.1.1 Soient L 1 et L 2 deux lngges sur un lphet Σ. L 1 et L 2 sont f-équivlents, noté L 1 L 2, si leur différence symétrique est un ensemle fini. Autrement dit : L 1 ΔL 2 <. En se snt sur le fit que l lphet est un ensemle fini, on otient le lemme suivnt : Lemme II.1.2 Soient L 1 et L 2 deux lngges. L 1 L 2 ( k 0 w Σ : w k : w L 1 w L 2 ) C est-à-dire L 1 L 2 est équivlent à dire qu il existe k N tel que pour tout mot w de tille supérieure à k, l ccepttion de w est l même pour L 1 et L 2. Preuve ( ) On suppose L 1 L 2,c est-à-dire L 1 ΔL 2 <. On pose Δ = L 1 ΔL 2. Le crdinl de Δ est fini implique qu il existe un k =mx{ w w Δ }. On en déduit que tout mot de tille supérieure à k àlmême ccepttion sur L 1 et L 2. D où L 1 L 2 = ( k 0 w Σ : w k : w L 1 w L 2 ) ( ) On suppose k 0 w Σ : w k : w L 1 w L 2. On sit que Σ est fini donc il existe un nomre fini de mots w tel que w k pour k N. 12

D où L 1 L 2 =( k 0 w Σ : w k : w L 1 w L 2 ) On étend l notion de f-équivlence de lngges àlf-équivlence d utomtes et d étts. Définition II.1.3 Soient M 1 et M 2 deux NFA. M 1 M 2 L(M 1 ) L(M 2 ) Définition II.1.4 Soient M 1 =(Σ,Q,I,F,δ), M 2 =(Σ,Q,I,F,δ ) deux utomtes et q 1 Q et q 2 Q deux étts. q 1 q 2 L q 1 L q 2. De l même mnière que pour l définition de f-équivlence de lngges, on otient les lemmes suivnt : Lemme II.1.5 Soient M 1 =(Σ,Q,I,F,δ), M 2 =(Σ,Q,I,F,δ ) deux utomtes et q 1 Q et q 2 Q deux étts. q 1 q 2 ( k 0 w Σ w k : δ(q 1,w) F δ(q 2,w) F ). Preuve On q 1 q 2 L q 1 L q 2 k 0 w Σ w k : w L q 1 w L q 2. En utilisnt l définition des lngges droits, on otient q 1 q 2 ( k 0 w Σ w k : δ(q 1,w) F δ(q 2,w) F ). Àprtirdesprécédentes propriétés, on déduit le lemme suivnt sur les DFA : Lemme II.1.6 Soient deux DFA M 1 =(Σ,Q,i,F,δ)etM 2 =(Σ,Q,i,F,δ ). M 1 M 2 L i L i. Preuve Découle directement du corollire I.2.3. 13

De l même mnière que l reltion de Myhill-Nérode[11, 3] est une reltion d équivlence sur les lngges, les utomtes et les étts, on montre que l reltion de f-équivlence est une reltion d équivlence pour ces derniers ussi : Lemme II.1.7 L reltion f-équivlence est une reltion d équivlence pour les lngges. Preuve L reltion de f-équivlence est : réflexive : Soit L un lngge, L L : l différence symétrique est finie cr elle est nulle. symétrique : pr définition l opértion de différence symétrique est symétrique. trnsitive : Soient L 1,L 2,L 3 Σ trois lngges tel que L 1 L 2 et L 2 L 3. On donc k,k N tel que : w Σ : { w k (w L 1 w L 2 ) w k (w L 2 w L 3 ) Soit k m =mx(k,k ), on otient que : w Σ : w k m (w L 1 w L 2 ) (w L 2 w L 3 ) Donc k 0telque w Σ : w k (w L 1 w L 3 ) : l reltion est trnsitive. Corollire II.1.8 L reltion f-équivlence est une reltion d équivlence pour les utomtes et pour les étts d un utomte. Aynt montré que l f-équivlence est une reltion d équivlence, on peut introduire le lemme suivnt qui v être importnt pour construire un lgorithme de clcul des clsses de f-équivlences entre les étts d un utomte. Lemme II.1.9 L reltion f-équivlence est une congruence à droite pr l ction de δ. (C est-à-dire pour deux étts p, q, sip q lors w Σ δ(p, w) δ(q, w).) Preuve D près le théorème II.1.7, est une reltion d équivlence. On suppose q 1 q 2. Selon le lemme II.1.5 k 0telque w Σ : w k (δ(q 1,w) F δ(q 2,w) F ). Supposons qu il existe q 1,q 2 tel que q 1 = δ(q 1,α)etq 2 = δ(q 2,α)pour α Σ tel que q 1 q 2. Pr conséquent, k 0 w Σ : w k tel que δ(q 1,w) F et δ(q 2,w) F 14

ou δ(q 1,w) F et δ(q 2,w) F. Pour k suffismment grnd : { δ(q1,αw) F δ(q 2,αw) F { (δ(δ(q1,α),w) F δ(δ(q 2,α),w) F ) { (δ(δ(q1,α),w) F δ(δ(q 2,α),w) F ) { δ(q1,αw) F δ(q 2,αw) F ce qui contredit l hypothèse q 1 q 2. Corollire II.1.10 Soient M 1 =(Σ,Q,i,F,δ)etM 2 =(Σ,Q,i,F,δ )deuxdfa. M 1 M 2 = q Q p Q q p Lemme II.1.11 Soient q 1,q 2 respectivement deux étts de M 1 =(Σ,Q,i,F,δ)etM 2 =(Σ,Q,i,F,δ ) deux DFA. q 1 q 2 Σ δ(q 1,) δ(q 2,) Preuve découle du lemme II.1.9. : On suppose Σ:δ(q 1,) δ(q 2,), on veut montrer que q 1 q 2. Selon le lemme II.1.5, Σ k tel que w Σ : w k (δ(δ(q 1,),w) F δ(δ(q 2,),w) F ). D où w Σ : w k (δ(q 1, w) F δ(q 2, w) F ). En posnt k m le mximum des k +1,onien Pr conséquent q 1 q 2. w Σ : w k m (δ(q 1,w) F δ(q 2,w) F ) Proposition II.1.12 Du lemme II.1.9 et du corollire II.1.11 découle l propriété suivnte: q 1 q 2 w Σ δ(q 1,w) δ(q 2,w) Le lemme II.1.11 permet de construire l lgorithme 1 qui repère àrepérer ps-à-ps l f-equivlence d étt. 15

F J M Q B E I L P R A D C H G, Figure 4 Automte sur lequel on mis en vnt les étts f-équivlents. P Q : P ΔQ = {ε}. L M d près le lemme II.1.11 : pr l lettre, L et M rrivent sur les étts P et Q ; pr l lettre, ils rrivent sur l étt M ce qui implique l f-équivlence. De l même mnière pour G H I J et C D. Corollire II.1.13 Soient M =(Σ,Q,i,F,δ)unDFAetp, q Q. Si q p lors q p. Nous venons de voir comment supputer l prtition des étts f-équivlents. À prtir de cette prtition, il n est ps cceptle de fusionner ensemle les étts de chque composnte de l prtition. En effet, l différence symétrique des lngges droits des étts de chque composnte possède un nomre fini de mots ; mis les lngges guches de ces étts sont potentiellement infini. L fusion d étts f-équivlents, dont le lngge guche est infini, engendrerit un utomte non f-équivlent à l utomte originl. Dns l prochine section, nous montrerons comment distinguer les étts ynt un lngge guche fini de ceux ynt un lngge guche infini. II.2 Noyu, nneu et critères de fusion Dns cette nouvelle section, nous llons order les propriétésqui déterminent comment hyper-minimiser un utomte en fusionnnt certins éttsf-équivlents. 16

Pour déterminer quels étts f-équivlents sont fusionnles, on v utiliser les propriétés qui découlent des définitions d nneu et de noyu. Définition II.2.1 Le noyu(kernel) d un utomte M, noté K ou encore K(M), est l ensemle des étts q tel que L q =. L nneu (premle) d un utomte M, noté P ou encore P (M), est l ensemle des étts q pour lesquels L q <. Lemme II.2.2 Soit M =(Σ,Q,I,F,δ) un utomte, {K, P} est une prtition de Q. Preuve K P = Q F J M Q B E I L P R A D C H G, Figure 5 Automte où on distingue les étts du noyu en rouge (E,F,I,J,L,M,P,Q,R) etlesétts de l nneu en leu (A, B, C, D, G, H). L nneu et le noyu permettent de crctériser le fit que le lngge guche d un étt soit fini ou infini. Ces crctéristiques vont permettre de déterminer quels étts f-équivlents sont fusionnles et comment les fusionner. 17

Lemme II.2.3 Soit M =(Σ,Q,i,F,δ) un DFA ccessile (c est-à-dire où touslesétts sont ccessiles). { (1) soit q1 P et q q 1,q 2 Q, q 1 P q 2 P 1 n est ps ccessile depuis q 2 ou (2) soit q 2 P et q 2 n est ps ccessile depuis q 1 Preuve ( ) On suppose q 1 P q 2 P. 1 er cs : q 1 et q 2 pprtiennent à P : Supposons qu il existe un chemin de q 1 vers q 2,lpropriété (1) est respectée. (en effet supposer qu il existe un chemin de q 2 vers q 1 contredit l hypothèse qu ils pprtiennent à P ) Delmême mnière en supposnt un chemin de q 2 vers q 1,lpropriété (2) est respectée. 2 nd cs : q 1 P et q 2 K :lpropriété (1)estvérifiée, il ne peut y voir de chemin d un étt de K vers un étts de P pr définition. 3 e cs : q 2 P et q 1 K similire u second cs. ( ) trivil Lemme II.2.4 Soit M =(Σ,Q,i,F,δ) un DFA ccessile complet. Soient q 1,q 2 Q deux étts distincts. Si q 1 q 2 lors l une des deux propriétés suivntes est vérifiée : (1)soitq 1,q 2 P et il n existe ps de chemin de l un vers l utre (2)soit q K K tel que q 1 q 2 q K. Preuve Soient q 1,q 2 Q où q 1 q 2 et q 1 q 2. siq 1 ou q 2 pprtient u noyu lors l propriété (2)estvérifiée s il n existe ps de chemin ni de q 1 vers q 2 ni de q 2 vers q 1 lors l propriété (1) est vérifiée Supposons que q 1,q 2 P et qu il existe un chemin de q 1 vers q 2.Pr conséquent w Σ + tel que δ(q 1,w) = q 2 ; d près le lemme II.1.9, δ(q 1,w) δ(q 2,w). En posnt q 3 = δ(q 2,w), on nécessirement q 1 q 2 q 3 et q 1 q 2 q 3.Onpeutrépéter indéfiniment cette ction jusqu à rriver dns un étt du noyu (cr l utomte est complet). Lemme II.2.5 Soient M 1 =(Σ,Q,i,F,δ)etM 2 =(Σ,Q,i,F,δ )deuxdfaf-équivlent, il existe lors une fonction h : Q Q stisfisnt les deux propriétés suivntes : 1. Si q P (M 1 )lorsq h(q) sinonq h(q) (q K(M 1 )). 18

2. Si q K(M 1 )lorsh(q) K(M 2 ). Preuve Soit q P (M), cel implique nécessirement i P (M), d près le lemme II.1.9, on q h(q) cri i (lemme II.1.6). Soit q K(M). Pr induction en utilisnt le lemme II.1.9, on pour tout couple (p, ) Q Σ, p h(p). Supposons que δ(p, ) h(δ(p, ) q h(δ(p, ). D près le lemme II.1.9, on q h(q). Supposons que l différence symétrique soit non-nulle, cel implique qu il existe une infinité demotsw Σ dns l différence symétrique L(M 1 )ΔL(M 2 ), ce qui contredit l f-équivlence. Donc q h(q). Définition II.2.6 Soient M 1 =(Σ,Q,i,F,δ)etM 2 =(Σ,Q,i,F,δ )deuxdfa. On prle d isomorphisme de noyu sur M 1, M 2 (noté M 1 =K M 2 ) qund il existe une ijection f : K(M 1 ) K(M 2 ) stisfisnt les deux propriétés suivntes : 1. q K(M 1 ):q F f(q) F, 2. q, K(M 1 ) Σ:f(δ(q, )) = δ (f(q),). Théorème II.2.7 Soient M 1 =(Σ,Q,i,F,δ)etM 2 =(Σ,Q,i,F,δ ) deux DFA minimux. Si M 1 M 2 lors il existe un isomorphisme de noyu sur M 1,M 2 : M 1 =K M 2. Preuve D près le lemme II.2.5, il existe un morphisme de f : K(M 1 ) K(M 2 ). M 1 et M 2 sont minimux donc il n existe ps de couple d étts équivlents. En utilisnt encore le lemme II.2.5, on f injective. En inversnt les rôles de M 1 et M 2, on voit trivilement que K(M 1 ) = K(M 2 ), doncf est ijective. Définition II.2.8 Soient M 1 =(Σ,Q,i,F,δ)etM 2 =(Σ,Q,i,F,δ )deuxdfa. On prle d isomorphisme d nneu, noté M 1 =P M 2, qund il existe une ijection f : P (M 1 ) P (M 2 ) telle que : q 1,q 2 P (M 1 ), Σ:δ(q 1,)=q 2 δ (f(q 1 ),)=f(q 2 ) On remrque que l isomorphisme d nneu ne préserve ps l ccepttion. 19

Ces différentes propriétés sur l nneu et le noyu vont permettre de lier l notion d étts f-équivlents et de fusions. L prochine section v crctériser l hyper-minimlité à prtir des deux différentes prtitions vues, l prtition des étts f-équivlents Q/ et l prtition nneu-noyu {P, K}. II.3 Hyper-minimlité Nous llons, dns cette section, mettre en lien les étts f-équivlentset les étts de l nneu et du noyu d un utomte miniml. Les propriétés énoncées dns cette section permettent de construire les lgorithmes d hyper-minimistion. En se snt sur les propriétés de f-équivlence, on construit le lemme suivnt : Lemme II.3.1 Un DFA M est dit hyper-miniml s il n existe ps de DFA M f-équivlent vec moins d étts. Preuve Ce déduit directement de l définition II.1.1. Mintennt l hyper-minimlité définie, on v présenter le théorème importnt (issu des deux prochins lemmes) qui v permettre de séprer ce que l on sit déjà fire (l minimistion d utomte), de ce qui est issu de nouvelles notions : mnipuler le noyu et l nneu d un utomte. Lemme II.3.2 Soit M un DFA. Si pour M, l une de ces propriétés est vérifiée : 1. il existe un étt inccessile 2. il existe une pire d étts équivlents (équiv. de Myhill-Nérode)[11, 3] 3. il existe une pire d étts f-équivlents tel que l un d eux est dns l nneu Alors il existe un DFA M f-équivlent à M vec moins d étts. Preuve Le 1 er cs (il existe un étt q inccessile) et 2 nd cs (il existe q 1 q 2 et q 1 q 2 ) implique que l utomte M peut être minimiser. Ce qui nous donne M équivlent à M vec moins d étts et d près le corollire II.1.13, on M M. Le 3 e cs (il existe q 1 q 2 et q 1 q 2 vec l un deux pprtennt à P ): 20

si L q1 ΔL q 2 = 0 on revient u second cs cr en effet cel revient à q 1 q 2. sinon on revient à une configurtion décrite dns le lemme II.2.3. On construit un utomte M Δ M : Supposons q 1 P (le cs q 2 P est symétrique), on construit l utomte M Δ où Q Δ = Q \{q 1 } et l fonction de trnsition δ Δ est : { δ(q, ) si δ(q, ) q1 (q, ) Q Σ:δ Δ (q, ) = sinon Dns le cs où i = q 1 on prend i Δ = q 2. On ien M Δ Q < M Q, il fut encore montrer que M Δ M. Pr hypothèse, les propositions (1) q 1 q 2 et (2) q 1 P sont stisfites. q 2 D près l première hypothèse (1), il existe k q2 qui implique w L q 1 w L q 2. tel que w Σ : w k q2 Étnt donné l seconde hypothèse(2),ilexistenécessirement k q1 =mx{ w w L q 1 }. Montrons que ( w Σ : w k Δ = k q1 + k q2 ) implique (w L(M) w L(M Δ )). Soit γ Σ de longueur supérieure à k Δ tel qu on puisse décomposer γ en α.β et δ(i, α) =q 1. Donc pr l construction de M Δ : δ Δ (i Δ,α)=q 2. Nécessirement, β k q2 donc δ(q 1,β) F δ Δ (q 2,β) F Δ. On peut donc écrire δ(δ(i, α),β) F δ Δ (δ Δ (i Δ,α),β) F Δ δ(i, α.β) F δ Δ (i Δ,α.β) F Δ δ(i, γ) F δ Δ (i Δ,γ) F Δ. Dns tous les cs, il existe un DFA f-équivlent vec moins d étts. Nous venons de définir des conditions suffisntes àlconstructiond unutomte hyper-miniml. Montrons mintennt que ces conditions sont à l fois nécessires, ce qui v nous permette de déduire l équivlence : Lemme II.3.3 Soit M un DFA. S il existe un DFA f-équivlent à M vec moins d étts lors u moins l une de ces propriétés est vérifiée : 21

1. il existe un étt inccessile 2. il existe une pire d étts équivlents (équiv. de Myhill-Nérode) [11, 3] 3. il existe une pire d étts f-équivlents tel que l un d eux est dns l nneu Preuve Montrons que si ces propriétés sont stisfites : () tout étt est ccessile () il n existe ps de pire d étts équivlents (c) toute pire d étts f-équivlents est une pire d étts du noyu lors toute fusion donne un utomte non f-équivlent. Supposons (p, q) une pire d étts fusionnle tel que de cette fusion résulte un DFA f-équivlent M plus petit en nomre d étts. Pr hypothèse (1), p et q sont ccessile. Pr conséquent, leur lnggeguche est non nul. D près l hypothèse (2), ces étts ne sont ps équivlents. Donc l différence symétrique de leur lngge droit n est ps nulle. Il y deux cs envisgeles, soit p q et sont tous deux des étts du noyu ; soit ces étts ne sont ps f-équivlents. Premier cs : (p, q) est une pire d étts du noyu f-équivlents (3). Leur lngge guche est infini pr définition du noyu. Pr conséquent, l fusion de l un sur l utre engendre et/ou supprime une infinité de mots u lngge reconnu pr M pr rpport à L(M). ( k = vec k le crdinl de l différence symétrique des lngges droit des étts). Second cs : (p, q) est un pire d étts non f-équivlents. Leur lngge droit est donc infini. De l même mnière que pour le premier cs, que les étts pprtiennent ou non u noyu, l fusion de l un sur l utre engendre ou supprime une infinité de mots u lngge reconnu pr M pr rpport à L(M). Donc si les propriétés (1), (2) et (3) sont stisfites, lors toute fusion donne un utomte non f-équivlent. Théorème II.3.4 Soit un DFA M =(Σ,Q,i,F,δ). M est hyper-miniml si et seulement si 1. M est miniml et 2. q 1,q 2 Q, q 1 q 2 : q 1 q 2 q 1 K q 2 K Preuve Les lemmes II.3.3 et II.3.2, nous disent que M peut être remplcé pr un utomte f-équivlent vec moins d étts si et seulement si u moins l une de ces propriétés est vérifiée : 22

ilexisteunétt inccessile il existe une pire d étts équivlent (équiv. de Myhill-Nérode) [11, 3] il existe une pire d étts f-équivlent tel que l un d eux est dns l nneu Ainsi l contrposée de ceci est : M ne peut être remplcé pr un utomte f-équivlent vec moins d étts si et seulement si chcune de ces propriétés est vérifiée : () il n existe ps d étt inccessile () il n existe ps de pire d étts équivlent (équiv. de Myhill-Nérode) [11, 3] (c) il n existe ps de pire d étts f-équivlent tel que l un d eux est dns l nneu Les propriétés () et () implique (1) et l propriété (c) est équivlente à(2). Corollire II.3.5 Soit M =(Σ,Q,i,F,δ) un DFA miniml. Si i K lors M est hyper-miniml. Nous vons mintennt toutes les propriétés utiles pour construire un utomte hyper-miniml. Dns les précédentes propriétés, on utilise des pires d étts équivlents ou f-équivlents, l construction d un utomte plus petit v psser pr l fusion d un étt d une pire sur un l utre. Définition II.3.6 Soit q 1,q 2 Q, deuxétts d un DFA M =(Σ,Q,i,F,δ). On dit que q 1 est fusionné sur q 2 qund on remplce l ensemle des trnsitions δ(q, ) =q 1 pr δ(q, ) =q 2 pour tout (q, ) Q Σ, et on remplce Q pr Q \{q 1 }.Siq 1 = i lors on prend q 2 comme nouvel étt initil. On peut construire un utomte plus petit f-équivlent dès qu il existe une pire d étts f-équivlents dont l un u moins est dns l nneu. Cette construction est indépendnte de l finlité des étts. Lorsque nous fusionnons un étt q F sur un étt q Q \ F,onperd l ensemle des mots reconnu en q. A contrrio, l fusion d un étt q Q \ F sur un étt q F, on joute u lngge reconnu pr l utomte l ensemle des mots w tel que δ(i, w) =q. 23

{F} {J} {M} {Q} {B} {E} {I,H,G} {L} {P} {R},, {A} {C,D} Figure 6 L utomte hyper-miniml à l utomte de l figure II. Les étts G, H et I ont été fusionnés sur l étt I (les mots reconnu en H ont été perdu). Les étts C et D ont été fusionnés sur l étt D choisissnt insi de perdre les mots reconnu en C. Comme nous pouvons le constter, le choix d une fusion n est ps déterministe. Il est donc possile de générer différents utomtes hyper-minimux et f-équivlents entre-eux. Notre prochine prtie sée sur l rticle d Andres Mletti [2] v nous permettre de compter ces erreurs et insi pouvoir construire un lgorithme de fusion permettnt de minimiser le nomre d erreurs générer. Corollire II.3.7 Soient M 1 et M 2 deux utomtes f-équivlents. M 1 et M 2 hyper-miniminux n implique ps qu il existe un isomorphisme entre les deux. Exemple 2 L différence symétrique de ces deux utomtes est {ε}. Le premier utomte reconnit le lngge ( ) + et le second le lngge ( ). 24

A B B A On A A cr A A,et,d près le lemme II.1.11 B B. Ces deux utomtes sont donc f-équivlents. Et d près le corollire II.3.5, ils sont hyper-minimux. Cette dernière section nous permis de lier les différentes prtitions : Q/ et {K, P} pour créer un utomte hyper-miniml. Nous vons ussi vu que l construction de ces utomtes n est ps déterministe, il existe différents choix de fusion lors de l construction. Ces différentes possiilités utorisent l friction de différents utomtes hyper-minimux f- équivlents entre-eux. Ces utomtes distincts n engendrent donc ps le même lngge ; et prmi ces lngges distincts, certins vont engendrer une plus ou moins grnde différence symétrique vec le lngge reconnu à l origine. Dns l prochine section nous llons compter et crctériser les erreurs engendrées fin de supputer un utomte hyper-miniml optiml engendrnt le moins d erreurs possiles. II.4 Minimistion du nomre d erreurs Andres Mletti met en vnt dns l rticle [2] que certines fusions engendrent plus d erreurs que d utres. Exemple 3 Soit l utomte miniml suivnt : 25

F J B E I, A D, C Les étts C et D sont f-équivlent et pprtiennent à l nneu. Il y deux possiilités de fusions, C sur D ou D sur C : {F} {J} {F} {J} {B} {E} {I} {B} {E} {I},, {A} {C,D} {A} {C,D} On oserve que l fusion de C sur D (dns le premier utomte) enlève l reconnissnce du mot lors que l fusion de D sur C (dns le second) joute l reconnissnce du mot. Ces deux utomtes engendrent utnt d erreurs (1). L exemple 3 présente des utomtes hyper-minimux qui génèrent utnt d erreurs l un que l utre pr rpport u lngge reconnu à l origine. 26

Exemple 4 Soit l utomte miniml suivnt : F J B E I, A D, 0 C 1 Tout comme l exemple 3, il y deux choix de fusions : C sur D ou D sur C : {F} {J} {F} {J} {B} {E} {I} {B} {E} {I},, {A} {C,D} {A} {C,D} {0} {1} {0} {1} Contrirement à l exemple précédent, le nomre d erreurs est différent : pour 27

les étts C et D f-équivlents : le premier utomte enlève l reconnissnce des mots et et le second joute un nouveu mot :. L exemple 4 qunt à lui montre que cette génértion d erreurs n est ps uniforme. Lors de l hyper-minimistion, on v pouvoir distinguer une nouvelle forme d utomte hyper-minimux : les utomtes hyper-optimux. Définition II.4.1 Soit M un DFA miniml. Un utomte hyper-miniml M Ω de M est dit hyper-optiml s il n existe ps d utomte hyper-miniml M Ψ de M tel que L(M)ΔL(M Ψ ) L(M)ΔL(M Ω ). Nous pouvons noter qu il n y ps de sens de comprer deux utomtes M 1 et M 2 hyper-minimux f-équivlents sns utomte f-équivlent M de référence utilisé pour compter le nomre d erreurs. Andres Mletti[2] minimise le nomre d erreurs lors de l fusion des étts grâce à plusieurs fonctions. Il crée une fonction qui compte le nomre de chemin de chque étt de l nneu. Définition II.4.2 Soient M =(Σ,Q,i,F,δ)unDFAetq P. Le nomre de chemin de q, noté w(q), est : w(q) = w(p) vec w(i) = 1. δ(p,)=q (p,) Q Σ Il fut différencier les étts f-équivlents de l nneu finux et non-finux. En effet, comme nous pouvons l oserver dns l exemple 4, w(c) > w(d) (2 > 1), vec C F et D F.Demnière grossière, nous pouvons trduire cel comme l fusion de C sur D fit perdre l finlité etdeux(w(c)) mots du lngges lors que l fusion de D sur C conserve l finlité etjouteun(w(d)) mot u lngge. Proposition II.4.3 Soit B Q/ un ensemle d étts de l nneu. 28

Si q B F w(q) > q B\F être un étt de B F sinon de B \ F. Preuve trivil w(q) lors l étt sur lequel s effectue les fusions doit Ces deux critères sont une première pproche pour otenir une hyper-minimistion générnt moins d erreurs. Ces critères font ppel à une fusion clssique telle que définie en II.3.6. L rticle [2] pporte une nouvelle définition fin de sélectionner les trnsitions les plus intéressntes. Pour cel nous introduisons le nomre d erreurs : Définition II.4.4 Soient M =(Σ,Q,i,F,δ)unDFAetp, q Q deux étts f-équivlents. Le nomre d erreurs entre p et q, noté E p,q,est: E p,q = c + Σ E δ(p,),δ(q,) { 1 si p F ou exclusivement q F, où c = 0 sinon. L nouvelle pproche de l fusion, dns l rticle [2], consiste à utoriser une trnsformtion de l fonction de trnsition δ pour les couples étt-symole (l étt pprtennt à l nneu) à vleur dns le noyu. Pour un ensemle étts f-équivlents tous dns l nneu tel qu il existe pour l un u moins une trnsition dns le noyu, nous chercherons l trnsition qui engendrer le moins d erreurs. Proposition II.4.5 Soit B Q/ tel que B P et (q, ) B Σ δ(q, ) K. Après fusion des étts de B en un étt α et fusion des étts (fusionnles) de l composnte B de Q/ contennt δ(q, ), l meilleure trnsition δ(α, ) pour vleur β tel que min β B K { w(p) E δ(p,),β }. p B Preuve Les étts de B sont fusionnés en un seul étt α. D près le lemme II.1.9, q, q Bδ(q, ) δ(q,). Donc q Bδ(q, ) B. L ensemle des étts de B pprtennt à l nneu vont être fusionnés vec les étts du noyu. En clculnt l somme des w(p) E δ(p,),β, β B K pour p B, onclcule le nomre de chemin multiplié pr le nomre d erreur de l fusion (clssique) 29

δ(p, ) sur β. Ce qui donne le nomre d erreur pour l utomte généré pr cette trnsition. En prennt le minimum, on suppute donc l trnsition ynt un nomre d erreurs minimum. Exemple 5 Supputtion des chemins de l nneu et du nomre d erreurs de l utomte miniml suivnt : F J M Q B E I L P R A 0 D C H G, 1 L prtition Q/ est } {L, M}, {P, Q}, {R}. L prtition {K, P} est { {0}, {1}, {A}, {B}, {C, D}, {E}, {F }, {G, H, I, J}, { } {0, 1,A,B,C,D,G,H}, {E,F,I,J,L,M,P,Q,R}. Le nomre de chemin des étts de P : q 0 1 A B C D G H w(q) 1 1 1 1 2 1 3 6 Le nomre d erreurs E p,q sous forme d un tleu : 30

0 1 A B C D E F G H I J L M P Q R 0 0 1 0 A 0 B 0 C 0 9 D 9 0 E 0 F 0 G 0 5 2 3 H 5 0 3 2 I 2 3 0 1 J 3 2 1 0 L 0 1 M 1 0 P 0 1 Q 1 0 R 0 Les cses vides indiquent que q p et pr conséquent que E p,q définie. On remrque que E p,q = E q,p et E p,p =0. n est ps Les étts G et H sont fusionnés sur les étts I ou J (il n y ps d utres choix) : F J M Q B E I L P R A D,, 0 C 1 31

On note en pointillé les trnsitions qui ne sont ps clculées comme optimles. Pour les derniers étts fusionnles, C et D, onseposelquestiondel finlité :w(c) >w(d), donc on préserve l finlité, on fusionne C sur D. F J M Q B E I L P R A C,, 0 1 Clcul des trnsitions optimles { pour C : δ(c, ) = q tel que min p {I,J} q {C,D} w(d) E I,I =6;w(C) E H,J + w(d) E I,J =5 D où q = J. } w(q) E δ(q,),p = min p {I,J} }. { w(c) E H,I + } δ(c, ) =I : min {w(c) E G,I +w(d) E H,I =7;w(C) E G,J +w(d) E H,J =8 p {I,J} { } δ(1,)=i : min w(1) E G,I =2;w(1) E G,J =3. p {I,J} On otient donc l utomte hyper-optiml : 32

F J M Q B E I L P R A C, 0 1 Pour trouver les meilleures fusions, nous devons donc nous intéresser à trois points : l finlité desétts de l nneu les trnsitions des étts f-équivlents de l nneu vers des étts du noyu. le choix de l étt initil Ce chpitre présenté lesdifférentes crctéristiques des utomtes hyperminimux. Nous vons étudié l prtition des étts : noyu-nneu, insi que l l prtition des étts f-équivlents. Ces deux prtitions ont utorisé l introduction de propriétés sur l hyperminimlité, et, le théorème II.3.4 qui nous ccordé l dissocition d un domine ien connu de l théorie des utomtes : l minimistion, vec un nouveu propre à l hyper-minimistion. Comme nous l vons ussi vu, il n y ps unicité des utomtes hyperminimux. Lors de l construction de ces utomtes, il est possile d opérer plusieurs fusions qui génèrent potentiellement un nomre d erreurs différentes. Nous vons donc estimé ces erreurs et crctérisé une nouvelle ctégorie d utomte : les utomtes hyper-optimux pour lesquels le nomre mots joutés et/ou supprimés u lngge est minoré. Dns le prochin chpitre nous présenteronsdifférents lgorithmes permettnt de construire des utomtes hyper-minimux et hyper-optimux. 33

III Algorithmes d hyper-minimistion Nous sommes mintennt prêtà élorerdes lgorithmespermettnt l construction d utomtes hyper-minimux et hyper-optimux. Nous présenterons un premier lgorithme d hyper-minimistion en O(n 3 ) puis un second en O(n 2 )jusqu à otenir en lgorithme efficce en O(m log n). Nous présenteronsensuiteun lgorithmemoins efficcepermettnt l construction d utomtes hyper-optimux. Tout u long de cette prtie, nous noterons n le crdinl de l ensemle des étts d un utomte, et, m le crdinle de l ensemle des trnsitions. (On Σ n m.) III.1 Algorithme de Bdr, Geffert et Shipmn Commençons pr exposer un lgorithme grossier qui nous donner déjà une complexité polynomile en temps. C est le premier lgorithme présenté dns l rticle de Andrew Bdr, Vilim Geffert et In Shipmn[4]. Algorithme 1: Hyper-minimistion en O(n 3 ) Données : M un DFA Résultt : M un DFA hyper-miniml f-équivlent à M 1 minimiser M [10]; 2 clculer l prtition P des étts du noyu et de l nneu (lgo 2); 3 clculer l prtition F des étts f-équivlents (lgo 3); 4 fusionner les étts qui peuvent l être (lgo 4); L minimistion peut se clculer en O(n 2 ) pr l lgorithme de Moore[7] ou encore en O(n log n) pr l lgorithme de Hopcroft[10]. Certins utomtes prticuliers possèdent des lgorithmes plus performnts : pr exemple l minimistion d utomte cyclique peut se fire en O(n) grâce à l lgorithme de Revuz[6]. Cel étnt dns notre cs, on peut noter que l hyper-miniml d un utomte cyclique peut se construire trivilement en Θ(1) en retournnt l utomte reconnissnt le lngge vide. L seconde prtie consiste à étlir l prtition des étts du noyu et ceux de l nneu. Cette prtition peut-être élorée à prtir de l lgorithme de fermeture trnsitive[5] ttriué à Roy-Wrshll qui est de complexité Θ(n 3 ). Associer à cet lgorithme un prcours de l digonle de l mtrice permet de distinguer les lignes des étts de K à l origine de cycle ; l union des étts ccessiles pr cet étt permet de clculer l intégrlité dunoyu. 34

Algorithme 2: Clcul du noyu Données : M un DFA Résultt : K le noyu de M 1 T fermeture trnsitive[5] ssocié u grphe de M; 2 K ; 3 pour tous les q Q fire 4 si T [q, q] lors 5 jouter à K les étts ccessiles pr q 6 retourner K L troisième prtie consiste à former une nouvelle prtition distingunt l f-équivlence d étts. L lgorithme de Andrew Bdr, Vilim Geffert et In Shipmn[4] est un lgorithme à point fixe qui clcul les étts f-équivlents : L idée est de prtir d une prtition de singleton : Q = {q}. À chque tour de oucle, on v chercher à regrouper les clsses d étts f- équivlents en se snt sur le lemme II.1.9. Algorithme 3: Clcul de Données : M un DFA Résultt : T une prtition d étts f-équivlents // crétion d un tleu indicé pr les étts à vleurs dns des clsses 1 T [α 1,α 2,...] // q i Q α i = i; 2 M mtrice vide de dimension Q Σ ; 3 répéter 4 pour tous les (q, ) Q Σ fire 5 M[q, ] T[δ(q, )]; 6 i 0; 7 D // un dictionnire; 8 T old T; 9 pour tous les q Q fire 10 si M[q] Dlors 11 incrémenter i; 12 jouter M[q] i à D; 13 T [q] vleur ssocié M[q] dnsd; 14 jusqu à T = T old ; 15 retourner T Cet lgorithmepossèdeune complexitéen temps O(nm) ; l oucle principle v u plus s effectuer n fois. Et à chque ronde, on commence pr mettre-à-jour l mtrice qui ssocie les trnsitions de δ ux clsses d équivlences de T (Θ(m)) q Q 35

puis on compre les colonnes de l mtrice entres-elles (Θ(m)) pour créer une nouvelle prtition d étts f-équivlents. L lgorithme s rrête lorsqu on ne crée plus de nouvelle prtition. L dernière étpe est l fusion des étts f-équivlents qund cel est possile. Il v s gir d identifier dns les clsses de f-équivlence possédnt des étts pprtennt à l nneu pour les fusionner jusqu à otenir des clsses de singleton oudesclssesd étts du noyu. Algorithme 4: Fusion Données : M un DFA miniml et ses crctéristiques : K/P et l prtition des étts f-équivlent T Résultt : M un DFA hyper-miniml f-équivlent à M // l étpe de fusion de p sur q consiste à rediriger les trnsitions entrnte sur p vers q, supprimer les trnsitions issues de p et supprimer p de Q 1 pour tous les Δ T fire 2 Λ Δ P ; 3 sélectionner p Λ; 4 pour tous les q Λ \{p} fire 5 fusionner q sur p 6 Γ Δ \ Λ; 7 si Γ lors 8 fusionner p sur un étt quelconque de Γ Cet lgorithme ne s intéresse ps à l finlité des étts, on ne s intéresse ps ici u fit d jouter ou d enlever un mimimum de mots du lngge d origine. Cet lgorithme une complexité en temps O(n). L lgorithme principl 1 donc une complexité de l ordre de O(n 3 )quiestdû u clcul de l fermeture trnsitive. Le choix d utiliser l lgorithme de fermeture trnsitive[5] de Roy-Wrshll permet d order fcilement les choses mis est loin d être efficce, dns les prochins lgorithmes nous choisirons d utiliser des techniques moins triviles tel que l lgorithme de clcul des composntes fortement connexes de Trjn[13]. Les prochins lgorithmes vont permettre d rriver à une complexitéeno(n log n). III.2 Algorithme en O(n 2 ) Ce nouvel lgorithme étéprésenté pr Andrew Bdr[1]. Il eu pour ojectif d méliorer l complexité duprécédent. 36

L prtie principle reste identique à l lgorithme 1 mis les prties deux et trois sont eucoup plus spécifiques. L supputtion du noyu v s effectuer grâce à l lgorithme suivnt. Algorithme 5: clcul du noyu en O(n 2 ) Données : M un DFA Résultt : K le noyu de M 1 K ; 2 pour tous les q Q fire 3 K q l ensemle des étts non triviux ccessiles pr q 4 pour tous les q Q fire 5 si q K q lors 6 K K K q 7 retourner K L troisième prtie v permettre d méliorer l complexité. Pour clculer l prtition des étts f-équivlents on v utiliser l définition suivnte : Définition III.2.1 Soient M 1 =(Σ,Q 1,i 1,F 1,δ 1 )etm 2 =(Σ,Q 2,i 2,F 2,δ 2 )deuxdfa. On définit l utomte XOR cross product de M 1 et M 2 : D =(Σ,Q,i,F,δ ) où : Q = {(q 1,q 2 ) q 1 Q 1 q 2 Q 2 } = Q 1 Q 2, (q 1,q 2 ) Q Q 2 Σ:δ ((q 1,q 2 ),)=(δ 1 (q 1,),δ 2 (q 2,)), i =(i 1,i 2 ) F = {(q 1,q 2 ) (q 1 F 1 ) (q 2 F 2 )} = F 1 F 2 où est le ou exclusif. On v ussi utiliser l lgorithme suivnt qui clcule l ensemle des étts dont les lngges droits sont finis : 37

Algorithme 6: Clcul de l ensemle des étts d un DFA ynt un lngge droit fini Données : M un DFA et S l ensemle des étts non co-ccessile Résultt : L Q l ensemle des étts ynt un lngge droit fini 1 C Q \ S; 2 pour tous les q Q fire 3 Incom q ; 4 Outgo q 5 pour tous les (q, ) C Σ fire 6 q δ(q, ); 7 jouter (q, ) à Incom q; 8 jouter (q,)à Outgo q 9 L // une liste; 10 L proc une liste ssociée ux éléments de S; 11 tnt que L proc fire 12 q pop(l proc ; 13 jouter q à L; 14 pour tous les (q,) Incom q fire 15 enlever (q, ) deoutgo q; 16 si Outgo q = lors 17 jouter q à L proc 18 retourner L Et enfin, l lgorithme qui clcule les clsses d étts f-équivlents : 38

Algorithme 7: Clcul de l prtition des étts f-équivlent d un DFA en O(n 2 ) Données : M un DFA miniml Résultt : UF l prtition des étts f-équivlent de M 1 D XOR cross product(m,m); 2 S {(q, q) q Q}; 3 L clcul des étts à lngges droits finis pour (D,S) // lgo 6; // On utilise les couples de L pour créer l prtition 4 UF structure union find // structure de données d ensemles disjoints [5]; 5 pour tous les q Q fire 6 jouter l ensemle {q} à UF 7 pour tous les (q, r) L fire 8 P q UF.find(q); 9 P r UF.find(r); 10 si P q P r lors 11 UF.union(P q,p r ) 12 retourner UF L construction de l utomte D permet de clculer un contexte tel que (q, r) Q wσ, δ ((q, r),w) F δ(q, w) F δ(r, w) F. Ceci pour conséquence que l ensemle S est exctement l ensemle des étts de D dont le lngge droit est vide. Ainsi le clcul des lngges droits finis effectué pr l lgorithme 6 clcule exctement l ensemle des étts (q, r) Q qui correspondent à un ensemle des couples d étts f-équivlent de M. Et on otient donc l prtition d ensemles disjoints des étts f-équivlents. Cet lgorithme s exécute en O(n 2 ). L fusion des étts v s effectuer pr un lgorithme différent du précédent de complexité O(n) : 39

Algorithme 8: Fusionne des étts f-équivlents fusionnles en O(n). Données : M un DFA miniml ; UF prtition des étts f-équivlent ; (P, K) lesétts de l nneu et du noyu Résultt : M un utomte hyper-miniml de M 1 pour tous les S UF fire 2 P s S P ; 3 K s S K; 4 si K s lors 5 R pop(k s ) 6 sinon 7 R pop(p s ) 8 pour tous les q P s fire 9 fusionner q dns R III.3 Algorithme en O(m log n) On vu qu il existe des lgorithmes permettnt d otenir une complexité en O(m log n) pour l minimistion (en utilisnt Hopcroft[10]), en O(n) pourl fusion des étts (lgo 4 et 8). Les lgorithmes de crétions des deux différentes prtitions étts f-équivlents et noyu-nneu nous ont donné une complexité en temps de l ordre de O(n 2 ). Cette section v présenter les lgorithmes de Mrkus Holzer et Andres Mletti [9]quivontpermettredeclculerlenoyuenO(m) etd identifierl prtition des étts f-équivlents en O(m log n). Pour clculer le noyu de l utomte, on v utiliser une version llégée de l lgorithme de Trjn[13]. L lgorithme de Trjn clcule, pour un grphe, ses composntes fortements connexes dns un temps de l ordre de O(m + n). Cet lgorithme v prcourir tous les étts du grphe (dns un grphe, il n existe ps nécessirement un étt qui ccède à tous les utres). L complexité de cet lgorithme peut se réduire en se contentnt d un prcours àprtirdel étt initil (Trjn(M,q 0 )) ce qui nous donne une complexité en temps de l ordre de O(m) : 40

Algorithme 9: Clcule des étts du noyu Données : M un DFA, q un étt de M Glole : index, low : Q N initilement non défini, i N initilement à0ets une pile initilement vide Résultt : K le noyu de M // configure l index de q à i 1 index(q) i; // configure le plus petit index des étts ccessile depuis q jusqu à l index de q 2 low(q) i; // on incrémente l index 3 i i +1; 4 jouter q dns l pile S; 5 pour tous les Σ fire 6 si index(δ(q, ) n est ps défini lors // explortion de l étt non encore exploré 7 Trjn(M,δ(q, )); // màj du plus petit index 8 low(q) min(low(q),low(δ(q, )); 9 sinon 10 si δ(q, ) S lors 11 low(q) min(low(q),index(δ(q, ))) 12 si low(q) =index(q) lors // tous les éléments jusqu à p pprtiennent à l m^eme composnte 13 répéter 14 p sommet de l pile S; 15 dépiler S; 16... // suvegrder ces éléments dns une CFC 17 jusqu à p = q; Pour clculer l prtition des étts f-équivlents, le prochin lgorithme v utiliser des structures àccès en temps constnts ou logrithmique. On prendr une tle de hchge h à vleur dns Q où une clé est un vecteur d étts de tille Σ. À prtir de cette tle de hchge, on récupère un étt qui v indiquer un ensemle pr l structure π du type union-find[5]. 41

Algorithme 10: Clcule de l prtition des étts f-équivlents en O(m log n) Données : M un DFA miniml 1 pour tous les q Q fire 2 π(q) {q} // initilistion d une tle de hshge Q Σ Q 3 h ; // liste des étts considérés 4 I Q; // les étts cournts 5 P Q; 6 tnt que I fire 7 q tête de l liste I; 8 enlever l élément en tête de l liste I; // clcul d un vecteur à prtir des successeurs de q 9 succ < δ(q, ) Σ >; 10 si succ est une clé deltleh lors 11 p vleur ssociée à succ dns h; 12 si π(p) π(q) lors 13 échnger p et q 14 P P \{p}; 15 I (I \{p}) {r P Σ:δ(r, ) =p}; 16 fusionner l étt p sur q; 17 π(q) π(q) π(p) 18 jouter q dns h vec succ comme clé 19 retourner π Ces derniers lgorithmes permettent d otenir un lgorithme d hyper-minimistion en O(m log n) (à condition d utiliser l lgorithme de Hopcroft[10] pour l minimistion). Cel étnt, jusqu ici les lgorithmes de fusions ne s intéressent ps u nomre d erreurs générées pr ces fusions. L prochine prtie propose des lgorithmes pour effectuer des fusions minimisnt le nomre d erreurs. III.4 Algorithme de fusion vec un minimum d erreurs Voici l ensemle des lgorithmes permettnt de minimiser le nomre d erreurs lors des fusions d étts f-équivlent pour otenir un utomte hyper-optiml. Ces lgorithmes sont les lgorithmes de Andres Mletti [2]. Le premier lgorithme v permettre de compter le nomre de chemins pour les étts de l nneu : 42

Algorithme 11: CompAccess Données : M un DFA miniml, P son nneu et un tri topoloque ssocié uxétts de P Résultt : le tleu T du nomre de chemin ccédnt pour chque étt de P 1 w( (0)) 1 // le chemin ε prtnt de i; 2 pour j 1 P fire 3 w( (j)) w(p) 4 retourner w δ(p,)= (i) (p,) Q Σ Le second lgorithme clcule le nomre d erreurs engendrées pr l fusion p sur q ou q sur p. Algorithme 12: CompErrors Données : M un DFA miniml et p, q Q où p q Glole :lmtricee du nomre d erreurs initillement à0surl digonle et -1 prtout illeurs 1 si E p,q = 1 lors 2 c ((p F )xor(q F )); 3 E p,q c + Σ CompErrors(M,δ(p, ),δ(q, )) Le troisièmelgorithmevdécider pour un sous-ensemle d étts f-équivlents, tous inclus dns l nneu, s il est fvorle (en nomre d erreurs) de sélectionner un étt finl ou un étt non-finl pour les fusions. 43

Algorithme 13: CompFinlity Données : M un DFA miniml, B P d étts f-équivlents et le nomre de chemin d ccès vec w(p), p P Glole : nomre d erreurs e // nomre d erreurs pour les finux et non finux de B 1 (f,f) ( w(q), w(q)); q B F q B\F // on joute l plus petite vleur u nomre d erreurs gloles 2 e e + min(f,f); // on sélectionne un étt finl de B si f est le minimum 3 si f>flors 4 sélectionner q B F 5 sinon 6 sélectionner q B \ F 7 retourner q Le dernier lgorithme effectue les fusions engendrnt le moins d erreurs pour otenir un utomte hyper-optiml. Il utilise les précédents lgorithmes pour définir les meilleurs fusions pour les composntes dont tous les étts sont dns le noyu. Pour les utres composntes, les composntes non tritées pr cet lgorithme, on utiliser l lgorithme clssique de fusion 8. 44

Algorithme 14: OptMerge : fusion optimle des étts f-équivlents Données : M =(Σ,Q,i,F,δ) un DFA miniml, les étts du noyu K et l prtition des étts f-équivlent Q/ Glole : nomre d erreurs e, initilisé à 0 1 P Q \ K; 2 TopoSort(P ); 3 w CompAccess(M,P, ); 4 pour tous les B Q/ tel que B P fire 5 q CompFinlity (M,B,w); 6 pour tous les p B fire 7 fusionner p sur q 8 pour tous les Σ fire 9 B {q K q δ(q, )}; 10 si B lors 11 e e +min q B ( w(p) E δ(p,),q ); p B 12 δ(q, ) rg min q B ( w(p) E δ(p,),q ) p B 13 B {q K q i}; 14 si B lors 15 e e +min i,q ; q B 16 i rg min q B E i,q 17 retourner (M,e) 45

Conclusion Nous vons pu étudier l notion d hyper-minimlité des utomtes introduite pr l rticle [4]. Cedominedelthéorie des lngges permet de supputer un DFA u moins ussi petit qu un DFA miniml, en s utorisnt une différence symétrique finie entre le lngge reconnu à l origine et le lngge reconnu pr le DFA hyperminiml créé. Le clcul d un tel DFA s otient à prtir des notions d étts f-équivlents, et, de noyu et nneu d un utomte. Les différents rticles étudiés ont étli que, contrirement àlnotiondeminimlité d un utomte, il n y ps unicité dns les utomtes hyper-minimux. L non-unicité été développée dns l rticle [2]. Cette puliction définit une nouvelle construction d utomte hyper-minimux : les utomtes hyperoptimux. Ces derniers représentent les DFA hyper-minimux engendrnt un nomre minimum d erreurs pr rpport u lngge reconnu à l origine. Nous vons pu étudier différents lgorithmes u trvers des différents rticles [4,1,9,2].L rticle de référence[4] fourni un lgorithme simple s exécutnt en O(n 3 ), et celui de Holzer et Mletti[9], un lgorithme efficce en O(m log n). L rticle [2] nous pourvu d un nouvel lgorithme non plus efficce en terme de complexité temporelle mis en terme de nomre d erreurs générées pr l construction d un utomte hyper-optiml. Ce sujet est encore ouvert. Il récemment donné lieu à un rticle polonis [8] qui étend l notion de f-équivlence en ornnt supérieurement (pr k) l tille des mots pprtennt à l différence symétrique : l k-f-équivlence et en fournissnt de nouveux lgorithmes efficces d utomtes hyper-minimux à prtir de DFA (en O(m log n)) et de NFA (en O(m log 2 n)). Le chercheur Sven Schewe de l université de Liverpool s est ussi intéressé à poursuivre ces recherches sur les DBA et DPA [15]. (Les DBA et DPA sont des utomtes reconnissnt les lngges ω-régulier.) 46