Notes de révision : Automates et langages



Documents pareils
Chapitre 2 Le problème de l unicité des solutions

Théorème de Poincaré - Formule de Green-Riemann

STI2D Logique binaire SIN. L' Algèbre de BOOLE

Techniques d analyse de circuits

Correction de l épreuve CCP 2001 PSI Maths 2 PREMIÈRE PARTIE ) (

LANGAGES - GRAMMAIRES - AUTOMATES

Algorithmes sur les mots (séquences)

semestre 3 des Licences MISM annnée universitaire

Université Paris-Dauphine DUMI2E. UFR Mathématiques de la décision. Notes de cours. Analyse 2. Filippo SANTAMBROGIO

Séquence 8. Probabilité : lois à densité. Sommaire

ANALYSE NUMERIQUE NON-LINEAIRE

COURS D ANALYSE. Licence d Informatique, première. Laurent Michel

/HVV\VWqPHVFRPELQDWRLUHV

Synthèse de cours (Terminale S) Calcul intégral

Chapitre 11 : L inductance

L'algèbre de BOOLE ou algèbre logique est l'algèbre définie pour des variables ne pouvant prendre que deux états.

LICENCE DE MATHÉMATIQUES DEUXIÈME ANNÉE. Unité d enseignement LCMA 4U11 ANALYSE 3. Françoise GEANDIER

Chapitre VI Contraintes holonomiques

Tout ce qu il faut savoir en math

Intégrale et primitives

LITE-FLOOR. Dalles de sol et marches d escalier. Information technique

Cours d Analyse IV Suites et Séries de fonctions

Pour développer votre entreprise. Compta LES LOGICIELS EN LIGNE, VOUS ALLEZ DIRE OUI!

Module 2 : Déterminant d une matrice

Toyota Assurances Toujours la meilleure solution

Statuts ASF Association Suisse Feldenkrais

Pour développer votre entreprise LES LOGICIELS EN LIGNE, VOUS ALLEZ DIRE OUI!

Guide des bonnes pratiques

Avant d utiliser l appareil, lisez ce Guide de référence rapide pour connaître la procédure de configuration et d installation.

SYSTEME DE TELEPHONIE

ANALYSE : FONCTIONS D UNE VARIABLE RÉELLE

Licence M.A.S.S. Cours d Analyse S4

Turbine hydraulique Girard simplifiée pour faibles et très faibles puissances

Introduction à la modélisation et à la vérication p. 1/8

AUTOUR D UN MÉMOIRE INÉDIT : LA CONTRIBUTION D HERMITE AU DÉVELOPPEMENT DE LA THÉORIE DES FONCTIONS ELLIPTIQUES. Bruno BELHOSTE (*)

Chapitre 1 : Fonctions analytiques - introduction

Conseils et astuces pour les structures de base de la Ligne D30

Influence du milieu d étude sur l activité (suite) Inhibition et activation

Guide d'utilisation Easy Interactive Tools Ver. 2

Probabilités sur un univers fini

Commencer DCP-7055W / DCP-7057W /

Classeur courtier d assurance. Comment organiser son activité et se préparer à un contrôle

Sommaire. 6. Tableau récapitulatif Sophos NAC intégré Vs. NAC Advanced - 17 Février

Réalisation de sites Internet PME & Grandes entreprises Offre Premium. Etude du projet. Webdesign. Intégration HTML. Développement.

ManSafe. pour les Utilitiés. La Protection antichute pour les Industries de l'energie. Français. TowerLatch LadderLatch

EnsEignEmEnt supérieur PRÉPAS / BTS 2015

3- Les taux d'intérêt

Thèse Présentée Pour obtenir le diplôme de doctorat en sciences En génie civil Option : structure

Transfert. Logistique. Stockage. Archivage

Partie 4 : La monnaie et l'inflation

Guide de l'utilisateur

Baccalauréat S Asie 19 juin 2014 Corrigé

NEWS PRO ACTIV. [Juillet 2015] Ce mois-ci on vous parle de. L arrêté est applicable à compter du 1er Juillet 2015.

Le canal étroit du crédit : une analyse critique des fondements théoriques


LOGICIEL FONCTIONNEL EMC VNX

La pratique institutionnelle «à plusieurs»

Compte rendu de la validation d'un observateur cascade pour la MAS sans capteurs mécaniques sur la plate-forme d'essai de l'irccyn

Magister en : Génie Mécanique

INFORMATIONS TECHNIQUES

- Phénoméne aérospatial non identifié ( 0.V.N.I )

La plateforme Next Generation Mini guide

Bloc notes. a À faire tout de suite. Gardez secret votre code confidentiel. À conserver précieusement. Protégez votre carte

1 Définition et premières propriétés des congruences

INSTRUCTIONS POUR L INSTALLATION ET LE FONCTIONNEMENT DES SERRURES À POIGNÉE BÉQUILLE

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Santé et sécurité psychologiques en milieu de travail

Modification simultanée de plusieurs caractéristiques d un bien hédonique : une nouvelle méthode de calcul de la variation de bien-être des ménages

Proposition. Si G est un groupe simple d ordre 60 alors G est isomorphe à A 5.

Directives COV et alternative lipochimique : peintures, encres, nettoyage, dégraissage...

Le produit semi-direct

McAfee Firewall Enterprise Control Center

Régression multiple : principes et exemples d application. Dominique Laffly UMR CNRS Université de Pau et des Pays de l Adour Octobre 2006

FIG. 1 Module de stockage en position horizontale ; positionnement des jauges de déformation.

l appareil et vérifier les composants Module tambour-cartouche de toner (pré-installé)

INSTALLATION DE DETECTION INCENDIE

Livret de l étudiant

La paye. La comptabilité. Comparez et choisissez votre logiciel. Comparez et choisissez votre logiciel. Paye Bâtiment Paye Agricole 2013

Clients légers IGEL et bureaux virtuels : synergie idéale et coût minimal

Electrovanne double Dimension nominale Rp 3/8 - Rp 2 DMV-D/11 DMV-DLE/11

INF 232: Langages et Automates. Travaux Dirigés. Université Joseph Fourier, Université Grenoble 1 Licence Sciences et Technologies

Calcul fonctionnel holomorphe dans les algèbres de Banach

Image d un intervalle par une fonction continue

La mesure de Lebesgue sur la droite réelle

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

III- Raisonnement par récurrence

Informatique Théorique : Théorie des Langages, Analyse Lexicale, Analyse Syntaxique Jean-Pierre Jouannaud Professeur

Dualité dans les espaces de Lebesgue et mesures de Radon finies

Fonctions de plusieurs variables

Portiers audio et vidéo ABB-Welcome et ABB-Welcome M

Résolution de systèmes linéaires par des méthodes directes

Probabilités sur un univers fini

Meg Gawler Bréhima Béridogo. Mars 2002

Chapitre 2 Le problème de l unicité des solutions

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

La NP-complétude. Johanne Cohen. PRISM/CNRS, Versailles, France.

Résolution d équations non linéaires

La fonction exponentielle

FONDATION CLEMENTINE ET MAURICE ANTILLE

Transcription:

Préprtion à l grégtion de mthémtiques 2011 2012 Notes de révision : Automtes et lngges Benjmin MONMEGE et Sylvin SCHMITZ LSV, ENS Cchn & CNRS Version du 24 octore 2011 (r66m) CC Cretive Commons y-nc-s Automtes et lngges Ces notes de révisions sont destinées ux cndidts à l grégtion de mthémtiques qui ont choisi l option D d informtique à l orl. Les notes couvrent (pour l instnt) l essentiel du progrmme de l option en mtière d utomtes et de lngges rtionnels, et seront complétées un jour... Certines thémtiques lrgement hors progrmme sont églement ordées : elles sont signlées pr le symole ici reproduit en mrge. Les notes de révision ne se sustituent ps à l lecture des ouvrges clssiques sur le sujet, mis offrent des renvois à ces ouvrges et les complètent vec des exemples et des pplictions plus vriées. En prticulier, on ne trouver ps en ces pges une seule démonstrtion complète, mis seulement des justifictions rpides, qui sont à proscrire lors d un développement orl. Progrmme officiel Le progrmme comporte d près le document du site de l grégtion http:// greg.org/indexmths2011.html : 1. Automtes finis. Lngges reconnissles. Lemme d itértion. Existence de lngges non reconnissles. Automtes complets. Automtes déterministes. Algorithme de déterministion. Propriétés de clôture des lngges reconnissles. 2. Expressions rtionnelles. Lngges rtionnels. Théorème de KLEENE. 3. Automte miniml. Résiduel d un lngge pr un mot. Algorithme de minimistion. 4. Utilistion des utomtes finis : recherche de motifs, nlyse lexicle. 5. Lngges lgériques. Lemme d OGDEN. Existence de lngges non lgériques. Grmmires lgériques. Propriétés de clôture des lngges lgériques. 6. Automtes à pile. Lngges reconnissles pr utomtes à pile. 7. Utilistion des utomtes à pile : nlyse syntxique. Grmmires LL(1). Les leçons correspondntes sont : Leçon 907 Algorithmique du texte : exemples et pplictions. Leçon 908 Automtes finis. Exemples et pplictions. Leçon 909 Lngges rtionnels. Exemples et pplictions. Leçon 910 Lngges lgériques. Exemples et pplictions. Leçon 911 Automtes à pile. Exemples et pplictions. Leçon 923 Anlyses lexicle et syntxique : pplictions.

Notes de révision : Automtes et lngges 2 Si le progrmme de l option D porte glolement sur l informtique fondmentle, on noter tout de même l insistnce des jurys à demnder des exemples et pplictions pour les résultts ssez théoriques du thème. C est que ces résultts, souvent sous l forme de preuves constructives, ne se réduisent ps à des théorèmes sur des ojets mthémtiques, mis sont réellement ppliqués dns de nomreux domines. Deux questions sont à se poser systémtiquement fce à un résultt théorique en informtique : 1. «À quoi cel sert-il?», quelles sont les pplictions de ce résultt? 2. «Quel est le coût?», quelle est l complexité théorique de cette construction? Biliogrphie recommndée Tout n est ps forcément disponile dns toutes les iliothèques universitires, mis u moins une prtie de ces ouvrges font prtie de l iliothèque de l grégtion, et sont donc disponiles pendnt les trois heures de préprtion des cndidts. Des renvois vers ces ouvrges sont systémtiques dns les notes de révision. Il est peut-être utile de rppeler que les seuls documents utorisés lors de l préprtion de l orl sont des livres lrgement diffusés, de mnière à préserver l églité des chnces entre les cndidts. En prticulier, ces notes de révision ne peuvent ps être utilisées lors de l préprtion elle-même, mis ont voction à l être en mont lors du trvil de révision à proprement prler. [ASU86] Alfred AHO, Rvi SETHI et Jeffrey ULLMAN. Compilteurs : Principes, techniques et outils. Dunod, 2000. Trduit de Compilers, Addison Wesley, 1986. [Aut94] Jen-Michel AUTEBERT. Théorie des lngges et des utomtes. Msson, 1994. [Cr08] Olivier CARTON. Lngges formels, clculilité et complexité. Vuiert, 2008. [GBJL00] Dick GRUNE, Henri E. BALS, Ceriel J.H. JACOBS et Koen G. LANGENDOEN. Compilteurs. Dunod, 2002. Trduit de Modern Compiler Design, John Wiley & Sons, 2000. [Hr78] Michel A. HARRISON. Introduction to Forml Lnguge Theory. Addison Wesley, 1978. [HU79] John E. HOPCROFT et Jeffrey D. ULLMAN. Introduction to Automt Theory, Lnguges, nd Computtion. Addison Wesley, 1979. [Sk03] Jcques SAKAROVITCH. Éléments de théorie des utomtes. Vuiert, 2003. [SSS88] Seppo SIPPU et Eljs SOISALON-SOININEN. Prsing Theory, Vol. I: Lnguges nd Prsing. EATCS Monogrphs on Theoreticl Computer Science volume 15, Springer, 1988. [SSS90] Seppo SIPPU et Eljs SOISALON-SOININEN. Prsing Theory, Vol. II: LR(k) nd LL(k) Prsing. EATCS Monogrphs on Theoreticl Computer Science volume 20, Springer, 1990.

Notes de révision : Automtes et lngges 3 Contenu des notes de révision 1 Automtes et lngges rtionnels 5 1.1 Lngges reconnissles....................... 5 1.1.1 Propriétés élémentires.................... 6 1.1.2 Automtes déterministes.................... 7 1.1.3 Propriétés de clôture...................... 9 1.1.4 Lemmes d itértion....................... 12 1.2 Lngges rtionnels.......................... 15 1.2.1 Des expressions ux utomtes................ 16 Construction de THOMPSON.................. 16 Automte stndrd de GLUSHKOV............... 17 Expressions dérivées prtielles d ANTIMIROV......... 20 1.2.2 Des utomtes ux expressions................ 24 Construction de MCNAUGHTON et YAMADA.......... 24 Construction de BRZOZOWSKI et MCCLUSKEY........ 24 Lemme d ARDEN et élimintion de GAUSS.......... 26 Complexité des expressions rtionnelles........... 27 1.3 Minimistion.............................. 29 1.3.1 Automte des quotients.................... 31 1.3.2 Algorithme pr renversement de BRZOZOWSKI........ 32 1.3.3 Congruence de NERODE.................... 33 1.3.4 Algorithme de MOORE..................... 34 1.3.5 Monoïde syntxique...................... 35 1.4 Applictions............................... 38 1.4.1 Loclistion........................... 39 1.4.2 Anlyse lexicle......................... 43 1.4.3 Linguistique........................... 47 1.4.4 Théorie des codes....................... 48 1.4.5 Décidilité de l rithmétique de PRESBURGER........ 56 1.4.6 Automtes oustrophédons.................. 58 2 Références supplémentires 61

Notes de révision : Automtes et lngges 4

Chpitre 1 Automtes et lngges rtionnels Le progrmme de l grégtion pour les utomtes et lngges rtionnels tourne essentiellement utour du théorème de KLEENE : Théorème 1.1 (KLEENE [1956]). Soit Σ un lphet fini. Un lngge de Σ est rtionnel si et seulement si il est reconnu pr un utomte fini sur Σ : Rt(Σ ) = Rec(Σ ) On s ttcher donc prticulièrement à connître les preuves des deux inclusions Rt(Σ ) Rec(Σ ) pr l construction de THOMPSON, celle de GLUSHKOV, ou celle d ANTIMIROV (section 1.2.1), Rec(Σ ) Rt(Σ ) pr l construction de MCNAUGHTON et YAMADA, ou celle de BRZOZOWSKI et MCCLUSKEY, ou pr résolution d un système d équtions et le lemme d ARDEN (section 1.2.2). Il n est ps nécessire de mîtriser toutes ces constructions, mis il fut en connître une dns chque direction du théorème! Au résultt centrl qu est le théorème de KLEENE s joutent des résultts périphériques de 1. clôture pr diverses opértions (section 1.1.3), 2. lemmes d itértion (section 1.1.4), et 3. minimistion (section 1.3). Ces résultts sont à connître puisqu ils sont u progrmme et sont donc susceptiles de fire l ojet de questions à l orl. L introduction d un ou plusieurs de ces points dns un pln d une leçon 908 ou 909 est utile, en veillnt à ne ps oulier pour utnt les exemples et pplictions. C.f. [Cr08, p. 36], [Sk03, p. 94], [Aut94, p. 52], [SIPPU et SOISALON-SOININEN, 1988, p. 82], [HU79, p. 30], [Hr78, p. 57]. Le théorème n est ps vérifié pour tout monoïde [Sk03, p. 261]. 1.1 Lngges reconnissles Définition 1.2 (Automte fini). Un utomte fini sur un lphet Σ est un tuple A = Σ, Q, I, F, δ où Q est un ensemle fini d étts, I Q l ensemle des étts initiux, F Q l ensemle des étts finls, et δ Q Σ {ε} Q l reltion de trnsition. Alterntivement, on peut voir δ comme une fonction de Q Σ {ε} dns 2 Q l ensemle des prties de Q. On étend nturellement l définition de δ sur Q Σ Q pr δ (q, ε) = q et δ (q, w) = q δ(q,) δ(q, w). Pr un us de nottion ien prtique, on peut ussi 5 C.f. [Cr08, sec. 1.5.2][Sk03, sec. I.1], [Aut94, ch. 4], [SIPPU et SOISALON-SOININEN, 1988, sec. 3.2], [HU79, sec. 2.2 2.4], [Hr78, ch. 2].

Notes de révision : Automtes et lngges 6 l étendre à des ensemles d étts ou de mots pr l union δ (E, L) = q E,u L δ (q, u). Enfin, on peut définir similirement l reltion inverse δ 1 = {(q,, p) (p,, q) δ}. Définition 1.3 (Lngge reconnissle). Le lngge reconnu pr un utomte A = Σ, Q, I, F, δ est L(A) = {w Σ i I, f F, f δ (i, w)} L utre définition de Rec(Σ ) utilise l notion de reconnissnce pr monoïde : nous l étudierons plus en détil dns l section 1.3.5 Deux utomtes finis sur Σ sont équivlents s ils reconnissent le même lngge de Σ. Un lngge L sur Σ est reconnissle s il existe un utomte fini sur Σ tel que L = L(A). L ensemle des lngges reconnissles sur Σ est noté Rec(Σ ). 1.1.1 Propriétés élémentires On rppelle ici quelques propriétés élémentires sur les utomtes. Définition 1.4 (Automte ccessile). L ensemle des étts ccessiles d un utomte fini est δ (I, Σ ). Un utomte fini est ccessile si tous ses étts sont ccessiles, c est-à-dire si, pour tout étt q de Q, il existe un mot u de Σ et un étt initil i de I tels que q δ (i, u). Proposition 1.5. Pour tout utomte fini sur Σ, il existe un utomte fini ccessile équivlent. Démonstrtion. Étnt donné un utomte fini A = Σ, Q, I, F, δ, on définit l utomte A = Σ, Q, I, F, δ vec Q = δ (I, Σ ) δ = δ (Q Σ {ε} Q ) C.f. [SIPPU et SOISALON-SOININEN, 1988, ch. 2], [Sk03, exercice I.1.20]. On rppelle ussi que le prolème de l ccessiilité dns un grphe orienté, c est-à-dire de déterminer pour deux sommets quelconques p et q s il existe un chemin orienté qui relie p à q, est l exemple clssique vec 2SAT d un prolème NLOGSPACE-complet [Cr08, théorème 4.46], [HU79, sec. 13.5], [PAPADIMITRIOU, 1993, ch. 16]. Un clcul d ccessiilité dns un utomte se réduit à un clcul d ccessiilité dns un grphe orienté, qui n est lui-même qu un clcul de l imge d un ensemle pr l fermeture réflexive trnsitive de l reltion R d djcence du grphe. En prtique, on utilise pour ce type de prolème soit un simple prcours en profondeur depuis les étts initiux en O( Q + δ ), soit des lgorithmes plus vncés utilisnt les composntes fortement connexes du grphe (lgorithme de TARJAN [1972] en O(t mx( S, R )) où S est l ensemle des sommets du grphe, R l reltion d djcence, et t le coût lgorithmique d une opértion d union entre deux prties de S, ce que l on tend à pproximer pr O( A ) en posnt A = mx( Q, δ )). On définit de mnière similire un utomte co-ccessile comme un utomte où tout étt peut ccéder à u moins un étt finl. On oserve isément qu il suffit de vérifier l ccessiilité de l utomte trnsposé qui échnge I et F et utilise δ 1 comme reltion de trnsition, et donc que pour tout utomte fini on peut construire un utomte co-ccessile équivlent. En cominnt ccessiilité et coccessiilité, on définit les utomtes émondés. Définition 1.6 (Automte émondé). Un utomte fini est émondé s il est ccessile et co-ccessile. Théorème 1.7 (Vide). On peut décider si un lngge reconnissle est vide en temps polynomil.

Notes de révision : Automtes et lngges 7 Démonstrtion. Soit L = L(A) un lngge reconnissle. L est l ensemle vide si et seulement si l utomte émondé de A un ensemle vide d étts. Une utre construction qui utilise les résultts de complexité sur les grphes permet d éliminer les ε-trnsitions, ce que l on supposer ensuite chque fois que cel ser utile. Proposition 1.8. Pour tout utomte fini sur Σ, il existe un utomte fini sns ε- trnsition équivlent. Démonstrtion. Étnt donné un utomte fini A = Σ, Q, I, F, δ, on définit un utomte A = Σ, Q, I, F, δ tel que F = {q Q δ (q, ε) F } δ = {(p,, q) q Q, δ (p, ε, q ) (q,, q) δ} Comme précédemment, on peut réduire ce clcul à celui de l clôture réflexive trnsitive d une reltion, ici {(p, q) (p, ε, q) δ}. L complexité de l construction est lors en O( Q 2 ). Exemple 1.9. On oserve réellement cette complexité qudrtique sur l utomte fini sur l lphet {1,..., n} suivnt 1 2 0 1 2 n 1 n ε ε ε 1.1.2 Automtes déterministes n À l inverse, l universlité d une expression rtionnelle (et donc d un utomte non déterministe) est un prolème PSPACE-complet (STOCKMEYER et MEYER [1973], [SIPPU et SOISALON-SOININEN, 1990, p. 392]). En utilisnt une construction inspirée pr celle de GLUSHKOV, on peut construire un utomte fini sns ε-trnsitions de tille O(n(log n) 2 ) pour toute expression rtionnelle de tille n, et donc pour l expression (1 + ε)(2 + ε) (n + ε) correspondnt à l utomte de l exemple 1.9 [HROMKOVIČ et l., 1997]. Les définitions suivntes supposent des utomtes sns ε-trnsitions. Définition 1.10 (Automte complet). Un utomte fini est complet si, pour tout étt q de Q et pour tout symole de Σ, δ(q, ). Proposition 1.11. Pour tout utomte fini sur Σ, il existe un utomte fini complet équivlent. Démonstrtion. Étnt donné un utomte fini A = Σ, Q, I, F, δ, on définit un utomte A = Σ, Q {p}, I, F, δ vec δ = δ {(p,, p) Σ} {(q,, p) q Q, Σ, δ(q, ) = } Le clcul d un utomte complet est mnifestement en O( Q Σ ). L étt p est ppelé un étt puit. Définition 1.12 (Automte déterministe). Un utomte fini est déterministe si I 1 et pour tout étt q de Q et pour tout symole de Σ, δ(q, ) 1. Proposition 1.13. Pour tout utomte fini sur Σ, il existe un utomte fini déterministe équivlent. On doit en fit l notion d utomtes non déterministes et leur conversion en utomtes déterministes à RABIN et SCOTT [1959]. Démonstrtion. Étnt donné un utomte fini A = Σ, Q, I, F, δ, on construit A = Σ, 2 Q, I, {E Q E F }, δ vec δ = {(E,, E ) E = δ (E, )}

Notes de révision : Automtes et lngges 8 Cette construction pr l méthode des sous-ensemles (ou des prties) un coût de O(2 Q ) dns le pire des cs, et il existe des utomtes à n étts dont le déterminisé complet 2 n étts. C.f. [Cr08, sec. 1.6], [Sk03, sec. I.3.2], [Aut94, p. 45], [SIPPU et SOISALON-SOININEN, 1988, sec. 3.4], [HU79, théorème 3.2]. Voir en prticulier [Sk03, exercice I.3.6] pour plusieurs exemples d explosion lors de l déterministion, dont un exemple qui tteint l orne. Exemple 1.14. Un exemple clssique d explosion lors de l déterministion est l utomte suivnt, vec un pssge de n + 1 à 2 n + 1 étts.,,, 0 1 2 n 1 n Démonstrtion. On montre pr récurrence sur k = P pour toute prtie P de {1,..., n} que l étt {0} P est ccessile dns le déterminisé. L propriété est vrie pour k = 0 puisque {0} est l étt initil du déterminisé. Soit P un sous-ensemle de {1,..., n} de crdinl k + 1. On définit l ensemle P 1 = {i 1 i 1 P } Si P contient 1, lors soit P 1 est de crdinl k et {0} P 1 est ccessile pr hypothèse de récurrence ; on ien δ ({0} P 1, ) = {0} P donc P est ccessile. Si P ne contient ps 1, lors on procède pr récurrence sur j l plus petite vleur dns P. Pour j = 2, P 1 est de crdinl k + 1 et contient 1, donc est ccessile u vu du cs précédent, et δ ({0} P 1, ) = {0} P. Puis, pour une plus petite vleur j + 1 de P, P 1 pour plus petite vleur j donc est ccessile pr hypothèse de récurrence, et δ ({0} P 1, ) = {0} P. Mlgré son coût potentiellement explosif, l déterministion sert vnt tout à méliorer l complexité des prolèmes sur les utomtes! Pour peu que l utomte déterministe reste de tille risonnle, on énéficie lors de complexités polynomiles pour les prolèmes d équivlence et d inclusion de lngges, et linéire pour le prolème d pprtennce. C.f. [SIPPU et SOISALON-SOININEN, 1988, pp. 92 95]. Des complexités polynomiles pour les prolèmes d inclusion et d équivlence peuvent ussi être otenues en considérnt des utomtes non migus tout en diminunt les risques d explosion [STEARNS et HUNT III, 1985]. L utomte non déterministe de l exemple 1.14 étit justement non migu. Théorème 1.15 (Apprtennce). Soit w un mot de Σ et A un utomte fini sur Σ. 1. L pprtennce de w à L(A) est décidle en temps déterministe O( A w ) et en espce O( A ). 2. Si A est déterministe, lors l pprtennce de w à L(A) est décidle en temps déterministe O( A + w ) et en espce O( A ). Démonstrtion. Soit w = 1 n et A = Σ, Q, I, F, δ. On démontre le point 1 à l ide d un lgorithme qui clcule initilement les étts ccessiles pr S 0 := δ (I, ε) en temps O( A ) puis les ensemles S i := δ (S i 1, i ) en temps O( A ) pour i de 1 à n. Le mot w pprtient à L(A) si et seulement si S n F. On n esoin de conserver qu un seul ensemle S i à l fois dns ce clcul, donc on reste ien en espce O( A ). Pour le cs du point 2, on oserve que l lgorithme précédent voit ses ensemles S i réduits à des singletons clculles en temps O(1). L complexité doit de plus tenir compte du temps et de l espce pris pr le chrgement de A.

Notes de révision : Automtes et lngges 9 1.1.3 Propriétés de clôture C.f. [Cr08, sec. 1.8], [Aut94, Les lngges reconnissles sont clos pr union, concténtion et étoile de pp. 43 48], [HU79, sec. 3.2], KLEENE comme nous le verrons dns le cdre de l construction de THOMPSON en [Hr78, sec. 2.3]. section 1.2.1. Cette section est plutôt l occsion de prler d une utre propriété de clôture, pr reltion rtionnelle ou trnsduction rtionnelle, qui générlise plusieurs C.f. [Sk03, sec. IV.1], [BERSTEL, utres propriétés de clôture. 1979, ch. III]. L rticle fondteur S démonstrtion est souvent donnée en décomposnt l trnsduction en morphisme, morphisme inverse et intersection et en utilisnt les preuves de clôture MEZEI [1965]. en l mtière est dû à ELGOT et pr ces opértions. Nous prenons ici le cheminement inverse et nous déduirons les clôtures pr morphisme, morphisme inverse et intersection de celle pr trnsduction. Le principl vntge de cette introduction des trnsducteurs dns une leçon est qu ils donnent lieu à de nomreuses pplictions : u lieu de simplement définir un lngge, un trnsducteur définit une reltion ou une fonction, et permet donc de clculer effectivement. Définition 1.16 (Trnsducteur). Un trnsducteur sur Σ est un utomte fini sur Σ. Un trnsducteur est sous forme normle si s reltion de trnsition est incluse dns Q (Σ {ε} {ε} ) Q. L trnsduction rtionnelle sur Σ définie pr T est R(T ) = {(u, v) Σ δ (I, (u, v)) F } Proposition 1.17 (Clôture pr trnsduction). L ensemle des lngges reconnissles est clos pr trnsduction rtionnelle. Démonstrtion. Soient A = Σ, Q, I, F, δ un utomte fini sur Σ et T = Σ, Q, I, F, δ un trnsducteur sur Σ. On construit un utomte fini A =, Q Q, I I, F F, δ sur tel que R(T )(L(A)) = L(A ). Sns perte de générlité, on suppose A sns ε-trnsition et T sous forme normle. On définit lors vec dns {ε} et dns : δ = {((q 1, q 2 ), ε, (q 1, q 2)) Σ, (q 1,, q 1) δ (q 2, (, ε), q 2) δ } {((q 1, q 2 ),, (q 1, q 2)) (q 2, (ε, ), q 2) δ } Cette construction est essentiellement un rffinement du clcul de l intersection de deux utomtes à étts finis. L complexité de ce produit synchrone est en O( A A ) dns le pire des cs. Grâce à cette construction similire à celle de l intersection de deux utomtes finis, on otient les propriétés de fermeture suivntes : intersection de deux lngges reconnissles L 1 et L 2 sur Σ : en ppliqunt le trnsducteur L 2 L 2 à L 1. Pr exemple, le trnsducteur suivnt clcule le résultt de l intersection vec le lngge sur {, } { n n 0} { m m 0} : C.f. [Sk03, corollire IV.1.3], [HU79, théorème 11.1], [Hr78, théorème 6.4.3]. / / / /

Notes de révision : Automtes et lngges 10 quotient guche de L pr un mot u de Σ : le trnsducteur reconnît (u, ε) puis l identité sur Σ. Pr exemple, pour le quotient pr u = sur l lphet {, } : /, / /ε /ε /ε sous-mot : le trnsducteur choisit non déterministiquement entre recopier (identité) et effcer ses symoles d entrée (Σ ε). Pr exemple, sur {, } : /ε, /, /ε, / fcteur (et similirement préfixe ou suffixe) : le trnsducteur est initilement dns un étt d effcement des symoles, choisit non déterministiquement de psser en mode copie, puis non déterministiquement de psser en mode d effcement jusqu à l fin. Pr exemple, sur {, } : /ε, /ε /, / /ε, /ε /ε, /ε /ε, /ε sustitution rtionnelle σ de Σ dns Rec( ) : pr le trnsducteur défini pr ( Σ {} σ()). Cel implique les clôtures pr sustitution inverse, morphisme et morphisme inverse. Pr exemple, pour l sustitution σ définie pr { n n 0} et { m m 0} : ε/ /ε /ε ε/ /ε /ε /ε /ε ε/ ε/ On pourrit ussi exprimer les opértions d union et de concténtion de lngges reconnissles, mis les constructions sont des dpttions de celles pour les utomtes finis et n exploitent ps réellement les trnsducteurs. Il nous reste à mentionner une opértion de clôture importnte : celle pr complément. Proposition 1.18 (Clôture pr complément). L ensemle des lngges reconnissles est clôt pr complément. Démonstrtion. Soit A = Σ, Q, I, F, δ un utomte déterministe complet. L utomte Σ, Q, I, Q\F, δ reconnît L(A), le complémentire de L(A).

Notes de révision : Automtes et lngges 11 On en déduit imméditement l décidilité de l inclusion et de l équivlence de deux lngges reconnissles : Théorème 1.19 (Inclusion). Soient L 1 et L 2 deux lngges reconnissles. Décider si L 1 L 2 est PSPACE-complet. Démonstrtion. En effet, les clculs du complément et de l intersection de deux lngges reconnissles sont effectifs, et C.f. [SIPPU et SOISALON-SOININEN, 1988, théorème 3.46]. L 1 L 2 ssi L 1 L 2 =. En composnt «u vol» ces clculs vec un clcul du vide (qui est en espce logrithmique), cel fournit ien un lgorithme en espce polynomil. L complétude pour PSPACE vient du prolème de l universlité : Σ L est déjà PSPACEcomplet. On verr en section 1.3 une utre technique pour vérifier l équivlence de deux utomtes déterministes : clculer l utomte miniml (qui est cnonique) pour chcun et vérifier s ils sont isomorphes. L construction du complément d un lngge reconnu pr un utomte vec n étts psse ici pr le clcul d un utomte déterministe, vec une complexité en O(2 n ). On pourrit espérer trouver des utomtes non déterministes plus compcts pour le complémentire d un lngge, mis cette orne supérieure est tteinte, comme le montre l exemple suivnt : Exemple 1.20. On considère l utomte A n = {, }, Q, Q, Q, δ vec l ensemle d étts Q = {0,..., n 1} et les trnsitions δ(i, ) = i + 1 mod n pour tout i de Q, et δ(i, ) = i si i 0. Tout utomte reconnissnt L(A n ) possède u moins 2 n étts. 0 n 1 1 2 5 3 4 Exemple dpté de YAN [2008]. Démonstrtion. On peut déjà noter que l déterministion de cet utomte produit un utomte vec 2 n étts. Mis on cherche ici à montrer que même un utomte non déterministe pour le lngge L(A n ) doit être de tille exponentielle. Soit K un sous-ensemle de Q ; il existe 2 n ensemles K différents. On définit w K = x 0 x n 1 vec pour tout i de Q x i = i n i si i K et x i = n sinon.

Notes de révision : Automtes et lngges 12 On oserve que le mot w K w Q\K n est ps un mot de L(A n ) : pour chque i de Q, un fcteur i n i pprît dns w K w Q\K, et donc quel que soit le choix de l étt initil pour reconnître le mot, on devr tenter de lire un dns l étt 0. En revnche, si K K, sns perte de générlité on peut supposer K K et lors le mot w K w Q\K est dns L(A n ) : il existe lors un étt i tel que i K et i Q\K, et il suffit de fire démrrer l reconnissnce de w K w Q\K dns l étt n i. Dès lors, pour chcun des 2 n ensemles K, les ensemles d étts tteints en lisnt w K dns un utomte pour L(A n ) doivent être disjoints, sous peine de permettre l reconnissnce d un mot w K w Q\K dns L(A n ). C.f. [Cr08, sec. 1.9], [Sk03, pp. 77 80], [Aut94, p. 54], [HU79, sec. 3.1], [Hr78, théorème 2.2.2]. 1.1.4 Lemmes d itértion Les lemmes d itértion et les propriétés de clôture permettent de démontrer que certins lngges ne sont ps reconnissles. Il est en générl plus simple de procéder pr clôtures successives jusqu à un lngge mnifestement non reconnissle, comme { n n n 0}, sur lequel il est isé d ppliquer un lemme d itértion. Lemme 1.21 (Lemme de l étoile). Si L est un lngge reconnissle de Σ, lors il existe un entier n tel que 1. pour tout mot w de L vec w n, il existe une fctoristion w = u 1 u 2 u 3 vec u 2 non vide, telle que u 1 u 2 u 3 L, 2. pour tout mot w de L et pour toute fctoristion de w = v 1 v 2 v 3 vec v 2 n, il existe une fctoristion v 2 = u 1 u 2 u 3 vec u 2 non vide, telle que v 1 u 1 u 2 u 3v 3 L, 3. pour tout mot w de L et pour toute fctoristion w = u 0 u 1 u n u n+1 vec u i non vide pour i de 1 à n, il existe deux positions 0 j < k n telles que u 0 u 1 u j (u j+1 u k ) u k+1 u n u n+1 L. Démonstrtion. On démontre le troisième cs, les deux utres en sont déductiles. Soit L un lngge reconnissle, et A = Σ, Q, I, F, δ un utomte fini pour L. On pose n = Q le nomre d étts de A, et pour tout mot de L dmettnt une fctoristion w = u 0 u 1 u n u n+1 vec u i non vide pour i de 1 à n, on ppelle q i pour i de 0 à n l étt tteint près voir lu u 0 u 1 u i lors de l reconnissnce de w. Prmi ces n + 1 étts q i, il en existe u moins deux, q j et q k vec 0 j < k n tels que q j = q k. Mis lors u 0 u 1 u j (u j+1 u k ) u k+1 u n u n+1 L. Les exemples et les exercices sur le lemme d itértion ondent dns les livres sur les lngges formels. Voici deux exemples plus originux. Exemple 1.22. Soit L un lngge quelconque sur Σ, et # un symole qui n est ps dns Σ. Alors le lngge L # = (# + L) Σ stisfit les conditions de l première version du lemme de l étoile. En effet, on pose n = 1 et pour tout mot w de # + L on peut choisir une fctoristion vec u 1 = ε et u 2 = #, et pour tout i u 1 u i 2 u 3 = # i u 3 ser ien dns L #. Pour tout mot de Σ, le lemme est ien vérifié puisque Σ est reconnissle. Pourtnt L = µ(l # # + Σ ) pour le morphisme µ défini pr pour tout de Σ et pr # ε, et donc si L n est ps reconnissle, lors L # ne l est ps non plus.

Notes de révision : Automtes et lngges 13 Enfin, si L ne stisfit ps les conditions de l seconde version du lemme de l étoile, lors L # ne les stisfit ps non plus : il suffit d utiliser le même fcteur que pour L. Exemple 1.23. Soit L un lngge quelconque sur Σ et $ un symole qui n est ps dns Σ. On définit Les exemples 1.22 et 1.23 sont dptés de YU [1997]. L 1 = {$ + 1 $ + 2 $ + $ + n $ + n 0, i i Σ, et w = 1 n L} L 2 = {$ + v 1 $ + v 2 $ + $ + v n $ + n 0, i v i Σ, et j v j 2} L $ = L 1 L 2 Le lngge L $ stisfit les conditions de l deuxième version du lemme de l étoile. En effet, on pose n = 3 et on considère un mot xyz de L $ vec y 3. Si $ pprît dns y, lors on peut choisir une décomposition y = u 1 $u 3 qui vérifie ien le lemme. Si $ n pprît ps dns y, lors xyz est dns L 2, et on peut choisir un symole de Σ comme fcteur itérnt : si on l effce, on ur encore u moins deux symoles consécutifs de Σ et on rester donc dns L 2, et si on l itère on reste clirement dns L 2. Pourtnt, comme dns l exemple 1.22, on vérifie que L = µ(l $ ($ + Σ) $ + ) pour le morphisme µ défini pr pour tout de Σ et pr $ ε, et donc si L n est ps reconnissle, lors L $ ne l est ps non plus. Enfin, si L ne vérifie ps les conditions de l troisième version du lemme de l étoile, lors L $ ne les vérifie ps non plus. Si un mot 0 m servi à démontrer que L n est ps reconnissle en utilisnt des positions sur les lettres i0 à in, lors on considère le mot de L 1 de l forme $ 0 $ $ m $, et les positions correspondntes modulo l jout des symoles $. On utilise lors un mot w l = 0 ( ij+1 ik ) l m qui n est ps dns L : l itértion du fcteur $ ij+1 $ $ ik correspondnt préserve l propriété qu il n y qu une seule lettre entre deux symoles $, et donc le mot otenu n est ps dns L 2, et il n est ps non plus dns L 1 puisque w l n est ps dns L. Même dns s troisième version, le lemme de l étoile n est qu une condition nécessire pour qu un lngge soit rtionnel. Il est possile de renforcer l dernière version du lemme pour otenir des crctéristions des lngges rtionnels. Ce résultt utilise deux propriétés de fctoristion pr locs, qu on pourr mettre en C.f. l rticle d EHRENFEUCHT prllèle vec l version l plus forte du lemme de l étoile cité précédemment. On et l. [1981], [Cr08, fixe un entier h. théorème 1.106] et [Sk03, On dit qu un lngge L de Σ stisfit l propriété E sec. I.3.4]. h (ou propriété d itértion pr locs) si pour tout mot w Σ et toute fctoristion de l forme w = u 0 u 1 u 2 u h u h+1 vec u i 1 pour tout i {1,..., h}, il existe un couple (j, k) d indices, 0 j < k h, tels que le mot otenu en itérnt dns w le fcteur u j+1 u k un nomre quelconque de fois même sttut que w pr rpport à L, i.e. : n N w L u 0 u 1 u 2 u j (u j+1 u k ) n u k+1 u h u h+1 L On dit qu un lngge L de Σ stisfit l propriété E h (ou propriété de simplifiction pr locs) si pour tout mot w Σ et toute fctoristion de l forme w = u 0 u 1 u 2 u h u h+1 vec u i 1 pour tout i {1,..., h}, il existe un couple (j, k) d indices, 0 j < k h, tels que le mot otenu en supprimnt dns w le fcteur u j+1 u k même sttut que w pr rpport à L, i.e. : w L u 0 u 1 u 2 u j u k+1 u h u h+1 L

Notes de révision : Automtes et lngges 14 Théorème 1.24 (EHRENFEUCHT, PARIKH, ROZENBERG). Soit L un lngge de Σ. Les trois conditions suivntes sont équivlentes : (i) L est reconnissle ; (ii) il existe un entier h tel que L stisfit E h ; (iii) il existe un entier h tel que L stisfit E h. Démonstrtion. L preuve de ce théorème repose sur une générlistion du principe des tiroirs utilisé dns l preuve du lemme de l étoile précédent. Il s git du théorème de RAMSEY : Pour tous entiers k, m et r, il existe un entier N = R(k, m, r) tel que, si un ensemle E est de crdinl supérieur ou égl à N, pour toute prtition P de P (k) (E) (ensemle de toutes les prties à k éléments de E) en m clsses, on peut trouver un sous-ensemle F de E de crdinl r tel que P (k) (F ) est entièrement contenu dns une seule clsse de P. L impliction (i) = (ii) résulte de l ppliction de l version l plus forte du lemme de l étoile, à l fois pour L et son complémentire. Pr illeurs, il est évident que l propriété E h implique l propriété E h. Il reste donc à démontrer l impliction (iii) = (i). On le fit en deux étpes. Première étpe On montre que tout quotient (à guche) v 1 L = {u Σ vu L} d un lngge L qui stisfit E h est un lngge stisfisnt cette même propriété. Soit w = u 0 u 1 u 2 u h u h+1 une fctoristion d un mot w de Σ. Soit w = vw : pr hypothèse sur L, il existe un couple (j, k) d indices, 0 j < k h, tel que w = vu 0 u 1 u 2 u h u h+1 L vu 0 u 1 u 2 u j u k+1 u h u h+1 L qu on peut réécrire en w = u 0 u 1 u 2 u h u h+1 v 1 L u 0 u 1 u 2 u j u k+1 u h u h+1 v 1 L Ainsi, v 1 L vérifie l propriété E h. Seconde étpe On montre que l ensemle des lngges vérifint E h est fini. Ainsi, mise en commun vec l première étpe, on ur prouvé que le lngge L possède un nomre fini de quotients à guche, ce qui, comme on le verr dns l section 1.3.1, prouve que le lngge L est reconnissle. Posons N = R(2, 2, h + 1) et E = {0, 1,..., N 1}. Soient L et K deux lngges vérifint l propriété E h qui coïncident sur les mots de longueur inférieure à N 1. Nous llons montrer, pr récurrence sur l longueur des mots, que K = L : cel chèver de prouver l seconde étpe. Supposons que L et K coïncident sur les mots de longueur inférieure à M, M N 1, et soit w = 1 2 N 1 v un mot de Σ de longueur M. Soient X w et Y w les sous-ensemles de P (2) (E) définis pr X w = {(j, k) 0 j < k N 1, 1 2 j k+1 N 1 v L} Y w = P (2) (E)\X w Pr hypothèse de récurrence, X w est ussi tel que X w = {(j, k) 0 j < k N 1, 1 2 j k+1 N 1 v K}

Notes de révision : Automtes et lngges 15 Pr le théorème de RAMSEY, il existe un sous-ensemle F = {i 0 < i 1 < < i h } de E, de crdinl h + 1, tel que ou ien ou ien P (2) (F ) X w (1.1) P (2) (F ) Y w (1.2) Soit lors w = u 0 u 1 u 2 u h u h+1 v l fctoristion de w otenue en considérnt les h couples d indices consécutifs dns F, c est-à-dire u 0 = 1 i0, u 1 = i0 +1 i1,..., u h = ih 1 +1 ih, u h+1 = ih +1 N 1. Le choix de F implique que : 1. ou ien, pour tout 0 j < k h, le mot u 0 u 1 u 2 u j u k+1 u h u h+1 v est à l fois dns L et dns K, si c est (1.1) qui est vérifiée ; 2. ou ien, pour tout 0 j < k h, le mot u 0 u 1 u 2 u j u k+1 u h u h+1 v n est ni dns L ni dns K, si c est (1.2) qui est vérifiée. Puisque L et K vérifient l propriété E h, il existe j et k, 0 j < k h tels que w et w = u 0 u 1 u 2 u j u k +1 u h u h+1 v ont même sttut pr rpport à L et il existe j et k, 0 j < k h tels que w et w = u 0 u 1 u 2 u j u k +1 u h u h+1 v ont même sttut pr rpport à K. Si on est dns le cs 1, w et w sont dns L et dns K, et w est dns L comme w et dns K comme w ; si on est dns le cs 2, w et w ne sont ni dns L ni dns K, et w n est ni dns L comme w ni dns K comme w. Dns les deux cs, w même sttut pr rpport à L et K. Pr récurrence, on insi montré que K = L. 1.2 Lngges rtionnels Définition 1.25. (Lngge rtionnel) Rt(Σ ) est le plus petit ensemle de prties de Σ qui contient les prties finies de Σ et qui est fermé pr union, concténtion et étoile. Un lngge rtionnel sur Σ est un élément de Rt(Σ ). Comme chque prtie finie de Σ est soit l ensemle vide, soit une union finie de mots de Σ, et que ces mots sont soit le mot vide, soit l concténtion finie de lettres de Σ, on otient une définition équivlente sous l forme d expressions rtionnelles. C.f. [Cr08, sec. 1.5.1], [Sk03, sec. I.4], [Aut94, ch. 5], [SIPPU et SOISALON-SOININEN, 1988, sec. 3.1], [HU79, sec. 2.5]. Définition 1.26. (Expression rtionnelle) Une expression rtionnelle E sur Σ est un terme défini inductivement pr E ::= ε E 1 E 1 + E 2 E 1 E 2 où est un symole de Σ, et E 1 et E 2 sont des expressions rtionnelles. On interprète une expression rtionnelle E comme un lngge L(E) sur Σ défini inductivement pr L( ) = L(ε) = {ε} L() = {} L(E ) = L(E) L(E 1 + E 2 ) = L(E 1 ) L(E 2 ) L(E 1 E 2 ) = L(E 1 )L(E 2 )

Notes de révision : Automtes et lngges 16 Le lngge d une expression rtionnelle est ien un lngge rtionnel. Deux mesures sont courmment utilisées pour l tille d une expression rtionnelle E : E l tille du terme E, définie pr = ε = = 1 E = E + 1 E 1 + E 2 = E 1 E 2 = E 1 + E 2 + 1 L utre mesure est le nomre d occurences de symoles lphétiques dns E, défini pr = ε = 0 = 1 E = E E 1 + E 2 = E 1 E 2 = E 1 + E 2 Comme nnoncé u déut du chpitre 1, le résultt centrl sur les lngges rtionnels est qu ils coïncident vec les lngges reconnissles, sur le monoïde lire Σ. 1.2.1 Des expressions ux utomtes C.f. THOMPSON [1968] et [Sk03, pp. 157 158], [SIPPU et SOISALON-SOININEN, 1988, théorème 3.16], [HU79, théorème 2.3]. Construction de THOMPSON L construction l plus simple et l plus intuitive : on construit un utomte A(E) pr induction sur l expression rtionnelle E. Les utomtes générés vérifient comme invrint qu ils ont un unique étt initil, qui n ps de trnsition entrnte, et un unique étt finl, qui n ps de trnsition sortnte. Cet invrint permet d ssurer l vlidité de l construction pour l concténtion et l étoile. A( ) = A(ε) = A() = ε A(E ) = ε ε A(E) ε A(E 1 ) A(E 1 +E 2 ) = ε ε A(E 2 ) A(E 1 E 2 ) = A(E 1 ) A(E 2 )

Notes de révision : Automtes et lngges 17 Cette construction inductive trville en O( E ) sur l tille de l expression, et résulte en un utomte vec ε-trnsitions vec u plus 2 E étts et 3 E trnsitions, soit u finl O( E 2 ) une fois les ε-trnsitions éliminées. Exemple 1.27. Pr exemple, si on considère l expression E = ( + ), on otient pr cette construction l utomte ε ε ε ε ε Automte stndrd de GLUSHKOV Cette construction d un utomte équivlent à une expression rtionnelle E est pprécile, d une prt prce qu elle résulte en des utomtes de petite tille, et d utre prt prce qu elle reflète fidèlement les propriétés de l expression rtionnelle de déprt. Ainsi, l notion d miguïté d une expression rtionnelle est définie comme l miguïté de son utomte de GLUSHKOV [EVEN, 1965]. En effet, cette construction résulte en un utomte ynt un étt pour chque occurence d un symole de Σ dns l expression E, et distingue ces différentes occurrences ce qui revient à linériser E. C.f. GLUSHKOV [1961] et MCNAUGHTON et YAMADA [1960], et ussi BERSTEL et PIN [1996]. Définition 1.28 (Expression linéire). Une expression rtionnelle E sur Σ est linéire si chque symole de Σ pprît u plus une fois dns E. Proposition 1.29. Tout lngge rtionnel sur Σ est le résultt de l ppliction d un morphisme lphétique Σ u lngge d une expression rtionnelle linéire sur. Démonstrtion. Soit L(E) un lngge rtionnel sur Σ décrit pr une expression rtionnelle E sur Σ. On indice chque pprition d une lettre de Σ pr s position dns l lecture linérire de l expression, pr exemple (+) devient ( 1 + 2 ) 3. L expression E otenue est ien linéire sur l lphet indicé, et l imge de L(E ) pr le morphisme lphétique i est ien L(E). Il nous fut fire un petit détour pr les utomtes et lngges locux. Définition 1.30 (Lngge locl). Un lngge L sur Σ est locl s il existe trois ensemles P Σ, S Σ et N Σ 2 tels que L présenttion suit fidèlement BERSTEL et PIN [1996] ; voir ussi [Sk03, exercice II.1.8]. L\{ε} = (P Σ Σ S)\(Σ NΣ ) c.-à-d. tels que tout mot de L commence pr un symole dns P, finisse pr un symole dns S, et n it ucun fcteur de longueur deux dns N. On peut définir

Notes de révision : Automtes et lngges 18 ces ensemles P, S et N pr P = { Σ Σ L } S = { Σ Σ L } N = { Σ 2 Σ Σ L = }. Définition 1.31 (Automte locl). Un utomte fini déterministe est locl si, pour chque symole de Σ, {q Q q Q, (q,, q ) δ} 1. Il est de plus stndrd si son étt initil n ps de trnsition entrnte. Lemme 1.32. Les trois énoncés suivnts sont équivlents : 1. L est un lngge locl, 2. L est reconnu pr un utomte locl stndrd, 3. L est reconnu pr un utomte locl. Démonstrtion. 1 2. On construit l utomte A = Σ, Σ {i}, {i}, F, δ vec pour reltion de trnsition δ = {(i,, ) P } {(,, ) N} et S pour ensemle finl, plus potentiellement l étt i si ε pprtient à L. On vérifie isément que A est déterministe, locl et stndrd. Il reconnît de plus L : soit une exécution de A i 1 2 1 2 n n vec n > 0 et n F. Alors w = 1 n vérifie 1 P, n S et pour tout i de 1 à n 1, i i+1 N, donc w L. Inversement, si un mot w ε vérifie ces trois conditions, lors il existe ien cette même exécution dns A, et donc w L(A). 2 3. Évident. 3 1. À prtir d un utomte déterministe locl A = Σ, Q, q 0, F, δ, on clcule les ensemles P (A) = { Σ δ(q 0, ) } S(A) = { Σ q Q, δ(q, ) F } N(A) = Σ 2 \{ Σ 2 q Q, δ (q, ) } L = (P (A)Σ Σ S(A))\(Σ N(A)Σ ) On peut noter que L est un lngge locl. Soit mintennt une exécution dns A q 1 0 2 q1 q2 n q n vec n > 0 et q n F. Alors 1 P (A), n S(A) et pour tout i de 1 à n 1, i i+1 N(A), donc w = 1 n pprtient à L. Inversement, soit w = 1 n dns L. On montre inductivement pour chque i de 1 à n qu il existe une exécution q 1 0 2 q1 q2 i q i dns A. Puisque 1 P (A), l trnsition δ(q 0, 1 ) = q 1 est ien définie. Puis, puisque i i+1 N, il existe q et q tels que δ (q, i i+1 ) = q. Comme A est locl, δ(q, i ) = δ(q i 1, i ) = q i, et pr suite q = δ(q i, i+1 ) peut être pris en guise de q i+1. Enfin, n S implique qu il existe q dns Q et q f dns F tels que δ(q, n ) = q f, et encore une fois, comme A est locl, δ(q, n ) = δ(q n 1, n ), donc l exécution dns A se finit dns q n = q f.

Notes de révision : Automtes et lngges 19 On s intéresse ussi ux propriétés de clôture des lngges locux. Lemme 1.33. Soient L 1 et L 2 deux lngges locux sur des lphets disjoints Σ 1 et Σ 2. Alors L 1 L 2, L 1 L 2 et L 1 sont des lngges locux. Démonstrtion. Pr le lemme 1.32, il suffit de prendre des utomtes locux stndrds A 1 = Σ 1, Σ 1 {i 1 }, i 1, F 1, δ 1 et A 2 = Σ 2, Σ 2 {i 2 }, i 2, F 2, δ 2 pour L 1 et L 2 et de construire un utomte locl A = Σ, Q, q 0, F, δ pour le lngge désiré. Pour l union, on pose Σ = Σ 1 Σ 2, Q = Σ 1 Σ 2 {q 0 } et { F 1 F 2 {q 0 } si i 1 F 1 ou i 2 F 2 F = F 1 F 2 sinon δ = {(q 0,, ) (i 1,, ) δ 1 ou (i 2,, ) δ 2 } ((δ 1 δ 2 ) Σ 3 ). Pour l concténtion, on pose Σ = Σ 1 Σ 2, Q = Σ 1 Σ 2 {i 1 }, q 0 = i 1 et { F 1 F 2 si i 2 F 2 F = sinon F 2 δ = δ 1 {(q,, ) q F 1, (i 2,, ) δ 2 } (δ 2 Σ 3 ). Pour l étoile de KLEENE, on pose Σ = Σ 1, Q = Σ 1 {i 1 }, q 0 = i 1, F = F 1 {i 1 }, et δ = δ 1 {(,, ) F 1 et (i 1,, ) δ 1 }. Proposition 1.34. Pour toute expression linéire E sur Σ, on peut construire un utomte locl A sur Σ tel que L(E) = L(A). Démonstrtion. Comme E est linéire, pr le lemme 1.33, son lngge L(E) est locl. On clcule inductivement sur E les ensemles de symoles préfixes P (E), de symoles suffixes S(E), et de pires de symoles fcteurs F (E), en utilisnt ussi λ(e) égl à {ε} si ε L(E) et à sinon : λ( ) = λ(ε) = {ε} λ() = λ(e ) = {ε} P ( ) = P (ε) = P () = {} P (E ) = P (E) λ(e 1 + E 2 ) = λ(e 1 ) λ(e 2 ) P (E 1 + E 2 ) = P (E 1 ) P (E 2 ) λ(e 1 E 2 ) = λ(e 1 ) λ(e 2 ) P (E 1 E 2 ) = P (E 1 ) λ(e 1 )P (E 2 ) S( ) = S(ε) = S() = {} S(E ) = S(E) F ( ) = F (ε) = F () = F (E ) = F (E) S(E)P (E) S(E 1 + E 2 ) = S(E 1 ) S(E 2 ) F (E 1 + E 2 ) = F (E 1 ) F (E 2 ) S(E 1 E 2 ) = S(E 2 ) λ(e 2 )P (E 1 ) F (E 1 E 2 ) = F (E 1 ) F (E 2 ) S(E 1 )P (E 2 ) Comme L(E) est locl, il vérifie L(E)\{ε} = (P (E)Σ Σ S(E))\(Σ (Σ 2 \F (E))Σ ) On conclut en utilisnt l construction du lemme 1.32 pour otenir un utomte locl pour L(E).

Notes de révision : Automtes et lngges 20 En cominnt les propositions 1.29 et 1.34, on otient une méthode de construction d un utomte fini sns ε-trnsitions à prtir d une expression rtionnelle E, vec exctement E + 1 étts, où E est le nomre d ppritions de symoles de Σ dns E, et u pire O( E 2 ) trnsitions réellement otenues sur l expression correspondnt à l exemple 1.9. Exemple 1.35. Considérons à nouveu l expression rtionnelle E = ( + ). On peut l linériser en ( 1 2 + 3 ) 4 5, et en déduire l utomte suivnt. 1 2 i 3 4 5 Cette section reprend les preuves d ANTIMIROV [1996] ; voir ussi [Sk03, sec. I.5.2], et l construction similire de BRZOZOWSKI [1964] dns [Sk03, sec. I.4.4]. Expressions dérivées prtielles d ANTIMIROV Cette technique de construction d un utomte équivlent à une expression rtionnelle fournit des utomtes, générlement non déterministes, encore plus compcts que ceux de l utomte de GLUSHKOV. Cette construction est un rffinement de celle mise u point pr BRZOZOWSKI [1964], et le déterminisé de l utomte que l on otient est exctement celui que l on urit otenu pr l construction de BRZOZOWSKI. Définition 1.36 (Dérivée d une expression). L dérivée prtielle (E) d une expression rtionnelle E sur Σ pr une lettre de Σ est l ensemle d expressions rtionnelles sur Σ défini pr ( ) = (ε) = { {ε} () = si = sinon (E + F ) = (E) (F ) (E ) = (E) {E } { (E) {F } (EF ) = (E) {F } (F ) si ε L(E) sinon où l opértion de concténtion est étendue de mnière évidente ux ensemles d expressions rtionnelles. Attention, dns ( ) =, le symole du terme de guche est une expression rtionnelle, tndis que celui du terme de droite est l ensemle vide! On étend cette définition à des mots w de Σ et à des ensemles d expressions

Notes de révision : Automtes et lngges 21 rtionnelles S pr ε (E) = {E} w (E) = ( w (E)) w (S) = w (E). E S Exemple 1.37. Pr exemple, si on pose E = ( + ), on otient les dérivées prtielles successives (E) = {( + ) } (E) = {E, } (( + ) ) = (( + ) ) = {E} () = {ε} () = (ε) = (ε) =. Cet ensemle de dérivées prtielles se trduit isément en un utomte : ( + ) ε ( + ) L utomte construit à prtir des expressions dérivées prtielles d une expression rtionnelle E est A = Σ, Q, I, F, δ ynt pour ensemle d étts des expressions rtionnelles, et dont les trnsitions respectent les dérivtions : Q = {E 1 w Σ, E 1 w (E)} I = {E} F = {E 1 Q ε L(E 1 )} δ = {(E 1,, E 2 ) Q Σ Q E 2 (E 1 )}. Le fit que cet utomte reconnît L(E) découle de l proposition 1.38, et le fit qu il soit ien un utomte fini de l proposition 1.40. On note pr w 1 L = {u Σ wu L} le quotient à guche de L Σ pr w Σ. Proposition 1.38. Soit S un ensemle d expressions rtionnelles sur Σ et w un mot de Σ. Alors L( w (S)) = w 1 L(S). Démonstrtion. On opère pr récurrence sur l longueur de w. Si w = ε, lors pr définition L( ε (S)) = L(S). Soit mintennt w = u, pprtennt à Σ ; on

Notes de révision : Automtes et lngges 22 vérifie trivilement pr induction sur les expressions E de u (S) que L( (E)) = 1 L(E). On donc L( u (S)) = L( ( u (S))) = L( (E)) = 1 L(E) = 1 L( u (S)) E u(s) E u(s) et, en ppliqunt l hypothèse de récurrence sur L( u (S)), L( u (S)) = 1 u 1 L(S) = (u) 1 L(S). On note l ensemle des suffixes non vides d un mot w pr Suff + (w) = {v Σ + u Σ, w = uv}. Lemme 1.39. Pour tout mot w de Σ + et expressions E et F sur Σ, on : w (E + F ) = w (E) w (F ) (1.3) w (EF ) w (E) F v (F ) (1.4) w (E ) v Suff + (w) v Suff + (w) v (E) E (1.5) Démonstrtion. L éqution (1.3) est immédite pr récurrence sur w = u, pprtennt à Σ : u (E + F ) = ( u (E + F )) = ( u (E) u (F )) = ( u (E)) ( u (F )) = u (E) u (F ). L éqution (1.4) est démontrée pr recurrence sur w = u, pprtennt à Σ. Si u = ε, lors on ien (EF ) (E) F (F ) = (E) F v (F ) puisque Suff + () = {}. Puis u (EF ) = ( u (EF )) u (E) F = ( u (E) F ) v Suff + (u) v Suff + (u) ( u (E)) F (F ) = u (E) F v Suff + (u) v (F ) ( v (F )) v Suff + (u) v (F ) v Suff + () v (F ) Enfin l éqution (1.5) est elle ussi démontrée pr récurrence sur w = u, pprtennt à Σ. Si u = ε, lors (E ) = (E) E = v (E) E. v Suff + ()

Notes de révision : Automtes et lngges 23 Puis, u (E ) = ( u (E )) v (E) E v Suff + (u) = ( v (E) E ) v Suff + (u) ( ( v (E)) E (E )) v Suff + (u) = v (E) E (E) E = v Suff + (u) v Suff + (u) v (E) E. On montre mintennt que l ensemle des dérivées prtielles d une expression E est fini, et même qu il est orné pr E +1, ce qui rend l utomte d ANTIMIROV plus compct que celui de GLUSHKOV. Proposition 1.40. L ensemle des dérivées prtielles différentes d une expression rtionnelle E pr tous les mots de Σ contient u plus E + 1 éléments. Démonstrtion. Montrons pr induction sur E que w Σ + w(e) E. Le lemme ser lors démontré puisque w (E) = ε (E) w (E) E + 1. w Σ w Σ + Les cs de se, pour E =, E = ε et E = vec dns Σ sont évidents. On vérifie ensuite grâce ux équtions du lemme 1.39 w (E + F ) = ( w (E) w (F )) = w (E) + w (F ) w Σ + w Σ + w Σ + w Σ + E + F w (EF ) w (E) F w Σ + w Σ + = w (E) F w Σ + + v Suff + (w) E + F w (E ) v (E) E w Σ + w Σ + v Suff + (w) = w (E) E w Σ + E. v (F ) w Σ + v Suff + (w) v (F ) L tille de l utomte demeure cependnt en O( E 2 ), comme on peut le constter sur l exemple 1.9.

Notes de révision : Automtes et lngges 24 1.2.2 Des utomtes ux expressions Cette direction du théorème de KLEENE est l moins utile en prtique, et l plus coûteuse. Nous llons voir trois techniques pour réliser cette conversion, qui sont en rélité trois présenttions d une même technique (c.f. [Sk03, sec. 4.3]). C.f. MCNAUGHTON et YAMADA [1960] et [Cr08, p. 38], [Sk03, pp. 103 104], [Aut94, p. 53], [BEAUQUIER et l., 1992, p. 305], [SIPPU et SOISALON-SOININEN, 1988, théorème 3.17], [HU79, théorème 2.4], [Hr78, sec. 2.4]. Construction de MCNAUGHTON et YAMADA L construction l plus simple à démontrer, que l on trouver dns eucoup d ouvrges. En revnche, elle est délicte à utiliser à l min. Soit A = Σ, Q, I, F, δ un utomte fini ; on v chercher à clculer des expressions rtionnelles dérivnt les lngges L p,q = {w Σ q δ (p, w)} reconnus entre deux étts p et q de Q. En effet, le lngge de A est l union finie L(A) = p I,q F L p,q. On ordonne les étts de Q, lors vu comme l ensemle {1,..., n}, et on construit incrémentlement des expressions rtionnelles pour les ensemles de chemins L (k) p,q de p à q qui ne pssent que pr des étts intermédiires inférieurs à un certin k. Cette méthode fournit les expressions désirées puisque L p,q (n) = L p,q. On pose initilement { L (0) (p,,q) δ p,q = + ε si p = q (p,,q) δ sinon Puis, pour l étpe d induction sur k de 1 à n, on vérifie L p,q (k) = L p,q (k 1) + L (k 1) p,k (L (k 1) k,k ) L (k 1) k,q C.f. BRZOZOWSKI et MCCLUSKEY [1963] et [Cr08, p. 39], [Sk03, pp. 105 107]. Construction de BRZOZOWSKI et MCCLUSKEY Cette construction est plus intuitive, et plus isée à utiliser à l min. Elle consiste à éliminer un à un les étts de l utomte, et de mettre ses trnsitions à jour en cons quence, en utilisnt des prties rtionnelles de Σ comme étiquettes de trnsitions. Définition 1.41 (Automte générlisé). Un utomte générlisé est un utomte fini A = 2 Σ, Q, I, F, δ, c est-à-dire un utomte dont les trnsitions sont étiquetées pr des lngges L sur Σ. Proposition 1.42. Soit A = Rt(Σ ), Q, I, F, δ un utomte générlisé. Alors L(A) Rt(Σ ). Démonstrtion. L preuve consiste en l construction d un utomte équivlent à A. A n = Rt(Σ ), {q 0, q f }, {q 0 }, {q f }, {(q 0, L(A), q f )}

Notes de révision : Automtes et lngges 25 On construit tout d ord un utomte A 0 vec un unique étt initil q 0, un unique étt finl q f, et une seule trnsition entre deux étts q et q de A : A 0 = Rt(Σ ), Q {q 0, q f }, {q 0 }, {q f }, δ 0 δ 0 = {(q 0, {ε}, q) q I} {(q 0,, q) q (Q\I) {q f } {(q, {ε}, q f ) q F } {(q,, q f ) q (Q\F ) {q 0 }} {(q, L, q ) q q Q} {(q, {ε} L, q) q Q}. (q,l,q ) δ (q,l,q) δ Notons qu une trnsition existe entre toute pire d étts de A 0, potentiellement étiquetée pr ε ou. Cet utomte est ien équivlent à A, et ien ses étiquettes dns Rt(Σ ). L suite de l construction procède pr induction sur n = Q pour construire des utomtes A i où le ième étt est éliminé de A i 1, tels que A i soit encore équivlent à A. Notons q i l étt de Q éliminé à l étpe i, on lors A i = Rt(Σ ), {q i+1,..., q n, q 0, q f }, {q 0 }, {q f }, δ i δ i = {(q, L q,q (L q,qi L q i,q i L qi,q ), q ) Schémtiquement : (q, L q,q, q ), (q, L q,qi, q i ), (q i, L qi,q i, q i ), (q i, L qi,q, q ) δ i 1 }. L q,q q q L q,qi L devient q q,q (L q,qi L q i,q i L qi,q ) L q qi,q q i L qi,q i On vérifie ien que A i est équivlent à A i 1, et donc pr hypothèse d induction, à l utomte A d origine. Exemple 1.43. Appliquons cette technique d élimintion à l utomte A suivnt : A q 4 q 2 q 1 q 3 L première étpe est l construction de l utomte A 0 ; ici nous étiquetons les trnsitions vec des expressions rtionnelles, et ne fisons ps pprître les trnsitions étiquetées pr, ni les oucles élémentires uniquement étiquetées pr ε (qui devrient pprître sur chcun des étts q 1 à q 3 ) :

Notes de révision : Automtes et lngges 26 ε + A 0 q ε 0 q 4 q 2 q ε 1 q f q 3 On otient lors successivement les utomtes ε + A 1 q ε 0 q 4 q 2 q f q 3 ε + A 2 q ε 0 q 4 q f q 3 ε + + A 3 q ε 0 q 4 q f A 4 q 0 ( + ) q f C.f. [Cr08, p. 40], [Sk03, p. 107], [BEAUQUIER et l., 1992, p. 306]. Lemme d ARDEN et élimintion de GAUSS Voici enfin une troisième méthode pour clculer une expression rtionnelle à prtir d un utomte fini. Le principe est d exprimer les lngges de chque étt p de Q dns un système d équtions d inconnues X p, à vleur dns 2 Σ : { (p,,q) δ X p = X q + ε si p F (p,,q) δ X q sinon Comme L(A) est l union finie des solutions p I X p, il suffit de montrer que ces solutions sont elles-même rtionnelles. Un tel système se résout pr une élimintion de GAUSS, en ordonnnt les X i. On exprime lors chque X i comme l solution d une éqution X i = K i X i + L i vec