Théorie de la Programmation http://perso.ens-lyon.fr/daniel.hirschkoff/thpr hop
Programmation, Théorie de la programmation
Langages de programmation I il existe de nombreux langages de programmation I un langage de programmation, c est: une grammaire, un compilateur, un manuel de re fe rence, un environnement de de veloppement, une communaute d utilisateurs, un ensemble de bibliothe ques, un parc de re alisations,...
Exprimer le calcul la notion de calcul joue un ro le central en informatique I la notion de fonction est volontiers extensionnelle I plusieurs algorithmes pour re soudre un proble me I plusieurs manie res d exprimer un algorithme un certain nombre de gens vivants a la cour du royaume du Danemark a peu pre s tous morts
Théorie de la programmation les programmes comme objets mathématiques ce qu il y a de concret, c est le langage programme algorithme abstraction plus ou moins grande vis-à-vis de la machine (mémoire, constituants) énoncer et prouver des propriétes des programmes (recherche, enjeux scientifiques/industriels) lors de l exécution de ce programme... à la fin, la valeur de R sera égale à la racine carrée de la valeur de X une fonction attendant un entier ne sera pas utilisée avec une chaîne de caractères en entrée telle zone de la mémoire ne sera pas accédée la valeur contenue à l adresse mémoire p ne sera pas révélée au plus 10 utilisateurs auront accès simultanément à telle ressource l appel à ce bout de code utilisera une quantité de mémoire proportionnelle au carré de la valeur de la variable X
Plus concrètement pour ce cours, deux petits langages Imp, petit langage impératif µml, petit langage fonctionnel Démo déclinaisons langage impératif / langage fonctionnel compilateur / interprète les deux langages ont en commun les expressions arithmétiques while (x + 2) y 5 > 2 do... let t = (a b + 2) in...
Sujets traités dans ce cours décrire les programmes, et l exécution des programmes outils: définitions inductives sémantique opérationnelle exprimer des propriétés sur les programmes sémantique axiomatique (logique de Floyd-Hoare) Imp typage µml propriétés abstraites des programmes, notions de réécriture terminaison, confluence, déterminisme quelques bouts de maths discrètes quand c est nécessaire liens en passant avec la logique, avec la compilation
L outil Coq (démonstration assistée par ordinateur) http://coq.inria.fr installez-le sur votre machine pas de je n ai pas pu travailler car Coq ne marche pas sur mon ordinateur et/ou utilisez les machines des salles libre-service avec l interface coqide petite démonstration
Coq quelques idées à retenir on peut définir et manipuler des types inductifs Inductive nat : Set := O : nat S : nat -> nat ainsi que des fonctions agissant sur ces types inductifs on peut prouver des propriétés sur ces objets raisonnement par récurrence démonstrateur interactif: on lutte contre un ensemble de sous-buts à prouver, jusqu au Qed. on dispose pour cela de tactiques, dont notamment intro(s) trivial rewrite on reviendra sur tout cela, et approfondira, dans les prochaines semaines
Organisation enseignant responsable: Daniel Hirschkoff TPs: Alexandre Isoard, Jean-Marie Madiot, Antoine Plet jeudi, 8h-10h: 2 groupes vendredi, 8h-10h répartissez-vous de façon équilibrée, et tâchez de rester dans le même groupe cours: un peu sur transparents, beaucoup au tableau essentiellement des TPs, un peu de TDs ce qui est fait sur machine est à relire! évaluation: un partiel, un examen, des devoirs à rendre prérequis: une certaine familiarité avec la programmation indépendamment du langage qui n a aucune expérience de Caml? si Projet1, alors Caml au début
Partie 1 Sémantique opérationnelle des langages de programmation définitions inductives, raisonnements inductifs
Référence pour Imp 24/9/14 G. Winskel, The Formal Semantics of Programming Languages disponible à la bibliothèque nous couvrons les chapitres 2,3,4 (plus tard, le chapitre 6)
Langage Imp: syntaxe, sémantique opérationnelle grammaire de Imp expressions arithmétiques expressions booléennes commandes constructeurs c ::=... if b then c 1 else c 2... sémantique opérationnelle à grands pas de Imp règles d inférence σ, b true σ, c σ σ, while b do c σ σ, while b do c σ terminologie: exécution, évaluation des programmes (on ne parle que de programmes qui terminent) on définit par induction le jugement σ, c σ à l aide de règles d inférence
TPs la semaine dernière: premiers pas en Coq répartissez-vous mieux cette semaine: définitions inductives d ensembles de prédicats par exemple: étant donnée la définition inductive des entiers de Peano, on définit par induction le jugement (inf n k) à l aide des règles d inférence suivantes (inf 0 k) (inf n k) (inf (n + 1) (k + 1)) en Coq: Inductive inf: nat -> nat -> Prop := inf ax : forall k, inf 0 k inf reg : forall n k, inf n k -> inf (S n) (S k).
Retour sur Knaster-Tarski 01/10/14 théorème de Knaster-Tarski: justification des définitions inductives f croissante (pour ) sur l ensemble des parties de.?.. principe de preuve par induction sur t E montrer que la propriété que l on prouve est préservée par les constructeurs exemple: n : N, (n 1) ( (double n) > n ) définition de fonctions sur un ensemble inductif
Définitions inductives de prédicats anatomie des règles d inférence σ, a 1 k 1 σ, a 2 k 2 σ, a 1 + a 2 k k = k 1 + k 2 σ, b true σ, c 1 σ σ, if b then c 1 else c 2 σ σ, a k σ, X := a σ σ = σ[k/x ] σ, b, c 1, σ, c 2. (σ, b true σ, c 1 σ ) (σ, if b then c 1 else c 2 σ ) σ, b, c 1, σ, c 2 : metavariables k = k 1 + k 2 condition d application (side condition) elle ne mentionne ni un prédicat pré-existant (comme σ, a a) ni le prédicat que la règle d inférence définit
Retour sur les définitions inductives de prédicats un ensemble fini de règles d inférence pour définir un jugement noté ρ(t 1,..., t n ) H 1... H m Knaster-Tarski: un ensemble de dérivations (finies) dont la conclusion est de la forme ρ(t 1,..., t n ) ambiguïté: une telle définition induit un ensemble de n-uples ceux pour lesquels il existe une dérivation de ρ(t 1,..., t n ) ex.: σ, c σ sous-ensemble de M com M preuve par induction sur la dérivation propriété de la forme y 1... y n.ρ(y 1,..., y n ) P(y 1,..., y n ) ambiguïté:. si ρ(y 1,..., y n), alors.... s il existe une dérivation δ de ρ(y 1,..., y n), alors... un sous-cas par règle d inférence la propriété P vaut pour les prémisses de la forme ρ(... ) C SC
Aspects organisationnels TD et non TP jeudi: B1 & B2 vendredi: B1 mise en place du soutien principe à la carte vous avez travaillé venez laisser votre nom à la fin du cours (ou ajoutez-vous par mail à daniel.hirschkoff@ens-lyon.fr plus tard) un DM à venir, un partiel dans un mois environ avez-vous des échéances déjà prévues?
Passages obligés directives pour la rédaction
Passages obligés définitions par induction en rouge, ce qui est exigé dans une copie on se donne des ensembles pré-existants, des relations pré-existantes on définit par induction soit un ensemble, donné par les constructeurs suivants... (ou par la grammaire suivante... ) soit un jugement, noté..., [[ précisions éventuelles sur les metavariables apparaissant dans le jugement ]], (p.ex. noté σ, c σ, où c est une commande et σ, σ sont des états mémoire) donné par les règles d inférence suivantes...
Passages obligés preuves par induction en rouge, ce qui est exigé dans une copie on démontre l énoncé suivant: [[écrire l énoncé]] par induction sur la structure de toto lorsque toto est un élément d un ensemble E défini inductivement et l énoncé est de la forme toto E, blabla sur la dérivation de titi lorsque titi est un jugement défini inductivement et l énoncé est de la forme...., (titi) blabla ou bien cas 1: il y a k cas:... cas k: l hypothèse d induction dit blabla, ce qui permet de déduire... (énoncer l hypothèse d induction) ici il faut être raisonnable: détailler les cas qui le méritent, regrouper les cas qui sont traités identiquement on n est pas des gallinacés
Passages obligés définition de fonctions par induction en rouge, ce qui est exigé dans une copie lorsque E est (un ensemble/ un prédicat) défini par induction on définit la fonction f par induction sur son argument toto E il y a k cas NB: toto peut aussi être une dérivation
Grands et petits pas grands pas exécution, évaluation spécification petits pas réduction implémentation
Sémantique opérationnelle exemple Imp sa grammaire, sa sémantique à grands pas σ, c σ sémantique à petits pas pour Imp (σ, c σ, c ) correspondance entre et Imp réaliste la mémoire σ : V Z, uniquement pour écrire/lire des valeurs les registres R = [r 1,..., r k ]: c est avec eux qu on calcule (+, ) commandes read(x,r i ) write(r i,x) add(r i,r j,r k ) mult(r i,r j,r k ) cst(n,r i ) if then else séquence (;) while do skip sémantique à petits pas σ, R, c σ, R, c compilation: Imp Imp réaliste c ĉ X := Y + 5 devient read(y,1); cst(5,2); add(1,2,3); write(3,x) (définie par induction sur la commande) validation de la compilation: σ, c σ ssi σ, R, c σ, R, skip cf. projet Compcert
(
Très rapidement, quelques éléments de compilation analyses lexicale et syntaxique: fabriquer des arbres
Intepréter / compiler interprète: implémentation de la sémantique opérationnelle exécuter compilateur: traduction (p.ex. Imp assembleur) traduire (en préservant le sens) interprètes et compilateurs sont des programmes manipulant des programmes (en un certain sens, c est aussi le cas pour Coq)
Un compilateur traducteur de code à code (de fichier source à fichier objet) anatomie sommaire 1 2 3 1. front end du fichier de texte à une représentation arborescente "let x = 3 in (f x)+2" ou plutôt [ l ; e ; t ; ; x ; ; = ; ; 3 ; ; i ; n ; ; ; ( ; f ; ; x ; ) ; + ; 2 ; \n ] Let( Var "x", Cst 3, Add(App(Var "f", Var "x"), Cst 2) ) 2. des tas de transformations (représentations intermédiaires) 3. back end génération de code: d une représentation arborescente à un fichier de texte [Push(rx);Set(rj,f addr);call;pop;set(r0,2);add] start: push(rx); set(rj,f addr); call; pop; set(r0,2); add; tout est dans l étape 2: analyses, transformations, réécritures, algorithmique, optimisations,...
Front end: analyse lexicale, analyse syntaxique
Les deux étapes analyse lexicale flot de caractères (source) flot de lexèmes lexème (token): atome du langage typiquement: mots-clefs (let, begin, while,... ) symboles réservés ((, +, ;;, ;,... ) identificateurs (f, toto,... ) ainsi 32*52+(let x = 5 in x*x) INT(32), MULT, INT(52), ADD, LPAREN, LET, ID("x"), EGAL, INT(5), IN, ID("x"), MULT, ID("x"), RPAREN (INT et ID ont un attribut, entier et chaîne de caractères respectivement) analyse syntaxique flot de lexèmes arbre de syntaxe abstraite Add( Mult(Int(32), Int(52)), Let("x", Int(5), Mult(Var("x"), Var("x"))) ) étape intermédiaire: arbre d analyse syntaxique (parse tree)
Analyse lexicale chaque lexème est décrit par une expression régulière principaux éléments (syntaxe de ocamllex): caractère $, chaîne de caractères "else" intervalle [ 0-9 ] (un chiffre) disjonction (de caractères) [ \t ] (tabulation ou espace) juxtaposition [ A - Z ][ a - z A - Z ] (mot de 2 lettres commençant par une majuscule) répétitions: + signifie au moins 1, * zéro ou plus [ a - z ]+[ a - z 0-9 ]* (ça commence par une lettre puis des lettres ou des chiffres) disjonction a* b* en sortie de l analyse lexicale: des mots
Expression régulière automate non déterministe s0 a b c S1 s2 s3 s4 S1 ε s2 b s3 ε s6 s7 ε s4 c s5 ε NFA pour b c ε s2 b s3 ε s8 ε s6 S6 ε s9 ε ε s4 c s5 ε NFA pour (b c)* ε s2 b s3 ε s0 a s1 ε s8 ε s6 S6 ε s9 ε ε s4 c s5 ε NFA pour a(b c)*
Déterminisation, minimisation à partir de l automate du transparent précédent, on dispose de procédures pour déterminiser l automate (explosion du nombre d états), puis le minimiser b s0 a S1 on aboutit à c comment implémenter l automate résultant? une table (très creuse) état a b c d e e1 - e2 e3 - - e2 e4 - - - - e3 - - e3 - - éliminer les états: un plat de spaghetti, fait de if et de goto
Analyse syntaxique l analyse syntaxique se fonde sur une approche plus puissante: règles de grammaire les règles de grammaire font intervenir les lexèmes et des variables (les non terminaux) exemple de grammaire: E ::= K E + E E E (E) let Id = E in E E: non terminal (il peut y en avoir plusieurs) K, let, Id, +,, (, ), in, =: lexèmes présentation alternative: E K E E + E E E E E (E) E let Id = E in + E on parle de grammaire hors contexte analyse lexicale: du flot de caractères au flot de lexèmes analyseur syntaxique (ou parser): applique les règles de grammaire pour reconnaître une suite de lexèmes on change la structure: un flot (de lexèmes) devient un arbre on construit des phrases à partir de mots
Reconnaître une séquence de lexèmes l idée est de construire un arbre de dérivation permettant de reconnaître le flot de lexèmes grammaire: P ::= P + P P P K K un entier soit le flot 32, +, 26, *, 2 on peut reconnaître de deux manières: P P + P K 32 + P ou alors K 32 + P P K 32 + K 26 K 2 deux arbres différents: ambiguïté aucun moyen en revanche de reconnaître 9 * 1 + + 1 P P P P K 2 P + P K 2 K 32 + K 26 K 2
Ce que fait le parser E ::= E + E E E (E) a b c a+b*c pile entrée action $ a + b c$ shift $a +b c$ reduce : E a $E +b c$ shift $E+ b c$ shift $E + b c$ reduce : E b $E + E c$ shift (très malin) $E + E c$ shift $E + E c $ reduce : E c $E + E E $ reduce : E E E $E + E $ reduce : E E + E $E $ accept à la fin, on a un arbre add(id(a),mul(id(b),id(c))) construction d une dérivation par la droite Démo remarque: avec yacc, on ôte les ambiguïtés en bricolant, pas en réécrivant la grammaire (comme en FDI)
Au total analyses lexicale et syntaxique fabriquent du sens de la donnée brute à l expression d un calcul elles constituent le front end d un interprète ou d un compilateur ce qu on fait de l arbre de syntaxe abstraite: exprimer le sens du calcul en lui-même
)
Devoir numéro 1 disponible sur la page www du cours à rendre le 23 octobre à 19h au plus tard du papier dans mes mains ou dans mon casier un fichier par mail partiel: après les vacances de la Toussaint DM 2: quelque part avant les vacances de Noël examen: en 2015
Organisation
Les semaines qui viennent cette semaine TD et non TP salles B1 et B2 la semaine prochaine TD également la semaine 17-21 novembre mercredi 19: partiel programme: jusqu à aujourd hui inclus tous documents analogiques autorisés le sujet de l an dernier est en ligne jeudi 20 et vendredi 21: visite à l Université de Montpellier pas de cours ni TD/TP cette semaine-là
Retour sur le DM de bonnes notes rarement un retour sur la partie Coq but principal: faire le point, décanter poids relatif dans la note finale mauvaise note: soutien conseillé remarques on raisonne par induction sur la dérivation de σ, c σ, c par induction sur : bon, ok par induction (tout court) NON σ, c ne se dérive pas en σ, c, mais on construit une dérivation de σ, c σ, c une règle d inférence s écrit BLA BLI, pas BLA BLI ou si BLA, alors BLI montrons que BLA implique BLI est ok, pas montrons BLA BLI (c est un constructeur d arbre ) de même, Hind est un peu glissant (des BLI fois, Hind donne une dérivation de BLI )
Retour sur le DM, suite question 2.1 σ, I(X i ) σ, skip σ = σ[ (σ(x )+1) /X i ] σ, c σ, c σ, c σ, c σ, c c 2 σ, c σ, c 1 c σ, c σ, c σ, c σ, c; c 2 σ, c ; c 2 σ, skip; c σ, c σ, c σ, c σ, c σ, c σ, c + σ, c σ, c + σ, c σ, c + σ, c lemme 1 σ, c, σ, c, si σ, c + σ, c, alors c 2, σ, c; c 2 + σ, c ; c 2 par induction sur la dérivation de σ, c + σ, c, 2 cas 2è cas: utilisation de l hypothèse d induction lemme 2 σ, c, σ, c, si σ, c + σ, c, alors c 2, σ, c c 2 + σ, c c 2 par induction sur la dérivation de σ, c + σ, c, 2 cas 2è cas: l hypothèse d induction n est pas utile on pourrait procéder en raisonnant par cas sur la dérivation de σ, c + σ, c question 2.2 σ, c, σ, c, (σ, c σ, c ) ( (σ σ ) (σ, c σ, c ) ) partie 3.2 (coinduction)
Partie 2 Réécriture
Unification du premier ordre 1. {t, t} P, σ P, σ 2. {X, t} P, σ a) si t X et X Vars(t), b) si X / Vars(t), P[t/X ], [t/x ] σ 3. {f (t 1,..., t k ), f (u 1,..., u k )} P, σ {t 1, u 1 } {t k, u k } P, σ 4. {f (t 1,..., t k ), g(u 1,..., u n )} P, σ (avec f g) Théorème: correction: si P,, σ, alors σ est un mgu de P; complétude: si P,, alors U(P) =. Preuve: à venir
Réécriture générique de fin terminaison principe d induction bien fondée produit l exicographique, extension multiensemble ordre de réécriture confluence confluence, diamant, confluence locale lemme de Newman paires critiques dans les SRM termes substitutions, sous-termes SRT unification Systèmes de Réécriture: SRA, SRM, SRT
Permutation la semaine prochaine mercredi 10 décembre, 10h15-12h15 mercredi jeudi TP, salles 125 et 171 jeudi jeudi vendredi TP, salle 125 ou 171 vendredi 12 décembre, 8h-10h vendredi mercredi cours, amphi B
Partie 3 Logique de Floyd-Hoare
Un exemple si l état initial vérifie alors en exécutant le programme K = nk = n K 0 R := 1; while (K>1) do ( R:= R*K; K := K-1 ) on aboutit à un état qui vérifie R = n!
Un autre exemple si l état initial vérifie X 1 1 X 2 1 alors en exécutant le programme Y1 := X1; Y2 := X2; while (Y1 Y2) do if Y1 > Y2 then Y1 := Y1 - Y2 else Y2 := Y2 - Y1 on aboutit à un état qui vérifie Y 1 = pgcd(x 1, X 2) (Y 1 div X 1) (Y 1 div X 2) ( i. (i div X 1) (i div X 2) i Y 1 )
Triplets de Hoare c : commande Imp A, A : assertions A précondition A postcondition {A} c {A }
Logique de Hoare, validité, dérivabilité programmeurs X, Y, Z X := 3 logiciens i, j X = 3 {A} c {A } énoncés, affirmations (en logique de Hoare) = {A} c {A } ce qui est vrai (ce qui se passe) correction: = tout ce que je dis est vrai complétude: = tout ce qui est vrai, je sais le dire
Logique de Hoare, complétude: idées clef une assertion A dénote un ensemble d états mémoire plus faible précondition étant donnés A et c, définir une formule W (A, c) telle que si σ = W (A, c) et σ, c σ, alors σ = A décire les états qui tombent sur A après c Proposition: on peut définir W (A, c) complétude: supposons = {A} c {A }, a-t-on {A} c {A }? Proposition: on peut dériver {W (A, c)} c {A } reste à montrer = A W (A, c) Théorème (complétude relative): si = {A} c {A }, alors {A} c {A } modulo la décision effective de = A
Logique de Hoare remarques plus faible précondition: réponse théorique en pratique: programmes annotés (cf. TP) développements récents: logique de Hoare pour programmes avec pointeurs pas de miracle bon nombre de théorèmes d arithmétique peuvent se formuler comme des assertions A = {true} skip {A}? peut-on alors établir ces théorèmes de manière automatique? non Gödel (1er thm. d incomplétude) il ne s agit pas non plus d avoir un algorithme qui répond à étant donnés c, A, A, est-ce que = {A} c {A }? cf. = {true} c {false}
Construire des raisonnements des règles d inférence pour décrire l exécution des programmes sémantique opérationnelle de Imp σ, b true σ, c 1 σ σ, if b then c 1 else c 2 σ σ, b true σ, if b then c 1 else c 2 σ, c 1 pour établir des propriétés sur l exécution des programmes sémantique axiomatique de Imp {A b} c 1 {A } {A b} c 2 {A } {A} if b then c 1 else c 2 {A }
TP sur l unification à envoyer par mail à votre chargé de TP avant le 17 décembre à 23h59