Logique et bases de données



Documents pareils
Bases de données Cours 5 : Base de données déductives

Utilisation des tableaux sémantiques dans les logiques de description

1ère partie Nadine Cullot. Bases de données déductives. Bases de données déductives Introduction et Motivation

Amphi 3: Espaces complets - Applications linéaires continues

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

Réalisabilité et extraction de programmes

Chapitre VIII. Les bases de données. Orientées Objet. Motivation

Chap. 3: Le modèle de données entité-association (E.A.)

Logique. Plan du chapitre

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

3. Conditionnement P (B)

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Systèmes décisionnels et programmation avancée

Chapitre 2 Le problème de l unicité des solutions

Évaluation et implémentation des langages

Bases de données déductives

Apprentissage. Intelligence Artificielle NFP106 Année Plan. Apprentissage. Apprentissage

INF 232: Langages et Automates. Travaux Dirigés. Université Joseph Fourier, Université Grenoble 1 Licence Sciences et Technologies

CCP PSI Mathématiques 1 : un corrigé

Manuel d utilisation 26 juin Tâche à effectuer : écrire un algorithme 2

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

Polynômes à plusieurs variables. Résultant

1 Définition et premières propriétés des congruences

La NP-complétude. Johanne Cohen. PRISM/CNRS, Versailles, France.

1 Introduction et installation

Probabilités sur un univers fini

I. Polynômes de Tchebychev

Rappels sur les suites - Algorithme

Programmes des classes préparatoires aux Grandes Ecoles

Intelligence Artificielle Planification

Première partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015

Probabilités sur un univers fini

Raisonnement par récurrence Suites numériques

3 Approximation de solutions d équations

Structures algébriques

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Intelligence artificielle appliquée à l automatique

Modèle Entité/Association

Théorie des Langages

Approximations variationelles des EDP Notes du Cours de M2

PROJET 1 : BASE DE DONNÉES REPARTIES

Grandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test


Cours Base de données relationnelles. M. Boughanem, IUP STRI

Algorithmique et Programmation Fonctionnelle

Raisonnement probabiliste

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Raisonnements standard et non-standard pour les systèmes décentralisés de gestion de données et de connaissances

Intégration et probabilités TD1 Espaces mesurés

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Intégrité sémantique dans les bases de données relationnelles

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Les bases de données

Simulation de variables aléatoires

Cours 02 : Problème général de la programmation linéaire

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Calculs de probabilités

Bases de Données relationnelles et leurs systèmes de Gestion

Formes quadratiques. 1 Formes quadratiques et formes polaires associées. Imen BHOURI. 1.1 Définitions

Fondements de l informatique Logique, modèles, et calculs

Capes Première épreuve

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Logique : ENSIIE 1A - contrôle final

Cours d Analyse. Fonctions de plusieurs variables

Présentation du langage et premières fonctions

Exemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions

Chap 4: Analyse syntaxique. Prof. M.D. RAHMANI Compilation SMI- S5 2013/14 1

16H Cours / 18H TD / 20H TP

Chapitre 1 Généralités sur les bases de données

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Calculs de probabilités conditionelles

Langage SQL (1) 4 septembre IUT Orléans. Introduction Le langage SQL : données Le langage SQL : requêtes

UML et les Bases de Données

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

PLAN NOTATIONS UTILISÉES

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Bases de Données. Plan

Programmation linéaire

Probabilités. C. Charignon. I Cours 3

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

L E C O U T E P r i n c i p e s, t e c h n i q u e s e t a t t i t u d e s

UNION INTERCEPT SELECT WHERE JOINT FROM ACID

IN Cours 1. 1 Informatique, calculateurs. 2 Un premier programme en C

Cours de Master Recherche

Systèmes d information et bases de données (niveau 1)

I. Ensemble de définition d'une fonction

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Cours de mathématiques

MEMOIRE. Présenté à. L École Nationale d Ingénieurs de Sfax. en vue de l obtention du MASTERE

Résolution de systèmes linéaires par des méthodes directes

Continuité et dérivabilité d une fonction

M2 IAD UE MODE Notes de cours (3)

Limites finies en un point

Commun à tous les candidats

Espérance conditionnelle

Transcription:

Logique et bases de données Plan Théorie du premier ordre Hypothèses CWA, unique name, domain closure BD comme interprétation BD comme théorie du 1er ordre BD déductives Signification des différentes formes de clauses BDD définies BDD indéfinies Systèmes de programmation logique G. Falquet CUI - Université de Genève 1

Théorie du premier ordre Théorie = langage + axiomes + règles d inférence Théorie du 1er ordre langage: logique des prédicats du 1er ordre règles d inférence: modus ponens et généralisation (m.p.) de A et A B on infère B (gen.) de A on infère x.a axiomes: axiomes logiques A A A A (B A) (A B) (C A (B C)) x.a A(t/x) si x n apparait pas dans le terme t ( x.(a B)) (A x.b) si x n est pas libre dans A + axiomes propres G. Falquet CUI - Université de Genève 2

Dérivations et théorèmes Une formule w est dérivable d un ensemble de formules W (W w) si on peut dériver w de W et des axiomes en appliquant un nombre fini de fois les règles d inférence Un théorème est une formule dérivable directement à partir des axiomes. théorème On peut créer d autres règles de dérivation que m.p. et gen., p.ex. le principe de résolution. Mais elles doivent respecter certaines règles. Relation entre syntaxe et sémantique Un système formel est consistant (sound) si W w implique W = w "Tous les théorèmes sont des conséquences logiques des axiomes" Un système formel est complet (complete) si W = w implique W w "Toutes les conséquences logiques des axiomes sont des théorèmes" G. Falquet CUI - Université de Genève 3

Hypothèses BD + logique Monde clos (CWA) Ce qui n est pas connu comme vrai dans la base est faux p.ex. R(a, b, c) est vrai si <a, b, c> relation-r Nom unique les individus de "nom" différent sont différents Fermeture du domaine il n y a pas d autres individus que ceux de la base Exemple état-bd = Prof(Jean), Prof(Paul), Assistant(André), Assistant(Pierre) Qui n est pas professeur? FD + NU + CWA --> réponse: André et Paul G. Falquet CUI - Université de Genève 4

Langage L(BD) correspondant à BD: BD comme interprétation A chaque schéma de relation R(A1, A2,, An) on associe un symbole de prédicat R (Extension) on ajoute les symboles de prédicat =,, <, >,, qu on interprète sur D Les constantes sont les valeurs trouvées dans la base Interprétation I(BD) Le domaine d interprétation D est l union de toutes les valeurs d attributs qui apparaissent dans la base. La relation r correspondant au schéma R(A1, A2,, An) donne l interprétation du symbole de prédicat R Consistance La base est consistante si pour chaque contrainte C exprimée en L(BD), l interprétation de C selon I(BD) = vrai Requête La réponse à w(x1, x2,, xn) est l ensemble des tuples <d1, d2,, dn> qui rendent w vraie selon l interprétation I(BD) G. Falquet CUI - Université de Genève 5

BD comme théorie du 1er ordre Principe: construire une théorie (axiomes) T(BD) qui admet BD comme unique modèle (unique interprétation qui rend vrais les axiomes). Axiomes d assertion Pour chaque r de BD et chaque tuple <e 1,, e n > de r Particularisation (i) complétion R(e 1,, e n ) Si r = {<e 1,1,, e n,1 >, <e 1,p,, e n,p >} -> x 1. x n.r(x 1. x n ) (x 1 = e 1,1 x n = e n,1 ) (x 1 = e 1,p x n = e n,p ) (ii) nom unique Si D = {e 1,, e r } -> (iii) fermeture du domaine (e 1 e 2 ) (e r 1 e r ) x.x = e 1 x = e r G. Falquet CUI - Université de Genève 6

Axiomes de l égalité réflexivité, symetrie, transitivité, substitution des termes égaux x 1. x n. y 1. y n. P(x 1,, x n ) x 1 = y 1 x n = y n P(y 1,, y n ) Contraintes d intégrité Requêtes BD satisfait w si T(BD) w La réponse à une requête w(x 1,, x n ) est l ensemble des tuples <e 1,, e n > tels que T(BD) w(e 1,, e n ) G. Falquet CUI - Université de Genève 7

Langages d interrogation Le langage de la logique du 1er ordre permet de poser des questions sous forme non procédurale. > calcul relationnel (Codd) Problèmes: Questions pas raisonnables R(x, y, z) la réponse dépend du domaine de valeur Limitations P(x, y, z) R(x, y, z) la réponse ne dépend que de P et R. fonctions du second ordre ( count(p) )? > extensions impures du langage > SQL fonctions non représentables: fermeture transitive > imbrication dans un langage de programmation > bd déductives G. Falquet CUI - Université de Genève 8

BD déductives BDD = ensemble de constantes + ensemble de clauses + contraintes d intégrité clauses P1 Pk R1 Rq équivalent à P1 Pk R1 Rq Classification des différentes formes de clauses Type 1 Constantes -> assertion d un fait Variables -> assertion générale R1(t1,, tk) Type 2 P1(t1,, tr) Constantes -> assertion d un fait négatif Variables -> contrainte d intégrité G. Falquet CUI - Université de Genève 9

Type 3 Contrainte d intégrité Prof(x) Etudiant(x) P1 Pk Type 4 P1 Pk R1 R.i. ou règle de déduction pour calculer R1 Type 5 Constantes -> assertion indéfinie R1 Rq Type 6 P1 Pk R1 Rq C.I. : Parent(x1, y1) Parent(x1, y2) Parent(x1, y3) (y1 = y2) (y1 = y3) (y2 = y3) R.D. : Parent(x, y) Mere(x, y) Pere(x, y) G. Falquet CUI - Université de Genève 10

BDD définies Principe: éviter le non déterminisme de type "A ou B est vrai" BDD définie = théorie (axiomes) + contraintes d intégrité Théorie du 1er ordre = théorie pour les bd conventionnelles + axiomes pour les règles de déductions Axiomes: 1. particularisation et égalité, 2. faits élémentaires, 3. règles de déduction Ax. 2: faits (clauses de type 1 avec constantes) Ax. 3. : clauses de type 4 uniquement R 1 (e 1,1, e n,1 ),, R 1 (e 1,p, e n,p ) P 1 P k R 1 Ax. 1. : reformulation de la complétude pour R 1 x 1. x n.r 1 (x 1. x n ) (x 1 = e 1,1 x n = e n,1 ) (x 1 = e 1,p x n = e n,p ) (* fait élémentaires *) P 1 ( ) P k ( ) (* règle *) etc. G. Falquet CUI - Université de Genève 11

Comme la vision "théorie de la preuve" des bd conventionnelles La réponse à une requête w(x 1,, x n ) est l ensemble des tuples <e 1,, e n > tels que T(BD) w(e 1,, e n ) La base satisfait la contrainte φ si T(BD) φ. Les axiomes de complétude permettent de dériver un fait négatif R 1 (a 1. a n ) quand R 1 (a 1. a n ) n est pas un fait R 1 (a 1. a n ) n est pas dérivable par les axiomes 3 G. Falquet CUI - Université de Genève 12

Définition opérationnelle Eliminer les axiomes de fermeture du domaine -> requêtes à domaine restreint Eliminer nom unique et complétude par negation as finite failure Introduction d une méta-règle: P est vrai ssi -/- P (i.e. ssi on ne peut prouver P) Il faut que le procédé de preuve se termine toujours! Possible car il existe un unique modèle minimal de la théorie La logique devient non monotone: plus d axiomes peut entrainer moins de faits prouvables Il n y a plus besoin des axiomes d égalité G. Falquet CUI - Université de Genève 13

Règles de déductions ou contraintes d intégrité? Les rdd et les c.i. ont la même forme les rdd génèrent de nouveaux faits les c.i. "limitent" le contenu de la base (faits et règles) Quelques critères 1. Les rdd ne doivent pas contenir de fonctions, sinon réponses inifinies et non explicites => les formules contenant des doivent être des c.i. 2. Les clauses de type 5 et 6 donnent des c.i., sinon réponses indéfinies 3. Les clauses de type 3 ne produisent pas de noveaux faits -> c.i. 4. Certaines connaissances générales ne produisent pas de nouveaux faits p.ex. les dépendances fonctionnelles Pere(x, y), Pere(z, y) x = y (l égalité est déjà connue indépendamment de la base) G. Falquet CUI - Université de Genève 14

BDD indéfinies Les axiomes 3 sont des clauses indéfinies ou définies Plus compliqué que les BDD définies P(a, b) P(a, c) R(x, y) S(y, z) P(x, y) Q(x, y, z) 1. Inconsistance par rapport à CWA si on applique negation as failure vole(titi) vole(x) -> oiseau(x) avion(x) Comme on ne peut prouver ni oiseau(titi) ni avion(titi) on déduit oiseau(titi) et avion(titi) Mais {vole(titit), vole(x) -> oiseau(x) avion(x), oiseau(titi), avion(titi)} est inconsistant G. Falquet CUI - Université de Genève 15

Generalized Closed World Assumption E l ensemble des clauses positives non prouvables On a le droit de déduire P(x) seulement si C E. P(x) C est non prouvable Les mécanismes de déductions doivent être plus sophistiqués pour être complets input resolution et résolution LUSH sont complets pour les clauses de Horn mais pas pour les clauses non-horn. Utiliser résolution linéaire, résolution linéaire avec sélection(sl) ou LUST Les réponses ne sont plus définies. p.ex. si on a le fait P(a) P(b) la réponse à P(x) sera x = (a ou b) G. Falquet CUI - Université de Genève 16

,,,, G. Falquet CUI - Université de Genève 17