Modèle Logique de Donnée Définition: le modèle logique décrit la structure de données

Documents pareils
Le Langage SQL version Oracle

Langage SQL : créer et interroger une base

Langage SQL (1) 4 septembre IUT Orléans. Introduction Le langage SQL : données Le langage SQL : requêtes

Introduction au Système de Gestion de Base de Données et aux Base de Données

Patrice BOURSIER. Professeur, Univ. de La Rochelle. Bases de Données. Notes de cours

Initiation à SQL. Le langage de communication avec une base de données relationnelles. Application avec PostgreSQL. Nathalie Camelin 2011/2012

16H Cours / 18H TD / 20H TP

Bases de Données Avancées

Le langage SQL pour Oracle - partie 1 : SQL comme LDD

Bases de données relationnelles

Exemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions

14/04/2014. un ensemble d'informations sur un sujet : exhaustif, non redondant, structuré, persistant. Gaëlle PERRIN SID2 Grenoble.

Le Langage De Description De Données(LDD)

COMMANDES SQL... 2 COMMANDES DE DEFINITION DE DONNEES... 2

1 Introduction et installation

Information utiles. webpage : Google+ : digiusto/

Bases de données. Yamine AIT AMEUR. INPT-ENSEEIHT DIMA 2 Rue Charles Camichel Toulouse Cedex 7

INSTITUT NATIONAL DES TELECOMMUNICATIONS CONTROLE DES CONNAISSANCES. 2. Les questions sont indépendantes les unes des autres.

SQL Historique

1. Qu'est-ce que SQL? La maintenance des bases de données Les manipulations des bases de données... 5

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Bases de Données. Plan

Plan. Bases de Données. Sources des transparents. Bases de SQL. L3 Info. Chapitre 4 : SQL LDD Le langage de manipulation de données : LMD

Les bases de données

Bases de Données relationnelles et leurs systèmes de Gestion

A QUOI SERVENT LES BASES DE DONNÉES?

Introduction aux bases de données. Généralités sur les bases de données. Fonctions d'un SGBD. Définitions. Indépendance par rapport aux traitements

Langage propre à Oracle basé sur ADA. Offre une extension procédurale à SQL

Le langage SQL Rappels

Vincent Augusto

Bases de données relationnelles & SQL

Mejdi BLAGHGI & Anis ASSÈS

ECR_DESCRIPTION CHAR(80), ECR_MONTANT NUMBER(10,2) NOT NULL, ECR_SENS CHAR(1) NOT NULL) ;

Rappel sur les bases de données

Optimisation SQL. Quelques règles de bases

Cours 3. Développement d une application BD. DBA - Maîtrise ASR - Université Evry

Partie II Cours 3 (suite) : Sécurité de bases de données

INTRODUCTION : Données structurées et accès simplifié

FileMaker 13. Guide de référence SQL

1 Introduction. 2 Le modèle relationnel. 3 Algèbre relationnelle 4 SQL. 5 Organisation physique des données 1/228

Création et Gestion des tables

Chapitre 3 LE MODELE RELATIONNEL ET SQL (DDL)

Structured Query Language

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste

TP Contraintes - Triggers

Le langage SQL (première partie) c Olivier Caron

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Bases de données et sites WEB

Introduction aux Bases de Données

Pour les débutants. langage de définition des données

Présentation du module Base de données spatio-temporelles

Les bases de données Page 1 / 8

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES

UML et les Bases de Données

Olivier Mondet

NFA 008. Introduction à NoSQL et MongoDB 25/05/2013

Bases de Données. Le cas des BD relationnelles ouverture sur les BD relationnelles spatiales Séance 2 : Mise en oeuvre

CREATION WEB DYNAMIQUE

I4 : Bases de Données

Cours Bases de données

LE LANGAGE SQL2 1. INTRODUCTION

Chapitre 5 LE MODELE ENTITE - ASSOCIATION

Quelques aspects du Relationnel-Objet du SGBD Oracle

Chapitre 1 Généralités sur les bases de données

COURS de BASES de DONNEES

DESS CCI Formation Continue. Février Université Louis-Pasteur de Strasbourg Département d'informatique

SQL sous SqlServer OLIVIER D. DEHECQ Olivier 0

A QUOI SERVENT LES BASES DE DONNÉES?

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

1 Position du problème

Cours SGBD 1. Concepts et langages des Bases de Données Relationnelles

Conception des bases de données : Modèle Entité-Association

Base de Données et Langage SQL

Bases de données et sites WEB Licence d informatique LI345

Systèmes de Gestion de Bases de Données

CONCEPTION Support de cours n 3 DE BASES DE DONNEES

Compétences Business Objects

Modélisation de bases de données : Le modèle relationnel

IFT3030 Base de données. Chapitre 2 Architecture d une base de données

BASES DE DONNÉES. CNAM Centre associé de Clermont-Ferrand Cycle A Année J. Darmont I. INTRODUCTION II. LES SYSTÈMES HIÉRARCHIQUES

Bases de données cours 4 Construction de requêtes en SQL. Catalin Dima

A.E.C. GESTION DES APPLICATIONS TECHNOLOGIE DE L'INFORMATION LEA.BW

1. Base de données SQLite

Plan Général Prévisionnel (1/2) (non contractuel) Internet et Outils L1/IO S2-IO2 Bases de données: Jointures, Transactions

Bases de données réparties: Fragmentation et allocation

Intégrité des données

Bases de données - Modèle relationnel

TP base de données SQLite. 1 Différents choix possibles et choix de SQLite : 2 Définir une base de donnée avec SQLite Manager

Cours: Administration d'une Base de Données

1/ Présentation de SQL Server :

Conception d une base de données

... /5. Bases de Données I (J. Wijsen) 23 janvier 2009 NOM + PRENOM : Orientation + Année : Cet examen contient 11 questions.

INITIATION AUX BASES DE DONNEES MODELISATION et LANGAGE SQL

Bases de Données Relationnelles. Le Modèle Relationnel

INTRODUCTION AU DATA MINING

Introduction aux Systèmes de Gestion de Bases de Données Relationnelles. Olivier Losson

Année Universitaire 2009/2010 Session 2 de Printemps

Systèmes d information et bases de données (niveau 1)

1 Modélisation d une base de données pour une société de bourse

Transcription:

Modèle Logique de Donnée Définition: le modèle logique décrit la structure de données Objectifs: Éviter les incohérences dans les données : Une personne n a qu une date de naissance, le prix d un produit est unique,. Éviter la redondance d information : La même information est stockée dans différentes relations Anomalies:insertion, suppression, modification Éviter les valeurs nulles: Difficiles à interpréter : inconnu, connu mais non disponible, inapplicable Rend les jointures difficiles à spécifier Éviter les jointures inutiles: Améliorer les performances : la jointure est une opération coûteuse 1 2 Modèle Relationnel Modèle de niveau logique simple défini par Edgar Frank Codd en 1970 (prix Turing en 1986) Relation Une relation met en correspondance des éléments appartenant à des ensembles non nécessairement distincts. Petit Moyen Grand Taille Relation: Sous-ensemble de Taille Vitesse (produit cartésien) Vitesse Rapide Lent 3 4 Relation Mathématique Une relation entre n ensembles D i est un sousensemble du produit cartésien des n ensembles D 1 D 2 D n Par conséquent, une relation est un ensemble de n-uplets (a 1, a 2,, a n ) où a i D i n est appelé degré de la relation Domaine Les ensembles D i d une relation sont appelés les domaines de la relation Exemple: le domaine de l ensemble Taille est {petit, moyen, grand} Un domaine peut être défini par extension (liste des valeurs): Exemple: {Rapide, Lent} Un domaine peut être défini par intension (critères de restrictions sur les valeurs): Exemple: Tous les nombres pairs positifs Certains domaines peuvent être identiques. Il est cependant nécessaire de les distinguer dans la relation. Par conséquent, un nom d attribut A i est associéà chaque domaine correspondant à son rôle dans la relation Une relation est noté R(A 1, A 2,, A n ) où R est le nom de la relation 5 6 1

Schéma Relationnel Un schéma relationnel est: Un ensemble de définitions de relation liées à un même schéma conceptuel Les contraintes d intégrité associées à ces relations (clés, contraintes de domaines, de références, ) Clé d une relation Clé candidate: sous ensemble minimal d attributs qui permet d identifier chacun des n-uplets de la relation Clé primaire: une des clés candidates choisie comme identifiant Si les valeurs d un attribut A i d une table doivent appartenir à l ensemble des valeurs d un attribut A j clé d une autre table, on dira que A i est une clé étrangère Notation: Emp(id_emp, age, salaire, #deptno) Dpt(deptno, nom, lieu) 7 8 Vision Tabulaire du Modèle Relationnel une relation est une table à deux dimensions n-uplet ligne de la table attribut colonne de la table 9 10 Classe d Entité Association dont une seule des cardinalité maximum est n - Attr_REF - Attr1 - AttrN - Attr1_REF - Attr1_N 1,1 -,n ASSOCIATION - Attr2_REF - Attr2_M (Attr1_REF, Attr1_1,, Attr1_N, #Attr2_REF) Entite1(Attr_REF, Attr1,..., AttrN) (Attr2_REF, Attr2_1,, Attr2_M) 11 12 2

Association dont les deux cardinalités maximum sont n Association dont les deux cardinalité maximum sont 1 Solution 1 - Attr1_REF - Attr1_N -,n ASSOCIATION - AttrA_1 - AttrA_k -,n - Attr2_REF - Attr2_M - Attr1_REF - Attr1_N 1,1 ASSOCIATION 0,1 - Attr2_REF - Attr2_M ( Attr1_REF, Attr1_1,..., Attr1_N) ( Attr1_REF, Attr1_1,..., Attr1_N) ASSOCIATION ( #Attr1_REF, #Attr2_REF, AttrA_1,..., AttrA_K) ASSOCIATION ( #Attr1_REF, #Attr2_REF) Unicité des occurrences des clés étrangères ( Attr2_REF, Attr2_1,..., Attr2_M) 13 Rien ne garanti qu il y ait ( Attr2_REF, Attr2_1,..., Attr2_M) une associée à chaque 14 Association dont les deux cardinalité maximum sont 1 Solution 2 - Attr1_REF - Attr1_N 1,1 ASSOCIATION 0,1 - Attr2_REF - Attr2_M Unicité des occurrences des clés étrangères (Attr1_REF, Attr1_1,, Attr1_N, #Attr_REF2) Association faisant intervenir plus de deux entités - Attr1_REF - Attr1_N -,n ASSOCIATION - AttrA_1 - AttrA_k ( Attr1_REF, Attr1_1,, Attr1_N) ASSOCIATION ( #Attr1_REF, #Attr2_REF, #Attr3_REF, AttrA_1,, AttrA_K ) -,n -,n - Attr2_REF - Attr2_M ENTITE3 - Attr3_REF - Attr3_1 - Attr3_M (Attr2_REF, Attr2_1,, Attr2_M) ( Attr2_REF, Attr2_1,..., Attr2_M) ENTITE3 ( Attr3_REF, Attr3_1,, Attr3_P) 16 Association réflexive - Attr1_REF - Attr1_N 1,1 -,N ASSOCIATION ( Attr1_REF, Attr1,..., AttrN, #Attr1_REF_E) Héritage - Attr1_M ENTITE0 - Attr0_REF - Attr0_1 - Attr0_N - Attr2_P ENTITE0(Attr0_REF, Attr0_1,, Attr0_N) (Attr0_REF, Attr1_1,, Attr1_M) (Attr0_REF, Attr2_1,, Attr2_P) Les entités spécialisées peuvent avoir des attributs clés supplémentaires 17 18 3

Héritage ENTITE0 - Attr0_REF - Attr0_1 - Attr0_N Agrégation Auditeur - IdAuditeur - Nom - Prenom 0,n Evalue - Attr1_M Si ENTITE0 est sans instance: - Attr2_P Entreprise Service - Intitulé 1,n 1,n - codeentreprise Appartient - NomEntreprise - CA 0,n (Attr0_REF, Attr0_1,, Attr0_N, Attr1_1,, Attr1_M) (Attr0_REF, Attr0_1,, Attr0_N, Attr2_1,, Attr2_P) Appartient(#Intitulé, #CodeEntreprise, ) Evalue (#IdAuditeur, #Intitulé, #CodeEntreprise, ) 19 20 Relation universelle Relation universelle: liste des attributs Exemple: employe( idemp, nom, prenom, salaire, service, directeurservice, projet, primeprojet ) 21 22 Problème employe( idemp, nom, prenom, salaire, service, directeurservice, projet, primeprojet ) Problème principal : Redondance d information les attributs service, directeurservice, sont répétés pour chaque projet employé du service Conséquence : Anomalies Anomalie d insertion il est difficile/impossible d insérer un nouveau service tant qu il n a pas d employé affecté (valeurs nulles) Anomalie de suppression si le dernier employé d un service est supprimé, le service est automatiquement supprimé aussi. Pour éviter cela, il faut prévoir un traitement spécifique à l effacement du dernier employé Anomalie de modification si une propriété associée à un service est modifiée, par ex. le directeur, tous les n-uplets doivent être modifiés 23 DEPENDANCES FONCTIONNELLES DEFINITION: Une dépendance fonctionnelle f est une expression f: X Y Où X et Y sont des ensembles d attributs (on dit que f est définie sur X Y). Une relation r(z) satisfait la dépendance fonctionnelle f: X Y ssi 1. X Y Z et 2. tous les n-uplets t et t dans r(z) qui ont les mêmes valeurs pour les attributs dans X, partagent également les mêmes valeurs pour les attributs Y : t,t r: t.x = t.x t.y = t.y. 24 4

Exemple dépendance fonctionnelle employe( idemp, nom, prenom, salaire, service, directeurservice, projet, primeprojet ) idemp nom, prenom, salaire, service, directeurservice service directeurservice idemp, projet primeprojet Les dépendances fonctionnelles expriment des contraintes sémantiques sur les données Propriétés des dépendances fonctionnelles X, Y, Z sont des ensembles d attributs. Axiomes d Armstrong Réflexivité : Y X => {X Y} Augmentation: {X Y} => {XZ YZ} Transitivité : {X Y, Y Z} => {X Z} Règles additionnelles (déduites des règles de bases) Union : {X Y, X Z } => {X YZ} Pseudo transitivité : {X Y, WY Z} => { WX Z } Décomposition : {X YZ} => { X Y, X Z} 25 26 Inférence de DFs Soit F un ensemble de dépendances fonctionnelles défini sur un ensemble d attributs U : On dit que F implique logiquement la DF X Y (avec XY Z) si toutes les relations r(z) qui satisfont toutes les dépendances fonctionnelles dans F, satisfont également X Y On note alors : F =X Y Exemple: Inférence de DFs Exemple: F = {A C, B D} On peut montrer que AB détermine R=ABCD 1. AB ABC (A C + augmentation) 2. ABC ABCD (B D + augmentation) 3. AB ABCD (1.+2. + transitivité) F = {A B, B C} = A C 27 28 Dépendance fonctionnelle élémentaire Soit X un ensemble d attributs X un sous-ensemble de X, X X A un attribut avec A X La dépendance fonctionnelle X A est élémentaire, s il n existe pas X tel que X A Ex: {A C, AD C} AD C non élémentaire {A C, C D, A D} A D est élémentaire 29 Dépendance fonctionnelle directe Soit X un ensemble d attributs, Y un ensemble d attributs avec Y X, et Y X A un attribut, A Y La dépendance fonctionnelle X A est directe s il n existe pas Y tel que X Y et Y A Si Y existe la dépendance est transitive Ex: {A C, AD C} AD C est directe {A C, C D, A D} A D n est pas directe 30 5

Surclé, clé candidate et clé primaire Soit R(Z) un schéma de relation, F un ensemble de dépendances fonctionnelles sur Z, et X un sous-ensemble des attributs de R Z: X est une surclé (superkey) de R avec F si F =X Z X est un clé candidate de R, si X est une surclé et il n existe pas de surclé Y, qui est un sous-ensemble strict de X : Y X («clé minimale») Remarques: Une clé primaire est une clé candidate utilisée pour organiser physiquement les données On peut trouver toutes clés d une relation à partir d un ensemble de DF (inférence) Fermeture transitive Inférence par le calcul de la fermeture transitive d un ensemble de DF La fermeture transitive (ou clôture) d un ensemble de dépendances fonctionnelles F est l ensemble de toutes les dépendances fonctionnelles que l on peut déduire de F: F + = {X Y F =X Y } Une relation r(z) satisfait un ensemble de dépendances fonctionnelles F si elle satisfait toutes les dépendances fonctionnelles X Y où XY Z et X Y est dans la fermeture transitive de F. 31 32 Fermeture transitive d'un ensemble F (F + ) : F { DF élémentaires obtenues par transitivité ou pseudo transitivité } Couverture minimale d'un ensemble F (MIN(F)) : (MIN(F)) + = F + il n'existe pas F' inclus dans MIN(F) tel que : (F') + = F + A,B A F D A,F F C, D, E D,F,G,H D, G, H I, J, K J, K A,B A F D ELE(F+) C, E D,F,G,H,I,J,K D, G, H, I, J, K I, J, K A,B A F D MIN(F) C, E F D, G, H I, J, K Équivalence et couverture minimale Deux ensembles de DF différents peuvent exprimer les même contraintes: F ={AB D, D C, C D, AB C} F ={AB C, D C, C D} F et F sont équivalents(expriment les même contraintes). On note : F F F est plus «compacte» 33 34 Équivalence et couverture minimale F est équivalent à F (F F ) ssi F + = F + F est un ensemble minimal de DF ssi F ne contient pas de DF X Y : redondante : F + =(F - { X Y })+ redondante à gauche (partielle) : X X implique X Y F + Ex: {A B, B C, AC D} AC D redondante à gauche F est une couverture minimale de F ssi F F et F est un ensemble minimal de DF Graphe de dépendance R_entreprise( idemp, service, directeurservice, salaire, projet, primeprojet) service directeurservice idemp service, salaire idemp, projet primeprojet Dessiner graphe Fermeture transitive Correspondance E/A 35 36 6

Normalisation Normalisation : Méthodologie de conception descendante pour produire un «bon schéma» par décomposition d un schéma d origine. Le schéma produit doit: éviter les anomalies de mises-à-jour : forme normale préserver la sémantique du schéma d origine : sans perte d informations et sans pertes de dépendances Idée : On part d un schéma de relation R et d un ensemble de dépendances fonctionnelles F définies sur R On applique un ensemble de transformations logiques de R en respectant les contraintes définies par F 37 38 Raffinement par décomposition Problème: Décomposer le schéma relationnel S avec les dépendances fonctionnelles F en plusieurs relations sans perdre des informations etdes dépendances (si possible) dans F Décomposition sans perte d informations (SPI): pour chaque base de données du schéma S qui satisfait F, il doit être possible de la reconstruire (par des jointures) à partir des tables obtenues après la décomposition (par projection). Décomposition avec préservation des dépendances (SPD): il doit être possible de vérifier toutes les contraintes définies par F sans effectuerdejointures (efficacité). Impact sur les requêtes? Letemps d exécution peut augmenter (si plus de jointures) 39 40 PREMIERE FORME NORMALE (1NF) La relation a une clé. Les attributs sont composés d une valeur atomique, non multi-valuée. DEUXIEME FORME NORMALE (2NF) R (A, B, C, D, E, F) Une relation R est en deuxième forme normale(2fn ou 2NF en Anglais) par rapport à un ensemble de DF F ssi tout attribut n appartenant pas à la clé de R dépend complètement de la clé. Lesattributs nonclé nedoiventpasdépendre qued une partiedelaclémaisdesatotalité. R (A, B, C, D, E, F) Exemple: employe(idemp, idservice, nom, salaire, nomservice) avec F= {idemp idservice, nom, salaire, nomservice} employé n'est pas en 2FN (nom, salaire et nomservice dépendent uniquement de idemp) employé(idemp, idservice, nom, salaire, nomservice) est 2FN 41 42 7

TROISIEME FORME NORMALE (3NF) R (A, B, C, D, E, F) Une relation est en troisième forme normale si tous les attributs non clé sont en dépendance fonctionnelle élémentaire directe avec la clé. Il nedoit pas y avoir de dépendance fonctionnelleentre des attributs non clé Il peut rester des dépendances fonctionnelles entre attributs de la clé et entre attributs non clé vers des attributs de la clé Exemple: employe(idemp,nom, salaire, idservice, nomservice,directeur) avec F= {idemp (nom, Salaire,idService), idservice (nomservice, directeur}) Algorithme de décomposition - Soit F un ensemble de dépendances fonctionnelles définies sur l'ensemble U des attributs - Déterminer ELE(F + ). - Rechercher la couverture minimale de F ( MIN(F) ). - Construire la relation universelle R, relation composée de tous les attributs - Déterminer la clé primaire de la relation R, à partir de MIN(F). - Pour chaque dépendance fonctionnelle, tant que la dépendance fonctionnelle ne contient pas tous les attributs de la relation, décomposer la relation R en deux nouvelles relations : La relation R (A, B, C) avec la DF {B >C} n est pas en 3 FN, elle sera décomposée en R (A, B) et R2 (B, C) - Appliquer le processus de décomposition sur les relations obtenues jusqu'à l'obtention de relations en 3FN. La décomposition peut être représentée sous forme d'arbre, les feuilles de l arbre constituent les relations de la base. employe n'est pas en 3FN (idservice nomservice, directeur). employe(idemp,nom, salaire) service(idservice, nomservice,directeur) est en 3FN 43 44 A,B C, E A F F D, G, H D I, J, K R (A, B, C, D, E, F, G, H, I, J, K) R1 (A, B, C, E) R2 (A, D, F, G, H, I, J, K) Forme normale de Boyce-Codd Observation: En 3FN, on peut encore avoir des DF transitives si les attributs dépendants sont dans la clé. Définition : Soient R une relation et F un ensemble de DF. On dit que R est en forme normale Boyce-Codd par rapport à F (FNBC ou BCNF en Anglais), si pour toute DF X A, X est la clé primaire de R. => Tout attribut n appartenant pas à la clé dépend complètement la clé et uniquement de la clé Il n y a pas de DF impliquant un attribut de la clé Cette décomposition est SPI mais n est pas SPD R21 (A, F) R22 (F, D, G, H, I, J, K) R221 (F, D, G, H) R222 (D, I, J, K) Exemple: Projet (idemp, idprojet, role, lieu) avec { (idemp, idprojet) (role, lieu), lieu idprojet } Non BCFN Décomposition: Projet (idemp, idprojet role), Location (lieu, idprojet) 45 46 DEPENDANCES MULTIVALUEES Soit R(X, Y, Z), si (x, y, z) R et (x, y, z ) R (x, y, z) R, (x, y, z ) R Alors X Y (et donc aussi X Z) Il existe une dépendance multivaluée entre X et Y. QUATRIEME FORME NORMALE (4 NF) idetudiant filière sport 10454 Mathématique Football 10454 Philosophie Musculation 10454 Philosophie Football 10454 Mathématique Musculation 15838 Informatique Football Remarque: les DF sont un cas particulier de DM y1 z1 idetudiant filière idetudiant sport y2 x1 6 n-uplets dans la table 10454 Mathématique 10454 Philosophie 10454 Football 10454 Musculation y3 z2 15838 Informatique 15838 Football 47 48 8

QUATRIEME FORME NORMALE (4 NF) Une relation est en quatrième forme normale si les seules dépendances multivaluées qui existent sont des dépendances fonctionnelles. a1 b1 c1 a1 b2 c1 a2 b1 c3 a1 b1 c2 a1 b2 c2 a2 b1 c2 R (A, B, C) La relation R n est pas en 4FN QUATRIEME FORME NORMALE (4 NF) R (A, B, C) R1 (A, B) R2 (A, C) a1 c1 a1 b1 a2 c3 a1 b2 a1 c2 a2 b1 a2 c2 a1 b1 c1 a1 b2 c1 a2 b1 c3 a1 b1 c2 a1 b2 c2 a2 b1 c2 49 50 QUATRIEME FORME NORMALE (4 NF) a1 b1 c1 a1 b2 c1 a2 b1 c3 a1 b1 c2 R (A, B, C) La relation R est en 4FN (Pas de n-uplet (a1, b2, c2)) CINQUIEME FORME NORMALE (5 NF) Une relation est en cinquième forme normale si et seulement si toute dépendance de jointure est impliquée par les clés candidates de la relation Dépendance de jointure Soit R(A 1, A 2,, A n ) un schéma de relation et X1, X2,, Xm des sous-ensembles de (A 1, A 2,, A n ). On dit qu'il existe une dépendance de jointure (X 1, X 2,,X m ) si la relation R est obtenue par la jointure de R 1 (X 1 ), R 2 (X 2 ),, R m (X m ) R = R 1 (X 1 ) R 2 (X 2 ) R m (X m ) L intersection de deux ensembles X i et X j peut être non nulle Propriété Les dépendances multivaluées sont des cas particuliers de dépendances de jointure 51 52 CINQUIEME FORME NORMALE (4 NF) idvendeur organisme produit 1 CNT Assurance-vie 2 AXT Crédit immo 1 CNT Crédit immo 2 CNT Crédit immo 2 AXT Crédit conso idvendeur organisme idvendeur produit 1 CNT 1 Assurance-vie 2 AXT 1 Crédit immo 2 CNT 2 Crédit immo organisme produit 2 Crédit conso CNT Assurance-vie CNT Crédit immo AXT Crédit immo AXT Crédit conso 53 CINQUIEME FORME NORMALE (5 NF) R (A, B, C) R1 (A, B) R2 (A, C) R3 (B, C) a1 b1 c1 a1 b2 c1 a2 b1 c3 a1 b1 a1 b2 a2 b1 a2 b2 a1 c1 a1 c2 a2 c2 a2 c3 a1 b1 c2 b1 c1 a1 b2 c2 b1 c3 a2 b2 c2 b1 c2 a2 b1 c2 b2 c2 54 9

OPTIMISATION A PARTIR DU SCHEMA LOGIQUE Sans modification de structure des tables de données Indexation des tables - Sur clés primaires, clés étrangères - Sur d autres attributs Conséquences sur : Les algorithmes de recherche, donc sur les performances La taille de la base est augmentée de la taille des index Les insertions entraînent une mise à jour des index Pas de conséquences sur l écriture des requêtes SQL Dénormalisation : Conséquences sur : Implantation de tables non normalisées Lors des interrogations, les opérations de jointure sont moins nombreuses (amélioration des performances des consultations) La taille de la base est augmentée étant donné les redondances Les insertions entraînent la répercussion des mises à jour sur plusieurs n-uplets (mises à jour pénalisées) Répartition verticale ou horizontale des tables 55 56 Avec modification de structure des tables de données Ajouts de redondances : - Attributs calculés, résultat d opérations sur attributs présents dans la base. Le calcul peut porter sur des attributs appartenant à des tables différentes Conséquences sur : - Attributs clés étrangères, associations redondantes L écriture des requêtes. Les informations redondantes étant présentes dans la base il n est pas nécessaire de refaire les calculs à chaque interrogation (amélioration des performances des consultations) La taille de la base est augmentée de la taille attributs Les insertions entraînent la répercussion des mises à jour afin d assurer la cohérence des données (mises à jour pénalisées) 57 SQL Structured Query Langage Standard établi pour les SGBD relationnel Dérivé de l algèbre relationnel SQL est un langage où l utilisateur décrit le résultat à obtenir SQL est non-procédural: le SGBD détermine l enchaînement des traitement à effectuer afin d obtenir le résultat Standard SQL SQL est un standard ANSI/ISO Plusieurs mise-à-jour du langage: SQL1: première version standardisée (1986,1987) SQL2: mise à jour majeure (type date, opérations ensemblistes, ) SQL3: déclencheurs, types composites, fonctionnalités orientées objets, SQL:2003, SQL:2006, SQL:2008, Variations par rapport au SQL standard propre à chaque SGBD 10

Langages de requêtes Langage de Définition de Données (LDD): Définition des relations, contraintes d intégrité Définition des vues Définition des index (non standardisée) Définitions des droits: GRANT, REVOKE Contrôle de transaction: COMMIT, ROLLBACK, Langage de Manipulation de Données (LMD): Interrogation: SELECT Définition, modification, suppression: INSERT, UPDATE, DELETE Dictionnaire de données Tables contenant les informations sur les objets de la base (métadonnées) Normalisé dans le standard SQL: DEFINITION_SCHEMA (Tables, non directement accessibles) INFORMATION_SCHEMA (Vues) Sous Oracle, les vues du dictionnaires ont des noms de la forme: USER_<Objet> : objets appartenant à l utilisateur courant ALL_<Objet> : objets accessibles à l utilisateur courant DBA_<Objet> : tous les objets de la base (vue réservée à l administrateur) Quelques tables du dictionnaires : DICTIONARY (DICT), USER_TABLES (TABS), USER_TAB_COLUMNS (COLS), USER_USERS, Type SQL: Numérique exact INTEGER (ou INT) Entier (précision non standardisée) Exemples : 2, 3, 459 SMALLINT Petit entier (précision non standardisée) Exemples : 2, 3, 459 NUMERIC(p, c) (ou DECIMAL(p, c) ou DEC(p, c)) Nombre décimal avec p chiffres au total, dont c chiffres après la virgule Exemples : 2.5, 456.342, 6 Sous Oracle, tous ces types sont équivalent à NUMBER (par exemple, INT NUMBER(38)) Type SQL: Numérique Réel REAL Point flottant (précision non standardisée) Exemples : 3.27E-4, 24E5 DOUBLE PRECISION Point flottant à double précision (non standardisée) Exemples : 3.27265378426E-4, 24E12 FLOAT(n) Point flottant précision minimale est de n chiffres pour la mantisse Exemples : 3.27E-4, 24E5 Type SQL: Chaîne de caractères Chaîne de caractères (VARYING et NATIONAL : SQL2 intermédiaire) CHARACTER(n) Chaîne de caractère de taille fixe égale à n CHARACTER VARYING (n) Taille variable (max de n caractères) NATIONAL CHARACTER(n) Ensemble de caractères alternatif spécifique à l'implémentation NATIONAL CHARACTER VARYING(n) Taille variable Sous oracle: CHARACTER CHAR CHARACTER VARYING VARCHAR2 NATIONAL CHARACTER NCHAR NATIONAL CHARACTER VARYING NVARCHAR2 Type SQL: Date Date et temps DATE année (quatre chiffres), mois (2 chiffres) et jour (2 chiffres) Exemple : DATE '1998-08-25' TIME[(p)] heure (2 chiffres), minutes (2 chiffres), secondes (2 +p chiffres) Exemple : TIME '14:04:32.25' TIMESTAMP[(p)] DATE + TIME Exemple : TIMESTAMP '1998-08-25 14:04:32.25' INTERVAL Représente un intervalle de temps. Sous Oracle: Date: précision jusqu à une seconde, format par défaut dépend de la configuration su SGBD (sous Codd; DD-MON-YY ) TIMESTAMP, TIMESTAMP WITH TIME ZONE, INTERVAL YEAR TO MONTH, INTERVAL DAY TO SECOND 11

Type: autres Booléen Binaire long (SQL3) BINARY LARGE OBJECT (n) (BLOB(n)) Longue chaîne de caractère (SQL3) CHARACTER LARGE OBJECT (n) (CLOB(n)) NATIONAL CHARACTER LARGE OBJECT (n) (NCLOB(n)) Sous Oracle: Pas de type booléen BLOB, CLOB, NCLOB disponible (4GB) Rappel SQL CREATE TABLE ( NomCol1 TYPE, NomColn TYPE, PRIMARY KEY (Col1, ), FOREIGN KEY (Col1, ) REFERENCES tableetrangères(colet1, ) ); Sélection Syntaxe SELECT [DISTINCT] col1 AS alias_col1,, coln FROM table t1,, table tn WHERE ; Opérations ensemblistes sur le résultat des requêtes SQL: <req1> UNION INTERSECT EXCEPT <req2> ORACLE: <req1> UNION INTERSECT MINUS <req2> Jointures Syntaxe jointure SQL2 pour oracle: plus explicite sur le type de jointure utilisé Extrait les conditions de jointures des critères de restrictions Jointure naturelle: NATURAL JOIN Exemple: SELECT * FROM dpt NATURAL JOIN empt; WHERE Colonne de même nom doit exister dans les deux tables Jointure: JOIN/ INNER JOIN ON Exemple: SELECT * FROM emp e1 INNER JOIN emp e2 ON e1.mgr=e2.emp WHERE ; Jointure externe: LEFT/RIGHT/FULL OUTER JOIN Exemple: SELECT * FROM emp LEFT OUTER JOIN dpt ON emp.dpt = dpt.deptno; WHERE Tous les n-uplet de emp seront affichés même si la condition de jointure n est pas réalisé. Dans ce cas, les attributs de emp correspondant auront comme valeur NULL. Produit cartésien: CROSS JOIN Fonctions d agrégation SQL Partition d une table avec la clause GROUP BY SELECT deptno, count(empno) as nbemp from emp GROUP BY deptno; empno name deptno 7639 SMITH 20 7521 CLARK 20 7834 KING 30 8456 SCOTT 40 6210 TURNER 40 9566 WARD 50 deptno nbemp 20 2 30 1 40 2 50 1 Colonne résultat d une requête GROUP BY, uniquement colonne de groupage ou résultats de fonctions d agrégation Fonctions d agrégation: AVG, COUNT, MAX, MIN, SUM, Fonctions d agrégation SQL Restriction sur les groupes selectionnés avec la clause HAVING SELECT deptno, count(empno) as nbemp from emp GROUP BY deptno HAVING count(empno) > 1; empno name deptno 7639 SMITH 20 7521 CLARK 20 7834 KING 30 8456 SCOTT 40 6210 TURNER 40 9566 WARD 50 deptno nbemp 20 2 40 2 Attention à bien distinguer les conditions de restriction sur les n- uplets (WHERE ) des conditions de restriction sur les groupes (HAVING ) 12

Requêtes corrélées Sous-requête corrélée à la requête principale: SELECT empno, name FROM emp e1 WHERE e1.sal > ( SELECT MAX(e2.sal) FROM emp e2 WHERE e2.mgr = e1.empno ); Tests d existence EXISTS / NOT EXISTS SELECT deptno FROM dpt WHERE EXISTS ( SELECT * FROM emp WHERE emp.deptno=dpt.deptno ); Quantificateurs ALL: le résultat de la comparaison d une valeur au résultat d une sous-requête doit être vérifiépourtous lesn-uplets résultat d une sous-requête. SELECT empno, name FROM emp e1 WHERE e1.sal > ALL ( SELECT e2.sal FROM emp e2 WHERE e2.mgr = e1.empno); SOME/ANY: le résultat de la comparaison d une valeur au résultat d une sous-requête doitêtrevérifié pour aumoins un des n-uplets résultatd une sous-requête. SELECT empno, name FROM emp e1 WHERE e1.sal > ANY ( SELECT e2.sal FROM emp e2 WHERE e2.mgr = e1.empno); Requêtes récursives (SQL) Parcours d arborescence/graphe WITH RECURSIVE Chemin(x,y) AS (SELECT x,y FROM Arc) UNION (SELECT C1.x, C2.y FROM Chemin C1, Chemin C2 WHERE C1.y = C2.x) SELECT * FROM Chemin; Table Arc x y 1 3 2 3 3 4 3 5 Table Chemin x y 1 3 2 3 3 4 3 5 1 4 1 5 2 4 2 5 Requêtes récursives (Oracle) Parcours d arborescence/graphe SELECT x, y FROM Chemin START WITH x in (1,2,3) CONNECT BY PRIOR y=x; Table Arc x y 1 3 2 3 3 4 3 5 Table Chemin x y 1 3 2 3 3 4 3 5 1 4 1 5 2 4 2 5 Possibilité d utiliser l attribut level pour connaitre la profondeur de récursivité 13