2A-SI 4 - Bases de Données 4.4 - Normalisation de schémas relationnels



Documents pareils
Bases de Données. Plan

A QUOI SERVENT LES BASES DE DONNÉES?

INITIATION AUX BASES DE DONNEES MODELISATION et LANGAGE SQL

... /5. Bases de Données I (J. Wijsen) 23 janvier 2009 NOM + PRENOM : Orientation + Année : Cet examen contient 11 questions.

MERISE. Modélisation de Systèmes d Information. Pierre Gérard. DUT Informatique 2ème année 2004/2005. IUT de Villetaneuse - Université de Paris 13

Modèle Entité/Association

Exemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions

Formation à l utilisation des Systèmes de Gestion de Bases de Données Relationnelles. organisée avec la collaboration du

Chap. 3: Le modèle de données entité-association (E.A.)

Patrice BOURSIER. Professeur, Univ. de La Rochelle. Bases de Données. Notes de cours

Conception d une base de données

1 Modélisation d une base de données pour une société de bourse

Entrepôt de données 1. Introduction

Modélisation des données

Introduction aux bases de données. Généralités sur les bases de données. Fonctions d'un SGBD. Définitions. Indépendance par rapport aux traitements

Rappel sur les bases de données

CONCEPTION Support de cours n 3 DE BASES DE DONNEES

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

Bases de Données Avancées

Les bases de données

Information utiles. webpage : Google+ : digiusto/

Année Universitaire 2009/2010 Session 2 de Printemps

Conception des systèmes répartis

16H Cours / 18H TD / 20H TP

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

TP Bases de données réparties

CHAPITRE 1. Introduction aux bases de données

Introduction aux Systèmes de Gestion de Bases de Données Relationnelles. Olivier Losson

Bases de données réparties: Fragmentation et allocation

Resolution limit in community detection

Chapitre 1 Généralités sur les bases de données

Introduction au Système de Gestion de Base de Données et aux Base de Données

Grandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test

Modélisation de bases de données : Le modèle relationnel

Décision Markovienne appliquée à un jeu de stop ou encore : Pickomino (Heckmeck Am Bratwurmeck)

Introduction aux Bases de Données

UML et les Bases de Données

Urbanisation des Systèmes d Information Architecture d Entreprise. 04 Architecture du SI : identifier et décrire les services, structurer le SI

Définitions. Numéro à préciser. (Durée : )

Bases de données relationnelles

Chapitre 07 Le modèle relationnel des données

A QUOI SERVENT LES BASES DE DONNÉES?

Thierry Spriet Version rééditée au format PDF et remise en page

Bases de Données. Stella MARC-ZWECKER. Maître de conférences Dpt. Informatique - UdS

Bases de Données Relationnelles. Le Modèle Relationnel

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

Démarches d urbanisation : réorganiser le Système d Information en structurant ses fonctions dans des blocs fonctionnels communicants.

Chapitre 5 LE MODELE ENTITE - ASSOCIATION

Cours SGBD 1. Concepts et langages des Bases de Données Relationnelles

et les Systèmes Multidimensionnels

Calculer avec Sage. Revision : 417 du 1 er juillet 2010

FONDEMENTS MATHÉMATIQUES 12 E ANNÉE. Mathématiques financières

Chapitre Introduction : Notion de Bases de données. 2. Définition : BD Répartie. 3. Architecture des SGBD. 4. Conception des bases réparties

Programme détaillé BTS INFORMATIQUE DE GESTION DIPLÔME D ETAT. Objectifs de la formation. Les métiers. Durée de la formation

Programmes des classes préparatoires aux Grandes Ecoles

INTRODUCTION : Données structurées et accès simplifié

1ère partie Nadine Cullot. Bases de données déductives. Bases de données déductives Introduction et Motivation

INSTITUT NATIONAL DES TELECOMMUNICATIONS CONTROLE DES CONNAISSANCES. 2. Les questions sont indépendantes les unes des autres.

Sujet de thèse CIFRE RESULIS / LGI2P

Le langage SQL Rappels

1. Introduction. Bases de données Réparties, Fédérées et Réplication. Plan. Bibliographie du cours

Évaluation et optimisation de requêtes

Bases de données Cours 5 : Base de données déductives

Systèmes d information et bases de données (niveau 1)

Concevoir un modèle de données Gestion des clients et des visites

UE 8 Systèmes d information de gestion Le programme

Master Informatique et Systèmes. Architecture des Systèmes d Information. 02 Architecture Applicative

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Université de Bangui. Modélisons en UML

Utilisation des tableaux sémantiques dans les logiques de description

1 Introduction et installation

Règlement du Certificate of Advanced Studies en Stratégie et management du système d information (CAS SMSI)

Conception des bases de données : Modèle Entité-Association

INF 232: Langages et Automates. Travaux Dirigés. Université Joseph Fourier, Université Grenoble 1 Licence Sciences et Technologies

Le modèle de données

Base de Données et Langage SQL

DESS CCI Formation Continue. Février Université Louis-Pasteur de Strasbourg Département d'informatique

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Rappels sur les suites - Algorithme

.../5. Gestion de Bases de Données (J. Wijsen) 27 janvier 2011 NOM + PRENOM : Orientation + Année : Cet examen contient 8 questions. Durée : 2 heures.

ils entretiennent entre eux des flux, ils partagent des perceptions sur l environnement

Module BDR Master d Informatique (SAR)

Gestion des Clés Publiques (PKI)

Estimation des charges. «Le travail se dilate jusqu à remplir le temps disponible»

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

Initiation aux bases de données (SGBD) Walter RUDAMETKIN

Calculs de probabilités

avec des nombres entiers

TD 1 - Structures de Traits et Unification

Précision d un résultat et calculs d incertitudes

Bases de données élémentaires Maude Manouvrier

MABioVis. Bio-informatique et la

Master Informatique et Systèmes. Architecture des Systèmes d Information. 03 Architecture Logicielle et Technique

ECTS INFORMATIQUE DE GESTION Option Administrateur de réseaux Locaux d entreprise

Algorithmes de recherche

UNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU

Mejdi BLAGHGI & Anis ASSÈS

Bases de Données relationnelles et leurs systèmes de Gestion

Introduction au Data-Mining

UML (Diagramme de classes) Unified Modeling Language

Transcription:

2A-SI 4 - Bases de Données 4.4 - Normalisation de schémas relationnels Stéphane Vialle Stephane.Vialle@supelec.fr http://www.metz.supelec.fr/~vialle Avec l aide du cours de Y. Bourda Intérêt de la «normalisation» Deux approches possibles de la normalisation Dépendances fonctionnelles Passage en formes normales 1

Intérêt de la normalisation Besoin : d éviter d avoir une seule «grosse» relation! de décomposer les relations en plus petites, plus homogène «sémantiquement» limitant la duplication des informations dans les tables Problème : comment décomposer les relations? une mauvaise décomposition mène à des pertes d informations et à de mauvaise recompositions!! Démarche : décomposer les relations sous formes «normales» Intérêt de la normalisation Décomposition : On n obtient plus la même table!! Jointure «naturelle» : Véhicule Constructeur, si «Modèles» identique 2

Intérêt de la normalisation Décomposition : Comment trouver systématiquement une «bonne» décomposition (dont l interrogation sera efficace)? On obtient la même table Jointure «naturelle» : Véhicule Constructeur, si «Modèles» identique Intérêt de la «normalisation» Deux approches possibles de la normalisation Dépendances fonctionnelles Passage en formes normales 3

Deux approches possibles Analyse suivant le modèle entités-associations Collecte d informations Groupement de tous les attributs dans une seule relation Schéma entités-associations Transformation (systématique) en schéma relationnel Schéma relationnel Passage en 1NF Passage en 2NF Passage en 3NF Identification des DFE Décomposition sans pertes de la relation Schéma relationnel en «couverture minimale» Algorithme itératif de passage en 3NF (systématique) Approche intuitive (modélisation intermédiaire) Schéma relationnel optimisé (3NF) Passage en BCNF (identification de DFE) Schéma relationnel en BCNF Approche mathématique (algèbre relationnelle) Intérêt de la «normalisation» Deux approches possibles de la normalisation Dépendances fonctionnelles Passage en formes normales 4

Dépendances fonctionnelles : DF Dépendance fonctionnelle (DF) : Soit R(A1;A2; An) un schéma de relation, et X et Y des sous-ensembles de {A1;A2; An}. On dit que X détermine Y ou que Y dépend fonctionnellement de X si, et seulement si, des valeurs identiques de X impliquent des valeurs identiques de Y. Notation : X Y Exemple : Voiture(NV, Couleur, Type, Marque, Conducteur, Infraction) Contient notamment les DF suivantes : NV Couleur NV Type, Marque NV, Conducteur Infraction Dépendances fonctionnelles élémentaires : DFE Dépendance fonctionnelle élémentaire (DFE) : Dépendance fonctionnelle de la forme X Y, dans laquelle Y est un attribut unique n appartenant pas à X et où il n existe pas X0 inclus dans X tel que X0 Y. Exemple : Voiture(NV, Couleur, Type, Marque, Conducteur, Infraction) Contient notamment les DFE suivantes : NV Couleur NV Type Type Marque NV Marque NV, Conducteur Infraction 5

Graphe de DF et DFE Autre définition : Dépendance fonctionnelle élementaire = le plus petit nombre d attributs en déterminant un autre. Seule règle applicable : transitivité L ensemble des DF forme un graphe, mais sans aucun intérêt car comportant trop d arcs. L ensemble des DFE est modélisé par un graphe dit «graphe des dépendances fonctionnelles élémentaires». Fermeture transitive des DFE Fermeture transitive : G : graphe des DFE, G* : fermeture transitive de G, graphe constitué de toutes les DFE de G augmenté de toutes celles obtenues par transitivité. 6

Couverture minimale des DFE Couverture minimale : Soit G un graphe des dépendances fonctionnelles élémentaires, Soit G* sa fermeture transitive, La couverture minimale est un ensemble F d attributs vérifiant : F* = G* (les deux ensembles d attributs ont même fermeture transitive) Si on enlève une dépendance fonctionnelle élémentaire de F alors F* G* (tous les éléments de F sont indispensables, aucun n est en trop) G* F Intérêt de la «normalisation» Deux approches possibles de la normalisation Dépendances fonctionnelles Passage en formes normales 7

Passage en «formes normales» Préambule : définition formelle d une clé Clé de relation : Soit R(A1; ; An) un schéma de relation, et X un sous-ensemble de (A1; ; An), X est une clé si, et seulement si, : X (A1;A2; ;An) (DF) X est minimal : il n existe pas de sous-ensemble Y de X tel que Y (A1;A2; ;An). Exemple : {NV, Conducteur} est une clé mais pas {NV, Conducteur, Marque} Si plusieurs clés clé primaire et clés candidates. Toute relation comporte une clé (éventuellement composé de tous les attributs de la relation!). Passage en «1 ère forme normale» Première forme normale (1NF) : Une relation est en première forme normale si, et seulement si, tout attribut contient une valeur atomique. Tout attribut est non décomposable, il ne peut pas être constitué d un agrégat comme (nom,prénom) ou d une liste comme une liste de prénoms. 8

Passage en «2 ième forme normale» Deuxième forme normale (2NF) : Une relation est en deuxième forme normale si, et seulement si : elle est en première forme normale ; tout attribut n appartenant pas à une clé ne dépend pas d une partie de cette clé. «toute la clé est utile tout le temps» Rmq : Toute relation pour laquelle toute clé ne comporte qu un attribut est en deuxième forme normale. Voiture(NV, Couleur, Type, Marque, Conducteur, Infraction) NV Couleur NV Type NV Marque NV, Conducteur Infraction Type Marque Voiture(NV, Couleur, Type, Marque) Conduite(NV, Conducteur, Infraction) Passage en «3 ième forme normale» Troisième forme normale (3NF) : Une relation est en troisième forme normale si, et seulement si : elle est en deuxième forme normale ; tout attribut n appartenant pas à une clé ne dépend pas d un attribut non clé. «toute la clé et rien que la clé» Remarques : Pas de dépendances entre attributs non clés. Plus de redondances liées à la transitivité des DFE. Si plusieurs clés, vérifier la propriété pour toutes les clés. Voiture(NV, Couleur, Type, Marque) NV Couleur NV Type NV Marque Type Marque Voiture(NV, Couleur, Type) Constructeur(Type, Marque) 9

Passage en «Boyce-Codd NF» Forme normale de BOYCE-CODD (BCNF) : Une relation est en forme normale de BOYCE-CODD si, et seulement si : elle est en troisième forme normale, les seules dépendances fonctionnelles élémentaires sont celles dans lesquelles une clé détermine un attribut adresse(ville, Rue, Numero, Codepostal) Ville, Rue, Numero Codepostal Codepostal Ville adr1(codepostal, Ville) adr2(codepostal, Rue, Numero) Bilan des passages en NF On passe progressivement de quelques grosses tables à beaucoup de petites tables; L exploitation de la base devient plus efficace. Mais beaucoup d attributs sont répliqués dans plusieurs tables; On doit réaliser de plus en plus de jointures On s arrête souvent à la 3NF, qui est un bon compromis. 10