2A-SI 4 - Bases de Données 4.4 - Normalisation de schémas relationnels



Documents pareils
A QUOI SERVENT LES BASES DE DONNÉES?

Formation à l utilisation des Systèmes de Gestion de Bases de Données Relationnelles. organisée avec la collaboration du

Bases de Données. Plan

Resolution limit in community detection

CONCEPTION Support de cours n 3 DE BASES DE DONNEES

MERISE. Modélisation de Systèmes d Information. Pierre Gérard. DUT Informatique 2ème année 2004/2005. IUT de Villetaneuse - Université de Paris 13

... /5. Bases de Données I (J. Wijsen) 23 janvier 2009 NOM + PRENOM : Orientation + Année : Cet examen contient 11 questions.

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

Introduction aux Systèmes de Gestion de Bases de Données Relationnelles. Olivier Losson

Année Universitaire 2009/2010 Session 2 de Printemps

Patrice BOURSIER. Professeur, Univ. de La Rochelle. Bases de Données. Notes de cours

Entrepôt de données 1. Introduction

Bases de Données Avancées

A QUOI SERVENT LES BASES DE DONNÉES?

Modèle Entité/Association

Introduction aux bases de données. Généralités sur les bases de données. Fonctions d'un SGBD. Définitions. Indépendance par rapport aux traitements

INITIATION AUX BASES DE DONNEES MODELISATION et LANGAGE SQL

1 Modélisation d une base de données pour une société de bourse

Les bases de données

Chap. 3: Le modèle de données entité-association (E.A.)

TP Bases de données réparties

Conception d une base de données

Gestion des Clés Publiques (PKI)

Thierry Spriet Version rééditée au format PDF et remise en page

Bases de données réparties: Fragmentation et allocation

CESI Bases de données

MATURITÉ MARKETING Comment interpréter vos résultats

Programmation sous QT

Règlement du Certificate of Advanced Studies en Stratégie et management du système d information (CAS SMSI)

Grammaires d unification

Chapitre 1 Généralités sur les bases de données

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES

UML et les Bases de Données

16H Cours / 18H TD / 20H TP

Modélisation des données

Information utiles. webpage : Google+ : digiusto/

Modélisation de bases de données : Le modèle relationnel

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Décision Markovienne appliquée à un jeu de stop ou encore : Pickomino (Heckmeck Am Bratwurmeck)

Rappel sur les bases de données

Conception des systèmes répartis

Estimation des charges. «Le travail se dilate jusqu à remplir le temps disponible»

Bases de données relationnelles

Les différents types de relation entre les tables

Cours de Génie Logiciel

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

Correction du baccalauréat ES/L Métropole 20 juin 2014

1 Introduction et installation

et les Systèmes Multidimensionnels

Modèle Entité-Association. C est un modèle important pour la conception des bases de données relationnelles. Il

Cours SGBD 1. Concepts et langages des Bases de Données Relationnelles

Bases de données Cours 5 : Base de données déductives

INTRODUCTION : Données structurées et accès simplifié

Définitions. Numéro à préciser. (Durée : )

Soutien technique en informatique

Précision d un résultat et calculs d incertitudes

clef primaire ; clef étrangère ; projection ; restriction ; jointure ; SQL ; SELECT ; FROM ; WHERE

BASES DE DONNÉES. CNAM Centre associé de Clermont-Ferrand Cycle A Année J. Darmont I. INTRODUCTION II. LES SYSTÈMES HIÉRARCHIQUES

La NP-complétude. Johanne Cohen. PRISM/CNRS, Versailles, France.

Chapitre 07 Le modèle relationnel des données

UE 8 Systèmes d information de gestion Le programme

Exemple accessible via une interface Web. Bases de données et systèmes de gestion de bases de données. Généralités. Définitions

NF26 Data warehouse et Outils Décisionnels Printemps 2010

1ère partie Nadine Cullot. Bases de données déductives. Bases de données déductives Introduction et Motivation

Bases de Données relationnelles et leurs systèmes de Gestion

Programmation en Java IUT GEII (MC-II1) 1

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

.../5. Gestion de Bases de Données (J. Wijsen) 27 janvier 2011 NOM + PRENOM : Orientation + Année : Cet examen contient 8 questions. Durée : 2 heures.

Données Réparties. Thibault BERNARD.

Le modèle de données

Algorithmes de recherche

Bases de Données. Stella MARC-ZWECKER. Maître de conférences Dpt. Informatique - UdS

Palo Alto Networks Guide de l administrateur Panorama. Panorama 5.1

Utilisation des tableaux sémantiques dans les logiques de description

Le monde change vite, les méthodes de gestion évoluent. La traçabilité et le reporting s invitent désormais dans les usines de préfabrication.

Tickets 3:3. ChevauxPartants

Introduction au Système de Gestion de Base de Données et aux Base de Données

Systèmes d information et bases de données (niveau 1)

Devenez un véritable développeur web en 3 mois!

I4 : Bases de Données

TD 1 - Structures de Traits et Unification

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Évaluation et optimisation de requêtes

Bases de Données Relationnelles. Le Modèle Relationnel

Jean-François Boulicaut & Mohand-Saïd Hacid

Introduction au Data-Mining

NFA 008. Introduction à NoSQL et MongoDB 25/05/2013

BI = Business Intelligence Master Data-ScienceCours 3 - Data

Urbanisation des Systèmes d Information Architecture d Entreprise. 04 Architecture du SI : identifier et décrire les services, structurer le SI

Les bases de données Page 1 / 8

6 - Le système de gestion de fichiers F. Boyer, UJF-Laboratoire Lig, Fabienne.Boyer@imag.fr

Jade. Projet Intelligence Artificielle «Devine à quoi je pense»

jeudi 19 septembre 2013, Bournezeau Services et Solutions en Carrière

DESS CCI Formation Continue. Février Université Louis-Pasteur de Strasbourg Département d'informatique

Politique linguistique

Chapitre Introduction : Notion de Bases de données. 2. Définition : BD Répartie. 3. Architecture des SGBD. 4. Conception des bases réparties

SESSION 2014 ÉPREUVE À OPTION. (durée : 4 heures coefficient : 6 note éliminatoire 4 sur 20)

Chapitre 5 : Flot maximal dans un graphe

14/04/2014. un ensemble d'informations sur un sujet : exhaustif, non redondant, structuré, persistant. Gaëlle PERRIN SID2 Grenoble.

Transcription:

2A-SI 4 - Bases de Données 4.4 - Normalisation de schémas relationnels Stéphane Vialle Stephane.Vialle@supelec.fr http://www.metz.supelec.fr/~vialle Avec l aide du cours de Y. Bourda Intérêt de la normalisation Besoin : d éviter d avoir une seule «grosse» relation! de décomposer les relations en plus petites, plus homogène «sémantiquement» limitant la duplication des informations dans les tables Problème : comment décomposer les relations? une mauvaise décomposition mène à des pertes d informations et à de mauvaise recompositions!! Démarche : décomposer les relations sous formes «normales» 1

Intérêt de la normalisation Décomposition : On n obtient plus la même table!! Jointure «naturelle» : Véhicule Constructeur, si «Modèles» identique Intérêt de la normalisation Décomposition : Comment trouver systématiquement une «bonne» décomposition (dont l interrogation sera efficace)? On obtient la même table Jointure «naturelle» : Véhicule Constructeur, si «Modèles» identique 2

Deux approches possibles Analyse suivant le modèle entités-associations Collecte d informations Groupement de tous les attributs dans une seule relation Schéma entités-associations Transformation (systématique) en schéma relationnel Schéma relationnel Passage en 1NF Passage en 2NF Passage en 3NF Identification des DFE Décomposition sans pertes de la relation Schéma relationnel en «couverture minimale» Algorithme itératif de passage en 3NF (systématique) Approche intuitive (modélisation intermédiaire) Schéma relationnel optimisé (3NF) Passage en BCNF (identification de DFE) Schéma relationnel en BCNF Approche mathématique (algèbre relationnelle) Dépendances fonctionnelles : DF Dépendance fonctionnelle (DF) : Soit R(A1;A2; An) un schéma de relation, et X et Y des sous-ensembles de {A1;A2; An}. On dit que X détermine Y ou que Y dépend fonctionnellement de X si, et seulement si, des valeurs identiques de X impliquent des valeurs identiques de Y. Notation : X Y Exemple : Voiture(NV, Couleur, Type, Marque, Conducteur, Infraction) Contient notamment les DF suivantes : NV Type, Marque NV, Conducteur Infraction 3

Dépendances fonctionnelles élémentaires : DFE Dépendance fonctionnelle élémentaire (DFE) : Dépendance fonctionnelle de la forme X Y, dans laquelle Y est un attribut unique n appartenant pas à X et où il n existe pas X0 inclus dans X tel que X0 Y. Exemple : Voiture(NV, Couleur, Type, Marque, Conducteur, Infraction) Contient notamment les DFE suivantes : NV Type Type Marque NV Marque NV, Conducteur Infraction Graphe de DF et DFE Autre définition : Dépendance fonctionnelle élementaire = le plus petit nombre d attributs en déterminant un autre. Seule règle applicable : transitivité L ensemble des DF forme un graphe, mais sans aucun intérêt car comportant trop d arcs. L ensemble des DFE est modélisé par un graphe dit «graphe des dépendances fonctionnelles élémentaires». Fermeture transitive des DFE Fermeture transitive : G : graphe des DFE, G* : fermeture transitive de G, graphe constitué de toutes les DFE de G augmenté de toutes celles obtenues par transitivité. 4

Couverture minimale des DFE Couverture minimale : Soit G un graphe des dépendances fonctionnelles élémentaires, Soit G* sa fermeture transitive, La couverture minimale est un ensemble F d attributs vérifiant : F* = G* (les deux ensembles d attributs ont même fermeture transitive) Si on enlève une dépendance fonctionnelle élémentaire de F alors F* G* (tous les éléments de F sont indispensables, aucun n est en trop) G* F Passage en «formes normales» Préambule : définition formelle d une clé Clé de relation : Soit R(A1; ; An) un schéma de relation, et X un sous-ensemble de (A1; ; An), X est une clé si, et seulement si, : X (A1;A2; ;An) (DF) X est minimal : il n existe pas de sous-ensemble Y de X tel que Y (A1;A2; ;An). Exemple : {NV, Conducteur} est une clé mais pas {NV, Conducteur, Marque} Si plusieurs clés clé primaire et clés candidates. Toute relation comporte une clé (éventuellement composé de tous les attributs de la relation!). 5

Passage en «1 ère forme normale» Première forme normale (1NF) : Une relation est en première forme normale si, et seulement si, tout attribut contient une valeur atomique. Tout attribut est non décomposable, il ne peut pas être constitué d un agrégat comme (nom,prénom) ou d une liste comme une liste de prénoms. Passage en «2 ième forme normale» Deuxième forme normale (2NF) : Une relation est en deuxième forme normale si, et seulement si : elle est en première forme normale ; tout attribut n appartenant pas à une clé ne dépend pas d une partie de cette clé. «toute la clé est utile tout le temps» Rmq : Toute relation pour laquelle toute clé ne comporte qu un attribut est en deuxième forme normale. Voiture(NV, Couleur, Type, Marque, Conducteur, Infraction) NV Type NV Marque NV, Conducteur Infraction Type Marque Voiture(NV, Couleur, Type, Marque) Conduite(NV, Conducteur, Infraction) Passage en «3 ième forme normale» Troisième forme normale (3NF) : Une relation est en troisième forme normale si, et seulement si : elle est en deuxième forme normale ; tout attribut n appartenant pas à une clé ne dépend pas d un attribut non clé. «toute la clé et rien que la clé» Remarques : Pas de dépendances entre attributs non clés. Plus de redondances liées à la transitivité des DFE. Si plusieurs clés, vérifier la propriété pour toutes les clés. Voiture(NV, Couleur, Type, Marque) NV Type NV Marque Type Marque Voiture(NV, Couleur, Type) Constructeur(Type, Marque) 6

Passage en «Boyce-Codd NF» Forme normale de BOYCE-CODD (BCNF) : Une relation est en forme normale de BOYCE-CODD si, et seulement si : elle est en troisième forme normale, les seules dépendances fonctionnelles élémentaires sont celles dans lesquelles une clé détermine un attribut adresse(ville, Rue, Numero, Codepostal) Ville, Rue, Numero Codepostal Codepostal Ville adr1(codepostal, Ville) adr2(codepostal, Rue, Numero) Bilan des passages en NF On passe progressivement de quelques grosses tables à beaucoup de petites tables; L exploitation de la base devient plus efficace. Mais beaucoup d attributs sont répliqués dans plusieurs tables; On doit réaliser de plus en plus de jointures On s arrête souvent à la 3NF, qui est un bon compromis. 7