BD réparties. Bases de Données Réparties. SGBD réparti. Paramètres à considérer



Documents pareils
Module BDR Master d Informatique (SAR)

Chapitre Introduction : Notion de Bases de données. 2. Définition : BD Répartie. 3. Architecture des SGBD. 4. Conception des bases réparties

Gestion de données réparties. Cours 1

Systèmes d informations nouvelles générations. Répartition, Parallèlisation, hétérogénéité dans les SGBD. Exemple d application d un futur proche

1. Introduction. Bases de données Réparties, Fédérées et Réplication. Plan. Bibliographie du cours

Intégration de données hétérogènes et réparties. Anne Doucet

ORACLE 10G DISTRIBUTION ET REPLICATION. Distribution de données avec Oracle. G. Mopolo-Moké prof. Associé UNSA 2009/ 2010

Bases de données réparties et fédérées

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

et les Systèmes Multidimensionnels

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Faculté des sciences de gestion et sciences économiques BASE DE DONNEES

Bases de données distribuées et fédérées

ISC Système d Information Architecture et Administration d un SGBD Compléments SQL

Chapitre 10. Architectures des systèmes de gestion de bases de données

INTRODUCTION AUX BASES de DONNEES

Répartition, Réplication, Nomadisme, Hétérogénéité dans les SGBDs

Cours Bases de données

Architectures d'intégration de données

Répartition, Réplication, Nomadisme, Hétérogénéité dans les SGBDs

Bases de données Cours 1 : Généralités sur les bases de données

Initiation aux bases de données (SGBD) Walter RUDAMETKIN

Notes de cours : bases de données distribuées et repliquées

Présentation du module Base de données spatio-temporelles

Les Entrepôts de Données

Bases de Données Réparties Concepts et Techniques. Matthieu Exbrayat ULP Strasbourg - Décembre 2007

CESI Bases de données

ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE

Module BD et sites WEB

//////////////////////////////////////////////////////////////////// Administration bases de données

Bases de Données Réparties

Cours Base de données relationnelles. M. Boughanem, IUP STRI

CHAPITRE 1 ARCHITECTURE

Base de données II Module 3b

Réplication des données

Introduction aux bases de données Cours 1 : Généralités sur les bases de données

MYXTRACTION La Business Intelligence en temps réel

Introduction aux SGBDR

Bases de données relationnelles : Introduction

Master I Génie Logiciel

TP Bases de données réparties

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Enterprise Intégration

Information utiles. webpage : Google+ : digiusto/

Sybase PowerAMC 16. Guide des nouvelles fonctionnalités générales. DOCUMENTATION

WEA Un Gérant d'objets Persistants pour des environnements distribués

Mercredi 15 Janvier 2014

Bases de Données Avancées

Qu est-ce que ArcGIS?

Architectures web/bases de données

Licence Professionnelle Commerce Electronique. MySQL. Michel DUBOIS Michel Dubois : Support de cours SGBD N 1

Bases de Données. Stella MARC-ZWECKER. Maître de conférences Dpt. Informatique - UdS

Introduction aux Bases de Données Relationnelles Conclusion - 1

Atelier 1. Portails documentaires : BioLib et Cemadoc

Jérôme FESSY. IUT de Paris 5. Base de Données. Cours Introductif. Base de Données

UE 8 Systèmes d information de gestion Le programme

Bases de données cours 1

Intégration de systèmes client - serveur Des approches client-serveur à l urbanisation Quelques transparents introductifs

DÉVELOPPEMENT INFONUAGIQUE - meilleures pratiques

Java et les bases de données

Le modèle client-serveur

SQL Server 2012 et SQL Server 2014

IT203 : Systèmes de gestion de bases de données. A. Zemmari zemmari@labri.fr

LES ENTREPOTS DE DONNEES

C-JDBC. Emmanuel Cecchet INRIA, Projet Sardes.

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Programme détaillé. Administrateur de Base de Données Oracle - SQLServer - MySQL. Objectifs de la formation. Les métiers

Langage SQL (1) 4 septembre IUT Orléans. Introduction Le langage SQL : données Le langage SQL : requêtes

Urbanisme du Système d Information et EAI

Bases de données avancées Introduction

Introduction aux applications réparties

IBM System i. DB2 Web Query for System i : le successeur de Query/400? Oui, mais bien plus!!!

IFT3030 Base de données. Chapitre 2 Architecture d une base de données

Compte Rendu d intégration d application

Les bases de données Page 1 / 8

Bases de Données. Plan

Java et les bases de données: JDBC: Java DataBase Connectivity SQLJ: Embedded SQL in Java. Michel Bonjour

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

SAP Business Suite Powered by SAP HANA Transactionnel et Analytique réunis

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Les nouvelles architectures des SI : Etat de l Art

Business & High Technology

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing

Introduction aux Bases de Données

Annuaires LDAP et méta-annuaires

La problématique de la Préservation des Bases de Données. Olivier ROUCHON CINES Groupe PIN Jeudi 7 Octobre

Bases de données réparties: Fragmentation et allocation

Chapitre 1 : Introduction aux bases de données

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Démos Reporting Services Migration vers SQL2008

ORACLE 10g Découvrez les nouveautés. Jeudi 17 Mars Séminaire DELL/INTEL/ORACLE

Module BDR Master d Informatique (SAR)

Architecture N-Tier. Ces données peuvent être saisies interactivement via l interface ou lues depuis un disque. Application

PostgreSQL. Formations. Catalogue Calendrier... 8

L objet de cet article est de présenter succinctement ces possibilités.

BASES DE DONNÉES. CNAM Centre associé de Clermont-Ferrand Cycle A Année J. Darmont I. INTRODUCTION II. LES SYSTÈMES HIÉRARCHIQUES

CONCEPTION Support de cours n 3 DE BASES DE DONNEES

MERISE. Modélisation et Conception de Systèmes d Information

Transcription:

Bases de Données Réparties Définition Architectures Outils d interface SGBD Réplication SGBD répartis hétérogènes BD réparties Principe : BD locales, accès locaux rapides accès aux autres SGBD du réseau (accès globaux). Plusieurs niveaux d intégration : Client/serveur : BD centralisée, seuls certains traitements (interface, p.ex.) sont locaux. Accès distant (Remote Data Access) Vues réparties : extension du mécanisme de vues pour définir des vues sur plusieurs sites. BD réparties : Plusieurs BD sur plusieurs sites, mais une seule BD «logique». Ordinateurs (sites) faiblement couplés, communiquent via le réseau. Chaque site contient des données de la base, peut exécuter des transactions locales et participer à l exécution de transactions globales. 1 2 SGBD réparti SGBD1 SGBDR SGBD2 Rend la répartition (ou distribution) transparente dictionnaire des données réparties traitement des requêtes réparties gestion de transactions réparties gestion de la cohérence et de la sécurité Paramètres à considérer Coût et temps de communication entre les sites Fiabilité fréquence des pannes des sites, du réseau Accessibilité aux données accès aux données en cas de panne des sites, du réseau. accès aux sites les moins encombrés, les plus puissants 3 4

Evaluation de l'approche BDR avantages extensibilité partage des données hétérogènes et réparties performances avec le parallélisme disponibilité avec la réplication inconvénients administration complexe complexité de mise en œuvre et de développement distribution du contrôle difficulté de migration surcharge (l échange de messages augmente le temps de calcul) Migration vers une BDR Décomposition en BD locales BD BD1 BD2 BD3 Intégration logique des BD locales existantes BD BD1 BD2 BD3 5 6 Architecture de schémas application 1 application 2 Schéma global Schéma local 1 Schéma local 2 Schéma local 3 Schéma global schéma conceptuel global donne la description globale et unifiée de toutes les données de la BDR (e.g., des relations globales) indépendance à la répartition schéma de placement règles de correspondance avec les données locales indépendance à la localisation, la fragmentation et la duplication indépendance applications/bdr schéma global lourd à gérer Le schéma global fait partie du dictionnaire de la BDR et peut être conçu comme une BDR (dupliqué ou fragmenté) 7 8

Exemple de schéma global Architecture fédérée Schéma conceptuel global Client (nclient, nom, ville) Cde (ncde, nclient, produit, qté) Schéma de placement Client = Client1 @ Site1 U Client1 @ Site2 Cde = Cde @ Site3 application 1 application 2 Schéma fédéré 1 Schéma fédéré 2 Schéma local 1 Schéma local 2 Schéma local 3 moyen contrôlé de migration 9 10 Conception d'une BDR par intégration Traduction de schémas Intégration de schémas BD1 BD2 BD3 Traducteur 1 S local 1 Traducteur 2 S local 2 Intégrateur Schéma Global Traducteur 3 S local 3 Intégration de schémas 1. pré-intégration identification des éléments reliés (e.g. domaines équivalents) et établissement des règles de conversion (e.g. 1 inch = 2,54 cm) Pbs : hétérogénéité des modèles de données, des puissances d expression, des modélisations 2. comparaison identification des conflits de noms (synonymes, homonymes) et des conflits structurels (types, clés, dépendances) 3. conformance résolution des conflits de noms (renommage) et des conflits structurels (changements de clés, tables d'équivalence) Définition de règles de traduction entre le schéma intégré et les schémas initiaux. 4. fusion et restructuration fusion des schémas intermédiaires et restructuration pour créer un schéma intégré optimal. 11 12

Outils d'interface SGBD Extracteurs et Passerelles Extracteur données Passerelle procédure données Réplicateur données Transformation Select Select table SQL résultat copie1 copie2 Fonctions définition des procédures de transformation (dictionnaire) et exécution dans l'environnement cible conversion de formats et de valeurs filtrage et fusion de fichiers ou de tables données calculées et résumés Fournisseurs indépendants Evolutionary Technology Inc. (ETI), Information Builders Inc. (IBI), Prism, Carleton, etc. extracteurs indépendants entre les données sources et les outils cibles Editeurs de SGBD Oracle, DB2, Sybase, etc. passerelles entre le SGBD et les données sources 13 14 La réplication Objectifs Fonctions Modèles d'appartenance fixe, dynamique ou partagé Détection des modifications Produits Data Propagator Relational (DProp R) d'ibm Informix OnLine CA-OpenIngres Replicator Oracle Sybase Replication Server Multi Server Option d'afic Technologies Objectifs de la réplication Avantages Accès simplifié, plus performant pour les lectures Résistance aux pannes Parallélisme accru Evite des transferts Inconvénients - Overhead en mise à jour - Cohérence des données 15 16

Objectifs de la réplication Fonctions d'un réplicateur Problème : comment partager des données entre p sites? Solution 1 : sans duplication stockage sur un site et accès réseau depuis les autres sites problèmes de performances et de disponibilité Solution 2 : duplication manuelle propagation des mises à jour d'un site vers les autres par une transaction multi-site avec validation 2PC problèmes liés au 2PC : bloquant et cher Solution 3 : réplication automatique et transparente depuis un site primaire vers des sites cibles 17 Définition des objets répliqués table cible = sous-ensemble horizontal et/ou vertical d'une ou p tables Définition de la fréquence de rafraichissement immédiat (après mise à jour des tables primaires) à intervalles réguliers (heure, jour, etc.) à partir d'un événement produit par l'application Rafraîchissement complet ou partiel (propagation des modifications) push (primaire -> cibles) ou pull (cible -> primaire) Support des données hétérogènes via les passerelles 18 Modèle d'appartenance fixe Modèle d'appartenance dynamique Seul le site primaire peut mettre à jour, les sites cibles ne recevant que des copies en lecture Diffusion primaire cible1 cible2 Le site primaire peut être différent au cours du temps, en fonction d'événements: panne d'un site, état de la données, etc. Appartenance à l'instant t1 primaire cible1 cible2 Consolidation Appartenance à l'instant t2 primaire1 primaire2 cible cible2 primaire cible1 19 20

Modèle d'appartenance partagée Détection des modifications Une donnée appartient à plusieurs sites, qui peuvent chacun mettre à jour et diffuser aux autres sites augmente la disponibilité peut produire des conflits, qui doivent être détectés et résolus primaire2 Solution 1 : utilisation du journal les transactions qui modifient écrivent une marque spéciale dans le journal détection périodique en lisant le journal, indépendamment de la transaction qui a modifié modification de la gestion du journal primaire1 primaire3 Solution 2 : utilisation de triggers la modification d'une donnée répliquée déclenche un trigger mécanisme général et extensible la détection fait partie de la transaction et la ralentit 21 22 SGBD réparti hétérogène Produits Outils SGBDR Interface réseau Interface réseau Interface SGBD1 SGBD1 Interface réseau Interface SGBD2 SGBD2 SGBD relationnels Oracle, Ingres, Sybase, DB2, Informix DataJoiner (IBM) basé sur DB2 VirtualDB (Enterworks) basé sur GemStone, vue objet des tables Open Database Exchange (B2Systems) Disco (GIE Dyade Bull-Inria) utilisé par Kelkoo 23 24

Oracle/Star SGBD Oracle gestion du dictionnaire de la BDR SQL*Net transparence au réseau connexion client-serveur, loggin à distance automatique évaluation de requêtes réparties validation en deux étapes et réplication SQL*Connect : passerelle vers les bases non-oracle Database link Lien à une table dans une BD distante specifié par : Lien vers une BD distante nom de l'utilisateur, mot de passe Paramètres de connexion (protocole réseau, site, port, instance, ) Lien à une table de la base distante Synonyme: pseudo table locale = table distante Exemple create database link BaseParis connect to paul identified by «password» using Paris ; create synonym EmpParis for Emp@BaseParis; 25 26 Oracle/Star : architecture Conclusions et perspectives Net8 Transparent Gateway DB2 Outils Oracle Net8 Net8 Transparent Gateway Informix Applications classiques décisionnel (data warehouse) transactionnel Applications nouvelles intégration de données du Web grand nombre de sources hétérogénéité très forte intégration des données semistructurées (HTML, XML) intégration de la recherche documentaire 27 28