Bases de Données Avancées



Documents pareils
Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014

Olivier Mondet

XML par la pratique Bases indispensables, concepts et cas pratiques (3ième édition)

2 Serveurs OLAP et introduction au Data Mining

SQL Server et Active Directory

Bases de données et sites WEB

Thierry BOULANGER. par la pratique. Bases indispensables Concepts et cas pratiques XML. 3 ième édition. Nouvelle édition

OpenPaaS Le réseau social d'entreprise

CREATION WEB DYNAMIQUE

Le langage SQL (première partie) c Olivier Caron

Le Langage De Description De Données(LDD)

Pratique et administration des systèmes

Module BDWEB. Maîtrise d informatique Cours 9 - Xquery. Anne Doucet. anne.doucet@lip6.fr

La rencontre du Big Data et du Cloud

Application Form/ Formulaire de demande

Architectures d'intégration de données

Master Technologies numériques appliquées à l'histoire Deuxième année

Le langage SQL pour Oracle - partie 1 : SQL comme LDD

PHP 5. La base de données MySql. A. Belaïd 1

La base de données XML exist. A. Belaïd

Cours Bases de données

Langage SQL : créer et interroger une base

SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste

21 mars Simulations et Méthodes de Monte Carlo. DADI Charles-Abner. Objectifs et intérêt de ce T.E.R. Générer l'aléatoire.

Master I Génie Logiciel

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

SQL Parser XML Xquery : Approche de détection des injections SQL

Hervé Couturier EVP, SAP Technology Development

Forthcoming Database

INSTITUT NATIONAL DES TELECOMMUNICATIONS CONTROLE DES CONNAISSANCES. 2. Les questions sont indépendantes les unes des autres.

ISC Système d Information Architecture et Administration d un SGBD Compléments SQL

A QUOI SERVENT LES BASES DE DONNÉES?

Principales failles de sécurité des applications Web Principes, parades et bonnes pratiques de développement

StruxureWare Power Monitoring Expert v7.2

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

BD et XML : Exercices

Introduction aux bases de données

Bases de données avancées Introduction

Notes de cours : bases de données distribuées et repliquées

AMENDMENT TO BILL 32 AMENDEMENT AU PROJET DE LOI 32

Les Entrepôts de Données

PeTEX Plateforme pour e-learning et expérimentation télémétrique

La Poste choisit l'erp Open Source Compiere

Cours Bases de données 2ème année IUT

Quick Start Guide This guide is intended to get you started with Rational ClearCase or Rational ClearCase MultiSite.

Optimiser votre reporting sans déployer BW

Information utiles. webpage : Google+ : digiusto/

Sécurité des sites Web Pas un cours un recueil du net. INF340 Jean-François Berdjugin

8. Cours virtuel Enjeux nordiques / Online Class Northern Issues Formulaire de demande de bourse / Fellowship Application Form

Langage SQL (1) 4 septembre IUT Orléans. Introduction Le langage SQL : données Le langage SQL : requêtes

L offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence

Pascale Borla-Salamet Consultante Avant Vente Oracle France. Oracle Exadata Performance et Optimisation de votre Datawarehouse

Sécurité des applications web. Daniel Boteanu

Java et les bases de données: JDBC: Java DataBase Connectivity SQLJ: Embedded SQL in Java. Michel Bonjour

OLAP : Mondrian + Pentaho. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

L Art d être Numérique. Thierry Pierre Directeur Business Development SAP France

Accès à l'information XML par des requêtes XQuery au travers de son XSchema

Comment Accéder à des Bases de Données MySQL avec Windows lorqu'elles sont sur un Serveur Linux

Stage Ingénieur en développement logiciel/modélisation 3D

Diplôme de Comptabilité et de Gestion. D é c r e t N d u 2 2 d é c e m b r e A r r ê t é d u 8 m a r s

Bases de données - Modèle relationnel

Java et les bases de données

Fiche Produit Desktop Popup

Cursus Sage ERP X3 Outils & Développement. Le parcours pédagogique Sage ERP X3 Outils et Développement

<Insert Picture Here>ApExposé. Cédric MYLLE 05 Février Exposé Système et Réseaux : ApEx, Application Express d Oracle

Bases de données Cours 1 : Généralités sur les bases de données

Les bases de données

UNIVERSITE DE CONSTANTINE 1 FACULTE DES SIENCES DE LA TECHNOLOGIE DEPARTEMENT D ELECTRONIQUE 3 ème année LMD ELECTRONIQUE MEDICALE

SQL Historique

Mysql avec EasyPhp. 1 er mars 2006

Développement de base de données Microsoft SQL Server Durée : 5 jours Référence : DPSQL12. Contenu

e-science : perspectives et opportunités pour de nouvelles pratiques de la recherche en informatique et mathématiques appliquées

L installation a quelque peu changée depuis les derniers tutos, voici une actualisation.

Gestion de base de données

PHP et les Bases de données - Généralités

Vulnérabilités et sécurisation des applications Web

Introduction au développement SharePoint. Version 1.0

La persistance des données dans les applications : DAO, JPA, Hibernate... COMPIL 2010 francois.jannin@inp-toulouse.fr 1

Les Utilisateurs dans SharePoint

Le cadre des Web Services Partie 1 : Introduction

laposte.net) Ministère de l'éducation nationale Atelier sécurité Rabat RALL 2007

La dernière base de données de Teradata franchit le cap du big data grâce à sa technologie avancée

FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES

L ESPACE À TRAVERS LE REGARD DES FEMMES. European Economic and Social Committee Comité économique et social européen

Frequently Asked Questions

StruxureWare Power Monitoring v7.0. La nouvelle génération en matière de logiciel de gestion complète d énergie

Installation d'un serveur FTP géré par une base de données MySQL

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

MODE OPERATOIRE OPENOFFICE BASE

Comment la ville de Westmount a automatisé la préparation de ses réunions du conseil :

Tom Pertsekos. Sécurité applicative Web : gare aux fraudes et aux pirates!

Programming Server-Side Web Applications with Object-Oriented PHP NC Group Syllabus. Duration: 75 hours 1-2-2

Master Exploration Informatique des données DataWareHouse

Technologies du Web. Ludovic DENOYER - ludovic.denoyer@lip6.fr. Février 2014 UPMC

SNMP for cloud Jean Parpaillon. SNMP4cloud - 1

Transcription:

0-0 Bases de Données Avancées S. Cerrito Année 2007-2008, Evry

1 Médiation de données ayant des sources différentes 1

Architecture générale SCHEMA GLOBAL MEDIATEUR Requete utilisateur Moteur de requete Adaptateur Adaptateur Adaptateur Schema Local Schema Local Schema Local Donnees 1 Donnees 2 Donnees 3 2

Schéma global : on décrit dans un formalisme spécifique le vocabulaire que l utilisateur pourra utiliser pour exprimer sa requête. (Et il faut aussi un formalisme de description du contenu des sources). L utilisateur exprime sa requête en termes du schéma global. Il faut aussi une correspondance entre relations globales et relations locales. Deux approches : 1. Approche Global As View (GAV) : toute relation locale est une vue sur les locales. 2. Approche Local As View (LAV) : vice-versa, i.e. ce sont les relations locales qui sont des vues sur les globales. 3

Adaptateurs (Wrappers) : interfaces entre les sources et le médiateur. Programmes qui transforment les requêtes (élaborées par le médiateur) en des requêtes exécutables sur les sources. 4

Exemple de Schéma Global/Relation Locales Pour simplifier, prenons un formalisme logique pour exprimer les relations globales et les locales aussi. Schéma Global, relations globales : emp(e) : E est un employé, tél(e,n) : N est le num. de tél. de E, buréau(e,b) : B est le num. de bureau de E, dir(e,d) : D est le directeur de E, dept(e,de) : De est le département de E. même-bur(e,e ) Emp(E) & Emp(E ) & bureau(e,b) & bureau(e,b) emp-tél-bur(e,n,b) Emp(E) & Emp(E ) & tél(e,n) & bureau(e,b) emp-dept-dir(e,de,d) Emp(E) & Emp(E ) & dept(e,de) & dir(e,d) Sources, relations locales : Source 1 : s1(e,n,d) fournit infos sur les employés, leur tél et leur directeur. Source 2 : s2(e,b,de) fournit infos sur les employés, leur bureau et leur département. Source 3 : s3(e,n) fournit infos sur les num de tél des employés du dépt. jouets. 5

Exemple de Schéma Global/Relation Locales : suite Correspondance relations globales et locales : Approche GAV On exprime les relations globales en fonction des relations locales, par ex. : emp(e) = DEF s1(e,n,d) OR s2(e,b,de) OR s3(e,n) emp-tél-bur(e,n,b) = DEF (s1(e,n,d) & s2(e,b,de)) OR (s3(e,n) & s2(e,b,de)) OR (s3(e,n) & s2(e,b, jouets )) R : donner les employés du bureau N. 10 et leur tél. : emp-tél-bu(e, tél, 10 ). Pour calculer R, dans un formalisme logique, on peut faire du chaînage en arrière, à la Prolog, par ex. 6

Exemple de Schéma Global/Relation Locales : suite Correspondance relations globales et locales : Approche LAV On exprime les relations locales en fonction des relations globales : s1(e,n,d) = DEF emp(e) & tél(e,n) & dir(e,d) s2(e,b,de) = DEF emp(e) & bureau(e,b) & dept(e,de) s3(e,n) DEF emp(e) & tél(e,b) & dept(e, jouets ) Requête : donner les employés du bureau N. 10 et leur tél., i.e. emp-tél-bur(e,n,10) (langage du schéma global). On doit calculer les valeur E, N des relations locales : a) s2(e,10,de) & s1(e,n,d) sur les sources 2 et 1 b) s2(e,10,de) & s3(e,n) sur les sources 2 et 3 7

(a) et (b) se réécrivant en : a ) emp(e) & buréau(e,b) & dept(e,de) & emp(e) & tél(e,n) & dir(e,d) b ) emp(e) & buréau(e,b) & dept(e,de) & emp(e) & tél(e,b) & dept(e, jouets ). 8

Peu importe si l approche est GAV ou LAV, l hétérogénéité des sources donne lieu à des difficultés : 1 Modèles de données : Relationnel, Objet, Semi-structuré, même HTML ou des fichiers plats. 2 Structuration : Même dans le cadre du même type de modèle, possibilité de 2 schémas différents. Par ex. une source relationnelle stocke les infos sur les clients dans 1 seule table, une autre en plusieurs tables. Et puis, une source peut ne pas avoir de schéma (HTML, par ex.) 3 Problèmes de sémantique. i) Par ex. d un attribut :pour la source A altitude est mesuré en mètres, pour B en miles. Pire : pour A le salaire est net, pour B est brut. ii) Possibilité d informations contradictoires. 9

1.1 Que peut-il apporter XML s il est choisi comme langage du schéma global? 10

Tout d abord : Expressivité Riche. Par ex., dans un approche LAV, si on veut passer du relationnel au semi-structuré, les schémas relationnels : Cours(NumCours,NomProf,Salle) Inscriptions(NomEtudiant,NumCours) ont une écriture simple en un DTD, par ex. :!ELEMENT Cours (NomProf,Salle)!ATTLIST Cours NoCours ID #REQUIRED!ELEMENT Inscriptions (NomEtudiant)!ATTLIST Inscriptions NoCours IDREF #REQUIRED 11

Reprise des difficultés, une par une 1 Modèles de données XML fournit une syntaxe neutre pour décrire des données structurés, conceptuellement, par des graphes, permettant l imbrication et les références. Plusieurs structures de données peuvent être ainsi représentées. Ce point est lié à l expressivité de XML. Ici, la contribution de XML est importante. 12

Reprise des difficultés, une par une 2 Structuration : Même dans le cadre du même type de modèle, possibilité de 2 schémas différents. Puis, une source peut ne pas avoir de schéma du tout. A nouveau, on peut exprimer plusieurs structurations de données sous forme de graphes, et les DTD ou les XML-schémas sont très expressifs. Ceci dit, la nécéssité de créer des mappings entre les plusieurs formes et cas de schémas, éventuellement à l aide de Xquery, reste. 13

Reprise des difficultés, une par une 3 Problèmes de sémantique. Attribut ayant domaines différents, informations contradictoires. XML fournit un méchanisme permettant d attacher des metadonnées, décrivant les données, ce qui aide à determiner quelle transformations doivent être faites pour intégrer plusieurs sources. Par ex., ici on indique ce que l altitude est < Altitude > 500 < UniteMes > miles </UniteMes > </Altitude > Mais le problème reste complex. 14

Réalités Industrielles (liste qui ne se veut pas exhaustive) Enosys Software. An extrait de http ://xml.coverpages.org/enosys-xquery.html : an XML-based information integration software provider,..., the latest evidence of the technology industry s adoption of XQuery as the new standard for enterprise information integration (EII). By providing a standard method for query and retrieval of XML data, XQuery is playing the role that SQL did for relational databases in the late eighties, said Dave Banks, CEO of Enosys. Enosys technology has deep roots in research from Stanford and University of California, where query-able real-time XML views of multiple data sources were first proposed and researched by the founders and key members of the Enosys team. Enosys was the first to harness the power of XQuery for enterprise information integration. With an XQuery-based EII offering, users spend significantly less money and less time to achieve real-time integration of data from disparate sources. 15

Actuate (achat de Nimble, qui avait dévéloppé de la technologie pour l intégration des données : http ://www.actuate.com/products/data-integration/index.asp Technologie utilisant, entre outre, Xpath. 16

Liquid Data Derivé de Enosys Fournit une vue fondée sur XML de toutes les données d une entreprise. Les sources apparaissent soit comme des documents virtuels XML soit comme une collection de fonctions qui prennent des paramètres XML et produisent des résultats XML (i.e. des requêtes XQUERY). 17