Données semi-structurées Actives

Dimension: px
Commencer à balayer dès la page:

Download "Données semi-structurées Actives"

Transcription

1 Institut National de formation en Informatique INI Mémoire de Magister intitulé : Données semi-structurées Actives Cas de cours en ligne Réalisé par : K. ELARABA ZIANE Encadré Par : Dr Azeddine CHIKH Juin 2007

2 Table des matières Données semi-structurées actives Chapitre I : Introduction 7 PARTIE I : DONNEES SEMI-STRUCTUREES Chapitre II : Représentation des données semi-structurées II.1. Introduction 10 II.2. L'objet structuré, l'objet semi structuré et l objet non structuré.. 11 II.3. Définition données Semi-structurées (SSD) 11 II.4. Modèles des SSD II.4.1 Le modèle OEM II.4.2 Le modèle XML 16 II.5. Base de documents ou base de données pour les SSD? II.6. Gestion des donnés semi-structurées.. 19 II.6.1 Théories autour de l émergence de ces nouveaux SGBD.. 19 II.7. SGBD semi-structurées.. 20 II.7.1 LORE.. 20 II.7.2 TAMINO. 20 II.8. Extension des systèmes relationnels existants 21 II.8.1 XML et ORACLE 10g. 21 II.8.2 XML et les autres SGBDs. 22 II.9 Conclusion 23 Chapitre III : Interrogation des données semi-structurées III.1.Introduction. 24 III.2. Caractéristiques d un Langage de requêtes de SSD.. 25 III.3. Modèles de données de type orienté OEM 26 III. 3.1OEM-QL.. 26 III. 3.2 Lorel 26 III.4. Modèles de données de type XML. 27 III.4. 1Xpath 29 III.4.2 XML-QL 29 III.4.3 XQL 30 III.4.4 XQuery. 30 III.5. Conclusion.. 35 PARTIE II ACTIVE XML Chapitre IV : Active XML & les technologies associées IV.1. Introduction 36 IV.2. Service web. 36 IV.2.1Vue d ensemble.. 36 IV.2.2 La description des services avec WSDL 36 IV.2.3 Le protocole SOAP.. 38 IV.3. Active XML.. 40 IV.3.1 Brève description

3 IV.3.2 Principe d Actif XML IV document AXML IV service AXML. 44 IV.3.3 Architecture globale IV.4.base de données Actives et AXML IV.4.1 Les bases de données actives et les déclencheurs 48 IV.4.2 Définition des triggers en XML. 48 IV.5 Conclusion 50 PARTIE III CONTRIBUTION Chapitre V : Représentation SSD du contenu pédagogique V.1 Introduction.. 51 V.2 spécification IMS-LD.. 52 V.3 Rappel sur le rapport entre les SSD et XML.. 54 V.4 Utilisation conjointe des bases de documents et des bases de données 56 V.4.1 Principe général 56 V.4.2 Méta-modèle du système.. 60 V.5 Architecture d édition du contenu semi-structuré 62 V.6 Conclusion 64 Chapitre VI : Application de AXML en e-learning VI.1. Introduction VI.2. L objet pédagogique d'une plate-forme e-learning VI.3 Différents type de projets E-Learning ; 66 VI.4 Les besoins des différents types d utilisateurs VI.5 Les activités dans une plate-forme e-learning 68 VI.6. Diffusion d objets pédagogiques fondée services web.. 69 VI.6.1 Les bases de services web VI.6.2 L approche services web VI.7. Définition des tâches et des services correspondants. 71 VI.7.1 Création de documents pédagogiques. 72 VI.7.2 Stockage des objets pédagogiques VI.7.3 Présentation des documents pédagogiques VI.7.4 Implantation des exercices.. 74 VI Environnement de développement à distance.. 74 VI Evaluation du parcours VI.8. Conception de l environnement de développement à distance.. 76 VI.8.1 Les fonctionnalités retenues.. 76 VI.8.2 implantation de l environnement de développement. 76 VI.8.3 Approche pour un développement SOAP.. 77 VI.8.4 Mise en œuvre du service VI.9 Conclusion 80 Chapitre VII : Architecture détaillée du Pair AXML VII.1 introduction 81 VII.2 Pair AXML comme client 82 3

4 VII.2.1 Quand activer un appel?.. 82 VII Pull explicite. 83 VII Pull implicite. 83 VII mode Push. 83 VII.2.2 Le temps de validité pour les données retournées. 84 VII La validité zéro VII Illimité VII.2.3 Quoi faire avec le résultat?.. 85 VII.2.4 Où obtenir les paramètres d'appel?.. 86 VII.3 Pair AXML comme serveur 87 VII.3.1 Pull : interroger et mettre à jour les services VII.3.2 Push : services continus VII.4 Spécifications techniques. 89 VII.4.1 La machine virtuelle de Java 89 VII.4.2 Les outils de XML. 89 VII.4.3 Le processeur de requête de Xquery.. 90 VII.4.4 Le moteur de servlet de Tomcat.. 90 VII.4.5 La palette d outils de SOAP Axis. 90 Chapitre VIII : Conclusion 91 Glossaire.. 93 Bibliographie. 94 Webographie. 97 4

5 Table des figures II.1 Une base de données OEM sur les bâtiments Montpelliérains.. 14 II.2 Exemple de document XML III.1 Exemple d une requête Lorel. 26 III.2 Résultat d une requête Lorel. 27 III.3 DTD du document «bibliographie.xml». 28 III.4 Exemple (Q2-1) de XML-QL III.5 Exemple (Q2-2) de XML-QL 29 III.6 Exemple (Q2-3) de XML-QL 30 III.7 Exemple d'une requête FLWR de XQuery.. 32 III.8 Document XML à interroger par XQuery.. 33 III.9 Les expressions conditionnelles en XQuery. 33 III.10 Les constructeurs en XQuery. 33 III.11 Résultat d évaluation d un constructeur III.12 Exemple de document XML pour fonctions XQuery. 34 III.13 Exemple de fonction XQuery IV.1 Illustration de l invocation d un service Web IV.2 Format d un message SOAP IV.3 Exemple de requête SOAP RPC IV.4 Résultat de requête SOAP RPC.. 39 IV.5 Matérialisation d un appel.. 41 IV.6 Un document AXML avant/après un appel service IV.7 Exemple de document AXML IV.8 Document AXML après appel service.. 44 IV.9 Après invocation d un service IV.10 Architecture globale pour AXML.. 48 IV.11 Trigger en XML. 50 V.1 Un document XML. 56 V.2 Systèmes classiques documents/bases de données V.3 Traitement d un document avec automatisation V.4 Un document balisé avec/sans précision V.5 Présentation entité-association de données.. 61 V.6 Schéma de l implantation du système VI.1 La gestion du contenu pédagogique Actif. 73 VI.2 Les activités e-learning présentées par des services web.. 74 VI.3 Modèle de gestion d un cours représenté par un réseau de Petri.. 76 VI.4 Schéma de fonctionnement de l EDD. 77 VI.5 Implémentation du service Web pour l'exécution des exercices. 79 VII.1 Architecture P2P d AXML VII.2 Document AXML persistent.. 86 VII.3 Définition d un Service AXML donné comme une requête.. 88 VII.4 La pile des technologies du Pair AXML. 90 5

6 RESUME Le traitement de l information passe aujourd hui par les bases de données qui ont su prendre une place importante dans le domaine informatique. Avec l évolution de la technologie informatique. Les SGBDs (Systèmes de Gestion de Base de Données) ne cessent de s améliorer et de se perfectionner. Dans les années 80, les SGBD offraient un large éventail de modèles de données et de traitement. Cependant, ils se révélaient souvent très limites pour gérer explicitement la dynamique des bases des données. Ces systèmes sont souvent qualifie de passif, par opposition aux systèmes actifs qui eux, sont capable d effectuer des actions prédéfinies, en réponse a des événements spécifiques lorsque certaine conditions sont vérifiées. La prochaine génération des bases de données sera capable de réagir à des modifications. Cette introduction de la réactivité au sein des bases de données résulte de deux tendances : d une part, le développement de langage de règles (règles de production, règles actives, règles déductives). Et d autre part le développement des technologies de modélisations. La popularité sans cesse croissante de XML et l émergence des services web ont donnée naissance à une nouvelle génération de données semi-structurées dite Active XML AXML document. Cette famille de données est caractérisée par le fait qu une partie des données est présentée explicitement pendant qu une autre est définie intentionnellement à l aide d appels imbriqués des services web. Les services web peuvent échanger dans ce contexte l information intentionnelle en utilisant les données AXML comme paramètre et résultats. Le présent travail de recherche s intéresse aux données semistructurées actives et plus particulièrement a la technologie AXML. Il tente de faire un état de l art correspondant à ce domaine qui est en plein émersion, et étudier son applicabilité dans le domaine de l enseignement en vue de construire des cours en ligne qui soient semi-structurés et actifs. Nous considérons que le caractère actif de ces cours les rend plus interactifs. Mots clé : Données semi-structurées, OEM, AXML, Cours en ligne, e-learning, service Web. 6

7 ABSTRACT The data processing passes today by the databases which take an important place in the data-processing field. Since the evolution of dataprocessing technology, the SGBDs (Data base management systems) do not cease improving. In the Eighties, the DBMS offered a broad range of treatment and data models. However, they proved often very limiting to explicitly manage the dynamics of the data bases. These systems are often describes as passive, in opposition to the active systems, which are able to carry out pre-defined actions, in response to specific events when certain conditions are checked. The next generation of the databases will be able to react to modifications. This introduction of the reactivity within the databases results from two tendencies: (1) the development of language of rules (rules of production, rules active, deductive rules), and (2) the development of technologies of modeling. The increasing popularity of XML and the emergence of the Web services gave rise to a new generation of semi-structured data known as Active XML, AXML document. This family of data is characterized by the fact that part of the data is presented explicitly while another is intentionally defined using overlapping calls of the Web services. The Web services can exchange in this context intentional information by using data AXML like parameters and results. This research task is interested in the active semi-structured data and more particularly in technology AXML. It tries to make a state of the art corresponding to this field which is into full emergence, and to study its applicability in the curricular area in order to build courses on line which are semi-structured and active. Keywords: Semi structured data, OEM, AXML, curses online, e-learning, web service 7

8 Chapitre 1 Introduction Données semi-structurées actives La gestion de données est sans doute l'un des aspects les plus importants de l'informatique. Pendant longtemps, les bases de données respectant certaines structurations, ont été les sources essentielles d'information. Faire communiquer ou coopérer ces sources revenait à faire de l'intégration de bases de données. Maintenant que les bases de données n'ont plus ce monopole, surtout depuis l'émergence de l'internet (Web), l'intégration se retrouve plus compliquée puisque nous ne pouvons plus compter sur la forte structuration des bases de données., de nombreux efforts ont été dévolus à l'extension de ces techniques pour également prendre en compte des données semi-structurées, en particulier leurs mise à jour [OZSU99]. Mais l ouverture des systèmes d information sur Web (e-system) est en train de changer la vision à la gestion des données distribuées sur le Web, et de constituer un changement de contexte important, d'une part en raison de la grande hétérogénéité des sources de données et du problème posé par leur flexibilité, et d'autre part parce que ces sources de données sont autonomes, et réparties à une grande échelle, celle du Web. L'objectif de ce travail est de proposer une approche novatrice pour intégrer des données semi-structurées et des services, qui prennent en compte ces deux aspects, et de ce fait est adaptée à la gestion de données à l'échelle du Web. Flexibilité XML [W3C05], en tant que standard définissant un modèle de données et un format de représentation pour les données semistructurées, a suscité un intérêt considérable au sein de la communauté de gestion de données, en raison principalement de la flexibilité qu'il apporte pour résoudre les problèmes de dynamique de structure. Cependant, sur le Web, une grande partie des problèmes de flexibilité proviennent du fait que les sources exposent leurs données sous forme de pages HTML, mêlant ainsi structure et présentation. De plus ces données ne sont souvent que partiellement accessibles, au travers de formulaires HTML. Heureusement, de nouvelles technologies et standards de communication sont récemment apparus, qui permettent la publication de données sur le Web et l'accès à celle-ci de manière adéquate : les services Web. Ces derniers sont simplement des programmes qui acceptent des paramètres et retournent en résultat des données XML. Les standards WSDL et SOAP régissent respectivement la manière dont ils sont décrits et invoqués à distance à travers l'internet. Notre modèle met en œuvre efficacement XML et les services Web pour des tâches de gestion de données distribuée. Autonomie D'une certaine manière, les architectures centralisées d'intégration de données vont à l'encontre de l'esprit du Web, celui d'un 8

9 «faible couplage» entre les systèmes participants, où le contrôle est le plus souvent partagé et les systèmes indépendants les uns des autres. De plus, le passage à l'échelle nécessaire pour prendre en charge un volume très large du Web est difficile pour les systèmes centralisés. En revanche, les architectures pair-à-pair, basées sur un partage des ressources par échanges directs entre systèmes participants, constituent une alternative crédible aux systèmes centralisés, et ont déjà fait leurs preuves dans le contexte du partage de fichiers sur Internet [FREE07]. Ces architectures capturent la nature autonome des systèmes, et leur capacité à jouer le rôle à la fois de producteurs d'information (c'est à dire de serveurs) et de consommateurs d'informations produites par d'autres (c'est à dire de clients). Dans notre modèle, les architectures pair-à-pair sont à la base de la gestion de données distribuées. Nous proposons Active XML (AXML, en abrégé), un langage qui tire profit des services Web pour la gestion de données, et qui est mis en œuvre dans une architecture pair-à-pair. Ce langage introduit la notion de documents AXML, qui sont des documents XML contenant des appels à des services Web. Le modèle AXML définit également les services AXML, comme étant des services Web capables d'échanger des documents AXML. L'introduction de ces services conduit à des mécanismes évolués d'interaction entre systèmes, qui ont la particularité d'être centrés sur les données. Ainsi, plusieurs systèmes peuvent collaborer dynamiquement à la réalisation d'une tâche de gestion de données, et sont en particulier capables de découvrir de nouvelles sources de données pertinentes au cours de leur exécution. Notre travail vise à transformer des appels de services Web inclus dans des documents XML semi-structuré en un puissant outil de gestion de données distribuées appliqué sur le cas de e-learning. En combinant de manière transparente des données semi-structurées extensionnelles (exprimées en XML) et des données intensionnelles (les appels de services, qui sont un moyen d'obtenir des données), Les documents et les services AXML s'intègrent parfaitement à une architecture pair-à-pair, dans laquelle chaque système joue le rôle de client, en invoquant les appels de services inclus dans ses documents AXML, et celui de serveur en fournissant des services utilisant ses documents. En nous basant sur ce paradigme. Dans le cadre de ce travail, nous allons nous intéresser aux problèmes de modélisation et d interrogation des données semi-structurées où nous montrons l'utilisation du modèle (resp. langage) XML pour la modélisation (l'interrogation) des données semi-structurées. Ainsi que l emploi d une nouvelle approche basée sur les documents Actif-XML où nous allons concevoir un système de e-learning qui manipule des données semistructurées et qui est basé sur des appels de services web. 9

10 Notre contribution consiste en deux points essentiels: Données semi-structurées actives 1. Actuellement, peu de travaux sur la modélisation des systèmes basés sur les données semi-structurées. Pour pallier à ce manque, nous proposons une modélisation d un contenu pédagogique semi-structuré d un système e-learning. 2. Nous proposons, que les cours semi-structurés de ce système permettent des appels aux services web afin de rendre ce système plus actif. Pour cela nous allons employer le nouveau langage Active XML (AXML). Ce document est organisé comme suit : Le premier chapitre est une introduction générale. Le deuxième chapitre présente les différentes approches proposées pour la modélisation des données semi-structurées. Le troisième chapitre traite les différents langages d interrogation des données semi-structurées où nous focalisons sur le langage XQuery qui est le plus adéquat et le plus récemment normalisé. Au quatrième chapitre nous nous intéressons au langage AXML qui permet de modéliser un système basé sur des documents semistructurés contenant des appels aux services web. A partir du cinquième chapitre commence l interprétation des fondements théoriques et méthodologiques étudiés dans les chapitres précédents à travers un cas d étude qui sera la gestion du contenu pédagogique dans un système e-learning. Au cinquième chapitre nous nous intéressons à la modélisation du contenu pédagogique «semi-structuré» et la façon dont il est interrogé. Au sixième chapitre, nous étudions l aspect fonctionnel des données par l emploi des appels au service web ainsi que l usage du langage AXML. Le dernier chapitre sera notre conclusion. Nous tenterons d'y mettre nos idées en perspective et mentionnerons quelques questions importantes qui, à notre sens, méritent d'être étudiées. 10

11 Chapitre 2 Les données semi-structurées Données semi-structurées actives II.1 Introduction : De nouveaux paradigmes ont vu le jour (e.g.. bases de données orientées-objet, bases de données déductives, bases de données contraintes). Ces paradigmes offrent une meilleure flexibilité comparés au modèle relationnel. Cependant, dans certains domaines d application, comme les bases de données Web, les bases de données biologiques, les bibliothèques virtuelles, etc, il subsiste un besoin considérable en flexibilité, à la fois dans la représentation et la manipulation des données. Ces applications sont caractérisées par l absence de structure fixe et rigide. Les modèles de données semi-structurés ont pour finalité la représentation de données qui ne sont pas structurées intentionnellement, mais qui sont structurées de façon hétérogène, ou qui évoluent si rapidement que les changements ne se répercutent pas au niveau de la structure. Un exemple typique est le World Wide Web avec ses pages HTML, ses fichiers textes, ses bases de données biologiques, ses données bibliographiques, etc Le problème principal dans les données semi-structurées est que la structure des données n est pas entièrement connue. Ceci conduit au fait que l interrogation de ces données suppose un accès par le contenu, ce qui l oppose à l accès via la structure (e.g., systèmes relationnels). De plus, ceci a conduit au fait que très souvent les utilisateurs naviguent au hasard dans les données en raison de la non nécessité d une connaissance structurelle. Le développement d Internet a augmenté la complexité des systèmes d informations par les différents niveaux d interactions (entre sources d information et de connaissances, entre systèmes et utilisateurs) par l offre de volumes importants d informations hétérogènes, multimédias et distribuées. En effet, les SI doivent supporter à la fois des données structurées (par exemple, stockées dans des bases de données relationnelles) et des données semi-structurés (par exemple les documents multimédias), ce qui nécessite d assurer la cohérence de cet ensemble. De nouveaux outils de recherche et d extraction de l information pertinente, sûre et fiable deviennent nécessaires. 11

12 12 Données semi-structurées actives II.2. L'objet structuré, l'objet semi-structuré et l objet non structuré : Trois types de sources de données peuvent être considérés pour les systèmes d information ouverts sur le Web : les sources de données fortement structurées, les sources de données semi-structurées et les sources de données non structurées. La première classe est représentée par les bases de données (relationnelles ou objets). Les données sont créées conformément à un schéma bien défini pendant la phase de conception. Une source de données semi-structurées ne possède pas un schéma de données explicitement représenté dans la source. Le schéma de données est implicite et il est véhiculé avec les données. Par conséquent, une même entité peut avoir plusieurs structures différentes dans une même source de données. Ce type de sources de données est généralement représenté en utilisant le format XML. La troisième catégorie est celle des données non structurées. Une source de données non structurée ne présente aucune notion de schéma de données. Ces sources représentent l information en utilisant soit des images soit des phrases exprimées en langue naturelle. Ces sources sont représentées sur le Web en utilisant le format HTML. Elles peuvent être transformées, en utilisant des techniques d indexation et d annotation, en sources de données semi-structurées. C est pour cela que nous ne considérons dans notre travail que les deux premiers types de sources. II.3. Définition Données Semi-structurées Les données semi-structurées sont des données qui possèdent une structure flexible et des données hétérogènes et qui n'ont pas de schéma a priori mais plutôt dont le schéma peut-être extrait à partir de la donnée. La plupart du temps, un ensemble de données semi-structurées est représenté sous la forme d'un graphe dont les feuilles contiennent les données et dont les nœuds et les liens représentent la structure de l'ensemble. La modification, l'ajout ou la suppression d'une donnée entraîne une modification du graphe, c'est-à-dire de la structure de l'ensemble. Modèles de données universels qui permettent de représenter des structures Irrégulières : on peut comparer des données dans formats différents (e.g. une chaîne de caractères avec un n-uplet) Implicites : données et structures (grammaire, schéma) sont mélangées Partielles : coexistence de données structurées et non-structurées Exemples: OEM, XML, graphes/arbres étiquetés Les données sont hétérogènes au niveau de la structure et de la sémantique:

13 Structure : (syntaxe irrégulière) un même document peut exister sous format PostScript (vue plate), SGML/XML/HTML (semi-structuré) _ le nom d une personne peut être une chaîne de caractères ou un n-uplet avec deux attributs (nom et prénom). La structure n est pas figée En plus les structures peuvent être imbriquées c.a.d des valeurs peuvent être à leurs tour d autres structures. Sémantique : un nom d attribut peut avoir différentes significations dans deux bases de données différentes (e.g. homonyme adresse = adresse professionnelle ou adresse personnelle) Données sans schéma ou auto descriptives II.4. Modèles des données semi-structurées Principe : partir des documents existants et trouver une structure commune, suffisamment souple pour prendre en compte les irrégularités, les valeurs manquantes, les évolutions, etc Les modèles semi-structurés utilisent des graphes annotés pour représenter les données. Les différents modèles diffèrent par : l endroit où sont situées les annotations (arêtes et/ou nœuds) l existence ou non d un ordre sur les fils d un nœud la façon de représenter le partage d information -Ex : OEM : annotations sur arcs et feuilles, pas d ordre UnQL: annotations sur les arcs, pas d ordre XML : annotations sur les nœuds et feuilles, existence d un ordre Deux principaux modèles de données semi-structurées ont vu le jour : OEM [PAPA 95], implanté dans le projet LORE [MCHU 97], et le modèle d XML [BUNE 96]. Pour le modèle UnQL il est basé sur OEM avec quelques modifications au niveau de l annotation. La caractéristique principale de ces modèles est qu ils sont autodescriptifs. En effet, les modèles de données usuels (relationnel et objet) présentent deux niveaux : Le niveau schéma, descriptif de la structure générale (classes et schémas relationnels) d un ensemble de données partageant des caractéristiques communes, et le niveau données où chaque occurrence (objet et n-uplet) obéit à une structure définie au niveau du schéma. Dans les modèles de données semi-structurées, schéma et données sont confondus en un seul et même niveau. Chaque objet contient son propre schéma. Ces modèles sont basés sur la théorie des graphes. 13

14 Un objet est un graphe dont la description des attributs est codée dans les arêtes. Le squelette du graphe représente donc la structure de l objet. Notons que la notion de type est très simple. Le modèle dispose de types atomiques de base, et d un type spécial (i.e. le type complexe) caractérisant tout objet composé d objets de type atomique ou d autres objets complexes. Tous les objets complexes ont alors une structure évolutive et non figée, qui peut être irrégulière et incomplète. La notion de classe y est inexistante. A l opposé des modèles objets pour les bases de données, le comportement des objets semi-structurés n est pas abordé pour l instant. Les bases de données semi-structurées, sauf pour certaines applications spécifiques pour lesquelles elles ont été créées spécialement, sont en général issues de l intégration de plusieurs bases de données hétérogènes, se trouvant notamment sur le web. II.4.1 Le modèle OEM Le modèle OEM (Object Exchange Model) [PAPA 95] a été conçu à l université de Stanford, et est dédié au stockage des données semistructurées. OEM fait partie d un vaste projet de système de gestion de bases de données semi-structurées LORE, dont il est le noyau. La structure sous-jacente d une base de données OEM est un graphe orienté connexe. Les objets sont alors représentés par des nœuds du graphe et les relations entre les objets sont représentées par des arcs étiquetés. Il y a deux types d objets différents : Les objets atomiques qui contiennent des valeurs (integer, string, etc.). Les nœuds correspondants peuvent contenir seulement des arcs entrants. Les objets complexes qui ne contiennent pas de valeurs, et sont composés d autres objets complexes ou atomiques. 14

15 Alger école près de résidence résidence près de gardien nom adresse nom nom concierge adresse adresse «Carnot» numéro "St Jean" "12 rue d Alger" "M. Contoz"St Priest" rue numéro rue "M. Rispe" "64" "Bd Metz" "64" "Av Fleming" FigII.1 modèle OEM sur bâtiments Montpelliérains Un nœud distingué du graphe, la racine, constitue le point d entrée de la base de données. La figure II.1 représente une base de données OEM qui contient des informations sur les bâtiments Montpelliérains. Observons que la structure peut être irrégulière (une adresse peut être soit une chaîne de caractères soit un objet complexe contenant un nom de rue et un numéro, une résidence peut contenir des informations sur un gardien ou non), de même que le typage (i.e. un numéro dans une adresse peut être un entier ou une chaîne de caractères). Une base de données OEM peut être interrogée par un langage spécifique pour les données semi-structurées appelé Lorel [ABIT 97a]. Lorel est une extension de OQL [CATT 94], sur deux points principaux : l utilisation d expressions de chemin, construites à partir d étiquettes et de jokers en utilisant des expressions régulières. l utilisation de la coercion, de manière à pallier le typage fort des bases de données traditionnelles, qui est incompatible avec la nature des données semi-structurées. Par exemple, la requête Lorel suivante (Fig II.2) renvoie les résidences dont le numéro de rue est 64 : SELECT Montpellier.résidence WHERE Montpellier.résidence.adresse.numéro=64 15

16 16 Données semi-structurées actives La réponse est la résidence St Priest, bien que le numéro de rue soit une chaîne, grâce à l utilisation de la coercicon. Une telle requête posée dans un système de bases de données traditionnel donnerait une réponse vide ou une erreur. Notons également qu une requête sur le numéro 12 n aurait pas donné la résidence Villa St Jean comme réponse, car son adresse ne contient pas de champ numéro. En effet, avec Lorel, l utilisateur est sensé connaître la structure de la base de données. C est la raison pour laquelle le système LORE inclut un guide de données (dataguide) qui permet à l utilisateur d examiner le squelette de la base. L exemple suivant renvoie le nom de tous les bâtiments de Montpellier dont le numéro de rue est 64: SELECT B.nom FROM Montpellier.# B WHERE B.adresse.numero=64 Les réponses sont la résidence St Priest et l école Carnot. Le symbole # joue le rôle d un joker et permet de sélectionner tous les attributs de l objet Montpellier, quel que soit leur nom (école, résidence). B est une variable prenant comme valeur les objets attributs successifs de d objet Montpellier. L exécution de la requête va donc considérer toutes les écoles et les résidences en testant si le numéro (s il existe) de leur adresse est 64. Pour interroger ces bases, on ne dispose à l heure actuelle que des techniques prouvées dans les bases de données classiques, c est-à-dire des langages du type SQL, OSQL, etc. Le problème est, par essence, l inexistence d un schéma global cohérent. Des outils, les dataguides [GOLD 97], permettent par ailleurs d aider à l exploration de la structure de la base et par conséquent à la formulation de requêtes. Extraire le schéma global des données est utile à l utilisateur dans l expression de ses requêtes, et au système pour l optimisation de l accès aux données. A l utilisateur car cela lui fournit une idée de la structure de la base, sans qu il ait à utiliser les dataguides, et au système car la structure permet d utiliser les techniques bien connues comme le clustering, les index, les arbres de placement, etc. mais permet aussi d utiliser un langage de programmation statiquement et fortement typé, ce qui assure la cohérence des applications. L un des objectifs est donc de trouver une structure unique sous-jacente. Cependant, cela ne paraît présenter d intérêt majeur que si les données semi-structurées peuvent être intégrées dans un modèle utilisant cette structure et effectuant les dites optimisations, comme dans les systèmes de bases de données objets traditionnels. Toutefois, l extraction de structure telle qu elle est se fait actuellement ne fournit pas de structuration parfaite des données. En effet, certains objets, peuvent se retrouver rattachés à un type qui ne les décrit pas exactement. Ainsi on dit qu ils sont presque d un type donné. Ce principe de typage approximatif pose tout de même de sérieux problèmes dans la mesure où l on ne peut parler de la structure d un objet, si celle-ci n est pas exacte. Toute tentative d intégration des objets issus de bases semi-

17 structurées dans des bases de données structurées est alors impossible, à moins d utiliser une solution brutale consistant à assigner un type différent pour chaque objet ayant une structure différente, même s ils sont sémantiquement du même type. Dans ce cas, la notion de type ne sert plus à rien, car on peut obtenir dans des cas extrêmes autant de types que d objets. Il est donc nécessaire d utiliser un modèle possédant des caractéristiques issues d un modèle structuré et également des caractéristiques issues des modèles de données semi-structurées. Un tel modèle permettrait de gérer les objets à type approximatif, et permettrait de résoudre le dilemme suivant: que choisir entre un modèle de données totalement structuré dans lequel les accès aux données sont optimisés, et un modèle de données flexible dans lequel les accès nécessitent des traitements plus lourds à cause de l absence d informations de typage? Le modèle des objets variables est donc un premier pas vers l intégration des données structurées et des données semi-structurées. Cela offre la possibilité d utiliser la structure quand celle-ci est connue, et de gérer néanmoins des données arbitraires. II.4.2 Le modèle XML XML [Bray et al98] (extended Markup Language) est un format textuel extensible de description de document défini par le W3C. De la famille des langages de marquage SGML [Goldfarb 91] (ISO 8879 :1986), il permet de s'adapter à quasiment tous les domaines où l'on a besoin de structurer de l'information de façon portable. XML permet de faire le lien entre un langage conçu plus spécialement pour le formatage de documents (SGML) et un modèle de données en émergence permettant une vision plus réaliste mais plus complexe des données qu'est le modèle semi-structuré. Ce langage permet ainsi de définir une structure de données et son contenu. XML est conçu de façon à faciliter l'intégration et l'échange de données entre applications. Il isole le formatage et le rendu des documents par rapport à sa structure. C'est à des langages de style spécifiques tels que XSL (extended Style Sheet) [Clark et Deach 2001] qu'on laisse le soin de s'occuper du rendu de la page XML lors de la publication. XML est un langage à base d'éléments, d'étiquettes, d'attributs et de valeurs. Les balises (tag) ouvrantes (resp. fermantes) sont constituées d'étiquettes (label) représentées entre le symbole < (resp. </) et le symbole >. Le composant logique compris entre une balise ouvrante et une balise fermante est appelé valeur. Le composant logique constitué de la balise ouvrante, de la valeur et de la balise fermante est appelé élément (element). 17

18 La valeur peut être vide, contenir du texte, d'autres éléments ou contenir un mélange des deux (mixed element content). Les balises définissent la structure du document. L'élément de plus haut niveau englobant tous les autres et n'ayant pas de parents est appelé élément racine. Un élément peut contenir des informations additionnelles appelées attributs (attributes). Un attribut est un couple formé d'un nom et d'une valeur et est représenté à l'intérieur de la balise ouvrante sous la forme nom = "valeur" Un document XML est un ensemble d'éléments ainsi imbriqués. Un document XML peut avoir deux qualifications, il peut être : {Bien formé : quand il respecte la syntaxe du langage XML définie par le W3C ; {Valide : quand il est associé à une définition de type de document et qu'il la respecte (nom des éléments, type, répétition et ordre d'apparition dans le document). Un document XML bien formé est un document XML qui respecte certaines règles simples : 1. Il existe un et un seul élément racine qui contient tous les autres éléments. 2. Les balises sont correctement imbriquées : chaque balise ouvrante a une balise fermante associée et il n'y a pas de chevauchement. 3. Le nom des balises est libre mais il contient au moins une lettre. 4. Les attributs des balises, lorsqu'ils existent, doivent comporter obligatoirement une valeur qui doit toujours apparaitre entre double apostrophes. 5. Quand un élément est vide, les balises peuvent être simplifiées : <balise></balise> est identique à <balise/>. La représentation XML du graphe de données semi-structurées de l'exemple de la figure II.2 est donnée dans le document 2.2. Un attribut catégorie (prenant la valeur '3' puis '5') a été aussi rajouté à l'élément restaurant (les attributs n'ont pas d'équivalents en OEM). 18

19 XML est à présent le format standard utilisé pour représenter des données semi-structurées, et [Goldman et al. 1999] montre que les projets utilisant OEM peuvent migrer aisément vers XML. <?xml version=1.0" encoding="iso " standalone="yes"?> <divertissement> <restaurant categorie="3"> <nom>palace d'ivry</nom> <plat>salade Thai</plat> <telephone> </telephone> <proprietaire>m. SALIM</proprietaire> </restaurant> <restaurant categorie="5"> <nom>royal Fata</nom> <plat>plaque chauffante de canard</plat> <plat>assortiment vapeur</plat> <plat>cafe liegois</plat> </restaurant> <pizzeria>nolpiltaine</pizzeria> </divertissement> Fig II.2 Exemple de document XML II.5 Bases de données ou base de documents Pour les SSD? La distinction entre contenus orientés données et contenus orientés document n est pas toujours claire en pratique. Un contenu orienté données comme une facture par exemple peut contenir aussi des données de granularité forte et irrégulièrement structurées telles que des descriptions. Et inversement, un contenu orienté document comme un manuel utilisateur peut contenir des données de granularité fine et régulièrement structurées, telles que le nom de l auteur ou une date de révision (il s agit la plupart du temps de métadonnées). Les documents juridiques ou médicaux constituent aussi d autres exemples, ils sont écrits sous forme de prose mais contiennent des parties distinctes telles que des dates, des noms, des procédures, et doivent souvent être stockés dans leur intégralité pour des raisons légales. En dépit de cette imprécision, la caractérisation de vos contenus comme orientés données ou orientés document vous aidera à décider du genre de base de données à utiliser. En règle générale, les données sont stockées dans une base traditionnelle, qu elle soit relationnelle, orientée objet ou hiérarchique. Cela peut être réalisé à l aide d un logiciel intermédiaire [middleware] ou par la base elle-même qui dispose alors de possibilités intrinsèques. Dans ce dernier cas, la base de données est qualifiée de compatible XML [XML-enabled]. Les documents quand à eux sont stockés dans une base XML native, c est-à-dire une base conçue spécialement pour stocker du XML, ou bien alors dans un système de gestion de contenu [content management system], c est-à-dire une application conçue pour gérer des documents et construite au-dessus d une base XML native. 19

20 20 Données semi-structurées actives Ces règles ne sont pas absolues. Les données, et particulièrement les données semi-structurées, peuvent être stockées dans des bases XML natives, et inversement, les documents peuvent être stockés dans des bases traditionnelles lorsque peu de caractéristiques spécifiques au format XML sont requises. En outre, les frontières entre les bases traditionnelles et les bases XML natives deviennent floues car les bases traditionnelles intègrent des capacités propres aux bases XML, et les bases XML natives supportent le stockage de parties de documents dans des bases externes (généralement des bases relationnelles). II.6 Gestion des donnés semi-structurées : Les réflexions sur la gestion intelligente des données semi-structurées sont en plein essor, en effet le développement d outils rendant possible une telle gestion mobilise un certain nombre de pôles de recherche. Les approches sont certes différentes, certains voulant créer des outils neufs et originaux ou d autres tentant d adapter des outils ayant déjà faits leurs preuves, à savoir les systèmes de gestions de bases de données relationnelles. Mais tous ces courants se rejoignent en un axe fédérateur à savoir que ces bases de données tentent de capturer la structuration variable et peu figée des données semi-structurées. Avec la prise en compte des liens inter-documents, ces bases de données supportent alors le multimédia et même l hypermédia. A l'heure de l'interconnexion des réseaux, le développement rapide de XML s'explique par la nécessité de disposer d'un langage universel permettant la communication entre applications hétérogènes. XML associe la souplesse des données semi-structurées (la description de la structure des données est facultative) et la simplicité des documents structurés (XML est auto descriptif : la structure est exprimée par des marques dans le document, cf. figure 1). Dans la suite de cet article nous ferons souvent l'amalgame entre XML, et documents structurés ou données semi-structurées. Avec XML, le semi-structuré constitue sans doute une voie d avenir pour les bases de données. Même s il est probable qu aucune méthode ne satisfera à elle seule tous les besoins et que l on utilisera plusieurs méthodes complémentaires. II.6.1 Théories autour de l émergence de ces nouveaux SGBD. Des systèmes de gestion de bases de données relationnels (SGDBR) peuvent sembler être un choix possible pour faciliter l'échange d'objets XML. Mais le modèle de données à base de table du SGBDR ne convient pas à la nature hiérarchique de XML. Un SGBDR devrait casser et aplanir un document XML dans une multitude de tables. Même des bases de données relationnelles multidimensionnelles ou des bases de données orientées objet, ne peuvent pas manipuler des données avec une telle structure dynamique. Une base de données XML doit être capable de

Architectures web pour la gestion de données

Architectures web pour la gestion de données Architectures web pour la gestion de données Dan VODISLAV Université de Cergy-Pontoise Plan Le Web Intégration de données Architectures distribuées Page 2 Le Web Internet = réseau physique d'ordinateurs

Plus en détail

Objectifs. Maîtriser. Pratiquer

Objectifs. Maîtriser. Pratiquer 1 Bases de Données Objectifs Maîtriser les concepts d un SGBD relationnel Les modèles de représentations de données Les modèles de représentations de données La conception d une base de données Pratiquer

Plus en détail

Chapitre 1 : Introduction aux Systèmes de Gestion de Bases de Données (Eléments de base)

Chapitre 1 : Introduction aux Systèmes de Gestion de Bases de Données (Eléments de base) Chapitre 1 : Introduction aux Systèmes de Gestion de Bases de Données (Eléments de base) 1. Généralités sur l'information et sur sa Représentation 1.1 Informations et données : a. Au sen de la vie : C

Plus en détail

Fonctionnement du serveur Z39.50

Fonctionnement du serveur Z39.50 Fonctionnement du serveur Z39.50 Table des matières 1 Configuration du serveur...2 1.1 Comportement du serveur...2 1.2 Configuration de la traduction z39.50 -> base de données...2 1.3 Configuration du

Plus en détail

XML-Bases. www.fenetresurtoile.com XHTML. Les bases. Jean-François Ramiara. INP-ENM 04/10/2012 Toulouse. Copyright J.F. Ramiara Tous droits réservés

XML-Bases. www.fenetresurtoile.com XHTML. Les bases. Jean-François Ramiara. INP-ENM 04/10/2012 Toulouse. Copyright J.F. Ramiara Tous droits réservés XHTML Les bases Jean-François Ramiara INP-ENM 04/10/2012 Toulouse 1 Généralités Jean-François Ramiara XML 2 jours Initiation à XML Contenu Cours Exercices Support PDF Horaires Tour de table 2 Sommaire

Plus en détail

Les principaux domaines de l informatique

Les principaux domaines de l informatique Les principaux domaines de l informatique... abordés dans le cadre de ce cours: La Programmation Les Systèmes d Exploitation Les Systèmes d Information La Conception d Interfaces Le Calcul Scientifique

Plus en détail

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Cours Base de données relationnelles. M. Boughanem, IUP STRI Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),

Plus en détail

Langage HTML (2 partie) lt La Salle Avignon BTS IRIS

Langage HTML (2 partie) <HyperText Markup Language> <tv>lt La Salle Avignon BTS IRIS</tv> Langage HTML (2 partie) «Je n'ai fait que prendre le principe d - hypertexte et le relier au principe du TCP et du DNS et alors boum! ce fut le World Wide Web!» Tim Berners-Lee

Plus en détail

1. Une approche innovante, basée sur «l objet document» 2. Le respect des chaînes éditoriales de l entreprise

1. Une approche innovante, basée sur «l objet document» 2. Le respect des chaînes éditoriales de l entreprise Lucid e-globalizer, solution globale de gestion de contenu multilingue. Ce document a pour objectif de vous présenter Lucid e-globalizer, la solution de gestion de contenu multilingue de Lucid i.t., ses

Plus en détail

Indexation et interrogation de photos de presse décrites en MPEG-7

Indexation et interrogation de photos de presse décrites en MPEG-7 Indexation et interrogation de photos de presse décrites en MPEG-7 Emmanuel Bruno Jacques Le Maitre Elisabeth Murisasco Laboratoire SIS, Equipe Informatique Université de Toulon et du Var Bâtiment R, BP

Plus en détail

Systèmes d information et bases de données (niveau 1)

Systèmes d information et bases de données (niveau 1) Systèmes d information et bases de données (niveau 1) Cours N 1 Violaine Prince Plan du cours 1. Bibliographie 2. Introduction aux bases de données 3. Les modèles 1. Hiérarchique 2. Réseau 3. Relationnel

Plus en détail

Module BD et sites WEB

Module BD et sites WEB Module BD et sites WEB Cours 8 Bases de données et Web Anne Doucet Anne.Doucet@lip6.fr 1 Le Web Architecture Architectures Web Client/serveur 3-tiers Serveurs d applications Web et BD Couplage HTML-BD

Plus en détail

Généralités sur les bases de données

Généralités sur les bases de données Généralités sur les bases de données Qu est-ce donc qu une base de données? Que peut-on attendre d un système de gestion de bases de données? Que peut-on faire avec une base de données? 1 Des données?

Plus en détail

République Algérienne Démocratique et Populaire Ministre de l enseignement supérieur et de la recherche scientifique

République Algérienne Démocratique et Populaire Ministre de l enseignement supérieur et de la recherche scientifique République Algérienne Démocratique et Populaire Ministre de l enseignement supérieur et de la recherche scientifique UNIVERSITE MENTOURI DE CONSTANTINE FACULTE DES SCIENCES DE L INGENIEUR DEPARTEMENT D

Plus en détail

TECHNOLOGIES XML, CONCEPTION, MISE EN OEUVRE

TECHNOLOGIES XML, CONCEPTION, MISE EN OEUVRE XML/ SOA/ Web services TECHNOLOGIES XML, CONCEPTION, MISE EN OEUVRE Réf: PXM Durée : 4 jours (7 heures) OBJECTIFS DE LA FORMATION XML est devenu une technologie incontournable tant sur le poste utilisateur

Plus en détail

SQL pour. Oracle 10g. Razvan Bizoï. Tsoft, Groupe Eyrolles, 2006, ISBN : 2-212-12055-9, ISBN 13 : 978-2-212-12055-4

SQL pour. Oracle 10g. Razvan Bizoï. Tsoft, Groupe Eyrolles, 2006, ISBN : 2-212-12055-9, ISBN 13 : 978-2-212-12055-4 SQL pour Oracle 10g Razvan Bizoï Tsoft, Groupe Eyrolles, 2006, ISBN : 2-212-12055-9, ISBN 13 : 978-2-212-12055-4 Ce guide de formation a pour but de vous permettre d'acquérir une bonne connaissance du

Plus en détail

Gestion de Contenus Web (WCM)

Gestion de Contenus Web (WCM) Web Content Management 1 Gestion de Contenus Web (WCM) Bernd Amann Modelware : vers la modélisation et la sémantisation de l information École CEA-EDF-INRIA 16-27 juin 2003 Cours No 1 - Gestion de Contenus

Plus en détail

Architectures web/bases de données

Architectures web/bases de données Architectures web/bases de données I - Page web simple : HTML statique Le code HTML est le langage de base pour concevoir des pages destinées à être publiées sur le réseau Internet ou intranet. Ce n'est

Plus en détail

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/ Systèmes de gestion de bases de données Introduction Université d Evry Val d Essonne, IBISC utiles email : cinzia.digiusto@gmail.com webpage : http://www.ibisc.univ-evry.fr/ digiusto/ Google+ : https://plus.google.com/u/0/b/103572780965897723237/

Plus en détail

XML et Bases de données. XMLType Oracle XML DB

XML et Bases de données. XMLType Oracle XML DB Oracle XML DB Oracle XML DB Depuis la version 9i et de façon enrichie dans la version 10g, Oracle propose des outils pour gérer des documents XML Depuis la 10g il n'y a plus d'extraction car auparavant

Plus en détail

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES Dossier G11 - Interroger une base de données La base de données Facturation contient tout un ensemble d'informations concernant la facturation de la SAFPB (société anonyme de fabrication de produits de

Plus en détail

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014 pascal.dayre@enseeiht.

Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS. IDS2014, Nailloux 26-28/05/2014 pascal.dayre@enseeiht. Evolution et architecture des systèmes d'information, de l'internet. Impact sur les IDS IDS2014, Nailloux 26-28/05/2014 pascal.dayre@enseeiht.fr 1 MVC et le web 27/05/14 2 L'évolution des systèmes informatiques

Plus en détail

Unité de formation 1 : Structurer une application. Durée : 3 semaines

Unité de formation 1 : Structurer une application. Durée : 3 semaines PROGRAMME «DEVELOPPEUR LOGICIEL» Titre professionnel : «Développeur Logiciel» Inscrit au RNCP de niveau III (Bac+2) (JO du 23 Octobre 2007) (32 semaines) Unité de formation 1 : Structurer une application

Plus en détail

XML, PMML, SOAP. Rapport. EPITA SCIA Promo 2004 16 janvier 2003. Julien Lemoine Alexandre Thibault Nicolas Wiest-Million

XML, PMML, SOAP. Rapport. EPITA SCIA Promo 2004 16 janvier 2003. Julien Lemoine Alexandre Thibault Nicolas Wiest-Million XML, PMML, SOAP Rapport EPITA SCIA Promo 2004 16 janvier 2003 Julien Lemoine Alexandre Thibault Nicolas Wiest-Million i TABLE DES MATIÈRES Table des matières 1 XML 1 1.1 Présentation de XML.................................

Plus en détail

Système de base de données

Système de base de données Système de base de données 1. INTRODUCTION Un système de base de données est un système informatique dont le but est de maintenir les informations et de les rendre disponibles à la demande. Les informations

Plus en détail

Rapport de projet : Interrogation de données hétérogènes.

Rapport de projet : Interrogation de données hétérogènes. Université Montpellier II Sciences et Techniques GMIN332 Gestion de Données Complexes, Master 2 Informatique 2013-2014 Rapport de projet : Interrogation de données hétérogènes. Otmane Nkaira Étudiant en

Plus en détail

Une solution de reporting haut de gamme éprouvée. Accès aux données et présentation sous la forme de votre choix

Une solution de reporting haut de gamme éprouvée. Accès aux données et présentation sous la forme de votre choix Crystal Reports XI Une solution de reporting haut de gamme éprouvée Crystal Reports XI, solution standard reconnue dans le monde entier, vous aide à concevoir, gérer et distribuer des états sur le Web,

Plus en détail

CHAPITRE 1. Introduction aux web services. 1.1 Définition. Contenu du chapitre : Env. De dev. Langage Visual Studio Java EE Qt Creator C#

CHAPITRE 1. Introduction aux web services. 1.1 Définition. Contenu du chapitre : Env. De dev. Langage Visual Studio Java EE Qt Creator C# CHAPITRE 1 Introduction aux web services Contenu du chapitre : Env. De dev. Langage Visual Studio Java EE Qt Creator C# NetBeans JavaScript Eclipse Objective C Xcode PHP HTML Objectifs du chapitre : Ce

Plus en détail

BD réparties. Bases de Données Réparties. SGBD réparti. Paramètres à considérer

BD réparties. Bases de Données Réparties. SGBD réparti. Paramètres à considérer Bases de Données Réparties Définition Architectures Outils d interface SGBD Réplication SGBD répartis hétérogènes BD réparties Principe : BD locales, accès locaux rapides accès aux autres SGBD du réseau

Plus en détail

Ecole Nationale Supérieure des Télécommunications Les outils XML

Ecole Nationale Supérieure des Télécommunications Les outils XML Ecole Nationale Supérieure des Télécommunications Les outils XML Page 1 sur 13 SOMMAIRE 1 Introduction 3 2 Parseur XML et processeur XSLT 4 2.1 Le Parseur XML v2 4 2.1.1 Les API DOM et SAX 4 2.1.2 Le parseur

Plus en détail

Introduction à LINQ. Chapitre 1. Qu est-ce que LINQ?

Introduction à LINQ. Chapitre 1. Qu est-ce que LINQ? Chapitre 1 Introduction à LINQ En surfant sur le Web, vous trouverez différentes descriptions de LINQ (Language Integrated Query), et parmi elles : LINQ est un modèle de programmation uniforme de n importe

Plus en détail

Bases de données Cours 1 : Généralités sur les bases de données

Bases de données Cours 1 : Généralités sur les bases de données Cours 1 : Généralités sur les bases de données POLYTECH Université d Aix-Marseille odile.papini@univ-amu.fr http://odile.papini.perso.esil.univmed.fr/sources/bd.html Plan du cours 1 1 Qu est ce qu une

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

Bases de données avancées Introduction

Bases de données avancées Introduction Bases de données avancées Introduction Dan VODISLAV Université de Cergy-Pontoise Master Informatique M1 Cours BDA Plan Objectifs et contenu du cours Rappels BD relationnelles Bibliographie Cours BDA (UCP/M1)

Plus en détail

BASES DE DONNÉES. CNAM Centre associé de Clermont-Ferrand Cycle A Année 1997-98. J. Darmont I. INTRODUCTION II. LES SYSTÈMES HIÉRARCHIQUES

BASES DE DONNÉES. CNAM Centre associé de Clermont-Ferrand Cycle A Année 1997-98. J. Darmont I. INTRODUCTION II. LES SYSTÈMES HIÉRARCHIQUES BASES DE DONNÉES CNAM Centre associé de Clermont-Ferrand Cycle A Année 1997-98 J. Darmont I. INTRODUCTION II. LES SYSTÈMES HIÉRARCHIQUES III. LES SYSTÈMES RÉSEAU IV. LES SYSTÈMES RELATIONNELS V. LE LANGAGE

Plus en détail

et Groupe Eyrolles, 2006, ISBN : 2-212-11747-7

et Groupe Eyrolles, 2006, ISBN : 2-212-11747-7 Tsoft et Groupe Eyrolles, 2006, ISBN : 2-212-11747-7 OEM Console Java OEM Console HTTP OEM Database Control Oracle Net Manager 6 Module 6 : Oracle Enterprise Manager Objectifs Contenu A la fin de ce module,

Plus en détail

Service combinators for farming virtual machines

Service combinators for farming virtual machines Master d Informatique Fondamentale École Normale Supérieure de Lyon Sémantique du parallélisme Chantal Keller Service combinators for farming virtual machines K. Bhargavan, A. D. Gordon, I. Narasamdya

Plus en détail

Cours Bases de données

Cours Bases de données Informations sur le cours Cours Bases de données 9 (10) séances de 3h Polycopié (Cours + TD/TP) 3 année (MISI) Antoine Cornuéjols www.lri.fr/~antoine antoine.cornuejols@agroparistech.fr Transparents Disponibles

Plus en détail

Intégration d'applications d'entreprise (INTA)

Intégration d'applications d'entreprise (INTA) Master 2 SITW - Recherche Intégration d'applications d'entreprise (INTA) Dr. Djamel Benmerzoug Email : djamel.benmerzoug@univ-constantine2.dz Maitre de Conférences A Département TLSI Faculté des NTIC Université

Plus en détail

Introduction aux bases de données

Introduction aux bases de données Introduction aux bases de données 1. Introduction 1.1. Qu est-ce qu une base de données Définition : Un ensemble d informations logiquement reliées entre elles. Plus précisément, nous appellerons base

Plus en détail

PROSOP : un système de gestion de bases de données prosopographiques

PROSOP : un système de gestion de bases de données prosopographiques PROSOP : un système de gestion de bases de données prosopographiques Introduction : Ce document présente l outil en développement PROSOP qui permet la gestion d'une base de donnée prosopographique de la

Plus en détail

Résumé XML XML. XPATH SVG Schema XSL. VoiceXML. Figure 1 : évolution des langages à balises

Résumé XML XML. XPATH SVG Schema XSL. VoiceXML. Figure 1 : évolution des langages à balises XML, extensible Markup Language 1-Origine de XML On trouve l origine des langages à balises dans la nécessité d échanger des informations dont la structure est trop complexe pour être simplement mise sous

Plus en détail

FICHE CONCEPT 01 ETL (EXTRACT TRANSFORM & LOAD)

FICHE CONCEPT 01 ETL (EXTRACT TRANSFORM & LOAD) FICHE CONCEPT 01 ETL (EXTRACT TRANSFORM & LOAD) BIEN GERER SES REFERENTIELS DE DONNEES : UN ENJEU POUR MIEUX PILOTER LA PERFORMANCE DE SON ETABLISSEMENT octobre 2008 GMSIH 44, Rue de Cambronne 75015 Paris.

Plus en détail

*4D, quand c est la solution qui compte. 4D démocratise les services Web

*4D, quand c est la solution qui compte. 4D démocratise les services Web *4D, quand c est la solution qui compte. 4D démocratise les services Web Table des matières I. INTRODUCTION page 3 II. VERS UNE DEFINITION DES SERVICES WEB 1. Qu est ce que c est? page 3 2. A quoi ça sert?

Plus en détail

Le langage SQL Rappels

Le langage SQL Rappels Le langage SQL Rappels Description du thème : Présentation des principales notions nécessaires pour réaliser des requêtes SQL Mots-clés : Niveau : Bases de données relationnelles, Open Office, champs,

Plus en détail

SemWeb : Interrogation sémantique du web avec XQuery. Les membres du projet SemWeb

SemWeb : Interrogation sémantique du web avec XQuery. Les membres du projet SemWeb SemWeb : Interrogation sémantique du web avec XQuery Les membres du projet SemWeb Contexte et objectifs Le projet SemWeb s inscrit dans les efforts de recherche et de développement actuels pour construire

Plus en détail

Chapitre 1 : Introduction aux bases de données

Chapitre 1 : Introduction aux bases de données Chapitre 1 : Introduction aux bases de données Les Bases de Données occupent aujourd'hui une place de plus en plus importante dans les systèmes informatiques. Les Systèmes de Gestion de Bases de Données

Plus en détail

taboo D Excel à Access Croiser, extraire et analyser ses données Thierry Capron Groupe Eyrolles, 2008, ISBN : 978-2-212-12066-0

taboo D Excel à Access Croiser, extraire et analyser ses données Thierry Capron Groupe Eyrolles, 2008, ISBN : 978-2-212-12066-0 Thierry Capron sans taboo D Excel à Access Croiser, extraire et analyser ses données Groupe Eyrolles, 2008, ISBN : 978-2-212-12066-0 Table des matières 1. PREMIERS PAS VERS LES BASES DE DONNÉES... 1 Un

Plus en détail

Programmabilité du réseau avec l'infrastructure axée sur les applications (ACI) de Cisco

Programmabilité du réseau avec l'infrastructure axée sur les applications (ACI) de Cisco Livre blanc Programmabilité du réseau avec l'infrastructure axée sur les applications (ACI) de Cisco Présentation Ce document examine la prise en charge de la programmabilité sur l'infrastructure axée

Plus en détail

Composition de Services Web

Composition de Services Web Composition de Services Web Dr. Djamel Benmerzoug Email : djamel.benmerzoug@univ-constantine2.dz Maitre de Conférences A, Département TLSI Faculté des NTIC Université Constantine 2 Abdelhamid Mehri 127

Plus en détail

L INFORMATION GEOGRAPHIQUE

L INFORMATION GEOGRAPHIQUE Champs sur Marne ENSG/CERSIG Le 19-nove.-02 L INFORMATION GEOGRAPHIQUE Archivage Le Système d information géographique rassemble de l information afin de permettre son utilisation dans des applications

Plus en détail

L approche Bases de données

L approche Bases de données L approche Bases de données Cours: BD. Avancées Année: 2005/2006 Par: Dr B. Belattar (Univ. Batna Algérie) I- : Mise à niveau 1 Cours: BDD. Année: 2013/2014 Ens. S. MEDILEH (Univ. El-Oued) L approche Base

Plus en détail

Faculté des sciences de gestion et sciences économiques BASE DE DONNEES

Faculté des sciences de gestion et sciences économiques BASE DE DONNEES BASE DE DONNEES La plupart des entreprises possèdent des bases de données informatiques contenant des informations essentielles à leur fonctionnement. Ces informations concernent ses clients, ses produits,

Plus en détail

Les bases de données Page 1 / 8

Les bases de données Page 1 / 8 Les bases de données Page 1 / 8 Sommaire 1 Définitions... 1 2 Historique... 2 2.1 L'organisation en fichier... 2 2.2 L'apparition des SGBD... 2 2.3 Les SGBD relationnels... 3 2.4 Les bases de données objet...

Plus en détail

Architectures et Web

Architectures et Web Architectures et Web Niveaux d'abstraction d'une application En règle générale, une application est découpée en 3 niveaux d'abstraction : La couche présentation ou IHM (Interface Homme/Machine) gère les

Plus en détail

10 Intégration de données sur le web

10 Intégration de données sur le web 10 Intégration de données sur le web 240 Requête utilisateur : Où est-ce que je peux voir les films qui ont participé au dernier Festival de Cannes? Je voudrais les résumés et critiques des films de Pedro

Plus en détail

Conception et réalisation d une base de données

Conception et réalisation d une base de données SQL Server 2014 Conception et réalisation d une base de données (avec exercices pratiques et corrigés) Jérôme GABILLAUD Table des matières 1 Les éléments à télécharger sont disponibles à l'adresse suivante

Plus en détail

DRS. Donnez des Capacités à Votre Serveur d Impression d Entreprise. Distributeur exclusif de la gamme des logiciels Levi, Ray & Shoup, Inc.

DRS. Donnez des Capacités à Votre Serveur d Impression d Entreprise. Distributeur exclusif de la gamme des logiciels Levi, Ray & Shoup, Inc. DRS Donnez des Capacités à Votre Serveur d Impression d Entreprise Distributeur exclusif de la gamme des logiciels Levi, Ray & Shoup, Inc. Les documents les plus importants de votre entreprise sont issus

Plus en détail

Bertrand DAVID : Interaction Humain-Machine

Bertrand DAVID : Interaction Humain-Machine Interaction Humain-Machine Xml La transformation avec Xslt Les parseurs les outils pour Xml Transformation de documents dans les applications multimédia 1 XML extensible Markup Langage Un langage universel

Plus en détail

Créer le schéma relationnel d une base de données ACCESS

Créer le schéma relationnel d une base de données ACCESS Utilisation du SGBD ACCESS Polycopié réalisé par Chihab Hanachi et Jean-Marc Thévenin Créer le schéma relationnel d une base de données ACCESS GENERALITES SUR ACCESS... 1 A PROPOS DE L UTILISATION D ACCESS...

Plus en détail

Introduction aux concepts d ez Publish

Introduction aux concepts d ez Publish Introduction aux concepts d ez Publish Tutoriel rédigé par Bergfrid Skaara. Traduit de l Anglais par Benjamin Lemoine Mercredi 30 Janvier 2008 Sommaire Concepts d ez Publish... 3 Système de Gestion de

Plus en détail

THEME PROJET D ELABORATION D UNE BASE DE DONNEES SOUS LE SERVEUR MYSQL

THEME PROJET D ELABORATION D UNE BASE DE DONNEES SOUS LE SERVEUR MYSQL . THEME PROJET D ELABORATION D UNE BASE DE DONNEES SOUS LE SERVEUR MYSQL Mr MEZRED MOHAMED Ingénieur météorologue INTRODUCTION Il existe de nombreuses manières de construire une base de données. En effet,

Plus en détail

BUSINESSOBJECTS EDGE PREMIUM

BUSINESSOBJECTS EDGE PREMIUM PRODUITS BUSINESSOBJECTS EDGE PREMIUM Avantages de la Business Intelligence Assurer une visibilité intégrale des activités Identifier de nouvelles opportunités Détecter et résoudre les problèmes Remplacer

Plus en détail

INTRODUCTION AUX BASES DE DONNÉES

INTRODUCTION AUX BASES DE DONNÉES INTRODUCTION AUX BASES DE DONNÉES Najib TOUNSI Cours à l'usage des premières années informatique Najib TOUNSI - 1 - SOMMAIRE Concepts de Bases Base de Données Système Gestion de Bases de Données Niveau

Plus en détail

PRODUCTION DE JEUX DE DONNÉES ANONYMISÉES

PRODUCTION DE JEUX DE DONNÉES ANONYMISÉES PRODUCTION DE JEUX DE DONNÉES ANONYMISÉES Les contenus de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas être considérés

Plus en détail

Bases de données et XML. Évaluation d un programme XSLT p.1/??

Bases de données et XML. Évaluation d un programme XSLT p.1/?? Bases de données et XML Évaluation d un programme XSLT p.1/?? Quelques questions XML, format de bases de données? Pas vraiment : stockage inefficace, pas très structuré, pas (encore) de langage de requête

Plus en détail

Conventions communes aux profils UML

Conventions communes aux profils UML Conventions communes aux profils UML Auteur : Projet ACCORD (Assemblage de composants par contrats en environnement ouvert et réparti)* Référence : Livrable 2.1 Date : Juin 2002 * : Les partenaires du

Plus en détail

Architecture N-Tier. Ces données peuvent être saisies interactivement via l interface ou lues depuis un disque. Application

Architecture N-Tier. Ces données peuvent être saisies interactivement via l interface ou lues depuis un disque. Application Architecture Multi-Tier Traditionnellement une application informatique est un programme exécutable sur une machine qui représente la logique de traitement des données manipulées par l application. Ces

Plus en détail

Initiation aux bases de données (SGBD) Walter RUDAMETKIN

Initiation aux bases de données (SGBD) Walter RUDAMETKIN Initiation aux bases de données (SGBD) Walter RUDAMETKIN Bureau F011 Walter.Rudametkin@polytech-lille.fr Moi Je suis étranger J'ai un accent Je me trompe beaucoup en français (et en info, et en math, et...)

Plus en détail

D une part, elles ne peuvent faire table rase de la richesse contenue dans leur système d information.

D une part, elles ne peuvent faire table rase de la richesse contenue dans leur système d information. PACBASE «Interrogez le passé, il répondra présent.». Le Module e-business Les entreprises doivent aujourd hui relever un triple défi. D une part, elles ne peuvent faire table rase de la richesse contenue

Plus en détail

Créer le modèle multidimensionnel

Créer le modèle multidimensionnel 231 Chapitre 6 Créer le modèle multidimensionnel 1. Présentation de SSAS multidimensionnel Créer le modèle multidimensionnel SSAS (SQL Server Analysis Services) multidimensionnel est un serveur de bases

Plus en détail

Les formations. Développeur Logiciel. ENI Ecole Informatique

Les formations. Développeur Logiciel. ENI Ecole Informatique page 1/5 Titre professionnel : Reconnu par l Etat de niveau III (Bac), inscrit au RNCP (arrêté du 12/10/07, J.O. n 246 du 23/10/07) (32 semaines) Unité 1 : Structurer une application 6 semaines Module

Plus en détail

de survie du chef de projet

de survie du chef de projet KIT de survie du chef de projet 01 1 2 3 4 5 6 04 03 07 07 03 03 LE SERVEUR LE CLIENT TECHNOLOGIE WEB CLIENT LE SERVEUR WEB TECHNIQUES & CADRE DE TRAVAIL APPLICATIONS 101 LE SERVEUR Un serveur informatique

Plus en détail

Java et les bases de données: JDBC: Java DataBase Connectivity SQLJ: Embedded SQL in Java. Michel Bonjour http://cuiwww.unige.

Java et les bases de données: JDBC: Java DataBase Connectivity SQLJ: Embedded SQL in Java. Michel Bonjour http://cuiwww.unige. : JDBC: Java DataBase Connectivity SQLJ: Embedded SQL in Java Michel Bonjour http://cuiwww.unige.ch/~bonjour Plan JDBC: API bas niveau pour l accès aux BD (SQL) - Introduction - JDBC et : Java, ODBC, SQL

Plus en détail

Petite définition : Présentation :

Petite définition : Présentation : Petite définition : Le Web 2.0 est une technologie qui permet la création de réseaux sociaux, de communautés, via divers produits (des sites communautaires, des blogs, des forums, des wiki ), qui vise

Plus en détail

BASE DE DONNEES. OlivierCuré [ocure@univ-mlv.fr]

BASE DE DONNEES. OlivierCuré [ocure@univ-mlv.fr] BASE DE DONNEES 1 Contact Olivier Curé ocure@univ-mlv.fr http://www.univ-mlv.fr/~ocure Copernic 4B060 2 Objectifs du cours Présentation des concepts liés aux bases de données, aux modèles des bases de

Plus en détail

Cahier de charges (Source : "Java EE - Guide de développement d'applications web en Java" par Jérôme Lafosse) Module. Site Web dynamique JSP / Servlet

Cahier de charges (Source : Java EE - Guide de développement d'applications web en Java par Jérôme Lafosse) Module. Site Web dynamique JSP / Servlet Cahier de charges (Source : "Java EE - Guide de développement d'applications web en Java" par Jérôme Lafosse) Module Site Web dynamique JSP / Servlet Sujet : betaboutique Soutenance le 04 / 01 /2013 &

Plus en détail

IBM Cognos TM1. Fiche Produit. Aperçu

IBM Cognos TM1. Fiche Produit. Aperçu Fiche Produit IBM Cognos TM1 Aperçu Cycles de planification raccourcis de 75 % et reporting ramené à quelques minutes au lieu de plusieurs jours Solution entièrement prise en charge et gérée par le département

Plus en détail

Initiation à l'encodage XML-TEI. Lou Burnard

Initiation à l'encodage XML-TEI. Lou Burnard Initiation à l'encodage XML-TEI Lou Burnard Objectifs de cette formation 1 Préciser ce que c'est que l'encodage textuel 2 Présenter les concepts fondamentaux de TEI-XML 3 Offrir beaucoup d' experimentation

Plus en détail

//////////////////////////////////////////////////////////////////// Administration bases de données

//////////////////////////////////////////////////////////////////// Administration bases de données ////////////////////// Administration bases de données / INTRODUCTION Système d informations Un système d'information (SI) est un ensemble organisé de ressources (matériels, logiciels, personnel, données

Plus en détail

Business & High Technology

Business & High Technology UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 3 : Le web dans l entreprise Sommaire Introduction... 1 Intranet... 1 Extranet...

Plus en détail

Présentation générale des Web Services

Présentation générale des Web Services Présentation générale des Web Services Vue Globale Type d'architecture reposant sur les standards de l'internet Alternative aux architectures classiques : Client/serveur n/tiers Orientée services permettant

Plus en détail

NVU, Notepad++ (ou le bloc-note), MySQL, PhpMyAdmin. HTML, PHP, cas d utilisation, maquettage, programmation connaissances en HTML, PHP et SQL

NVU, Notepad++ (ou le bloc-note), MySQL, PhpMyAdmin. HTML, PHP, cas d utilisation, maquettage, programmation connaissances en HTML, PHP et SQL Prise en main de NVU et Notepad++ (conception d application web avec PHP et MySql) Propriétés Intitulé long Formation concernée Matière Présentation Description Conception de pages web dynamiques à l aide

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

Architectures d'intégration de données

Architectures d'intégration de données Architectures d'intégration de données Dan VODISLAV Université de Cergy-ontoise Master Informatique M1 Cours IED lan Intégration de données Objectifs, principes, caractéristiques Architectures type d'intégration

Plus en détail

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude INF 1250 INTRODUCTION AUX BASES DE DONNÉES Guide d étude Sous la direction de Olga Mariño Télé-université Montréal (Québec) 2011 INF 1250 Introduction aux bases de données 2 INTRODUCTION Le Guide d étude

Plus en détail

Travailler avec des données de type XML

Travailler avec des données de type XML Travailler avec des données de type XML Version 1.0 Z Grégory CASANOVA 2 Travailler avec des données de type XML 28/07/2009 Sommaire 1 Introduction... 3 2 Pré requis... 4 3 XML typé et non typé... 5 3.1

Plus en détail

Intégration de données

Intégration de données Intégration de données Dan VODISLAV Université de Cergy-Pontoise Master Informatique M2 Plan Objectifs, principes, enjeux, applications Architectures d intégration de données Médiateurs et entrepôts Traitement

Plus en détail

Dossier I Découverte de Base d Open Office

Dossier I Découverte de Base d Open Office ETUDE D UN SYSTEME DE GESTION DE BASE DE DONNEES RELATIONNELLES Définition : Un SGBD est un logiciel de gestion des données fournissant des méthodes d accès aux informations. Un SGBDR permet de décrire

Plus en détail

C'est : C'est : un fichier, analogue à une feuille de calcul Excel, contenant les informations.

C'est : C'est : un fichier, analogue à une feuille de calcul Excel, contenant les informations. C'est : un ensemble de fichiers contenant toutes les informations nécessaires à une application + un logiciel de Gestion de ces informations appelé SGBD (Système de Gestion de Base de Données). C'est :

Plus en détail

Bases de Données. Plan

Bases de Données. Plan Université Mohammed V- Agdal Ecole Mohammadia d'ingénieurs Rabat Bases de Données Mr N.EL FADDOULI 2014-2015 Plan Généralités: Définition de Bases de Données Le modèle relationnel Algèbre relationnelle

Plus en détail

Introduction aux bases de données relationnelles

Introduction aux bases de données relationnelles Formation «Gestion des données scientifiques : stockage et consultation en utilisant des ases de données» 24 au 27 /06/08 Introduction aux ases de données relationnelles Christine Tranchant-Dureuil UMR

Plus en détail

Introduction aux bases de données

Introduction aux bases de données 1/73 Introduction aux bases de données Formation continue Idir AIT SADOUNE idir.aitsadoune@supelec.fr École Supérieure d Électricité Département Informatique Gif sur Yvette 2012/2013 2/73 Plan 1 Introduction

Plus en détail

SOAP OU REST, QUE CHOISIR?

SOAP OU REST, QUE CHOISIR? SOAP OU REST, QUE CHOISIR? Eric van der Vlist (vdv@dyomedea.com) SOAP ou REST, que choisir? Web Services Convention Juin 2004 Eric van der Vlist (vdv@dyomedea.com) SOAP-- WS Convention 2004 -- Page 1 COMPARER

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

PROGICIEL INTÉGRÉ DE BIBLIOTHÉCONOMIE

PROGICIEL INTÉGRÉ DE BIBLIOTHÉCONOMIE Edition de Logiciels Professionnels PROGICIEL INTÉGRÉ DE BIBLIOTHÉCONOMIE Gestion d un catalogue centralisé Gestion des prêts et des réservations Gestion des abonnements Bulletinage et listes de diffusion

Plus en détail

ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE

ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE ORACLE DATA INTEGRATOR ENTERPRISE EDITION offre de nombreux avantages : performances de pointe, productivité et souplesse accrues pour un coût total de

Plus en détail

1 Introduction et installation

1 Introduction et installation TP d introduction aux bases de données 1 TP d introduction aux bases de données Le but de ce TP est d apprendre à manipuler des bases de données. Dans le cadre du programme d informatique pour tous, on

Plus en détail