Modélisation multidimensionnelle des données complexes : application aux données médicales

Dimension: px
Commencer à balayer dès la page:

Download "Modélisation multidimensionnelle des données complexes : application aux données médicales"

Transcription

1 Modélisation multidimensionnelle des données complexes : application aux données médicales Sommaire : Midouni Sid Ahmed Djallal Version 9 08/06/05 1. Introduction Etat de l art Modélisation multidimensionnelle des données complexes Modélisation multidimensionnelle Données complexes Modélisation multidimensionnelle des données complexes Contexte et objectifs Le projet MAP Le magasin cardiovasculaire Notre démarche de modélisation Le magasin cardiovasculaire : existant Nouveau modèle multidimensionnel du magasin cardiovasculaire Le métamodèle Prototype et Evaluation Conclusion et perspectives : Liste des figures Figure 1 : Représentation multidimensionnelle... 7 Figure 2 : Schéma en étoile... 7 Figure 3 : Les données complexes... 8 Figure 4 : La démarche de modélisation Figure 5 : Le modèle multidimensionnel du module Cardiovasculaire [MAP04] Figure 6 : Le nouveau modèle Cardiovasculaire Figure 7 : Le Méta Modèle Figure 8 : Le processus de développement Figure 9 : Architecture du prototype GEDM Figure 10 : Liste des dimensions Figure 11 : Propriétés d une dimension Figure 12 : Liste des tables de faits Figure 13 : Propriétés d une table de faits Figure 14 : Le méta modèle multidimensionnel de CWM

2 Résumé: La vocation d un entrepôt de données est l analyse de données pour l aide à la décision dans les entreprises. Tout de même, la modélisation multidimensionnelle est la base des entrepôts de données et l analyse en ligne (OLAP). Dans ce rapport, nous abordons le problème de la modélisation multidimensionnelle des données complexes à travers le cas des données médicales du projet MAP (Médecine d'anticipation personnalisée). Nous proposons un méta modèle multidimensionnel étendu pour les données médicales en généralisant le modèle cardiovasculaire du projet MAP. Enfin, nous avons spécifié et réalisé un outil d aide à la conception d entrepôt de données médicales. Abstract : 2

3 1. Introduction L intérêt pour l analyse de données s est développé énormément ces dernières années. Les entreprises se sont rendues compte de l efficacité de la technologie OLAP 1 (OnLine Analytical Processing) dans l analyse et l exploration des données. Cette technologie est utilisée dans les systèmes d aide à la décision. Ces systèmes sont basés sur des techniques d entreposage de données pour exploiter la grande masse d informations disponibles dans les entreprises à des fins d analyse et d aide à la décision. La manière la plus appropriée pour faciliter cette analyse OLAP est la modélisation multidimensionnelle des données. Cette dernière représente les données comme des points dans un espace multidimensionnel [20, 21]. Les données sont vues comme des sujets d analyse (les faits) étudiés selon plusieurs axes (les dimensions). Chaque dimension est liée à un ou plusieurs points de vues définissant ainsi le degré de granularité des données (hiérarchies). Contrairement aux modèles relationnels, entité/association ou orientéobjet, les modèles multidimensionnels sont les plus appropriés pour faire l analyse et faciliter la prise de décision dans les entreprises. Ils permettent d observer des faits à travers des indicateurs (mesures) et des dimensions. Autrement dit, le modèle multidimensionnel se compose de faits contenant les mesures à analyser et de dimensions contenant les paramètres de l'analyse. La modélisation multidimensionnelle est donc une technique qui vise à organiser les données de telle sorte que les applications OLAP soient performantes et efficaces. Cependant, cette technique n est pas adaptée à un certain type de données, dites complexes. Depuis quelques années, la nécessité de gérer et de traiter ce type de données n a cessé de s accentuer à cause de la variété de ces données (texte, image, son, vidéo, etc.). Cette variété de données met clairement en évidence la nécessité de créer de nouveaux modèles multidimensionnels pour ces nouveaux types de données qui sont qualifiées de complexes. C est dans ce contexte que doit être repensée la modélisation multidimensionnelle. Les modèles existants, tel que le schéma en étoile, le schéma en constellation ou le schéma en flocon de neige, ont été conçus afin de rendre les données d un entrepôt prêtes à l analyse. Ces modèles offrent un cadre agréable pour faire la modélisation multidimensionnelle des données simples, mais ils ne sont pas adaptés aux données complexes. Notre travail de recherche s'inscrit dans le cadre des travaux menés au laboratoire ERIC (Equipe de Recherche en Ingénierie des Connaissances) et plus particulièrement au sein du pôle BDD (Bases de Données Décisionnelles). Ce pôle travaille sur l élaboration des solutions permettant l exploration des données complexes et s intéresse plus particulièrement au processus d entreposage de ce type de données. Le présent travail s insère dans la continuité de ces travaux. Il vise à apporter des solutions aux problèmes de la modélisation multidimensionnelle de données complexes, en l occurrence les données médicales du projet MAP (Médecine d'anticipation personnalisée). L entrepôt MAP est formé de plusieurs magasins interconnectés partageant les mêmes données sur les patients, les laboratoires, les médecins, etc. Chaque magasin contient également d autres données de natures différentes (biologiques, biométriques, cardiovasculaires, psychologiques, etc.). 1 OLAP: OnLine Analytical Processing, ce sont en fait les technologies utilisées pour faire l analyse de données multidimensionnelle stockées au sein d un entrepôt 3

4 Notre objectif est de proposer un modèle multidimensionnel pour ces données médicales, plus particulièrement pour les données du module cardiovasculaires, et de généraliser ce modèle vers un méta modèle pour l entrepôt de données médicales. Le rôle de cet entrepôt est d intégrer et de stocker toute information utile aux médecins MAP et de conserver l historique des données médicales pour supporter les analyses effectuées nécessaire aux prises de décision. Ce rapport est organisé de la manière suivante : nous étudions les principaux travaux traitant la modélisation multidimensionnelle des données et plus précisément les données complexes dans la section 2. La section 3 présente quelques définitions des concepts utilisés dans le domaine de la modélisation de données et présente aussi une définition de données complexes. La section 4 présente le contexte, les objectifs de ce travail et les motivations pour proposer un nouveau modèle du module cardiovasculaire. Notre démarche de modélisation est décrite dans la section 5. Elle consiste, dans un premier temps, à proposer le nouveau modèle multidimensionnel du module cardiovasculaire. Ce dernier modèle sera généralisé en un méta modèle qui prend en charge tous les types de données du projet MAP. La section 6 décrit une implémentation possible de ce méta modèle dans une base de données relationnelle ainsi que la manière de l instancier pour définir les autres magasins de données du projet MAP. La dernière section conclut ce travail et présente quelques perspectives d utilisation et de recherche ouvertes par ce méta modèle. 2. Etat de l art De nombreux travaux ont étudié la modélisation multidimensionnelle. Certains proposent des langages algébriques pour faciliter l interrogation et la manipulation des données de l entrepôt [2, 3, 4, 5, 6,11]. Ces modèles peuvent être classés en trois niveaux [25, 26] : Au niveau conceptuel, on trouve des modèles proches de l utilisateur et indépendants de l implémentation. Golfarelli et al. présentent un modèle conceptuel graphique pour l entreposage de données [19]. Trujillo et al. décrivent un modèle conceptuel orienté objet basé sur UML [17]. Franconi et al. proposent un modèle conceptuel des entrepôts de données basé sur la logique de description (langage de représentation) qui permet de décrire les concepts de ce modèle [12]. Au niveau logique, les modèles dépendent du SGBD, (Système de Gestion des Bases de Données) utilisé dans l implémentation, mais restent compréhensibles pour les utilisateurs finaux. Kimball résume les travaux de recherche traitant ce niveau [20]. Il décrit aussi l implémentation des modèles multidimensionnels dans des bases de données relationnelles. Vassiliadis et al. donnent une vue générale des modèles logiques pour les bases de données OLAP [21]. Au niveau physique, les modèles dépendant du SGBD spécifique utilisé sont conçus pour décrire la manière dont les données seront stockées. Ils expliquent l'implémentation des cubes de données. LujánMora et al. utilisent le diagramme de composant et le diagramme de déploiement d UML [UML] pour modéliser la structure physique des entrepôts de données [13]. Ces différentes propositions sont parfaitement adaptées aux applications de données classiques, mais ne répondent pas complètement aux exigences des applications à base de données complexes telles que les applications médicales. 4

5 La majorité de ces travaux ne prennent pas en compte les objets à structure complexes. Cependant, Olivier Teste a spécifié dans [4] [22] [24], des modèles de représentation et des langages de manipulation qui sont dédiés aux entrepôts et magasins de données complexes et évolutives et qui sont basés sur le paradigme objet. Il a intégré par ailleurs dans son modèle la dimension temporelle afin de conserver l'évolution des données de manière pertinente. Wan et Zeitouni [10] proposent un modèle multidimensionnel, pour un autre type de données complexes (les objets mobiles), qui considère le temps et l espace comme des dimensions importantes dans leur analyse multidimensionnelle. Tanasescu et al. ont conçu un modèle UML générique basé sur un modèle général [14, DBB02], pour mieux identifier et représenter tous les types des données complexes pour qu elles soient prêtes au processus de modélisation multidimensionnelle. Dans le même article, l auteur a proposé l utilisation des techniques de fouille de données permettent l'extraction les caractéristiques des données complexes en vue de leur modélisation multidimensionnelle. Les efforts de modélisation des données spatiales, considérées comme un autre type de données complexes, se concentrent sur la représentation arbitraire des objets géométriques (points, lignes, polygones, etc.) dans un espace multidimensionnel [16]. La technologie SOLAP [15] est basée sur une structure multidimensionnelle pour supporter l analyse spatiotemporelle. Miquel et al. proposent des solutions pour concevoir ces structures lorsque les sources de données sont hétérogènes des points de vue temporel, spatial et sémantique [9]. Ces structures sont ensuite explorées dans l environnement SOLAP. D'autres auteurs, comme Zghal et al. se sont intéressés aux problèmes de la modélisation multidimensionnelle des données spatiales en se basant sur le développement de l entrepôt spatial [8]. Dans le domaine médical, Pederson et Jensen proposent un modèle multidimensionnel intégrant des données temporelles et imprécises pour la gestion des patients de l hôpital [6]. Ils ont résolu les problèmes de validité et d incertitude des données respectivement par l ajout, au modèle, du temps de validité et de probabilité. Dans [JMP] les mêmes auteurs proposent des solutions d intégration des documents XML et des données relationnelles dans une base de données multidimensionnelle en vue de leur analyse OLAP. Les auteurs s intéressent à l aide à la décision dans le domaine médical [5], ils proposent un modèle de données étendu pour les bases de données multidimensionnelles qui améliore l analyse, le suivi et le contrôle des dépenses de santé, de l activité des médecins et du comportement consommateur des patients. Cependant ces études se limitent aux données au dossier du patient et ne traitent pas la complexité des données médicales. Peu de recherches s intéressent à la modélisation multidimensionnelle des données médicales. Ces travaux se révèlent inadaptés à notre contexte de travail car ils ne prennent pas en compte le problème de l hétérogénéité des données médicales. 3. Modélisation multidimensionnelle des données complexes Dans cette section nous allons définir, dans un premier temps, les concepts généraux utilisés dans le domaine de la modélisation multidimensionnelle. Nous commençons par une définition de la modélisation multidimensionnelle, ensuite nous présentons une définition des données complexes et enfin la modélisation multidimensionnelle de ce type de données. 5

6 3.1. Modélisation multidimensionnelle Pour mieux définir la modélisation multidimensionnelle et ses concepts, on doit répondre aux questions suivantes : Qu est ce qu un modèle? Quelle est la différence entre les systèmes transactionnels et les systèmes décisionnels? "Un modèle est la représentation d un objet, d un système ou d une idée sous forme quelconque autre celle de l entité représentée ellemême. Sa fonction est d'aider à expliquer, à comprendre ou à améliorer un système" [Sha 75]. Le modèle de données est le cœur d un système décisionnel. Toutes les expériences ont montré que la modélisation d un système décisionnel nécessitait des approches spécifiques différentes des approches utilisées dans les systèmes transactionnels. En effet, les techniques couramment utilisées pour modéliser les données ont initialement été conçues pour qu elles s adaptent à des problématiques qui n ont pas lieu d être dans le cadre de la mise en œuvre d un système décisionnel. L une des différences importantes entre les systèmes classiques (systèmes transactionnels) et les systèmes décisionnels (entrepôt de données) est l organisation des données dans le système, ou plus simplement, le modèle de données. Un modèle dimensionnel contient les mêmes informations qu un modèle Entité/Relation, mais présente les données dans un format symétrique plus approprié pour faire l analyse de données. La modélisation dimensionnelle est une approche dédiée aux systèmes décisionnels. Elle part du principe que l objectif majeur de ce type de système est l analyse de la ventilation de données quantitatives (les faits) par rapport à des données qualifiantes (les dimensions) [Fra 00]. Chaque modèle dimensionnel se compose d une table contenant une clé multiple, la table des faits, et d un ensemble de tables plus petites nommées tables dimensionnelles : La table des faits est la table principale de tout modèle dimensionnel destiné à héberger des données permettant de mesurer l activité (les mesures). Chacune de ces mesures est prise à l intersection avec toutes les dimensions. Une table dimensionnelle appartient à un ensemble de table accompagnant une table de faits. Chaque dimension est définie par sa clé primaire qui assure l intégrité référentielle avec la ou les tables de faits à laquelle elle est liée. Les tables de dimension servent à enregistrer les descriptions textuelles des dimensions de l activité. Exemple : Considérons les données suivantes. Ventes en Maintenant, nous considérons plusieurs tables, relatives aux ventes de chaque année entre 1999 et On peut alors observer les données dans un espace à trois dimensions : la 6

7 dimension catégorie, la dimension produits et la dimension temps. Chaque intersection de ces dimensions représente une cellule comportant le montant des ventes. Figure 1 : Représentation multidimensionnelle La figure 2 décrit le schéma en étoile modélisant les analyses des quantités et des montants des médicaments dans les pharmacies selon trois dimensions : le temps, la catégorie et la situation géographique. Figure 2 : Schéma en étoile 3.2. Données complexes La description des données complexes nécessite une certaine précision et un espace de représentation adapté. A ce jour, il n existe pas de modèle universel pour toutes les formes de données complexes. Une définition des données complexes (figure 3) est donnée dans [ICEIS 05] où les données sont qualifiées de complexes si elles sont: multiformats : l'information est représentée sous différents formats (base de données, données numériques, symboliques, textes, images, sons, vidéos...) ; et/ou multistructures : les données peuvent être structurées, non structurées ou semistructurées (bases de données relationnelles, collection de documents XML...); et/ou 7

8 multisources : les données proviennent de différents origines (bases de données réparties, web...) ; et/ou multimodales : un même phénomène est décrit par plusieurs canaux ou points de vue (radiographies et diagnostic audio d'un médecin pour évaluer l'état de santé d un patient, données exprimées dans des échelles ou des langues différentes...) ; et/ou multiversions : les données sont évolutives en termes de définition ou de valeur (bases de données temporelles, recensements périodiques dont les critères évoluent...). Figure 3 : Les données complexes 3.3. Modélisation multidimensionnelle des données complexes Nous avons vu jusqu'à maintenant la définition de la modélisation dimensionnelle et la définition des données complexes. Une nouvelle question se pose alors : les techniques de la modélisation dimensionnelle classique doiventelles être conservées telles quelles, doiventelles être adaptées au contexte des données complexes ou totalement repensées? Les bases de données et les entrepôts de données utilisent, à ce jour, des techniques d analyse qui traitent seulement des données simples comme les chaînes de caractères, les nombres, etc. Les données multimédia qui sont un exemple des données complexes engendrent plus d informations nécessaires à l analyse de données. L intégration et la structuration des données complexes dans une base de données classique ont déjà été réalisées [DBB02]. Ces structures permettent la gestion et la consultation des données mais elles ne sont pas appropriées à l analyse des données. Le plus souvent, les données complexes sont stockées dans les bases de données pour qu elles soient retrouvées plus facilement. 8

9 Les SGBD (les Systèmes de Gestion de Bases de Données) existant ne permettent pas de traiter les données complexes. Cependant, ces SGBD offrent des solutions pour permettre la gestion des données multimédia, il s agit de stocker les données complexes d origine dans des BLOB2 avec leurs descripteurs. Mais, si on veut analyser ces données complexes on est amené à les intégrer dans des bases de données multidimensionnelles qui sont des structures plus appropriées pour l analyse de données. 4. Contexte et objectifs Notre travail de recherche s inscrit dans le projet MAP (Médecine d Anticipation Personnalisée). Il s agit d apporter des solutions aux problèmes posées par la modélisation multidimensionnelle des données médicales. Les modèles existants tels que les modèles en étoile ou en constellation sont inadaptés aux données médicales du projet MAP. Pour cela, le but de ce stage est de proposer un modèle multidimensionnel qui permettra de traiter et d analyser ce type de données complexes. Dans cette section, nous présentons le projet MAP le contexte général de notre travail, et nous nous intéressons plus particulièrement au magasin cardiovasculaire du projet MAP Le projet MAP Le projet MAP est le fruit d une collaboration entre le laboratoire ERIC et le docteur Ferret, médecin du sport et porteur d un projet de création d entreprise accueilli au sein de l incubateur CREALYS. Ce projet est financé pour moitié par l université Lyon 2 et pour moitié par la région RhôneAlpes. L objectif est d étendre les résultats et avancées empiriques développés pour les sportifs de haut niveau à d autres populations et de faire en sorte que les sujets analysés deviennent les gestionnaires de leur capital santé. Ce travail est fondé sur la structuration, le stockage et l analyse d un ensemble de données médicales complexes (qualitatives, numériques, textes, images ) concernant un grand ensemble de personnes. L entrepôt de données médicales MAP est organisé sous forme d une collection de magasins de données (DataMarts). Chaque magasin contient les données spécifiques, à une spécialité médicale (par exemple, les données des analyses biologiques, les données biométriques, les données cardiovasculaires, etc.) et est défini par un ensemble de faits et de dimensions partagées avec d autres magasins de données. Une modélisation multidimensionnelle du magasin biologique et du magasin biométrique a été réalisée dans [MAP 03]. Les données de ces deux modules étaient essentiellement textuelles ou numériques. Par contre, les données du magasin cardiovasculaire [MAP 04] sont plus complexes, ce magasin contient en plus des données textuelles et numériques, des images, des vidéos et des conclusions écrites. Suite aux problèmes rencontrés lors de la modélisation multidimensionnelle du magasin cardiovasculaire et à cause de la variété et la complexité des données, nous allons nous intéresser plus particulièrement au module cardiovasculaire, tout en essayant de généraliser cette solution aux autres magasins du projet MAP Le magasin cardiovasculaire Le magasin cardiovasculaire est un magasin particulier de l entrepôt MAP. Il contient principalement les différentes données provenant des différents appareils médicaux, les 2 BLOB (Binary Large OBject), C'est en général une image ou une séquence sonore sans grande structure interne, qu'on trouve fréquemment dans une base de données. La taille d'un Blob peut aller jusqu'à plusieurs Go. 9

10 résultats cardiovasculaires des individus et toute autre information utile, et qui peuvent apporter une aide au diagnostic médical. Ces données sont qualifiées de complexes à cause de leur hétérogénéité et de la diversité de leur format. Notre but est d intégrer ces données dans une structure dimensionnelle pour apporter au médecin MAP l aide à la décision afin d émettre un diagnostic précis sur un individu donné. Un des objectifs de ce magasin est de conserver tout type de document, les documents conservés servent à la vérification en cas de doute ou pour établir de nouveaux diagnostiques. Les valeurs numériques sont aussi conservées, dont certaines sont issues directement des documents. En plus des documents multimédia, on trouve les rapports détaillés rédigés par le médecin MAP, qui contiennent les résultats, les remarques et la conclusion sur un examen particulier effectué par un individu à une date donnée. Les examens cardiovasculaires sont classés en plusieurs types, ces types sont à leur tour classés en familles d examen. Un type d examen peut contenir une ou plusieurs analyses médicales. Un individu peut effectuer un type d examen à une date donnée. Il existe quatre types d examens dans ce magasin : L échocardiogramme produit des vidéos, des images, des valeurs numériques et des conclusions écrites, L électrocardiogramme produit des tracés dont la nature numérique reste flou à l heure actuelle, L examen clinique cardiologique est un compte rendu qui contient des valeurs numériques et des commentaires écrits, Le test d effort contient des valeurs numériques. 5. Notre démarche de modélisation Notre démarche de modélisation est incrémentale. A partir d un modèle existant, nous procédons à construire un nouveau modèle multidimensionnel, CardioM, qui résout les problèmes rencontrés dans l ancien modèle. Ensuite, nous créons un méta modèle qui généralise le modèle CardioM pour pouvoir modéliser les autres magasins de données du projet MAP. En d autres termes, l idée derrière cette démarche est de modéliser le module le plus complexe dans l entrepôt médical MAP afin d extraire les différents concepts qui vont permettre de créer un méta modèle générique pour générer les autres modules de l entrepôt MAP. La figure 4 présente notre approche de modélisation qui se base sur le modèle existant afin de l améliorer pour proposer un méta modèle générique. Nous détaillons dans la suite chaque étape de notre approche en expliquant nos motivations pour effectuer le passage entre chaque deux étapes différentes de notre démarche. 10

11 Figure 4 : La démarche de modélisation 5.1. Le magasin cardiovasculaire : existant La figure 5 montre le modèle existant du magasin cardiovasculaire, c est le premier essai pour intégrer le magasin cardiovasculaire dans l entrepôt MAP. Ce modèle nous donne une vue générale sur le magasin cardiovasculaire. Il contient les différentes analyses médicales, les différents résultats et les conclusions des examens cardiovasculaires. Figure 5 : Le modèle multidimensionnel du module Cardiovasculaire [MAP04] 11

12 La première remarque que l on peut faire sur ce modèle est qu il n a pas une hiérarchie de temps, en d autres termes, il n a pas exprimé les différents niveaux hiérarchiques de cette dimension importante. La dimension temporelle est présente dans tous les magasins de données de notre entrepôt MAP. Elle doit faire l objet d une attention toute particulière lors de la modélisation des données. Pour cela, nous proposons de hiérarchiser la dimension du temps en quatre niveaux : Heure, Jour, Mois et Année. Le premier niveau (Heure) contient une clé primaire l Heure et le deuxième niveau contient le Jour comme clé primaire pour permettre d effectuer plusieurs examens et analyses dans la même journée. Les clés primaires des deux autres niveaux, Mois et Année, sont respectivement le mois et l année. Le centre et le point d entrée dans le modèle est la table de fait Compte_Rendu qui contient la conclusion sur les analyses médicales effectuées pour un individu donnée. Le problème est que ce compte rendu est le rapport final d un processus médical, il dépend du diagnostic du médecin sur les différentes analyses et examens médicaux. Le compte rendu est la conclusion générale du médecin sur un examen donné. Pour éviter cet abus de langage, nous préférons utiliser le concept Examen, qui sera le fait à analyser de notre modèle, à la place du Compte_rendu qui sera inclus dans la conclusion de l examen. Une autre remarque sur ce modèle est la relation plusieurs à plusieurs entre la table de faits Examen et la dimension Document_Cardio qui pose un problème de conception dans le modèle dimensionnel. Le problème est que la dimension Document_Cardio peut prendre zéro, un ou plusieurs valeurs pour un même enregistrement de la table de fait. En plus ces différentes valeurs n ont pas la même importance médicale sur laquelle se base le médecin pour effectuer un examen donné. Pour gérer cette dimension, nous proposons d ajouter une table intermédiaire Groupe_Doc entre la table de fait et la dimension, comme le montre la figure 4, qui regroupent l ensemble de documents cardiologiques. La table Groupe_Doc, qui est notre table intermédiaire, contient un groupe de documents pour chaque examen. La dernière remarque concerne les dimensions du modèle, la dimension Document_Cardio contient les documents multimédia, son rôle dans l entrepôt MAP est seulement le stockage de ces documents importants. A l heure actuelle, ce type de dimension ne peut pas faire l objet d une analyse OLAP. Nous proposons dans la suite une classification des différentes dimensions de l entrepôt MAP. Partant des différentes solutions apportées aux différents problèmes décrits cidessus, nous proposons un nouveau modèle multidimensionnel du module cardiovasculaire détaillé dans la section suivante Nouveau modèle multidimensionnel du magasin cardiovasculaire L analyse du module cardiovasculaire a permis d observer deux sujets d analyses importants, les résultats des analyses et la conclusion du médecin sur ces résultats, qui sont étudiés selon plusieurs axes d analyse : Individu, Type d Examen, Analyse, Temps, Médecin, Machine ou Document. Comme une première étape pour modéliser les données cardiovasculaires, nous avons utilisé un schéma en étoile. Nous avons mis les deux mesures dans une seule table de fait, cette table est lié à toutes les dimensions mentionnées audessus. Le problème dans cette première tentative est qu on a deux mesures qui ne dépendent pas totalement des mêmes dimensions, ce qui nous a amené à utiliser dans la deuxième étape 12

13 le modèle en constellation. Par conséquent, nous avons mis les deux mesures dans deux tables de faits séparées et entourées chacune de ces dernières par les dimensions appropriées. Cette solution n est pas adaptée à nos faits qui dépendent l un de l autre, on ne peut pas analyser l un sans avoir l autre, ce qui explique nos motivations pour faire le lien entre les deux tables de faits. Les deux mesures ont un degré de granularité différent qui est exprimé par le lien hiérarchique existant entre les tables de faits. Laboratoire Id Labo Nom Labo 0..1 Document Cardio Id Doc Groupe Doc Id Groupe Médecin Id Médecin Nom Prenom Spécialité Famille Exam Id Famille Famille Exam 0..1 Examen Individu Id Individu Nom Prenom Id Individu Id Type Id Médecin Id Groupe Id Temps Id Machine Conclusion Normal Type Exam Id Type Type Examen 0..1 Année Année Mois Mois Jour Jour Heure Heure Machine Id Machine Nom Résultat_Exam Id Examen Id Analyse Id Temps Valeur Analyse Id Analyse Nom Nom Alternatif Figure 6 : Le nouveau modèle Cardiovasculaire 13

14 Les dimensions du modèle et leurs niveaux hiérarchiques sont : Individu : cette dimension est commune avec les autres magasins de données, elle contient les informations sur le patient concerné par les examens cardiovasculaires. Temps : c est une autre dimension commune avec les autres magasins de données, elle sert à stocker la date de l enregistrement concerné, elle est exprimée par une hiérarchie à trois niveaux : Heure Jour Mois Année. Classification Analyse : elle contient trois niveaux hiérarchiques : Type examen : contient les différents types d examens cardiovasculaires (l échocardiogramme, l électrocardiogramme, l examen clinique général et le test d effort). Famille examen : dans notre cas, ce niveau contient seulement la valeur «cardiovasculaire», c est un niveau commun avec les autres magasins de données de l entrepôt MAP. Analyse : ce sont les différentes analyses cardiovasculaires effectués par un individu dans un certain type d examen, par exemple Echographie contient les analyses suivantes : Gradient Valvulaire, Fraction Ejection, Gradient Mitral, Diamètre Aortique, Personnel Médical : cette dimension est composée de deux niveaux: Médecin : c est le médecin responsable d effectuer l examen cardiovasculaire pour un individu donné. Laboratoire : c est l organisme dans lequel l individu passe son examen. Machine : est l ensemble des appareils médicaux qui permet de réaliser les différents examens cardiovasculaires et qui permet d exporter les différents résultats médicaux. Document Cardio : contient les différents documents médicaux sur lesquels se base le médecin pour faire les examens. Les données de la table de faits Examen sont analysées selon six dimensions (Individu, Type Examen, Temps, Médecin, Machine et Document), tandis que la table de fait Résultat Examen est vue selon trois axes d analyses (Examen, Temps et Analyse). La première remarque que l on peut faire sur ce modèle (figure 6) est qu on a un modèle en constellation mais un peu spécial, on a deux tables de faits qui sont liées entre elles avec un lien hiérarchique. Ce nouveau concept, le lien hiérarchique entre les deux tables de faits, est justifié par le niveau de granularité différent entre ces deux tables. Celle de niveau haut (Examen) joue un double rôle dans ce modèle, elle est considéré comme une table de fait par rapport aux dimensions qui sont autour d elle et elle joue le rôle de dimension par rapport à la table de fait de niveau de granularité plus bas (Résultat Exam). Dans notre cas, l examen contient les résultats agrégés des résultats d examen. La table de fait Examen contient deux mesures (Normale et Conclusion), la mesure Normale peut avoir deux valeurs ( oui ou non ) qui contiendra la réponse à la question : le patient atil déjà eu une alerte cardiovasculaire?, et la mesure Conclusion contient la conclusion du médecin sur un examen donné. L autre table de fait (Résultat Exam), qui contient les résultats des analyses passées dans un examen donné, est liée à la première table de fait par un lien hiérarchique. Dans la 14

15 première table, Examen, on trouve les valeurs globales et génériques, et dans la deuxième on a le détail de ces valeurs. En d autre terme, un enregistrement de la table de fait Examen est équivalent à un ensemble d enregistrement de la table Résultats Exam, ce qui explique la relation un à plusieurs entre ces deux tables. Nous constatons dans la partie droite du modèle une hiérarchie liée à la dimension Analyse qu elle est liée à la table de fait Résultats Exam. Cette dimension est hiérarchisée en type d examen qui est à leur tour agrégée en famille d examen. Cette hiérarchie (Type_Exam FamilleExam) permet de prendre en compte les différents types d examens du projet MAP (biologiques, biométriques, cardiovasculaires, ), elle est commune avec les autres modules du projet MAP. Passons maintenant aux dimensions du modèle, pendant la modélisation du module cardiovasculaire, on a constaté qu il y a un autre type de dimension, en plus des dimensions classiques et temporelles qui représentent des axes d analyse, ce sont les dimensions multimédia qui vont contenir tous les fichiers sources médicales. On ne peut pas appliquer l analyse OLAP sur ce type dimension mais elles vont servir comme un axe de vérification et de révision pour le médecin en cas de doute. Introduire ce type de dimensions dans les modèles multidimensionnels nécessite des méthodes pour construire un cube de données avec ce type de dimensions. Les trois types de dimensions seront détaillés un peu plus dans la section suivante Le métamodèle Afin de modéliser l entrepôt de données médicales MAP, c est à dire la collection de magasins de données, nous proposons un métamodèle orienté objet (figure 7) permettant de créer les différents magasins de données du projet MAP. Ce métamodèle est une généralisation du modèle cardiovasculaire décrit auparavant avec la prise en compte des faits complexes et les nouveaux concepts définis lors de la modélisation multidimensionnelle du magasin cardiovasculaire. Peu de travaux proposent des méta modèles multidimensionnels [8, YAM, CWM], l objectif de ces travaux est de spécifier des méta modèles pour représenter les bases de données multidimensionnelles. Par exemple les auteurs dans [8] ont spécifié un méta modèle pour la construction d un entrepôt de données spatiales. Aussi un autre méta modèle multidimensionnel proposé par Abelló [YAM]. Il s est basé sur le langage UML pour donner un plus de sémantique en profitant des concepts objets tel que les relations de généralisation et de composition. Cependant ces travaux ne sont pas suffisants et ne sont pas adaptés pour représenter les concepts multidimensionnels comme nous souhaitons le faire. Notamment, le standard de l OMG (Object Management Group), CWM 3 (Common Warehouse MetaModel) qui propose un ensemble de méta modèles pour les techniques d entrepôt de données. Cet ensemble CWM est assez complet pour modéliser un entrepôt de données dans son ensemble. Mais le métamodèle multidimensionnel proposé par CWM représente les aspects multidimensionnels d une façon générale, il ne contient pas tous les objets d une base de données multidimensionnelle. Il faut le combiner avec d autres métamodèles du même standard pour avoir une représentation plus complète. Nous avons essayé de prendre en compte, dans un seul métamodèle, tous les composants d une base de données multidimensionnelle. 3 Voir en annexe A: Common Warehouse Metamodel (CWM) 15

16 En plus le métamodèle CWM ne permet pas de spécifier et de représenter les nouveaux concepts multidimensionnels que nous avons proposé. Notre méta modèle présenté dans la suite constitue une extension de ces trois derniers travaux qui soit applicable aux données médicales. La figure 7 montre une représentation UML du méta modèle, ce qui va nous permettre de mieux représenter les concepts multidimensionnels génériques (Dimensions, Faits, Mesures) et les autres concepts extraits de notre étude du module cardiovasculaire (le lien entre les tables de fait, les différents types de dimensions). EDM : Entrepôt de données Medical MDM : Magasin de données Medical EDM Nom EDM Description EDM Hiérarchie Fait Type Lien MDM Id MDM Nom MDM Description MDM Dim Classique 1.. Rec T_Fait Id T_Fait Nom T_Fait Description T_Fait 1.. Ass 1.. Dimensions Id Dim Nom Dim Type Dim Description Dim Dim Temporelle 1.. Niveaux Id Niveau Nom Niveau Ordre Niveau Description Niveau Dim Multimédia Mesures Paramètres Attributs Id Attribut Nom Attribut Type Attribut Figure 7 : Le Méta Modèle 16

17 L instanciation de ce méta modèle va nous permettre de créer les différents magasins de données dans l entrepôt médical du projet MAP. Ce dernier, qui est représenté par la classe EDM, est composé d un ensemble de magasins de données représenté par la classe MDM. Chaque magasin (MDM) est caractérisé par un ensemble de faits, qui représentent les sujets d analyses, et un ensemble de dimensions, qui représentent les axes d analyse. A chaque fait correspond une ou plusieurs mesures et à chaque dimension correspond un ensemble de paramètres. Ces deux derniers concepts (Mesures et Paramètres) héritent de la même classe Attribut mais ils ont une sémantique différente dans les bases de données multidimensionnelles. Les faits complexes sont caractérisés par la relation récursive Rec qui permet d associer à chaque table de fait une autre table de faits, cette relation permet d exprimer l hiérarchie des tables de faits. L hiérarchie de dimensions est matérialisée par les deux classes Dimension et Niveaux, on associé à chaque niveau son ordre hiérarchique dans la dimension. Par exemple, l ordre du niveau Heure de la dimension Temps est égal à zéro et l ordre de Jour égal à un (figure 4). Nous définissons les principales classes de notre méta modèle comme suit : Entrepôt de données Notre entrepôt de données est matérialisé par la classe EDM (Entrepôt de Données Médicales), cette classe est le conteneur global de toutes les classes du méta modèle. La classe EDM est définie par (N EDM, Des EDM ) où N EDM est le nom de l entrepôt de données, Des EDM est la description de l entrepôt. Magasin de données C est un entrepôt de données spécialisé, destiné à ne contenir que les informations élaborées pour un objectif particulier. Par exemple le magasin cardiovasculaire contient seulement les données cardiovasculaires. Le magasin de données est représenté par la classe MDM (Magasin de Données Médicales), qui est définie par le quadruplet (N MDM, F MDM, D MDM, Ass) où N MDM est le nom du magasin de données, F MDM = {F1, F2,.} est l ensemble des faits, D MDM = {D1, D2,.} est l ensemble des dimensions, Ass est la fonction qui va associer chaque fait avec ses dimensions. La table de faits Une table de fait est la table centrale du modèle multidimensionnel. Elle contient les différentes mesures de l activité à analyser, ces mesures peuvent être observées selon différentes dimensions. Cette classe est définie par le triplet (N F, M F, Rec) où N F est le nom du fait, M F = {m1, m2,.} est l ensemble des mesures, Rec est la fonction récursive qui va associer un fait avec un autre fait pour permettre l hiérarchisation des faits. 17

18 La dimension Une dimension est un axe d'analyse au sein d'une structure multidimensionnelle. Elle est composée d'une liste ordonnée de paramètres (attributs) qui partagent une signification sémantique commune dans le domaine modélisé. Elle est définie par le quadruplet (N Dim, P Dim, H Dim, T Dim ) où N Dim est le nom de la dimension, P Dim = {p1, p2, } est l ensemble des paramètres, H Dim = {H1, H2,.} est l ensemble des niveaux formant les hiérarchies de cette dimension, T Dim = {Classique, Temporelle, Multimédia} est le type de la dimension. Nous distinguons trois types de dimensions dans notre modèle : les dimensions classiques, les dimensions temporelles et les dimensions multimédia. La dimension classique Les dimensions servent à enregistrer les valeurs pour lesquelles sont analysées les mesures de l'activité. Une dimension est généralement formée de paramètres (attributs) textuels (pour restreindre la portée des requêtes) et discrets (les valeurs possibles sont bien déterminées et constantes) [20]. Les paramètres d'une dimension sont organisés en hiérarchies de la granularité la plus fine vers la granularité maximale. La dimension temporelle La dimension temporelle joue un rôle primordial dans les modèles dimensionnels, elle est présente dans tous les magasins de données de notre entrepôt MAP. La dimension temporelle s ajoute à l entrepôt pour maintenir l historique de l évolution des données médicales dans le temps. Cette dimension est généralement considérée comme une dimension normale. La dimension multimédia Ce type de dimension contient les différents types de données multimédias contenues dans notre entrepôt médical, on trouve par exemple : des électrocardiogrammes et des échocardiogrammes. Les données de ce type de dimension sont difficiles à manipuler par les outils d analyses actuels, leur but dans notre entrepôt médical est l archivage de ces données multimédia pour faire la vérification et le contrôle, en cas de doute, des résultats d analyses. Par exemple, dans le module cardiovasculaire, la dimension Document contient les différents documents multimédias utilisés dans le suivi médical d un individu donné. 6. Prototype et Evaluation Afin de valider notre méta modèle (décrit dans la section 5.3), nous avons développé un prototype d aide à la conception et la modélisation de notre entrepôt MAP, intitulé GEDM (Générateur d Entrepôt de Données Médicales). Notre outil facilite la tache de l administrateur MAP pour créer et générer des magasins de données à fin de construire l entrepôt global, tout en respectant nos nouveaux concepts définis dans le méta modèle des données médicales. En effet, l élaboration de l entrepôt MAP suit un processus de développement à trois niveaux : conceptuel, logique et physique. 18

19 La figure 8 décrit ce processus de développement, la génération des magasins de données passe généralement par ces trois étapes : premièrement, on génère une instance du méta modèle (figure 7), cette instance représente le modèle multidimensionnel du magasin de données en cours de modélisation, deuxièmement, on fait la transformation de ce modèle soit vers un fichier XML ou vers une base de données relationnelle, ce dernier choix va nous permettre dans la troisième étape de choisir soit un entrepôt XML ou un entrepôt relationnel. Instanciation Transformation Création 2 Schéma XML 3 Méta Modèle 1 Modèle UML 4 Entrepôt de données XML 2 Schéma Relationnel 3 Niveau Méta Niveau Instance Entrepôt de données relationnel Niveau Conceptuel Niveau Logique Niveau Physique Figure 8 : Le processus de développement Pour des raisons techniques et à cause de la performance limitée (à notre connaissance) visàvis des entrepôts XML, nous avons opté pour la solution relationnelle. En effet, GEDM est un prototype implanté audessus du SGBD Oracle version 10g. Le choix d un SGBD relationnel est motivé par la grande capacité de stockage ainsi la performance lors de la manipulation des données. En effet, les systèmes de gestion de bases de données relationnelles offrent d excellentes performances en terme de rapidité d accès, de volume de stockage et de stabilité des données. 19

20 Le choix du SGBD Oracle version 10g est justifié par plusieurs raisons : Oracle Database 10g est la solution idéale pour le transactionnel en ligne, l'aide a la décision et la gestion de contenus, c est un produit qui combine l analyse relationnelle (SQL) et multidimensionnelle (OLAP) et intègre des fonctions d'extraction, transfert et chargement de contenu (ETL), en effet, le moteur OLAP est directement intégré dans le SGBDR avec, de ce fait, un seul système de sécurité et de stockage et une maintenance grandement facilitée, il propose un gestionnaire de base de données capable de gérer dans un même espace de stockage des données relationnelles et multidimensionnelles accessibles à travers une interface SQL standard. GEDM se base sur une approche incrémentale, l administrateur MAP élabore l entrepôt étape par étape en construisant les différents magasins de données du projet MAP. L architecture de ce prototype, comme le montre la figure 9, est composée essentiellement d une interface utilisateur et un générateur de script. L interface utilisateur permet de définir les magasins de données MAP, en introduisant les différents éléments (dimensions, faits, ) du schéma dimensionnel. Le générateur de script est le module responsable de la génération des scripts, ces derniers scripts permettent la création du schéma de l entrepôt de données MAP dans une base de données relationnelle, en s appuyant sur notre méta modèle défini dans la section 5.3. GEDM Administrateur MAP Interface Utilisateur Générateur de script Oracle Entrepôt Figure 9 : Architecture du prototype GEDM 20

21 Pour montrer la cinématique de notre application et pour comprendre son fonctionnement, nous nous intéressons encore une fois à la définition du module cardiovasculaire à travers le prototype GEDM. Les figures qui suivent décrivent la chronologie des principales fonctionnalités de ce prototype. Nous définissons en premier les tables dimensionnelles et leurs propriétés qui permettent par la suite de définir les tables de faits. La figure 10 liste les différentes dimensions existantes dans le magasin courant en offrant la possibilité d ajouter, de modifier ou de supprimer une dimension. Figure 10 : Liste des dimensions L'administrateur MAP peut ajouter une dimension à l'entrepôt en définissant les propriétés, les différents niveaux et les paramètres de la dimension (figure 11). Figure 11 : Propriétés d une dimension 21

22 Concernant les faits, la figure 12 illustre la liste des tables de faits. Cette interface permet d ajouter, de modifier ou de supprimer une table de faits. Figure 12 : Liste des tables de faits La figure 13 présente l interface permettant de représenter les différents onglets de la table de faits. Figure 13 : Propriétés d une table de faits 22

23 7. Conclusion et perspectives : Le travail présenté dans ce mémoire traite la modélisation multidimensionnelle des données complexes. Notre objectif est d intégrer les données médicales du projet MAP (Médecine d Anticipation Personnalisée), qui se compose de plusieurs modules, dans une structure multidimensionnelle pour apporter l aide au processus décisionnel. Pour répondre à cet objectif, nous avons proposé une approche de modélisation et d implémentation de l entrepôt médical en se basant sur un méta modèle que nous avons développé. Dans un premier temps, nous avons modélisé le module le plus complexe du projet MAP, le module cardiovasculaire. Pendant cette modélisation, nous avons constaté la difficulté de modéliser et d intégrer les données médicales telles que les données cardiovasculaires dans une structure multidimensionnelle. Par conséquent, nous avons senti le besoin de proposer de nouveaux concepts qui étendent les modèles existants vers un nouveau type de modèle. Dans un second temps, nous avons proposé un méta modèle en généralisant le modèle multidimensionnel du module cardiovasculaire. L instanciation de ce méta modèle permet de spécifier et de définir les différents magasins de données de l entrepôt MAP indépendamment des plates formes techniques. En fin, nous avons concrétisé ce méta modèle par le développement du prototype GEDM, acronyme de Générateur d Entrepôt de Données Médicales. Il comporte une interface utilisateur et un module générateur de script permettant de créer automatiquement les différents composants de l entrepôt de données. Notre approche étant incrémental, à partir des retours d usage nous essayons de faire évoluer le prototype que nous avons réalisé afin de lui permettre une meilleure manipulation de tous les éléments de notre entrepôt. Nos travaux futurs se concentrent sur la généralisation du méta modèle défini en ajoutant des nouveaux concepts afin de lui permettre de prendre en compte d autres types de données complexes. Ainsi l objectif sera l élaboration des nouveaux modèles de plus haut niveau d abstraction. 23

24 Annexe A: Common Warehouse Metamodel (CWM) Le CWM est le standard de l OMG pour les techniques liées aux entrepôts de données. Il couvre le cycle de vie complet de modélisation, construction et gestion des entrepôts de données. Le CWM définit un métamodèle qui représente les métadonnées aussi bien métiers que techniques qui sont le plus souvent trouvées dans les entrepôts de données. Il est utilisé à la base des échanges de métadonnées entre systèmes hétérogènes. Le CWM comprend actuellement un certain nombre de métamodèles concernant les entrepôts de données (représentation des données, analyse, gestion). Les métamodèles de données permettent de modéliser des ressources comme les bases de données relationnelles, les bases de données orientées objets. Une couche d analyse du CWM définit des métamodèles pour les transformations de données, OLAP, la visualisation, la nomenclature et le datamining. Une couche de gestion est constituée de métamodèles représentant les processus standards, la journalisation et la planification des activités. Le CWM représente une démarche d échange de métadonnées entre systèmes logiciels. Les échanges de métadonnées sont formulés en terme de modèles de données qui correspondent à un ou plusieurs métamodèles CWM. Un logiciel exporte ses métadonnées avec un modèle de leurs structures interne dans un format du CWM. Symétriquement, un logiciel importe des métadonnées à l aide d un modèle CWM et les traduit dans son format interne. L ensemble des métamodèles du CWM est assez complet pour modéliser un entrepôt de données dans son ensemble. Il est possible à l aide d outils CWM de générer une instance d entrepôt de données à partir de son modèle. Le schéma suivant (figure 14) présente le méta modèle multidimensionnel de CWM. Figure 14 : Le méta modèle multidimensionnel de CWM 24

Approche de modélisation multidimensionnelle des. des données complexes : Application aux données médicales. 5èmes Journées

Approche de modélisation multidimensionnelle des. des données complexes : Application aux données médicales. 5èmes Journées Approche de modélisation multidimensionnelle des données complexes : Application aux données médicales Sid Ahmed Djallal Midouni, Jérôme Darmont, Fadila Bentayeb To cite this version: Sid Ahmed Djallal

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

Entreposage de données complexes pour la médecine d anticipation personnalisée

Entreposage de données complexes pour la médecine d anticipation personnalisée Manuscrit auteur, publié dans "9th International Conference on System Science in Health Care (ICSSHC 08), Lyon : France (2008)" Entreposage de données complexes pour la médecine d anticipation personnalisée

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions

Plus en détail

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Le tout fichier Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché

Plus en détail

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016 Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques

Plus en détail

Business Intelligence : Informatique Décisionnelle

Business Intelligence : Informatique Décisionnelle Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données

Plus en détail

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML http://olivier-augereau.com Sommaire Introduction I) Les bases II) Les diagrammes

Plus en détail

BI2 : Un profil UML pour les Indicateurs Décisionnels

BI2 : Un profil UML pour les Indicateurs Décisionnels BI2 : Un profil UML pour les Indicateurs Décisionnels Sandro Bimonte Irstea, TSCF, 9 Av. Blaise Pascal, 63178, Aubière, France sandro.bimonte@irstea.fr Thème de Recherche MOTIVE www.irstea.fr 2 Plan Motivations

Plus en détail

Systèmes d information et bases de données (niveau 1)

Systèmes d information et bases de données (niveau 1) Systèmes d information et bases de données (niveau 1) Cours N 1 Violaine Prince Plan du cours 1. Bibliographie 2. Introduction aux bases de données 3. Les modèles 1. Hiérarchique 2. Réseau 3. Relationnel

Plus en détail

Chapitre 9 : Informatique décisionnelle

Chapitre 9 : Informatique décisionnelle Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle

Plus en détail

BUSINESS INTELLIGENCE

BUSINESS INTELLIGENCE GUIDE COMPARATIF BUSINESS INTELLIGENCE www.viseo.com Table des matières Business Intelligence :... 2 Contexte et objectifs... 2 Une architecture spécifique... 2 Les outils de Business intelligence... 3

Plus en détail

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles) SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients

Plus en détail

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/ Systèmes de gestion de bases de données Introduction Université d Evry Val d Essonne, IBISC utiles email : cinzia.digiusto@gmail.com webpage : http://www.ibisc.univ-evry.fr/ digiusto/ Google+ : https://plus.google.com/u/0/b/103572780965897723237/

Plus en détail

SQL SERVER 2008, BUSINESS INTELLIGENCE

SQL SERVER 2008, BUSINESS INTELLIGENCE SGBD / Aide à la décision SQL SERVER 2008, BUSINESS INTELLIGENCE Réf: QLI Durée : 5 jours (7 heures) OBJECTIFS DE LA FORMATION Cette formation vous apprendra à concevoir et à déployer une solution de Business

Plus en détail

Bases de Données Avancées

Bases de Données Avancées 1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

Les entrepôts de données

Les entrepôts de données Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction

Plus en détail

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS Nazih Selmoune (*), Zaia Alimazighi (*) Selmoune@lsi-usthb.dz, Alimazighi@wissal.dz (*) Laboratoire des systèmes

Plus en détail

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................

Plus en détail

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude INF 1250 INTRODUCTION AUX BASES DE DONNÉES Guide d étude Sous la direction de Olga Mariño Télé-université Montréal (Québec) 2011 INF 1250 Introduction aux bases de données 2 INTRODUCTION Le Guide d étude

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

Business & High Technology

Business & High Technology UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...

Plus en détail

Les Entrepôts de Données. (Data Warehouses)

Les Entrepôts de Données. (Data Warehouses) Les Entrepôts de Données (Data Warehouses) Pr. Omar Boussaid Département d'informatique et de Sta5s5que Université Lyon2 - France Les Entrepôts de Données 1. Généralités, sur le décisionnel 2. L'entreposage

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 3 - Data

BI = Business Intelligence Master Data-ScienceCours 3 - Data BI = Business Intelligence Master Data-Science Cours 3 - Datawarehouse UPMC 8 février 2015 Rappel L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage

Plus en détail

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

Mercredi 15 Janvier 2014

Mercredi 15 Janvier 2014 De la conception au site web Mercredi 15 Janvier 2014 Loïc THOMAS Géo-Hyd Responsable Informatique & Ingénierie des Systèmes d'information loic.thomas@anteagroup.com 02 38 64 26 41 Architecture Il est

Plus en détail

Conception, architecture et urbanisation des systèmes d information

Conception, architecture et urbanisation des systèmes d information Conception, architecture et urbanisation des systèmes d information S. Servigne Maître de Conférences, LIRIS, INSA-Lyon, F-69621 Villeurbanne Cedex e-mail: sylvie.servigne@insa-lyon.fr 1. Introduction

Plus en détail

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

Urbanisation des SI-NFE107

Urbanisation des SI-NFE107 OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle

Plus en détail

Bases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS

Bases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS Bases de Données Stella MARC-ZWECKER Maître de conférences Dpt. Informatique - UdS stella@unistra.u-strasbg.fr 1 Plan du cours 1. Introduction aux BD et aux SGBD Objectifs, fonctionnalités et évolutions

Plus en détail

Entrepôt de Données. Jean-François Desnos. Jean-Francois.Desnos@grenet.fr ED JFD 1

Entrepôt de Données. Jean-François Desnos. Jean-Francois.Desnos@grenet.fr ED JFD 1 Entrepôt de Données Jean-François Desnos Jean-Francois.Desnos@grenet.fr ED JFD 1 Définition (Bill Inmon 1990) Un entrepôt de données (data warehouse) est une collection de données thématiques, intégrées,

Plus en détail

Méthodologie de conceptualisation BI

Méthodologie de conceptualisation BI Méthodologie de conceptualisation BI Business Intelligence (BI) La Business intelligence est un outil décisionnel incontournable à la gestion stratégique et quotidienne des entités. Il fournit de l information

Plus en détail

SQL Server 2012 et SQL Server 2014

SQL Server 2012 et SQL Server 2014 SQL Server 2012 et SQL Server 2014 Principales fonctions SQL Server 2012 est le système de gestion de base de données de Microsoft. Il intègre un moteur relationnel, un outil d extraction et de transformation

Plus en détail

FreeAnalysis. Schema Designer. Cubes

FreeAnalysis. Schema Designer. Cubes FreeAnalysis Schema Designer Cubes Charles Martin et Patrick Beaucamp BPM Conseil Contact : charles.martin@bpm-conseil.com, patrick.beaucamp@bpm-conseil.com Janvier 2013 Document : BPM_Vanilla_FreeAnalysisSchemaDesigner_v4.2_FR.odt

Plus en détail

DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier?

DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier? DOSSIER SOLUTION CA ERwin Modeling Comment gérer la complexité des données et améliorer l agilité métier? CA ERwin Modeling fournit une vue centralisée des définitions de données clés afin de mieux comprendre

Plus en détail

Rapport de DEA. Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP. Anne-Muriel ARIGON

Rapport de DEA. Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP. Anne-Muriel ARIGON Rapport de DEA Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP Anne-Muriel ARIGON LIRIS INSA de Lyon Bâtiment 501 69621 Villeurbanne, France Encadré

Plus en détail

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence É C O L E D I N G É N I E U R D E S T E C H N O L O G I E S D E L I N F O R M A T I O N E T D E L A C O M M U N I C A T I O N Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION Mentions

Plus en détail

Bases de Données. Le cas des BD relationnelles ouverture sur les BD relationnelles spatiales Séance 2 : Mise en oeuvre

Bases de Données. Le cas des BD relationnelles ouverture sur les BD relationnelles spatiales Séance 2 : Mise en oeuvre Bases de Données Le cas des BD relationnelles ouverture sur les BD relationnelles spatiales Séance 2 : Mise en oeuvre Synthèse : conception de BD langage de modélisation famille de SGBD SGBD Analyse du

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Data warehouse (DW) Le Data warehouse (entrepôt de données) est une collection de données orientées sujet, intégrées, non volatiles

Plus en détail

Dossier I Découverte de Base d Open Office

Dossier I Découverte de Base d Open Office ETUDE D UN SYSTEME DE GESTION DE BASE DE DONNEES RELATIONNELLES Définition : Un SGBD est un logiciel de gestion des données fournissant des méthodes d accès aux informations. Un SGBDR permet de décrire

Plus en détail

LES ENTREPOTS DE DONNEES

LES ENTREPOTS DE DONNEES Module B4 : Projet des Systèmes d information Lille, le 25 mars 2002 LES ENTREPOTS DE DONNEES Problématique : Pour capitaliser ses informations, une entreprise doit-elle commencer par mettre en œuvre des

Plus en détail

La place de la Géomatique Décisionnelle dans le processus de décision

La place de la Géomatique Décisionnelle dans le processus de décision Géomatique décisionnelle La place de la Géomatique Décisionnelle dans le processus de décision - Arnaud Van De Casteele Mines ParisTech - CRC Arnaud {dot} van_de_casteele {at} mines-paristech.fr Les rencontres

Plus en détail

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données : Page 1 of 6 Entrepôt de données Un article de Wikipédia, l'encyclopédie libre. L'entrepôt de données, ou datawarehouse, est un concept spécifique de l'informatique décisionnelle, issu du constat suivant

Plus en détail

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration

Plus en détail

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015)

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015) Chaîne opératoire de réalisation d une base de données ANF «Comment concevoir une base de données» (29-30/01/2015) En introduction 1- Phase d analyse ou d audit 2- Modélisation & développement de la base

Plus en détail

Chapitre VIII. Les bases de données. Orientées Objet. Motivation

Chapitre VIII. Les bases de données. Orientées Objet. Motivation Chapitre VIII Motivation Le modèle relationnel connaît un très grand succès et s avère très adéquat pour les applications traditionnelles des bases de données (gestion) Les bases de données Orientées Objet

Plus en détail

XCube XML For Data Warehouses

XCube XML For Data Warehouses XCube XML For Data Warehouses Auteurs : Wolfgang Hümmer Andreas Bauer Gunnar Harde Présenté par : David TA KIM 2005-12-05 Sommaire Sommaire I Introduction au Datawarehouse Sommaire I Introduction au Datawarehouse

Plus en détail

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Solutions PME VIPDev Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Cette offre est basée sur la mise à disposition de l ensemble de nos compétences techniques et créatives au service

Plus en détail

ETL Extract - Transform - Load

ETL Extract - Transform - Load ETL Extract - Transform - Load Concept général d analyse en ligne (rappels) Rémy Choquet - Université Lyon 2 - Master 2 IIDEE - 2006-2007 Plan Définitions La place d OLAP dans une entreprise OLAP versus

Plus en détail

Rappel sur les bases de données

Rappel sur les bases de données Rappel sur les bases de données 1) Généralités 1.1 Base de données et système de gestion de base de donnés: définitions Une base de données est un ensemble de données stockées de manière structurée permettant

Plus en détail

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant

Plus en détail

Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses

Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses Thèse présentée par Cécile FAVRE pour obtenir le titre de Docteur en Informatique

Plus en détail

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza Avant de commencer à travailler avec le produit, il est nécessaire de comprendre, à un haut niveau, les problèmes en réponse desquels l outil a été

Plus en détail

Présentations personnelles. filière IL

Présentations personnelles. filière IL Présentations personnelles filière IL Résumé Liste de sujets de présentations personnelles. Chaque présentation aborde un sujet particulier, l'objectif étant que la lecture du rapport ainsi que l'écoute

Plus en détail

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012 CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2012 AGENDA Qui sommes nous? Présentation de Keyrus Keyrus : Expert en formations BI Nos propositions de formation 3 modes de formations Liste des

Plus en détail

Cours Base de données relationnelles. M. Boughanem, IUP STRI

Cours Base de données relationnelles. M. Boughanem, IUP STRI Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),

Plus en détail

GED: Gestion Electronique de Document (Support de cours) R. MAHMOUDI (mahmoudr@esiee.fr) www.research-ace.net/~mahmoudi 1 Gestion Electronique de Documents Plan du cours - Introduction générale - Spécificités

Plus en détail

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1 La Geo-Business Intelligence selon GALIGEO avec ESRI 2005 session «Décisionnel» 26/10/2005 1 La Business Intelligence : Une Définition La Business intelligence permet l utilisation des données opérationnelles

Plus en détail

TP Conception de Datawarehouse Initiation à ORACLE WAREHOUSE BUILDER Cédric du Mouza

TP Conception de Datawarehouse Initiation à ORACLE WAREHOUSE BUILDER Cédric du Mouza TP Conception de Datawarehouse Initiation à ORACLE WAREHOUSE BUILDER Cédric du Mouza Ce TP s appuie sur le tutorial de prise en main de Oracle Warehouse Builder, que vous pouvez trouver en anglais sur

Plus en détail

SWISS ORACLE US ER GRO UP. www.soug.ch. Newsletter 5/2014 Sonderausgabe. OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features

SWISS ORACLE US ER GRO UP. www.soug.ch. Newsletter 5/2014 Sonderausgabe. OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features SWISS ORACLE US ER GRO UP www.soug.ch Newsletter 5/2014 Sonderausgabe OBIF DB licensing with VMware Delphix 12c: SQL Plan / Security Features 42 TIPS&TECHNIQUES Alexandre Tacchini, Benjamin Gaillard, Fabien

Plus en détail

Démarche dirigée par les modèles pour la conception d entrepôts de données multidimensionnelles. F.Atigui, F.Ravat, O.Teste, G.

Démarche dirigée par les modèles pour la conception d entrepôts de données multidimensionnelles. F.Atigui, F.Ravat, O.Teste, G. Démarche dirigée par les modèles pour la conception d entrepôts de données multidimensionnelles F.Atigui, F.Ravat, O.Teste, G.Zurfluh IRIT (SIG/ED) Université Paul Sabatier 118 route de Narbonne 31062

Plus en détail

Intelligence Economique - Business Intelligence

Intelligence Economique - Business Intelligence Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit

Plus en détail

La problématique. La philosophie ' ) * )

La problématique. La philosophie ' ) * ) La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse

Plus en détail

Qu est-ce que ArcGIS?

Qu est-ce que ArcGIS? 2 Qu est-ce que ArcGIS? LE SIG ÉVOLUE Depuis de nombreuses années, la technologie SIG améliore la communication, la collaboration et la prise de décision, la gestion des ressources et des infrastructures,

Plus en détail

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire

Plus en détail

Intégration de données hétérogènes et réparties. Anne Doucet Anne.Doucet@lip6.fr

Intégration de données hétérogènes et réparties. Anne Doucet Anne.Doucet@lip6.fr Intégration de données hétérogènes et réparties Anne Doucet Anne.Doucet@lip6.fr 1 Plan Intégration de données Architectures d intégration Approche matérialisée Approche virtuelle Médiateurs Conception

Plus en détail

Bases de données multidimensionnelles et mise en œuvre dans Oracle

Bases de données multidimensionnelles et mise en œuvre dans Oracle Bases de données multidimensionnelles et mise en œuvre dans Oracle 1 Introduction et Description générale Les bases de données relationnelles sont très performantes pour les systèmes opérationnels (ou

Plus en détail

Nom de l application

Nom de l application Ministère de l Enseignement Supérieur et de la Recherche Scientifique Direction Générale des Etudes Technologiques Institut Supérieur des Etudes Technologiques de Gafsa Département Technologies de l Informatique

Plus en détail

Ministère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire

Ministère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire Ministère de l Enseignement Supérieur et de la Recherche Scientifique Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) École Doctorale Sciences et Technologies de l'information et de

Plus en détail

Pascal Brunot Hadrien Cambazard UML FOR BUSINESS INTELLIGENCE PROJECT

Pascal Brunot Hadrien Cambazard UML FOR BUSINESS INTELLIGENCE PROJECT UML FOR BUSINESS INTELLIGENCE PROJECT Abstract : this document deals with the role of UML into business intelligence projects (like data warehousing). After a quick overview of what UML offers, it focuses

Plus en détail

analyse et pérennise votre patrimoine informationnel

analyse et pérennise votre patrimoine informationnel analyse et pérennise votre patrimoine informationnel Décoder le passé Donner une signification «métier» aux gérées par vos applications, retrouver les liens qui les unissent, connaître en détail leur utilisation

Plus en détail

ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE

ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE ORACLE DATA INTEGRATOR ENTERPRISE EDITION offre de nombreux avantages : performances de pointe, productivité et souplesse accrues pour un coût total de

Plus en détail

Objectif. Participant. Prérequis. Oracle BI Suite EE 10g R3 - Développer des référentiels. 5 Jours [35 Heures]

Objectif. Participant. Prérequis. Oracle BI Suite EE 10g R3 - Développer des référentiels. 5 Jours [35 Heures] Objectif Utiliser les techniques de gestion de la mise en cache pour contrôler et améliorer les performances des requêtes Définir des mesures simples et des mesures calculées pour une table de faits Créer

Plus en détail

THOT - Extraction de données et de schémas d un SGBD

THOT - Extraction de données et de schémas d un SGBD THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) pj@miningdb.com, benoit@miningdb.com Mots clefs : Fouille d information, base de données, système

Plus en détail

INTRODUCTION AUX TECHNOLOGIES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES

INTRODUCTION AUX TECHNOLOGIES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES INTRODUCTION AUX TECHNOLOGIES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES Les contenus de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information

Plus en détail

Business Intelligence avec SQL Server 2012

Business Intelligence avec SQL Server 2012 Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Extrait Alimenter l'entrepôt de données avec SSIS Business

Plus en détail

Big Data On Line Analytics

Big Data On Line Analytics Fdil Fadila Bentayeb Lb Laboratoire ERIC Lyon 2 Big Data On Line Analytics ASD 2014 Hammamet Tunisie 1 Sommaire Sommaire Informatique décisionnelle (BI Business Intelligence) Big Data Big Data analytics

Plus en détail

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données

Plus en détail

Le Géodécisionnel. P7 : Projet Bibliographique Dans le cadre du Mastère ASIG. Les SIG au service du géodécisionnel.

Le Géodécisionnel. P7 : Projet Bibliographique Dans le cadre du Mastère ASIG. Les SIG au service du géodécisionnel. P7 : Projet Bibliographique Dans le cadre du Mastère ASIG Le Géodécisionnel Les SIG au service du géodécisionnel Thierry Lallemant 15 Mai 2008 Mastère ASIG / Projet Bibliographique 2008 1 TABLE DES MATIERES

Plus en détail

BI = Business Intelligence Master Data-Science

BI = Business Intelligence Master Data-Science BI = Business Intelligence Master Data-Science UPMC 25 janvier 2015 Organisation Horaire Cours : Lundi de 13h30 à 15h30 TP : Vendredi de 13h30 à 17h45 Intervenants : Divers industriels (en cours de construction)

Plus en détail

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Introduction à l Informatique Décisionnelle - Business Intelligence (7) Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence

Plus en détail

Business Intelligence avec SQL Server 2014 Maîtrisez les concepts et réalisez un système décisionnel

Business Intelligence avec SQL Server 2014 Maîtrisez les concepts et réalisez un système décisionnel Avant-propos 1. À qui s'adresse ce livre? 9 2. Les pré-requis 10 3. Les objectifs du livre 11 Introduction 1. Présentation du décisionnel 13 1.1 La notion de décideur 14 1.2 Les facteurs d'amélioration

Plus en détail

Bases de données Cours 1 : Généralités sur les bases de données

Bases de données Cours 1 : Généralités sur les bases de données Cours 1 : Généralités sur les bases de données POLYTECH Université d Aix-Marseille odile.papini@univ-amu.fr http://odile.papini.perso.esil.univmed.fr/sources/bd.html Plan du cours 1 1 Qu est ce qu une

Plus en détail

Université de Bangui. Modélisons en UML

Université de Bangui. Modélisons en UML Université de Bangui CRM Modélisons en UML Ce cours a été possible grâce à l initiative d Apollinaire MOLAYE qui m a contacté pour vous faire bénéficier de mes connaissances en nouvelles technologies et

Plus en détail

Workflow/DataWarehouse/DataMining. 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1

Workflow/DataWarehouse/DataMining. 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1 Workflow/DataWarehouse/DataMining 14-09-98 LORIA - Université d automne 1998 - Informatique décisionnelle - L. Mirtain 1 plan Workflow DataWarehouse Aide à la décision DataMinig Conclusion 14-09-98 LORIA

Plus en détail

Master Informatique Aix-Marseille Université

Master Informatique Aix-Marseille Université Aix-Marseille Université http://masterinfo.univ-mrs.fr/ Département Informatique et Interactions UFR Sciences Laboratoire d Informatique Fondamentale Laboratoire des Sciences de l Information et des Systèmes

Plus en détail

Didier MOUNIEN Samantha MOINEAUX

Didier MOUNIEN Samantha MOINEAUX Didier MOUNIEN Samantha MOINEAUX 08/01/2008 1 Généralisation des ERP ERP génère une importante masse de données Comment mesurer l impact réel d une décision? Comment choisir entre plusieurs décisions?

Plus en détail

Département Génie Informatique

Département Génie Informatique Département Génie Informatique BD51 : Business Intelligence & Data Warehouse Projet Rédacteur : Christian FISCHER Automne 2011 Sujet : Développer un système décisionnel pour la gestion des ventes par magasin

Plus en détail

Manuel utilisateur Portail SAP

Manuel utilisateur Portail SAP Manuel utilisateur Portail SAP Procédures demande d achats Manuel Utilisateur SmileySup - Portail SAP v1.0 1/31 1. Table des matières 1. Table des matières... 2 2. Introduction... 3 3. Vue processus...

Plus en détail

Business Intelligence avec Excel, Power BI et Office 365

Business Intelligence avec Excel, Power BI et Office 365 Avant-propos A. À qui s adresse ce livre? 9 1. Pourquoi à chaque manager? 9 2. Pourquoi à tout informaticien impliqué dans des projets «BI» 9 B. Obtention des données sources 10 C. Objectif du livre 10

Plus en détail

Visual Paradigm Contraintes inter-associations

Visual Paradigm Contraintes inter-associations Visual Paradigm Contraintes inter-associations Travail de Bachelor d'informaticien de gestion Partie C Présentation de Visual Paradigm 1 Présentation de Visual Paradigm For UML L objet du travail de Bachelor

Plus en détail

Méthodes d évolution de modèle produit dans les systèmes du type PLM

Méthodes d évolution de modèle produit dans les systèmes du type PLM Résumé de thèse étendu Méthodes d évolution de modèle produit dans les systèmes du type PLM Seyed Hamedreza IZADPANAH Table des matières 1. Introduction...2 2. Approche «Ingénierie Dirigée par les Modèles»

Plus en détail

DÉPLOIEMENT DE QLIKVIEW POUR DES ANALYSES BIG DATA CHEZ KING.COM

DÉPLOIEMENT DE QLIKVIEW POUR DES ANALYSES BIG DATA CHEZ KING.COM DÉPLOIEMENT DE QLIKVIEW POUR DES ANALYSES BIG DATA CHEZ KING.COM Étude de cas technique QlikView : Big Data Juin 2012 qlikview.com Introduction La présente étude de cas technique QlikView se consacre au

Plus en détail

INTRODUCTION AUX METHODES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES

INTRODUCTION AUX METHODES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES INTRODUCTION AUX METHODES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES Les contenus de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et

Plus en détail

Thibault Denizet. Introduction à SSIS

Thibault Denizet. Introduction à SSIS Thibault Denizet Introduction à SSIS 2 SSIS - Introduction Sommaire 1 Introduction à SQL Server 2008 Integration services... 3 2 Rappel sur la Business Intelligence... 4 2.1 ETL (Extract, Transform, Load)...

Plus en détail