Approche de modélisation multidimensionnelle des. des données complexes : Application aux données médicales. 5èmes Journées



Documents pareils
Entreposage de données complexes pour la médecine d anticipation personnalisée

La voix en images : comment l évaluation objectivée par logiciel permet d optimiser la prise en charge vocale

Système de diffusion d information pour encourager les PME-PMI à améliorer leurs performances environnementales

AGROBASE : un système de gestion de données expérimentales

Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Entrepôt de données 1. Introduction

La place de la Géomatique Décisionnelle dans le processus de décision

BI2 : Un profil UML pour les Indicateurs Décisionnels

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

et les Systèmes Multidimensionnels

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Modélisation Multidimensionnelle des Tableaux de Bord Prospectifs

Un SIG collaboratif pour la recherche historique Partie. Partie 1 : Naissance et conception d un système d information géo-historique collaboratif.

statique J. Bertrand To cite this version: HAL Id: jpa

Démarche dirigée par les modèles pour la conception d entrepôts de données multidimensionnelles. F.Atigui, F.Ravat, O.Teste, G.

Les Entrepôts de Données

Les Entrepôts de Données. (Data Warehouses)

Modélisation d objets mobiles dans un entrepôt de données

Problèmes d additivité dus à la présence de hiérarchies

Bases de Données Avancées

Introduction à la B.I. Avec SQL Server 2008

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Méthodologie de conceptualisation BI

Compte-rendu de Hamma B., La préposition en français

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Personnalisation collaborative pour l enrichissement des analyses dans les entrepôts de données complexes

BI = Business Intelligence Master Data-ScienceCours 3 - Data

Business Intelligence : Informatique Décisionnelle

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Urbanisation des SI-NFE107

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Dessin assisté par ordinateur en lycée professionnel

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Intelligence Economique - Business Intelligence

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

Comptabilité à base d activités (ABC) et activités informatiques : une contribution à l amélioration des processus informatiques d une banque

Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes

La démarche MDA. Auteur : Projet ACCORD (Assemblage de composants par contrats en environnement ouvert et réparti)*

Entrepôt de Données. Jean-François Desnos. ED JFD 1

BI = Business Intelligence Master Data-Science

Généralisation contextuelle de mesures dans les entrepôts de données

C-CUBE: Un nouvel opérateur d agrégation pour les entrepôts de données en colonnes

Les entrepôts de données

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

Notes de lecture : Dan SPERBER & Deirdre WILSON, La pertinence

Chapitre 9 : Informatique décisionnelle

SQL SERVER 2008, BUSINESS INTELLIGENCE

Hervé Couturier EVP, SAP Technology Development

LES ENTREPOTS DE DONNEES

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

ETL Extract - Transform - Load

Information utiles. webpage : Google+ : digiusto/

Présentation du module Base de données spatio-temporelles

AVERTISSEMENT. D autre part, toute contrefaçon, plagiat, reproduction illicite de ce travail expose à des poursuites pénales.

Plan de cours ADM 992C Page 1. École des sciences de la gestion Département de management et technologie Université du Québec à Montréal

La problématique. La philosophie ' ) * )

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS

Présentations personnelles. filière IL

Une méthode d apprentissage pour la composition de services web

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Sur le grossissement des divers appareils pour la mesure des angles par la réflexion d un faisceau lumineux sur un miroir mobile

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux

Rapport de DEA. Intégration de versions fonctionnelles dans les entrepôts de données multimédias au sein des systèmes OLAP. Anne-Muriel ARIGON

Skills Technology Software PARTENAIRE TECHNOLOGIQUE DE VOTRE DÉVELOPPEMENT

Alimenter un entrepôt de données par des données issues de services web. Une approche médiation pour le prototype DaWeS

Ministère de l Enseignement Supérieur et de la Recherche Scientifique. Ecole nationale Supérieure d Informatique (ESI) (Oued Semar, Alger) Mémoire

Evolution et personnalisation des analyses dans les entrepôts

Intégration de données hétérogènes et réparties. Anne Doucet

Budget Constrained Resource Allocation for Non-Deterministic Workflows on a IaaS Cloud

Big Data On Line Analytics

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Business & High Technology

Systèmes d information et bases de données (niveau 1)

AXIAD Conseil pour décider en toute intelligence

Gestion et analyse personnalisées des demandes marketing : cas de LCL-Le Crédit Lyonnais

Algèbre OLAP et langage graphique

Bases de données multidimensionnelles et mise en œuvre dans Oracle

ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE

L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne

Didier MOUNIEN Samantha MOINEAUX

THOT - Extraction de données et de schémas d un SGBD

Bases de Données OLAP

17/07/2013. Décisionnel dans le Nuage. Laboratoire ERIC. Section 1. Équipe d Accueil Décisionnel dans le Nuage.

Introduction au domaine du décisionnel et aux data warehouses

Datawarehouse and OLAP

Jean-Luc Archimbaud. Sensibilisation à la sécurité informatique.

Big Data -Comment exploiter les données et les transformer en prise de décisions?

Évolution de schémas dans les entrepôts de données : mise à jour de hiérarchies de dimension pour la personnalisation des analyses

Workflow/DataWarehouse/DataMining LORIA - Université d automne Informatique décisionnelle - L. Mirtain 1

et les Systèmes Multidimensionnels

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

TRAVAUX DE RECHERCHE DANS LE

Plan de cours. 1. Mise en contexte. 2. Place du cours dans le programme. 3. Descripteur du cours

Transcription:

Approche de modélisation multidimensionnelle des données complexes : Application aux données médicales Sid Ahmed Djallal Midouni, Jérôme Darmont, Fadila Bentayeb To cite this version: Sid Ahmed Djallal Midouni, Jérôme Darmont, Fadila Bentayeb. Approche de modélisation multidimensionnelle des données complexes : Application aux données médicales. 5èmes Journées francophones sur les Entrepôts de Données et l Analyse en ligne (EDA 09), 2009, Montpellier, France. Cépaduès, B-5, pp.155-166, 2009, Revues des Nouvelles Technologies de l Information. <hal-00411237> HAL Id: hal-00411237 https://hal.archives-ouvertes.fr/hal-00411237 Submitted on 26 Aug 2009 HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Approche complexes Sid Ahmed de modélisation Djallal Université : Application B.P.230- Midouni*, * Département Abou Tlemcen multidimensionnelle Jérôme Bekr d'informatique aux 13000, Belkaid Darmont**, données Algérie - Tlemcen Fadila médicales Bentayeb** des données ** Équipe djmidouni@hotmail.com l aide {jdarmont 5 Université avenue 69676 bentayeb}@ BDD, Bron Pierre Lumière Cedex, Laboratoire Mendès-France eric.univ Lyon ERIC est Résumé. la à base la La décision des vocation entrepôts dans d un les de entrepôt entreprises. de et données La modélisation l analyse est -lyon2.fr l analyse 2 multidimensionnelle ligne de données (OLAP). pour techniques elles différentes article, (Médecine données nous sont complexes sont sources, d'anticipation abordons pas efficaces adaptées étendu à appelés le travers problème pour Personnalisée). aux pour communément le traiter données cas les des la les modélisation variées données Nous données médicales et proposons simples hétérogènes multidimensionnelle complexes. numériques, un du généralisant provenant projet métamodèle Dans MAP mais Ces des cet 1 Introduction Mots multidimensionnel, modèle un outil cardiovasculaire d aide Clés : à Modélisation conception analyse du en projet d entrepôt ligne, des MAP. données entrepôts de Enfin, données complexes. nous médicales. de avons données, spécifié modèle réalisé Analytical Les utilisée des multidimensionnelle dans disponibles L intérêt techniques entreprises manière dans Processing) dans pour les d entreposage la se systèmes les l analyse plus sont entreprises dans appropriée rendues d aide de l analyse de à données à des compte données la pour fins décision. et s est d analyse faciliter l exploration pour l efficacité développé Le exploiter plus cette d aide souvent, des analyse énormément la la données. à la grande technologie ces décision. OLAP systèmes masse Cette ces est dernières OLAP la technologie d informations sont modélisation basés (On-line années. données La un modélisation espace de telle multidimensionnel, sorte multidimensionnelle des données. que les Cette Kimball applications dernière est (1996), donc OLAP représente Vassiliadis une technique soient les et performantes Sellis qui (1999). vise comme à organiser et des efficaces. points sur les est Cependant, cette technique n est pas adaptée à un certain type de données, dites complexes.

Modélisation s accentuer met que pour Depuis quelques multidimensionnelle années, des données gérer complexes et de traiter - Cas ce type des données de données médicales. complexes. agrégeables Les doit clairement ces être nouveaux modèles à En repensée cause effet, évidence types existants la les leur modélisation données variété la offrent nécessité (texte, simples, qui multidimensionnelle. un sont de image, cadre créer qualifiées mais comportent son, de agréable ils nouveaux vidéo, de ne complexes. des sont pour etc.). modèles mesures pas mener Cette C est adaptés multidimensionnels non variété la dans additives, aux n a de ce contexte cessé données non de multidimensionnelle des MAP aux magasin structures (Médecine présent cardiovasculaire et multidimensionnelles qui travail d'anticipation ont pour de des données vise ces et niveaux données à généraliser apporter complexes, Personnalisée1). de plus biomédicales, granularité difficile. des ce en modèle solutions l occurrence différents, Notre plus vers particulièrement objectif au un ce les problème métamodèle qui données est rend de proposer leur de médicales la intégration modélisation entrepôts données un du modèle projet dans analyses complexes données, contribution Outre médecins médicales. nécessaires cette plus suivie MAP introduction, précisément des Le aux et principaux rôle de prises conserver de des nous cet de données entrepôt décision. travaux présentons l historique est traitant complexes. d intégrer dans des la la modélisation données section La et de section stocker 2 médicales une multidimensionnelle 3 définition toute est pour information relative permettre des données à notre utile des du types sera généralisé de données par par la proposition la projet suite vers MAP. du un modèle La métamodèle section multidimensionnel 4 décrit permettant une implémentation du module prendre cardiovasculaire charge possible tous de qui les ce représentation métamodèle définir et 2 présente La Modélisation description les autres quelques dans magasins une des perspectives base multidimensionnelle de données complexes d utilisation du relationnelle projet nécessite de MAP. recherche ainsi une des La que certaine dernière données ouvertes la manière précision section par de complexes ce conclut l instancier et métamodèle. un espace travail pour (2005): données complexes. multistructures multiformats données, adapté. données Les A ce : données l'information les numériques, jour, il sont n existe qualifiées symboliques, est peuvent pas représentée de être de modèle complexes textes, structurées, sous universel images, différents si non elles pour sons, structurées sont, toutes formats vidéos...) Darmont les formes ou (base ; et/ou semi- al. Région - multimodales réparties, multisources structurées Web...) (bases :: les un ; de et/ou données même phénomène proviennent relationnelles, est de décrit collection différentes par plusieurs de origines documents canaux (bases XML...); ou de points données et/ou de 21 Projet Rhône-Alpes vue CREALYS (radiographies et l Université de création diagnostic d entreprise Lumière Lyon audio porté 2 par d'un le médecin Dr Jean-Marcel pour Ferret évaluer et cofinancé l'état de par santé la

d un patient, exprimées dans des échelles ou des langues Dj. différentes...) Midouni et al. ; (2001), l objet l interrogation Le - modèle de multiversions (bases évoluent...). et/ou plusieurs de de données travaux. : les multidimensionnel données temporelles, Certains sont proposent évolutives recensements est le des cœur langages termes d un périodiques système algébriques définition dont décisionnel, pour les de faciliter critères valeur classiques, données prennent Torlone Ces Teste différentes (1998), mais (2000). et ne la Pedersen manipulation propositions répondent pas Jensen sont des complètement données parfaitement (1999), de Pokorny l entrepôt, aux adaptées exigences et Sokolowsky Agrawal aux des applications et (1999), al. (1995), Ravat de à Cabibbo données base et est des et Teste magasins modèles complexes pas de représentation compte données telles les complexes que objets les des applications structure langages et évolutives complexe. de médicales. manipulation et qui Cependant, sont La basés qui majorité sont sur Olivier dédiés le de paradigme Teste ces aux travaux a entrepôts spécifié objet, al. ne plus soient conserver classique mieux consultation L intégration souvent, (2000). ont l'évolution déjà les Il des données et a été intégré la des réalisées, structuration données complexes mais par Darmont ailleurs elles manière sont des ne et dans données sont stockées al. pertinente. (2002). son pas modèle appropriées dans complexes Ces les structures bases dimension dans à l analyse permettent une données temporelle base des pour données. la de gestion données qu elles afin Le de prêtes (2002). de Tanasescu retrouvées au identifier Dans processus même al. plus et de représenter ont facilement. modélisation article, conçu les un tous modèle auteurs multidimensionnelle, les types UML ont proposé des générique données l utilisation Tanasescu basé complexes sur des un (2003), techniques modèle afin qu elles Darmont général de fouille soient et pour al. modélisation données (points, technologie spatio-temporelle, données Les efforts complexes, lignes, permettant multidimensionnelle. de polygones, modélisation l'extraction concentrent etc.) des des dans données sur caractéristiques un la représentation espace spatiales, multidimensionnel, des considérées arbitraire données complexes comme des objets Guting un en géométriques autre (1994). vue type de leur problèmes ces spatial l environnement structures et sémantique, SOLAP lorsque SOLAP. Rivest les Miquel basée et sources D'autres al. sur (2001). et une al. auteurs, données structure (2001). Miquel comme sont multidimensionnelle et Ces al. hétérogènes structures proposent Zghal et sont des al. solutions pour points ensuite se sont supporter de explorées pour intéressés vue concevoir temporel, l analyse dans aux La de développement intégrant Pedersen données mêmes relationnelles Jensen Dans et auteurs respectivement le al. des et domaine (2001). Jensen la dans données d'un proposent modélisation une (1999). entrepôt médical, temporelles base par des de l ajout Ils spatial, multidimensionnelle Pederson solutions données ont et au résolu Zghal imprécises modèle et multidimensionnelle d intégration Jensen et les al. du problèmes (2003). pour des temps proposent des données la gestion de documents de validité un spatiales vue modèle des de et XML patients et leur de multidimensionnel d incertitude probabilité. se analyse et d'un basant des données hôpital, OLAP, sur Les des le 3

Modélisation multidimensionnelles l activité études données (2001). Ravat se Ils des et limitent al. proposent multidimensionnelle médecins s intéressent aux qui données et un améliore du modèle à comportement l aide du des l analyse, dossier données de la données décision du le complexes consommateur suivi patient dans étendu et et contrôle - ne Cas domaine pour traitent des des des patients. données les pas médical, dépenses bases la médicales. complexité Cependant Ravat santé, et des ces al. 3 médicales. pas Peu Modélisation compte de médicales. Ces recherches travaux problème se s intéressent multidimensionnelle révèlent de l hétérogénéité inadaptés à la modélisation des à notre données contexte de multidimensionnelle médicales. l entrepôt travail car médical ils des ne prennent données d analyser Personnalisée). multidimensionnelle étoile but Ce MAP magasins L entrepôt de ou ce travail de travail ce constellation type de s est Il est s agit de données des déroulé (datamarts), d apporter proposer données sont médicales complexes. inadaptés dans médicales. un des Darmont modèle MAP solutions aux cadre données Les est multidimensionnel du et organisé aux modèles Olivier projet médicales problèmes MAP existants sous (2006, du forme posées (Médecine qui projet 2008). tels permette d une par que MAP. Chaque la les d Anticipation collection modélisation Pour de modèles traiter magasin cela, en le et multidimensionnel, nous généraliser données. défini contient analyses par les biologiques, Suite un données ensemble aux problèmes spécifiques, les de données faits rencontrés à et biométriques, une de spécialité dimensions lors de les médicale la partagées données modélisation (par cardiovasculaires, avec exemple, multidimensionnelle d autres les magasins données etc.) et des Cardio-M intéresser cardiovasculaire plus particulièrement et à cause de la au variété module cardiovasculaire, complexité des tout données, essayant nous allons est d autres Notre démarche cette solution Cardio-M. de modélisation aux autres Ensuite, magasins est incrémentale. nous créons projet un Nous MAP. métamodèle construisons qui généralise un nouveau modèle du dans créer l entrepôt termes, pour médical l idée pouvoir derrière MAP modéliser afin cette d extraire les démarche autres les est magasins différents de modéliser de concepts données module qui vont le projet plus permettre MAP. complexe En de 3.1 étudiés importants, L étude un Le selon métamodèle modèle les du plusieurs résultats module multidimensionnel générique des axes cardiovasculaire analyses pour d analyse générer et : conclusion du a les Individu, permis autres modules Type d observer médecin cardiovasculaire d Examen, l entrepôt sur deux ces résultats, Analyse, sujets MAP. d analyse qui Temps, sont 4 Médecin, Nous faits, modèle des Pour mêmes avons cette pose modéliser Machine dimensions, table mis un problème les est ou les trois liée Document. données ce mesures majeur. à qui toutes nous cardiovasculaires, Nous (Conclusion, les a amené avons dimensions deux à Normale proposer nous mesures mentionnées avons et un Valeur) qui modèle utilisé ne ci-dessus. dépendent dans un constellation. une schéma Cependant, pas seule totalement en table étoile. Nous de ce

avons dimensions puisqu on établir différent Cette mis qui solution lien ne les appropriées. est peut deux entre exprimé n est pas mesures les analyser deux pas par dans tout tables lien l un à deux hiérarchique fait sans faits. tables adaptée avoir Les de l autre. existant à faits deux nos séparées mesures Ceci faits entre explique qui les et ont tables dépendent entourées un nos degré Dj. faits. motivations chacune l un de Midouni granularité de par l autre et pour les al. Type Examen conclusion examen Normale Les Examen, données est peut vue Temps, avoir selon la deux Examen trois table Médecin, valeurs axes contient faits d analyses Machine ( oui Examen deux ou et (Examen, non ) Document), sont mesures analysées qui Temps (Normale contiendra tandis et selon Analyse). et six la Conclusion), réponse dimensions table de à faits la (Individu, table, le La patient table du a-t-il de médecin faits déjà Résultat sur une alerte Exam, examen cardiovasculaire qui donné. contient les? résultats et la mesure des analyses passées contient question Résultat dans mesure relation équivalent de ces Examen, valeurs. un donné, à un plusieurs on est ensemble En trouve liée d autres à entre la les d enregistrements première valeurs ces termes, deux globales table tables. un enregistrement et de faits génériques, par table un Résultats lien de et hiérarchique. dans la table Exam, la deuxième ce Dans fait qui on Examen la explique a première le détail est un la : FIG. 1 Nouveau modèle Cardiovasculaire - Cardio-M. 5

Modélisation Examen constellation lien une Pour prendre multidimensionnelle compte lien des qui données existe entre complexes la mesure - Cas Conclusion des données de médicales. Temps, table faits La table hiérarchique table Médecin, et la faits classique mesure faits entre par Machine Examen rapport Valeur la de table telle et joue aux Document) de façon dimensions faits un table double que Examen ce Résultat_Exam, et lien rôle elle qui et soit dans sont la joue table représenté. autour ce de modèle, rôle nous faits d elle de avons Ainsi, Résultat_Exam. dimension elle (Individu, est étendu nous considérée par avons la Type table rapport modèle défini Examen, comme de faits à un Analyse types biométriques, MAP. Nous prendre Examen de d examen qui faits constatons est contient cardiovasculaires ), liée et niveau compte familles à dans les de résultats table granularité d examen. partie différents de faits agrégés elle droite Cette plus Résultats types est de bas du hiérarchie la commune modèle table (Résultat d examens Exam. de (Type_Exam faits une Cette avec Exam). du hiérarchie Résultat les dimension projet Dans autres / Famille-Exam) notre liée MAP modules est à hiérarchisée cas, la (biologiques, la dimension du table permet projet de la pas vérification dans données dimensions module des Décrivons appliquer cardiovasculaire, et multimédia maintenant de l analyse classiques révision OLAP nous qui pour les et vont dimensions temporelles avons le sur médecin contenir constaté ce type du qui tous modèle cas qu il de représentent les dimensions y fichiers doute. Cardio-M. a un autre Introduire sources mais type axes Pendant elles médicales. de d analyse, ce dimensions, type la servent modélisation de On dimensions ce d'axe sont ne peut plus les du 3.2 les avec modèles elle. Les multidimensionnels trois types dimension nécessite sont des détaillés méthodes dans pour la section construire suivante un cube complexes magasins créer généralisation Afin Métamodèle les cardiovasculaire. de différents et modéliser données, du nouveaux modèle magasins nous l entrepôt cardiovasculaire concepts proposons de données définis un décrit métamodèle lors médicales du auparavant projet la modélisation orienté MAP, MAP. avec objet c est la Ce prise (FIG. à métamodèle dire 2) compte la permettant collection des est faits une du (2008). spécifier exemple, par autre en profitant Peu Abelló métamodèle Cependant de spatiales, tout des Zghal (Abelló, travaux des métamodèles concepts et essayant Zghal ces propose al. 2002) proposent travaux ont et objets est de pour al. spécifié des basé résoudre (2003). ne des tel représenter concepts sont que sur métamodèles un Un pas les langage deuxième génériques relations suffisants problèmes bases multidimensionnels. UML de métamodèle pour et de pour des généralisation ne pour données la sont relations construction donner conception pas multidimensionnelles. adaptés multiples, un et Leur de plus d un des composition. pour objectif de entrepôts Harbi sémantique représenter proposé est et Par Un al. 62 les MetaModel), données. Voir concepts Le en standard annexe Cet multidimensionnels ensemble propose : Common de l OMG un CWM Warehouse ensemble (Object est comme assez Metamodel Management complet nous métamodèles souhaitons (CWM). pour Group), modéliser pour faire. CWM2 les un techniques entrepôt (Common d entrepôt données Warehouse dans de

objets d autres avons base son aspects ensemble. essayé d une multidimensionnels métamodèles base de Mais prendre de le données du métamodèle même d une compte, multidimensionnelle, standard façon dans pour générale, un seul avoir métamodèle, il une OMG représentation proposé prend (2003). pas tous par Il faut les CWM plus compte composants Dj. le complète. combiner représente Midouni de tous d une Nous et avec les al. spécifier proposés génériques module applicable métamodèle, Notre de cardiovasculaire données (tables et (Dimensions, aux de ce de représenter données qui multidimensionnelle. faits nous constitue multiples (le Faits, médicales. permet lien entre Mesures) nouveaux et une de hiérarchisées, les La mieux extension De tables et figure concepts plus, les représenter de autres le 2 fait, dimensions de montre multidimensionnels ces les concepts différents les trois une multimédia). concepts derniers extraits CWM représentation types multidimensionnels ne de travaux que dimensions). notre permet nous UML étude qui pas avons soit du de données EDM, Chaque d analyses, correspond paramètres. L instanciation est magasin dans composé et une Ces un l entrepôt ou deux (MDM) ensemble de plusieurs d un derniers ce médical ensemble est métamodèle caractérisé mesures dimensions, concepts FIG. du de projet 2 magasins Métamodèle nous (Mesures par à MAP. qui un chaque permet représentent ensemble de Ce et données dimension Paramètres) dernier, MAP. créer les faits, représenté qui axes correspond les héritent est qui d analyse. différents représenté représentent par de la un la classe A magasins même ensemble par chaque les la MDM. classe sujets fait de 7

Attribut Modélisation multidimensionnelles. des chaque Les faits mais complexes multidimensionnelle ils ont sont une caractérisés sémantique des données par la relation complexes différente récursive - dans Cas des Rec les données qui bases permet médicales. de d associer données classiques, On du niveau Nous La associe tables hiérarchie table de Heure distinguons à faits. de chaque fait de dimensions une niveau trois autre son types table est ordre Temps matérialisée de de hiérarchique faits. est égal Cette à par zéro relation les dans et deux l ordre notre dimension. permet classes de modèle Jour d exprimer Dimension Par égal : exemple, les à un la et dimensions (FIG. hiérarchie Niveaux. l ordre 1). à analysées (attributs) sont bien déterminées les textuels les classique. mesures dimensions (pour et Ces de constantes), restreindre l'activité. temporelles dimensions Une la Kimball et portée servent les dimensions (1996). des à enregistrer requêtes) est généralement multimédia. et les discrets valeurs formée (les pour valeurs lesquelles de paramètres possibles sont Dimension dimensionnels, La données multimédias électrocardiogrammes médicales temporelle. elle dans est présente La s ajoute temps. dans à Cette l entrepôt tous temporelle les magasins pour joue est maintenir généralement un de rôle données l historique primordial de considérée notre de dans l évolution entrepôt comme modèles sont normale. multimédia. Ce type de dimension contient les différents types de données MAP. médical difficiles contenues à manipuler et des par échocardiogrammes. notre les outils entrepôt d analyses médical. Les actuels, données On leur trouve de but ce type par dans exemple de notre dimensions entrepôt : une des d analyses. les 4 d aide différents est Par documents l archivage exemple, multimédias dans pour vérification module utilisés cardiovasculaire, dans et contrôle, suivi médical en la dimension cas d un de doute, individu Document des donné. résultats (Générateur Afin Prototype à de la valider conception notre et métamodèle à la modélisation (section de 3.2), notre nous entrepôt avons développé MAP, intitulé un prototype contient de suit définis passe données Notre La un généralement figure processus dans outil afin d Entrepôt 3 métamodèle facilite décrit par construire développement ce la ces de processus tâche Données trois des l entrepôt de données étapes l administrateur de Médicales). à trois modélisation. : médicales. global, niveaux tout MAP : En La conceptuel, en effet, génération pour respectant l élaboration créer logique des et nos générer magasins et nouveaux de physique. l entrepôt des de magasins concepts données GEDM MAP 8 - dans relationnel, deuxièmement, vers premièrement, modèle une multidimensionnel troisième base respectivement. de données étape, génère fait la transformation nous relationnelle; une du magasin instance choisissons de du de données soit métamodèle ce modèle un en entrepôt cours soit (FIG. vers XML, modélisation; 2), un fichier qui soit représente un XML, entrepôt soit le

Dj. Midouni et al. motivé stabilité prototype des d excellentes Nous avons opté dans ce FIG. travail 3 Processus pour la solution de modélisation. étape L architecture GEDM données. par par des implanté étape se données. performances grande base En en effet, sur sur capacité construisant une les SGBD approche systèmes en de terme stockage Oracle les incrémentale. de de différents version gestion rapidité ainsi que 10g. de magasins L administrateur d accès, la bases relationnelle. Le performance choix de de volume d un données En MAP lors SGBD effet, relationnels de élabore du stockage GEDM relationnel projet manipulation l entrepôt offrent est MAP. et est de un d une - Le permettent données L interface introduisant générateur utilisateur relationnelle, prototype, les utilisateur création de différents et scripts d'un du comme permet générateur est s appuyant éléments schéma module de montre de de (dimensions, définir sur l entrepôt scripts. responsable notre la figure les métamodèle. de faits ) magasins données 4, de est la du composée génération schéma de MAP données dans dimensionnel. essentiellement des une scripts MAP, base qui de FIG. 4 Architecture du prototype GEDM. 9

5 Modélisation données se Le Conclusion travail multidimensionnelle présenté et dans perspectives cet article des données traite complexes de la modélisation - Cas des données médicales. pour proposé basant projet compose apporter une complexes. de approche une plusieurs aide Notre de au magasins modélisation objectif processus est de décisionnel. d intégrer données, et d implémentation les dans Pour données répondre une structure de médicales l entrepôt à cet multidimensionnelle, objectif, du médical projet nous MAP, avons nous des cardiovasculaires sur premier métamodèle temps, que nous nous avons avons modélisé conçu et le développé. magasin de données le plus complexe qui le nouveau difficulté besoin MAP, de proposer modéliser magasin dans une de cardiovasculaire. et nouveaux structure d intégrer multidimensionnelle. concepts les Pendant données qui cette étendent médicales modélisation, Par conséquent, modèles telles nous que existants avons nous les avons constaté données vers senti du un la acronyme multidimensionnel niveau multimédia. magasins utilisateur Dans type un deuxième modèle. différents Enfin, de de nous de L instanciation données prise Générateur avons en de compte temps, module développé d Entrepôt de des nous ce cardiovasculaire. tables métamodèle MAP ce avons métamodèle de de indépendamment proposé Données faits permet multiples L apport un Médicales. métamodèle implémentant spécifier des et hiérarchisées notre plateformes Il et comporte métamodèle de généralisant un définir prototype techniques. et des les dimensions se différents interface situe GEDM, modèle Les composants et un module l entrepôt générateur de de données. scripts permettant de créer automatiquement les au perspectives ajoutant données Notre faire manipulation évoluer approche travaillons complexes que de nouveaux prototype nous étant tous (par envisageons les incrémentale, éléments exemple, concepts que nous à la de définir afin avons généralisation à conduire notre partir de réalisé de entrepôt. prendre des nouveaux sont retours afin progressive en de suivantes. types lui compte d usage, permettre de du mesures d autres nous métamodèle une essayons et meilleure types d autres en - Nous types haut niveau envisageons dimensions). d abstraction. également Ainsi l objectif la définition est l élaboration d une méthodologie de nouveaux de conception modèles de et plus effet A construction méthodes décisionnels adaptées travers compte méthodes nécessaire aux existantes les comportant travail, pour données de nouveaux les conception prévoir nous afin entrepôts complexes pensons d'offrir l extension concepts données des un définir médicales. données entrepôts complexes. définis cadre des de opérateurs médicales. complet nouveaux dans de Nous données ce prévoyons pour OLAP travail A opérateurs l heure mais concevoir existants (les une elles actuelle, OLAP. faits extension des pour ne multiples systèmes sont Il il prendre est existe pas des 10 multiples, dimensions hiérarchisés. est pour et de les définir s inspirer dimensions des nouveaux des multimédia). opérateurs Une OLAP permettant voie traitant possible, traitement hiérarchies pour les des faits de

Références Abelló Agrawal Model, A., PhD YAM² Thesis, (Yet Universitat Another Multidimensional Politècnica Catalunya. Model): A Barcelona, Multidimensional April Dj. 2002. Midouni Conceptual et al. Report, R., IBM Gupta Almaden A., Research Sarawagi Center, S., Modeling San Jose (California), 1995. Databases, ICDE'97 p 232-243. Research Cabibbo Data structuring 1998:183-197. L., J., Torlone for warehousing, R., O., A Bentayeb Logical C. F., Approach Djeraba, Rabaseda ed., to S., Multidimensional Multimedia Zellouf Y., Mining: Web Databases. multiform A Highway EDBT (ICEIS Intelligent Kluwer, J., Warehouses, 05), 2002, Boussaid Multimedia Miami, 179-194. O., USA, 7th Ralaivao Documents; International May 2005. J., Aouiche Multimedia Conference K., An Systems Architecture Enterprise and Framework Applications, Information Complex Vol. Systems data 22, to Darmont Information 17th 06), personnalisée", 08), Washington, Lyon, Information J, J, J, Olivier Olivier France, "Entreposage Systems, 9th E, USA, Resources E, September "A International IGI "Biomedical complex May Publishing, de 2006, Management 2008. données data Conference 685-687; Data warehouse Hershey, complexes Warehouses", Association Idea on PA, System for Group USA, personalized, pour International Science Publishing, May Encyclopaedia la 2008, médecine anticipative Health Hershey, 149-156. Conference Care of d'anticipation PA, medicine", Healthcare (ICSSHC (IRMA USA. Kimball Jensen Harbi Guting Intelligent Décisionnels générique N., R. R., Meuke-Fante H., Moller The An pour Information Data (ASD introduction la T., conception Warehouse 08), Pedersen M., Systems, Mohammédia, Bentayeb to spatial des Toolkit: TB., 17(2/3):255--280, entrepôts F., Specifying database Boussaïd Practical Maroc, de systems, 2008. données", OLAP O., techniques 2001. "Un VLDB cubes méta 3ème Journal, modèle building Atelier XML multidimensionnel 1994. data, dimensional sur les Journal Systèmes data Of Pokorny OMG, Miquel Pedersen warehouses. M., Bédard John Y., Wiley. Brisebois 1996. Electronic Proceedings sources Common J., TB., Sokolowsky Business hétérogènes of Warehouse Jensen ICDE, Engineering CS., pp. P., : Exemple Metamodel 336--345, A Multidimensional A., Conceptuel / Conception d application 4. 1999. Internationale (CWM) Modeling Specification, d entrepôts Data foresterie,isi-nis, Tagung Modeling Perspective Wirtschaftsinformatik March données 2003, géospatiales Complex volume Data Version Warehouses, X, Data, 2001. 1.1. 1999. à partir 11 In

Rivest,S., Ravat Modélisation F., Teste multidimensionnelle O., Zurfluh G., Modélisation des données multidimensionnelle complexes - Cas des des données systèmes médicales. Tanasescu making: Université In EGC Actes 2001, Bédard, A., Defining des Lumière Modélisation Janvier 1ères Y. the Journées & 2001, Lyon2, characteris, Marchand multidimensionnelle Nantes. 2003. Francophones P., SOLAP, 2001, d'extraction Geomatica, Towards données better 2001. de complexes, support Gestion for des EDIIS spatial Connaissances décisionnels, DEA decision- ECD, - Annexe: Zghal Vassiliadis Teste and Record O., H., Generation, Elaboration Faiz 28(4): P., S., Sellis 64-69, Ben DMDW d'entrepôts T., Ghézala 1999. A 2003. Survey H., de données CASME: Logical complexes, A CASE Models Tool INFORSID for for OLAP Spatial - mai Databases, 2000, Marts Lyon. SIGMOD Design que la couvre données. base Le techniques CWM des le Le cycle échanges CWM Common est comprend qui de le sont définit standard vie de méta-données complet actuellement plus un Warehouse de métamodèle souvent l OMG de modélisation, entre un pour trouvées qui certain systèmes les Metamodel représente techniques dans nombre construction hétérogènes. les entrepôts liées méta-données (CWM) méta-modèles aux et gestion entrepôts données. aussi des concernant de Il entrepôts bien est données. utilisé métiers Il à Summary processus métamodèles et entrepôts bases data-mining. permettent de standard, de pour données les Une la de journalisation (représentation transformations modéliser couche orientées de des objets. gestion ressources des la planification données, Une est constituée comme couche OLAP, analyse, des les d analyse activités. la bases gestion). métamodèles visualisation, de du Les CWM métamodèles la représentant relationnelles, nomenclature définit des les data, (OLAP). a and Medicine). The modelling applying main Although purpose them forms these onto of heterogeneous basic data techniques warehouses issue in data and very is warehousing complex to efficient support data when decision-making. and imported On-Line working from Analytical different Multidimensional also very This challenging paper aims task. at addressing the issue of multidimensionally modelling simple complex Processing medical more precisely We propose medical an extended data from the MAP project metamodel (Personalized that is applied Anticipative numerical sources data, onto is 12 Keywords: present data a warehouses. by software Data generalizing warehouse tool that the modelling, we complex have developed cardiovascular multidimensional to achieve model model, the of computer-aided the OLAP, MAP complex warehouse. design data. We of