Lama EL SARRAJ *********************************************

Dimension: px
Commencer à balayer dès la page:

Download "Lama EL SARRAJ *********************************************"

Transcription

1 -MARSEILLE Ecole Doctorale Mathématique et Informatique N 184 Faculté Des Sciences et Techniques de Saint-Jérôme Laboratoire : Laboratoire des Sciences de L'information et des Systèmes (LSIS) UMR CNRS 7296 THESE DE DOCTORAT Discipline : Informatique Lama EL SARRAJ ********************************************* GUIDEE PAR DES ONTOLOGIES : APPLICATION AU MANAGEMENT HOSPITALIER ********************************************* Composition du jury : M. Gilles ZURFLUH Rapporteur Professeur, Université Toulouse 1 M. Omar BOUSSAID Rapporteur Professeur, Université Lyon 2 M. Bernard GUISIANO Examinateur Docteur en médecine, APHM Mme Christine VERDIER Examinatrice Professeur, Université de Grenoble M. Ladjel BELLATRECHE Examinateur Professeur, Université de Poitier Mme Sophie RODIER Examinatrice MCF, Université Blaise Pascale M. Bernard ESPINASSE Directeur de thèse Professeur, Aix-Marseille Université Mme Thérèse LIBOUREL Co-directrice de thèse Université Montpellier 2 1

2 Cette recherche a été financièrement supportée par un contrat à durée déterminée de du «et de Recherche en Informatique : Collaboration entre Laboratoires et Etablissement de Santé (PERICLES)». 2

3

4 Résumé ation de hospitalière, dans le cadre de la nouvelle gouvernance, et en se limitant au périmètre du Programme de Médicalisation des Systèmes d'information (PMSI). Cette recherche a été cette approche, nommé Ontologies- Connaissances (BC) exploitée par un moteur de personnalisation. La BC est composée des trois ontologies ntenant la en une recommandation de ressources complémentaires basée sur une expansion de la ressource considérée selon trois stratégies possibles. Afin de valider nos propositions, un prototype du système OPS a été développé avec un moteur de personnalisation a été implémenté en Java et exploitant une base de connaissance constituée des trois ontologies en OWL interconnectées. Nous illustrons le Mots- clés: Entrepôt de données, ontologie, base de connaissance, personnalisation, profil utilisateur, management hospitalier, PMSI. 4

5 Abstract This research is situated in the domain of Data Warehouses (DW) personalization and concerns DW assistance. Specifically, we are interested in assisting a user during an online analysis processes to use existing operational resources. The application of this research concerns hospital management, for hospitals governance, and is limited to the scope of the Program of Medicalization of Information Systems (PMSI). This research was supported by the Public Hospitals of Marseille (APHM). Our proposal is a semantic approach based on ontologies. The support system implementing this approach, called Ontology- based Personalization System (OPS), is based on a knowledge base operated by a personalization engine. The knowledge base is composed of three ontologies: a domain ontology, an ontology of the DW structure, and an ontology of resources. The personalization engine allows firstly, a personalized search of resources of the DW based on users profile, and secondly for a particular resource, an expansion of the research by recommending new resources based on the context of the resource. To recommend new resources, we have proposed three possible strategies. To validate our proposal, a prototype of the OPS system was developed, a personalization engine has been implemented in Java. This engine exploit an OWL knowledge composed of three interconnected OWL ontologies. We illustrate three experimental scenarios related to PMSI and defined with APHM domain experts. Keywords: Data Warehouse, ontology, knowledge base, personalization, user profile, hospital management, PMSI. 5

6 Remerciements 6

7

8 Préambule Nous souhaitons, en guise de préambule, présenter l'ossature de ce manuscrit. Une introduction générale présente le contexte institutionnel dans lequel les recherches se sont déroulées et définit les objectifs fixés dans le cadre de ce contexte. Par la suite, nous nous sommes efforcés présenter nos travaux dans un mémoire structuré comportant plusieurs parties : La première partie expose les spécificités du domaine hospitalier et comporte deux chapitres : Management hospitalier. Entrepôts de données pour le management hospitalier. La deuxième partie tants corrélés à nos objectifs et comporte trois chapitres : Conception des entrepôts de données : analyse des besoins et modèles. La personnalisation dans les EDs.. La troisième partie est dédiée à notre proposition et comporte quatre chapitres : Vers un système ED guidée par des ontologies. Une base de connaissances pour la personnalisation. ED de santé.. La quatrième partie est dédiée à la conclusion aux perspectives liées à cette recherche. 8

9 Introduction générale Contexte institutionnel Problématique et verrous scientifiques Contribution Organisation du manuscrit Première partie Chapitre 1 : Management hospitalier Introduction Nouvelle gouvernance Du PMSI à la T2A Vers de nouvelles méthodes de management

10 6 Conclusion Chapitre 2 : ED pour le management des établissements de santé Introduction Extraction, Transformation, Loading (Chargement) (ETL) Administration ED pour les Etablissements de Santé (EDS) Conclusion Deuxième partie Chapitre 3 : La conception des entrepôts de données Introduction Les démarches

11 4.1.1 Modèle standard Modèles de buts Modèles de requêtes Modèles structuré Synthèse sur la conception des EDs de santé Conclusion Chapitre 4 : La personnalisation dans les EDs Introduction La personnalisation dans les EDs Approches de personnalisation dans les EDs Synthèse sur la personnalisation des EDs Conclusion Chapitre 5 : Introduction Définition des ontologies Les ontologies Linguistique (OL) Les ontologies Conceptuelles (OC) Construction des ontologies Méthode de Gruninger et Fox (TOVE) Méthode METHONTOLOGY Méthode OntoClean Méthode Unified Process for ONtologie Building (UPON)

12 4 Conclusion Troisième partie Chapitre 6 : ontologies Introduction Architecture générale du système de personnalisation proposée Personnalisation de la recherche des ressources Description sémantique Recommandation de ressources Les acteurs impliqués par le système de personnalisation Conclusion Chapitre 7 : Introduction Considérations méthodologiques Ontologie de domaine Niveau 1 : PMSI règlementaire Niveau 2 : PMSI extra- règlementaire Niveau 3 : extra- PMSI : travail préliminaire

13 5 Ontologie des ressources Interconnexion des ontologies Conclusion Chapitre 8 : M Introduction Cadre général de la personnalisation Recherche personnalisée des ressources Définition générale du profil Profil pour la personnalisation Gestion de la Confidentialité Les techniques basées sur les correspondances syntaxiques Les techniques basées- raisonnement Distance de Jaro- Winkler Matching (mise en correspondance) Ranking (Tri du résultat)

14 4 Recommandation de ressources complémantaires Définition des concepts reliés au CA Conclusion Chapitre 9 : Introduction Choix techniques Architecture logicielle du système Scenario 1 : Profil chef de Pôle Obstétrique, Reproduction et Gynécologie Scenario 2 : Profil agent de la Direction des Affaires Financières (DAF) Scenario 3 : Profil pharmacien Conclusion Conclusion générale Bilan de la contribution Perspectives Liste des publications Bibliographie

15

16 Figure 1 : Structure de l'hôpital (formalisme UML) Figure 2 : Du RUM au GHS Figure 3 : Système d'information Figure 4 : Analyse par les structures Figure 5 : Analyse par les fonctions Figure 6 : Interface de communication Figure 7. Architecture d'un SID Figure 8: Exemple de cube de données Figure 9 : Exemple cube de données avec hiérarchies Figure 10: Aide à la construction de tableaux de bords (GMSIH 2006) Figure 11: Exemple tableau de bord opérationnels (GMSIH 2006) Figure 12 : Personnalisation de la visualisation des requêtes OLAP (Bellatreche, Giacometti et al. 2005) Figure 13 : Modèle en oignon (Pierra 2003) Figure 14 : Les étapes du cycle de vie des ontologies Figure 15 : Objectifs visés Figure 16: Architecture du système de personnalisation basé sur les ontologies Figure 17 : Vue globale : Recommandation à base sémantique des ressources Figure 18 : Acteurs participant à la création de la BC Figure 20 : Construction des ontologies Figure 21: 3 niveaux de l'ontologie de domaine Figure 22 : Modèle PMSI niveau Figure 23 : Codage des maladies dans les différents pays (Nakache 2007) Figure 25 : Ex Figure 26 : Modèle conceptuel de l'ed autour du PMSI Figure 27 : Concepts de l'ontologie de l'entrepôt de données avec Protégé Figure 28 : Extrait de l'ontologie de l'ed, de la table des faits aux dimensions (Protégé) Figure 30 : Extrait du schéma de l'ed en UML avec OWLGred Figure 31 : Extrait du schéma de l'ed avec Protégé/OntoGraf Figure 32: Tableau multidimensionnel Figure 33. Modèle de l'ontologie des ressources R avec Protégé/OntoGraf

17 Figure 35 : Les liaisons entre ontologies Figure 36 : Fichier de paramétrage de mapping sous format XSD Figure 37 : Extrait du fichier de paramétrage des liens, XML Figure 38 : Cadre général de la personnalisation Figure 39 : Contenu de la section Figure 40 : Schématisation du processus de personnalisation des résultats dans la recherche de ressources Figure 41 : Profil utilisateur et les concepts de la BC Figure 42 : Ressource candidate dans la BC Figure 43 : Schématisation du processus de matching au nombre de concepts par ressource candidate Figure 44 : Contenu de la section résultat Figure 46 : Recouvrement entre les trois ressources (R1, R2 et R3) Figure 47 : Représentation graphique d'un CA Figure 48 : Exemple d'arbre de CA (A) et une ressource d'analyse (B) Figure 49 : Architecture du système Figure 50 : Fonctionnalité du système (use case) Figure 51 : Profil utilisateur : définition des intérêts récurrents Figure 52 : Profil utilisateur : choix d'une catégorie de recommandation Tableau 1. OLTP vs OLAP Tableau 2 : ETL/ Données sources et données cibles Tableau 3 : Description des sources de données PMSI (Serna Encinas 2005) Tableau 4 : Tableau de synthèse ED de santé du domaine de la recherche Tableau 5 : Comparaison des démarches de conception d'un ED Tableau 6 : Synthèse "Approche globale" Tableau 7 : Synthèse "Algorithme" Tableau 8 : Synthèse méthode de construction d'ontologie Tableau 9 : Comparaisons des outils de construction d'ontologies Tableau 11. Synthèse «notre proposition»

18 1 Contexte institutionnel Nos travaux de recherche se situent dans le cadre du «Recherche en Informatique : Collaboration entre Laboratoires et Etablissement de Santé (PERICLES)». PERICLES est une convention- cadre de partenariat inter- établissements en informatique, système La préoccupation de PERICLES. Cette collaboration a pour objectif de travailler sur des problématiques communes aux établissements de santé. Cinq groupes de travail ont été créés : - GT1 : Circuit du médicament - - GT3 : Plateau médico- technique - GT4 : Filières de soins et réseaux de soins - GT5 : Logistique Nos travaux de recherche Publique des Hôpitaux de Marseille (APHM), plus précisément de sa direction aide à la décision interne des établissements de santé appliquée dans le cadre du Programme de médicalisation des 1 regroupe quatre sites hospitaliers (Centre hospitalier de la Timone, Hôpital Nord, Hôpital de la conception et Hôpital Sud). Elle représente le plus important centre hospitalier de la région Provence - Alpes - Côte d'azur 000 salariés et 1 interventions, consultations, personnes reçues aux urgences, naissances, un budget de 1,2 milliard Le mode financement des établissements de santé a évolué avec les années, depuis 2005, il est basé sur la Tarification T2A. Le PMSI est un dispositif qui permet de quantifier et de normaliser les données sur l'activité des établissements de santé. Ses données sont utilisées pour financer les établissements de santé en fonction de leur activité. Le changement du système de financement nécessite une adaptation des établissements de santé surtout au niveau du système de pilotage., plus que jamais, s provenant de domaines 1 hm.fr/ 18

19 d'analyser et de synthétiser les données selon différentes perspectives. Généralement un collection» et des applications permettant d'analyser, de requêter et de visualiser un volume massif de données stockées dans Entrepôt de Données (ED). er deux types recherche. Le but du travail de recherche est de développer un système axé sur les ontologies pour Préalablement, afin de déterminer le cahier de charge à satisfaire, nous avons réalisé une es utilisateurs par divers moyens 2 a consisté à mettre en place une prendre en compte pour mettre en place cet ED autour du PMSI. De plus, nous avons participé à la centralisation des données reliées a existant. autour du PMSI qui a été valid proposé une ontologie de domaine du PMSI et une méthode de personnalisation et de s 2 Problématique et verrous scientifiques Les EDs sont nés grandes inst utilisateurs finaux provenant de «backgrounds» différents. En effet, le problème la santé. Dans notre contexte, il existe environ agents de statut différent (ingénieurs, chefs de services, chefs de pôles, chercheurs scientifiques, etc.) et provenant de domaines différents (ex. médecins, pharmaciens, informaticiens, radiologues,

20 généticiens, etc.). Au- delà du problème de manque de sémantique, une assistance à Manque de sémantique Dans les grandes institutions, les utilisateurs ont généralement des backgrounds différents. La signification des données, est influencée par leurs backgrounds. Par exemple, dans le domaine du PMSI, le nombre de Résumé Standard de Séjour (RSS) signifie le nombre de séjours ne peuvent pas interpréter «nombre de RSS» sans des connaissances supplémentaires. De plus, dans le domaine des bases de données, les données sources sont «restructurées et orientées sujet etrouve plus ses propres marques et il est dans un du «nombre de RSS s, il ne pourra pas comprendre «nombre de RSS» sans connaissances explicatives. En conséquence, il a besoin de connaissances «sémantiques» supplémentaires (définition, unité de mesure, etc.) pour comprendre les éléments composant la ressource et pouvoir ppropriée. ens confronté à un choix massif de ressources, les utilisateurs ont besoin de trouver les parmi les ressources existantes, celles qui répondent à leurs besoins ou celles qui sont susceptibles de les intéresser pour compléter leur analyse. La restriction du résultat massif aux données les plus pertinentes reste un grand défi. Les verrous scientifiques, auquel nous nous intéressons, peuvent se résumer dans les questions suivantes : - dans un contexte donné? - données pour des utilisateurs de backgrounds différents? - analyse? 3 Contribution s contributions se résument en quatre points : (i) Elaboration de Connaissances (BC) cristallisée autour de 20

21 trois ontologies ED basée sur une BC, (iii) personnalisation des ressources et (iv) recommandation de ressources en exploitant la BC basée sur les ontologies. Une base de connaissance : basée sur les concepts principaux : (a) de domaine, (b) de la Ainsi, cette BC, basée sur les ontologies, permet de relier les divers concepts des trois catégories par des relations sémantiques. Environnement de description : les ressources avec des éléments de description de celles- ci et des connexions avec les des ressources et (b) comprendre les ressources. Environnement de personnalisation : basé sur le besoin, le profil utilisateur et les concepts de la BC. Cette approche permet de fournir les ressources personnalisées. Environnement de recommandation : resser. 4 Organisation du manuscrit La première partie de notre manuscrit, est composée des chapitres 1 et 2, et présente le contexte de notre travail. Cette partie est consacrée à la présentation de la problématique aide au pilotage pour le management hospitalier. Avant de présenter les travaux autour du SID pour le management hospitalier, nous allons introduire. La les travaux autours des EDs, centre du SID. Nous allons décrire comment les ontologies sont mises au service des EDs. Puis, nous présenterons ionner La troisième partie, constituée des chapitres 6, 7,8 et 9, est dédiée à notre proposition. Le chapitre 6 présente une vue globale du système. Dans le chapitre 7 sont explicitées les trois ontologies, principaux composants de notre système. Dans le chapitre 8, nous mis en place par ce système. Le chapitre 9, concerne le prototype réalisé ainsi que quelques scenarii de validation. Enfin, la dernière partie, conclut ce manuscrit. Fait le bilan de cette recherche et présente les perspectives de recherche envisageables. 21

22 22

23

24 Chapitre 1 : Résumé. Dans ce chapitre, nous présentons le contexte hospitalier de notre travail qui concerne le management hospitalier, spécifiquement le pilotage des établissements de santé. Nous présentons la nouvelle gouvernance et le nouveau mode de financement qui ont eu un impact majeur sur le management hospitalier. Sommaire 1 Introduction Nouvelle gouvernance Gouvernance externe des établissements de santé Agences Régionales de Santé (ARS) Le projet régional de santé Gouvernance interne des établissements de santé Structure des établissements de santé Du PMSI à la T2A Le PMSI La T2A Les Fichiers PMSI : du RUM au GHS Codage des actes et des diagnostics dans le PMSI Contrôle des données du PMSI Vers de nouvelles méthodes de management Au niveau stratégique Au niveau économique Au niveau opérationnel Direction des systèmes Conclusion

25 25 1 Introduction Depuis plusieurs années le système hospitalier public est en pleine réforme, principalement, afin de contenir les dépenses de santé sans cesse croissantes. Le 31 décembre 2006, tous les établissements publics de santé ont intégré la nouvelle réforme hospitalière et sa nouvelle gouvernance. La nouvelle gouvernance est caractérisée par trois mutations principales : (i) la transformation du système de pilotage stratégique ation du conseil exécutif), (ii) la transformation du système de financem la externe (ex. remplacement des agences régionales hospitalières par les agences régionales de santé). Ce chapitre, présente le contexte dans lequel nos travaux de recherche ont été effectués : 1, nous nous organisationnelle des établissements hospitaliers, avec leurs évolutions respectives. Dans la section 2, nous présentons la nouvelle gouvernance des établissements de santé, externe dans la section 2.1 et interne dans la section 2.2. Ensuite, nous décrivons dans la section 2.3 la structure actuelle des établissements de santé. Puis, dans la section 3 nous plus particulièrement sur son évolution récente notamment liée au Programme de ainsi que sur les nouvelles méthodes de gestion que ces évolutions doivent entraîner. Dans la section 4, nous présentons les nouvelles méthodes de gestion, les systèmes. La section 5 décrit le Système nformation Hospitalier (SIH). Enfin nous concluons, sur les limitations du SIH à supporter un pilotage tenant compte de ces nouvelles méthodes de gestion. En conséquence, nous discutons le besoin de développer de nouveaux outils informationnels complémentaires liés aux entrepôts de données et à leur exploitation. 2 Nouvelle gouvernance La nouvelle gouvernance a introduit des évolutions majeures sur le système de pilotage gestion e de ôles 2.1 Gouvernance externe des établissements de santé Les établissements de santé sont reliés au ministère de la Santé, aux établissements publics de santé et aux établissements de service public sous tutelles. Les établissements de santé sont soumis en permanence aux contrôles (des règles de santé, de l'assurance maladie, et de l'agence de la biomédecine), inspections et mise sous administration

26 provisoire de la part de l'inspection générale des Affaires sociales, de la chambre régionale mise en place de La mise en place des agences régionales relève de l'initiative du pouvoir public pour le pilotage régional aux larges compétences. En 2009, les ARS ont remplacé les ARH. A la différence des ARH, qui étaient des Groupements d'intérêt Public (GIP) associant l'etat et des organismes d'assurance maladie, les ARS auront le statut d'établissements publics de l'etat, placés sous la tutelle conjointe des ministres chargés de la santé, de l'assurance- maladie, des personnes âgées et des personnes handicapées Agences Régionales de Santé (ARS) atients, à la santé et aux territoires, crée, dans son article 118, les ARS qui sont les piliers de la réforme du système de santé. Les ARS ont vocation à regrouper les compétences exercées par sept structures différentes : - Les ARH, créées en 1996 et associant les services de l'etat et l'assurance- maladie. - Les directions départementales et régionales de l'action sanitaire et sociale. - Les Groupements Régionaux de Santé Publique (GRSP), institués par la loi du 9 août 2004 pour piloter les actions de santé publique. - - Maladie (URCAM), créées en Les Caisses Régionales d'assurance- Maladie (CRAM). - Les missions régionales de santé créées en 2004 pour exercer les compétences communes aux ARH et aux URCAM. Les AR une politique régionale de santé de la nation en respectant les autres agences sanitaires et collectivités territoriales et de tenir AM 3 est le montant prévisionnel établi annuellement pour les dépenses de 3 sociale.fr/chaque- annee- le- parlement- vote- l- objectif- national- des- depenses- d- assurance- maladie- ONDAM 26

27 27 de réduire les inégalités territoriales en santé ; Assurer un meilleur accès aux soins pour tous en permanence ; Garantir une efficacité des dépenses de santé en suivant une politique de prévention ; Assurer une meilleure coordination entre professionnels de santé pour mieux organiser le parcours de soins en fonction de chaque patient Le projet régional de santé années (article L ainsi que d médico- sociaux. s égion, de la Conférence Régionale de santé aux besoins et à la spécificité de chaque territoire, simplifier le système de santé et réunir au niveau de la région la force de l'etat e 2.2 Gouvernance interne des établissements de santé La nouvelle gouvernance a modifié la répartition des responsabilités dans redistribué les décisions selon la nouvelle structure (Debonnets 2007). «La loi Hôpital Patient Santé Territoire (HPST) se traduit par une volonté de mieux identifier les rôles des différents acteurs hospitaliers et de simplifier les circuits de décision.» (Ministère du travail de l'emploi et de la santé (secteur santé) 2011). Vers une nouvelle répartition des compétences Cela se traduit par la mise en place d conseil de surveillance, du directoire et du un regroupement de structures pour la modernisation de la gestion interne de (contrats des pôles). La nouvelle répartition des compétences au niveau hiérarchique se fait à plusieurs niveaux : - Le conseil de surveillance a un rôle décisionnel. Il délibère sur le projet Il a aussi un rôle c la sécurité des soins et de la gestion du risque et le règlement intérieur. - Le Directeur préside le Directoire, nommé pour les CHU par décret. Il prend des décisions et oriente la stratégie des établissements. Il élabore le projet médical. Il gère après concertation du directoire la qualité, la sécurité des soins, la gestion du

28 qui conclut avec la tutelle. - Le Directoire est présidé par le directeur, le vice- président est le président de la CME), il prépare le projet de directeur dans la adopté par le conseil de surveillance. - Le président de la CME est le coordonnateur médical, avec le directeur. Il ssement. Il élabore le projet continue de la qualité. Il propose au directeur les candidats qui pourront remplir les fonctions de chef de pôle. La CME joue un rôle consultatif sans le pouvoir de prendre des décisions. Elle se recentre sur la qualité médicale (Debonnets 2007), proj - Le chef de pôle est consulté pour les principales décisions. Il adopte le projet médical et il se charge de la cohérence des projets de pôle. - Le responsable de la structure interne est consulté pour les principales décisions. 2.3 Structure des établissements de santé Historiquement, l'activité des soins est organisée en service. Un service est composé d'une ou de plusieurs unités fonctionnelles. L'Unité Fonctionnelle (UF) est la plus petite entité de l'hôpital, caractérisée par une activité médicale et une gestion homogène. L'UF peut regrouper un à plusieurs lits. Elle est la plus petite unité compatible avec les contraintes de gestion et d'activité médicale homogène. La réforme budgétaire, instituée par le décret du 11 aout 1983, relative au budget global se voulait double (Lachèze- Pasquet and Stringre 1999), d'une part, elle mettait en place un nouveau financement des hôpitaux avec la dotation globale, d'autre part, elle visait à une évolution complète du mode de gestion interne avec la création des centres de responsabilité et avec la réalisation d'une gestion participative impliquant les chefs de service. Ce nouveau mode de gestion permet de réaliser des objectifs stratégiques, transversaux et de maîtriser les coûts de production et de dépenses budgétaires. Depuis, les services auraient pu être regroupés dans une entité plus large appelée département. Mais ces motivations politiques ont été fortement contestées par les médecins qui ont rejeté toute restructuration interne de l'établissement. La loi 31 juillet 1991, confirme les services comme norme d'organisation et introduit la notion de «fédérations» qui est un nouvel échelon de regroupement des UF, services ou départements, selon l'un ou plusieurs critères suivants : - Un rapprochement d'activité médicale. - Une gestion commune des lits ou d'équipements. - Un regroupement des moyens personnels. 28

29 P La loi du 2 mai 2005 maintient le concept des services, supprime le - médico- économiques par le directeur et le chef de pôle après concertation du directoire. Le projet de pôle délégations de signature, les relations entre les pôles, etc. ainsi que les objectifs en matière est de Unité Médicale (UM) répond à un découpage administratif. Unités fonctionnelles (UF) Une UF est la plus petite entité de l'hôpital. Les UF cliniques regroupent généralement un ou plusieurs lits. es. Une entité juridique est Figure 1, présente le modèle conceptuel de la structure de 1..* Unite_fonctionnelle 1..* 1..* 1 Pôle 1 Service Unite_medicale 1 1..* 1..* Etablissement_de_santé 1 1..* 1 1 Entite_juridique Figure 1 : Structure de l'hôpital (formalisme UML). 29

30 30 Conclusion Dans cette section, nous avons présenté, les changements managériaux majeurs dans les établissements de santé Français, aux niveaux interne et externe. Ces changements sont t la tarification à traité dans la section suivante. 3 Du PMSI à la T2A La nouvelle réforme hospitalière int le financement des établissements de santé par «dotation globale». La T2A permet de Programme de Médicalis 3.1 Le PMSI Le PMSI relève d'une démarche du ministère de santé datée de juin Le modèle du PMSI est une adoption et adaptation française du concept américain créé par Robert ersité de Yale aux Etats- Unis). En 1982, Le PMSI a été introduit en France par Jean de Kervasdoué (responsable de la direction des hôpitaux). Le PMSI permet de recueillir des informations à partir du dossier médical des patients. Au ait pas des objectifs économiques clairement affichés, (comme aux Etats- Unis) La loi de la réforme hospitalière du 31 juillet 1991 introduit le projet d'établissement. Les établissements de santé doivent définir leurs objectifs dans le domaine médical, social, de formation, de gestion et de systèmes d'information. En effet, les établissements doivent «tamment des pathologies et des modes de prise en charge en vue d'améliorer la connaissance et l'évaluation de l'activité et des coûts et de favoriser l'optimisation de l'offre de soins» J.O. du 2 août 1991 (article L.710-5, p ). Le PMSI est devenu une obligation légale pour les établissements publics hospitaliers de plus de 100 lits, et depuis le premier janvier 1997 activité. 3.2 La T2A La Loi n du 18 décembre 2003 (articles 22 à 34) a changé la modalité du 2005 mettent en place la T2A. La T2A est un élément principal de la «nouvelle gouvernance augmenté progressivement et remplacé le financement à «dotation globale». En 2004, elle représentait 10 % du budget des hôpitaux, 25% en 2005, 35% en 2006, 50% en 2007,

31 3.3 Les Fichiers PMSI : du RUM au GHS En principe, pour calculer la T2A, la première étape qui amène à la tarification, débute renseigne tous les items présents pour le PMSI. Le codage concerne deux types la T2A. deux parties : une partie administrative (ex. identité du patient, date de naissance, etc.), et une partie médicale. Le Résumé de Sortie Standardisé (RSS) Pour les séjours dans une même unité médicale un RSS équivaut à un RUM, par contre si un patient fréquente plusieurs unités médicales lors de la même hospitalisation, le RSS RSS. Le Résumé de Sortie Anonyme (RSA) ent être rendues anonymes. Une fois anonymisé le RSS devient RSA. Le Groupe Homogène de Malades (GHM) Le GHM regroupe les RSA homogènes aux niveaux médico- économiques. Pour aboutir à la facturation. Groupe Homogène de Séjours (GHS) Le GHM est converti en hôpitaux, a causé des pertes importantes pour plusieurs établissements. En résumé, lorsque le RUM est codé, les étapes présentées dans la Figure 2 s automatiquement pour donner lieu à un tarif par séjour. 31

32 Figure 2 : Du RUM au GHS. 3.4 Codage des actes et des diagnostics dans le PMSI Les fichiers PMSI sont standards et codés. Les diagnostics, sont codés à partir de la (OMS). En 1996, le code des diagnostics est passé de la version 9, à quatre chiffres, à la version 10 (CIM 10), avec une lettre et trois chiffres. Les actes sont codés avec la Classification Commune des Actes Médicaux (CCAM). Depuis la mise en place de la T2A, le CCAM remplace le Catalogue des Actes Médicaux (CdAM) qui était utilisé depuis Le rôle concerne surtout la qualité de codage. 3.5 Contrôle des données du PMSI Pour garantir la qualité du codage, les données du PMSI sont contrôlées en permanence. Les contrôles internes des éléments de la T2A sont réalisés par le Service ou le Information Médicale (SIM ou DIM). Le SIM ou DIM qui organise le recueil, la circulation et le traitement des données médicales, a un rôle prévu par les articles R à R du code de la santé publique. Les contrôles externes des éléments de la T2A sont contrôlés régulièrement par la Caisse Conclusion Ces changements, liés aux nouveaux modes de gouvernance et de financement, valuation et la prévoyance. 4 Vers de nouvelles méthodes de management Ces changements, liés aux nouveaux modes de gouvernance et de financement, 32

33 Groupement pour la Modernisation du Système d'information Hospitalier (GMSIH) 4, santé et médico- sociaux (ANAP) présente les outils et les méthodes de pilotage existants et leur déclinaison dans le domaine hospitalier. Les décisions hospitalières sont structurées selon trois niveaux hiérarchiques : stratégique, économique et opérationnel (GMSIH 2005). Dans les établissements de santé, les changements liés aux nouveaux modes de gouvernance et de financement nécessitent la mis traditionnel se projetait sur une durée «court terme» et se contentait de mesurer et de contrôler des actions actuelles ou anciennes. Pour être plus concurrentiel, les entreprises modernes ont mis en place un nouveau système de management stratégique basé sur de santé mais à la différence des entreprises industrielles, les établissements santé ne se limitent pas à la performance économique mais à leur capacité de répondre aux besoins organisationnelle. Plusieurs chercheurs ont travaillé sur les problématiques de management hospitalier (GMSIH 2005). En résumé, ils ont pu appliquer des méthodes de gestion déjà connues - sections suivantes seront présentés les outils et les méthodes de pilotage existants et leur déclinaison dans le domaine hospitalier. 4.1 Au niveau stratégique Avec le financement par allocation budgétaire les établissements de santé se projetaient sur une durée «court terme» et se contentaient de mesurer et de contrôler des actions é de financement, il est nécessaire de mettre en place un nouveau système de management stratégique basé sur Dans ce contexte, le Balanced- Scorecard (BSC) ou «tableau de bord prospectif» est la méthode de pilotage stratégique la plus répandue. Cette méthode créée dans les années 90 par Kaplan et Norton (Kaplan and Norton 1996), a remis en question les systèmes traditionnels de management, a permis de faciliter la communication du projet et de la projection dans le futur. uestion les 4 Le GMSIH, des établissements de santé publics et privés dans le domaine des systèmes d'information. Le groupement a publié des référentiels et a accompagné les établissements pour permettre la mise en place opérationnelle de ces derniers. 33

34 systèmes traditionnels de management. Le BSC repose sur une démarche stratégique top- down qui peut être adaptée aux établissements de santé à condition de la transformer en re la mise en cause à effet» de sa stratégie à la communication entre les équipes en se basant sur un ensem Selon (Haouet and Nobre 2011) et le groupe (GMSIH 2005) le pilotage des établissements de santé devrait relever de «balanced scorecard» ou «tableaux de bord prospectifs» déjà évoqués et proposé par Kaplan et Norton. 4.2 Au niveau économique La mise en place de la T2A a changé la modalité de financement des établissements de. Mais, au niveau économique le domaine hospitalier est différent des entreprises et des industries. Actvity Based Costing (ABM)/ Activity Based Management (ABM) (Leignel 2004) est une hospitalier anglo- saxon. Selon (Nobre and Biron 2002) la notion de coût complet et les apports de la méthodologie ABC/ABM peuvent être envisageables dans un contexte hospitalier français mais en remplaçant la base économique par la performance. Cette er la logique du calcul des coûts ressources par activité. Ce qui est important dans un établissement de santé pour la mise 4.3 Au niveau opérationnel Les objectifs principaux de la nouvelle gouvernance de 2007 sont de favoriser la communication entre les différents membres (corps médical, personnels soignants et agents administratifs). (Nobre 2000) favorise la coordination interne. Le groupe (GMSIH 2005) p tableaux de bord opérationnels au niveau des services/centres de responsabilités. La construction de ces tableaux de bord est destinée non seulement à la direction générale mais aussi aux responsables et chefs de services. Ces tableaux de bords se basent sur : financière, apprentissage organisationnel, patient et processus. (Remoleur 2005) présente les outils du pilotage de performance (indicateurs, tableaux de bord etc.) en insistant sur le fait que les tableaux de bord doivent être évolutifs responsables dans leur prise de décision et permettre aux établissement de santé de tion. 34

35 différents acteurs et services ce qui favorise la coordination interne. Ces tableaux de bord pourraient assister les responsables dans leur prise de décision et suivre leur Conclusion Les évolutions majeures, de ces dernières années, concernant la gouvernance et le financement des hôpitaux, nécessitent un nouveau système de pilotage rigoureux des structures hospitalières. On a pu constater que les méthodes de pilotage appliquées dans la performance économique mais à leur capacité à répondre aux besoins de santé, à sser par un SID spécifique mettant à la disposition des utilisateurs des outils et des méthodes France, élaborés à partir du PMSI, de tels systèmes doivent nécessairement reposer sur formation sont abordés dans la section suivante. 5 établissements de santé dans la gestion des établissements de santé. Nous présentons dans cette section les ou même SSPIM 5 pelé DSI, DSIO 6, DIR 7 etc.) associés 5.1 moyens de stockage des «dossiers papiers à transporter et difficilement partageables dans le domaine hospitalier a permis de gérer, 5 le (SSPIM)

36 s activités cliniques). (ANAP) considère que «Le système d'information (SI) d'un établissement lui permet de à son fonctionnement et à son pilotage. C'est l'ensemble du système de traitement de données, qui relève des technologies de l'information et de la communication, les opérations qui l'utilisent relèvent de l'organisation, au service des activités de l'établissement. La construction et l'évolution du SI ont pour objectifs principaux l'optimisation et l'aide à la décision à tous les niveaux de l'établissement.» La plupart du temps le terme «procédés informatiques, mais dans certain cas, le terme ture (G.NISAND) les établissements de santé. On peut distinguer dans les établissements de santé plusieurs (Degoulet 2001), cf. Figure 3 : - Le système d'information de Santé le système d'information global, regroupant tous les types d'acteurs et ressources de santé (médecin de ville, patients, autres hôpitaux etc.)». - (SIH) «un système informatique permettant de facilité la gestion, il contient des informations cohérentes et intégrées pour faciliter la gestion de l'ensemble des informations médicales et administratives d'un établissement de santé». - (ex. st : «traiter et fournir les informations nécessaires à son activité (services administratifs, services de soins etc.)». Autres hôpitaux Système d'information Hospitalier (SIH) Médecins de ville Patients Assurances Services médicals (Plateaux technique, Autres unités de soins) Services administratifs Système de gestion de l'unité de soins Médecins Personnel administratif Personnel soignant Figure 3 : Système d'information. Dans ce travail de recherche nous nous intéressons particulièrement aux SIH. 36

37 5.2 Nous nous situons dans le cadre de gestion des SIH. Dans cette partie nous détaillons le SIH. Le SIH recouvre deux domaines principaux : le médical relatif à la gestion de la bureautique médicale, à celle des laboratoires, des médicaments, aide au diagnostic, à la production des résumés et groupements reliés au PMSI, aux statistiques, à la recherche et enseignement médical, etc. ; et le système qui concerne la gestion de la bureautique administrative, gestion de la comptabilité, gestion des ressources humaines, etc. et le systèm peuvent représente une vision édical représente Objectif des SIH objectifs principaux (Kohler 2004) qualités des soins et la maîtrise des coûts. sances. La maitrise des coûts en traitant la réduction des durées de séjour, la réduction des tâches administratives et la vant figurer dans le SIH. structures (logistique et de soins) présenté dans la Figure 4 (hôpital et patient) présenté dans la Figure 5, (Fabbe- Costes and Romeyer 2004, Kohler 2004). 37

38 Logistiques Analyse par les structures Soins Services administratifs (Direction générale et fonctionnelle, services économiques, personnel) Services de traitement de (archives, informatique, statistiques et évaluations, communications et risques, sécurité, qualité) Services logistiques (restauration, blanchisserie, brancardage, entretien etc.) Unités de soins (consultation, services médicaux, services chirurgicaux, etc.) Unités médicotechniques (radiologie, imagerie, biochimie, endoscopie etc.) Pharmacie Figure 4 : Analyse par les structures. Anlayse par les fonctions Hôpital Patient Gestion des ressources (financières, personnels, matériels, lits, rendezvous, approvisionn Evaluation et planification des soins, épidémiologie hospitalière, recherche clinique) Gestion de (environnement du SIH, gestion des archives, accès aux banques Gestion médicoadministratif (identification, admissions, transfert, Gestion médicale et soignante (diagnostique, thérapeutique, pronostique, surveillance) Gestion du dossier patient Figure 5 : Analyse par les fonctions. : - Informatiser certaines informations. - Informatiser tout, communiquer partiellement. - Informatiser tout et tout communiquer. sera de tout informatiser et de tout communiquer en se basant sur une méthode de gestion adaptée, Figure 6. 38

39 Admission - Facturation Laboratoire Pharmacie Ressources humaines Radiologie Blocs opératoires Interface Interface de de communicat communication ion Dossier médical de spécialité Dossier médical commun Dossier infirmier Dossier administratif patient Figure 6 : Interface de communication. activité hospitalière qui peut être un support à de multiples analyses (médicales, comptables, managériales etc.), de comprendre les phénomènes, amélioration continue (Fabbe- Costes and Romeyer 2004, Kohler 2004). aussi, de gérer les trois grandes activités suivantes : Suivre en temps réel des activités et flux qui composent le processus de prise en charge du patient ; Identifier rapidement les aléas et dysfonctionnements pouvant apparaître au cours de ce processus ; Avoir à disposition des données pour la traçabilité des soins, donner la possibilité de reconstituer le processus de prise en charge et patient. 5.3 Département ormation médicale (DIM) Le code de santé publique définit dans son article L le rôle département ou service qui organise le recueil, la circulation et le traitement des données médicales, prévus par les articles R à R du code de la santé publique (Carayon and Baude 2013). La création du DIM est reliée à la mise en place du PMSI en France. Le DIM est une structure transversale de l'hôpital, qui a pour missions hospitalières : - La gestion et le conseil pour le Dossier Médical du patient ainsi que la gestion du Dossier Transfusionnel. - La représentation des services dans la mise en place de l'informatique Hospitalière. - La production de RUM (Résumés d'unités Médicales) pour les unités de court séjour. 39

40 - les aider à produire et à transmettre les RUM. - La production des RSS. - Le groupage des RSS en GHM. - La production de statistiques autour du PMSI. - La production des RSA. - Le contrôle interne de la qualité des RSA. - La garantie de la confidentialité des données reliées au PMSI performants dans les établissements de santé depuis la circulaire de Les missions de la DSI peuvent être classées en huit thématiques : - La stratégie et la planification. - La qualité et la certification. - La sûreté de fonctionnement du système d'information et la sécurité des équipements. - La communication. - La production et la fourniture de services informatiques. - - La recherche et le développement. - La stratégie et la planification : La DSI doit mettre en place une politique générale du SIH, des projets informatiques et logistiques des dossiers des patients. La DSI doit concevoir, réaliser ou acheter un SIH intégrant en temps réel des informations opérationnelles et décisionnelles qui répondent aux besoins des utilisateurs. Elle accompagne les utilisateurs pour le déploiement et la formation aux différents outils. La tendance actuelle : le développement de réseaux de santé (ex. dossier médical personnel, télémédecine etc.). - La qualité et la certification : politique qualité pour améliorer la satisfaction des clients. - La sûreté de fonctionnement du système d'information et la sécurité des équipements : La DSIO définit et met en place la politique de sûreté de fonctionnement du système d'information. - La communication : La mission de communication de la DSI vise à la faire connaître naissance dans le seul objectif. - La production et la fourniture de services informatiques : La DSI fournit les services informatiques aux utilisateurs en veillant sur le fonctionnement optimal de ces ressources pour l conditions. 40

41 - : La DSI administre les postes de travail, engage toutes technologique des équipements. - La recherche et le développement : La DSI conçoit et réalise ou achète les solutions logicielles adaptées aux attentes des utilisateurs et à assurer le maintien en ordre de bon fonctionnement de ces solutions. Conclusion Le SIH permet notamment de partager des données entre plusieurs services et personnes. s du SIH se limite aux utilisations organisationnelles. - exploiter les données issues des ba 6 Conclusion Face à la constante augmentation des dépenses de santé et sous la pression des pouvoirs publics, les établissements publics de santé doivent faire évoluer leur gouvernance, et leur té et de se projeter dans le futur en exploitant des informations actuellement gérées dans le Hospitalier (SIH), ainsi que la définition et le suivi de divers indicateurs et tableaux de bords. Ainsi le GMSIH, en considérant trois niveaux décisionnels classiques (stratégique, économique et opérationnel) préconise : au niveau stratégique la méthode de pilotage de performance le «Balanced- Scorecard» ou «tableau de bord prospectif», au niveau niveau des services/centres de responsabilités. Ces tableaux de bord et indicateurs doivent être évolutifs (évolutions des priorités et points clés à mettre sous contrôle), ils doivent assister les responsables dans leur prise de décision et permettre aux établissements de santé de suivre leur performance sur tous les très grandes quantités de données historisées, pour la plupart déjà disponibles dans le SIH, mais aussi complétées par des agement, il faut construire un méthodes nécessaires pour exploiter ces données. Les outils classiques auxquels sont liés le SIH ne sont alors pas adaptés à ce genre d gros volumes de entrepôt de données adaptées à ces problématiques. 41

42 tableaux d que de la Business Intelligence été développées, notamment de type On Line Analysis Processing (OLAP), ainsi que des techniques de fouille de données pour extraire des connaissances (ex. des modèles prédictifs) à partir de ces données. Aussi, l nous nous intéressons plus particulièrement aux méthodes de conception et santé. 42

43

44 Chapitre 2 : Résumé. nous présentons les différents concepts liés à ceux- et utilisent des composants du PMSI. Sommaire 1 Introduction : Règles OLAP Intégration des données Extraction, Transformation, Loading (Chargement) (ETL) Administration Naviguer dans le cube ED pour les Etablissements de Santé (EDS) Travaux de recherche autour des EDS Synthèse Conclusion

45

46 1 Introduction Cette thèse concerne les EDs, spécialement dans le domaine de la santé, et traite en revenir sur ce que sont les EDs, leurs objectifs et leurs rôles. Ainsi, ce chapitre est organisé de la manièr 2 bordons le rôle des 3, nous évoquons quelques travaux sur les EDs de santé et différents travaux de recherche qui nous paraissent pertinents pour notre étude. 2» pour le stockent des données renseignées quotidiennement par des agents métiers, les données sont stockées dans une base de données qui peut être volatile (à plus au moyen terme), son objectif est de donner décisionnels collectent et stockent des données issues de différentes bases de données e décisionnel sont Data Warehouse, en Data Mart, en anglais) qui sont des sous- Figure 7. Définition des ED Les Entrepôt de Données (ED), ou Data Warehouses en anglais, sont devenus depuis les Ils ont été mis en place avec succès dans divers secteurs comme les assurances, le hétérogènes internes (bases de données opérationnelles) ou externes (notamment bases de données et fichiers issus du web). Plusieurs définitions ont été proposées pour définir les EDs. Nous retenons la définition de Bill Inmon, qui définit un ED comme une «collection de données orientées sujet, e à la décision» (Inmon 1992). 46

47 47 Figure 7. Architecture d'un SID. Un ED est «orienté sujet - à- sur un sujet donné et à différents niveaux de granularité (niveaux de détails). Les données intégrées différentes sources pouvant être des bases de données opérationnelles. Ces données sont «non volatiles» afin de conserver la traçabilité des informations et des décisions prises, et historisées, est nécessaire pour assurer la durabilité et la variation au niveau du temps. Un référentiel temps doit ainsi être associé aux données. Enfin, les»; il Magasins et cube de données Un Magasin de Données (MD) aux traitements décisionnels, orienté en fonction des usages métiers ou besoins des décideurs. En général, les MDs sont organisés de manière multidimensionnelle (Lehner 1998). Au niveau concept espace à plusieurs dimensions formant un cube de données (Gray, Bosworth et al. 1996). différents niveaux de granularités (graduation des arêtes du cube) permettant

48 qui permettent sa conception, établissent en quelque sorte une interface homme/ed qui. Exemple. La Figure 8 trois arêtes graduées respectivement par spécialités médicales, par établissement de santé et par mois. Figure 8: Exemple de cube de données. faits» et des dimensions». 2.1 : Règles OLAP contient selon différents axes ou dimensions et différents niveaux de détail. Cette analyse se fait «en ligne 1993 les 12 règles de base permettant de qualifier un système OLAP dans un document technique intitulé «Providing OLAP to User- Analysts : An IT Mandate» (Codd 1993). Ces règles sont : - Règle 1 - Multi- dimensionnalité : le système OLAP doit permettre, par nature, une vue multidimensionnelle. - Règle 2 - erveur OLAP est tels que les tableurs. - Règle 3 - données nécessaires à ses analyses. 48

49 - Règle 4 - Stabilité : la performance des interrogations reste stable, sans remettre en cause le fonctionnement de la base, indépendamment du nombre - Règle 5 - Client- ecture client - serveur facile à appréhender par les utilisateurs. - Règle 6 - Dimensionnement : le dimensionnement est générique, il doit être accessible pour chacune des données. - Règle 7 - Gestion complète : le serveur OLAP assure la gestion des données clairsemées. - Règle 8 - Multi- simultané à plusieurs utilisateurs (gestion des mises à jour, intégrité, sécurité). - Règle 9 - Croisement des dimensions : Tous les données stockées ou calculées dans le cube sont accessibles et les règles de gestions toujours applicables. Le - dimensions sans restriction. - Règle 10 - Manipulation simple des données : le serveur OLAP permet une navigation simple et intuitive des données. - Règle 11 - Flexibilité : la flexibilité ou souplesse de la présentation des rapports est intrinsèque au modèle. - Règle 12 - Analyse sans limites : le nombre de dimensions et de niveaux poussées. Ces règles ont été complétées, en 1995, par 6 règles supplémentaires. De son côté 8, considère que le : «Fast Analysis of Shared Multidimensional Information (le modèle FASMI)» en francais «Multidimensionnelle Partagée» 9. OLAP versus OLTP e à la mes applications OLTP sont généralement des applications fonctionnelles du SI opérationnel dédiées au métier et à la production, à partir desquelles on peut ajouter, supprimer et permettant de résumer un ensemble de données en une valeur et un comportement. Les http :// france.org/prj/jargonf/f/fasmi.html 49

50 y ajoute des dimensions supplémentaires rendant le tableur dynamique, au lieu de créer des tables supplémentaires dans le modèle relationnel. Plusieurs différences existent entre le paradigme OLTP et le paradigme OLAP comme Tableau 1 : Tableau 1. OLTP vs OLAP. Objectif Types Volatilité Historisation OLTP Dédié au métier et à la production Personnels métiers Elevée (données volatiles) Pas OLAP Dédié (pilotage et prise de décision) Décideurs, analyste, etc. Faible. Données historisées. Ex : garder la trace des évolutions information datée être supprimées Granularité données Intégrées Performance des base de données Données primitives. On accède directement aux données atomiques Les données proviennent même source de données Haute performance. On peut traiter quelques centaines de tuples par seconde Accès prédéfini Données dérivées. Agrégées, niveau de synthèse selon les besoins Les données proviennent de différentes sources de données (formats, types, etc.) Grande souplesse. On peut rajouter en lignes et en colonnes plus de valeurs par seconde. Grande autonomie de Accès non défini et dynamique 50

51 2.2 Intégration des données er des données à partir de plusieurs sources de données hétérogènes pour les rendre homogènes afin de les analyser. Ce travail istration Extraction, Transformation, Loading (Chargement) (ETL) sous le nom de pumping, est le Sql Server Integration Services (SSIS). Extraction par «horodatage». Il ne faut pas perturber les activités de production. Il faut gérer les anomalies en traitant et gardant trace de celles- ci et en conservant les informations sur les données (métadonnées). Transformation es données homogènes et cohérentes. La Tableau 2 données issue de plusieurs applications. Chargement : Consiste plutôt mécanique et la moins complexe. Nécessaire de mettre en place une stratégie de rafraîchissement. Tableau 2 : ETL/ Données sources et données cibles Administration métadonnées. Il devrait renfermer des données descriptives concernant toutes les 51

52 déroulement du chargement en se basant sur les informations stockées dans les 2.3 Naviguer dans le cube ontre, pour transformer cette intéressants. Parfois, les points identifiés se révèlent aberrants et cela pourrait donc (Sarawagi, Agrawal et al. 1998), (Lin and Brown 2003), (Plantevit, Laurent et al. 2007) automatique de ces points aberrants. Pour naviguer au sein du cube de données, différents opérateurs peuvent être utilisés. Ces opérateurs peuvent être classés en deux catégories principales : les opérateurs liés à la structure et les opérateurs lies à la granularité. Les opérateurs liés à la structure sont essentiellement dédiés à la manipulation et la visualisation du cube. Les opérateurs liés à la granularité des données sont essentiellement utilisés pour détailler ou résumer les (Messaoud, Rabaséda et al. 2007). Forage de données (Drill down) : permet de détailler une mesure en affinant une dimension ou en ajoutant une autre dimension. Il permet de donner une spécification de : - Drill across : ou drill latéral, pour la comparaison de mesures issues de plusieurs tables de faits. - Drill through. : voir une mesure à travers plusieurs dimensions. - Reach through Slice and dice : permet la sélection et la projection des données. Roll up tions (ex. Max, Min) une autre (ex. passer du niveau ville à celui de pays). Opérations liées à la structure exemple pivot ou rotate, pour faire une rotation sur les dimensions. Switch ou permutation, pour inter- Exemple. La Figure 8 présente un exemple de cu la mesure «nombres séjours» au niveau des cellules et de trois arêtes graduées respectivement par «spécialités médicales», par «lieu» (établissement de santé) et par «mois». 52

53 Figure 9 : Exemple cube de données avec hiérarchies. 3 ED pour les Etablissements de Santé (EDS) la décision dans le domaine de la santé, soit au niveau de la décision médicale (diagnostics, épidémiologies, etc.) soit au niveau du pilotage des établissements hospitalier et de santé essentiellement au second niveau concernant les EDSs pour la gestion hospitalière. Nous avons étudié quatre travaux de recherche spécialisés dans le domaine décisionnel et appliqués à la santé. Les deux premiers travaux sont centrés sur la problématique de la santé, tandis que les deux derniers, sont centrés s liées à la diversité des domaines et surtout du domaine de la santé. Le quatrième travail médicale. Nous nous intéressons à ce travail parce q au service des systèmes décisionnels, comme ça sera le cas dans notre recherche. 3.1 santé Dans notre travail de recherche (El Sarraj, S. Rodier et al. 2011), nous avons effectué une en compte à la fois la spécificité de celles- ci et des besoins en analyse des gestionnaires hospitaliers pour la 53

54 établissements de santé sont identifiées. ANAP (ANAP), regroupant les études de la GMSIH, a élaboré plusieurs études pour positionner les enjeux auxquels les établissements de santé sont effectué plusieurs études dans ce contexte et propose aux établissements de santé un ensemble de méthodologies, des éléments de réflexion et de tableaux de bord pour les aider dans leur procédure. Pour aider les établissements à intégrer des outils décisi (GMSIH 2006) établissements de santé de pouvoir effectuer un pilotage de la performance efficient, régulier et adaptable aux besoins des établissements de santé doivent. Ensuite, pour de tableau de bords, Figure 10, un ensemble de tableaux de bord (stratégiques et opérationnels), Figure 11 eurs (GMSIH 2006) ainsi que des méthodologies de gestion de projet décisionnel décrivant les différentes phases et étapes permettant de construire un SID. Une étude, sur la notion de «pilotage des établissements de santé» (GMSIH 2005) établissements de santé et les notions principales sur le pilotage des entreprises, ses santé. Figure 10: Aide à la construction de tableaux de bords (GMSIH 2006). 54

55 Etablissement de Unité opérationnelle : Tableau de Bord Activité à fin mois M année N EFFICACITE OPERATIONNELLE (1 seule unité organisationnelle, sauf pôles) Nb patients % Nouveaux Entrées Autres entrées patients urgences directes Unité x Etablissement Lits installés Entrées totales Taux d'occupation Nb séjours > 24h. Nb séjours < 24h. hors séances Séances Consultations externes Unité x Etablissement Les 5 premiers GHM de l'unité organisationnelle GHM Nb séjours % activité DMS DMS de l'enc Motif 1 Motif 2 Motif 3 Motif 4 Motif 5 Motif 6 Evolution du nombre de dysf onctionnements Type 1 Type 2 Type 3 Type 4 Type 5 Type 6 Evolution du nombre d'évènements indésirables RESSOURCE ET APPRENTISSAGE ORGANISATIONNEL Effectifs Médical Soignant Médico-technique Administratif Unité organisationnelle % Nb ETP Absentéisme Nb ETP Etablis s e m e nt % Absentéisme Heures supplémentaires Quantité EFFICIENCE ECONOMIQUE Produits Suppléments Produits principaux euros euros Personnel Médicaments Dépenses principales euros euros Taux de qualité du codage PMSI Figure 11: Exemple tableau de bord opérationnels (GMSIH 2006). 3.2 Travaux de recherche autour des EDS Dans son travail de recherche Serna Encinas (Serna Encinas 2005), met en avant trois objectifs de la santé et une interface graphique pour la génération automatiques des indicateurs ; ialiser ; (iii) Traitement des 55

56 PMSI. Cet ED collecte des données géographiques, démographiques et données publiques concernant la santé (les fichiers RSA du PMSI, FINESS 10, CIM10 11 ), Tableau 3. Tableau 3 : Description des sources de données PMSI (Serna Encinas 2005). s matérialisées est nécessaire, surtout dans le cadre des EDs. Les données de cet EDS sont particulièrement volumineuses, elles regroupent les données par ce trav premiers rassemblent les différents indicateurs et «de consommation, de besoins et de flux «temporels». Dans leur travail de recherche appliqué au cadre du système de santé aux Etats Unis (Berndt, Hevner et al. 2003), proposent des techniques de conception d'un ED pour fournir une information efficace relative à l'organisation et à l'interprétation pertinente des données de soins de santé. En vue de mieux comprendre les questions de s, définis dans ce travail de la nomenclature internationale de la CIM10 (nomenclature pour le codage des diagnostics dans le cadre du PMSI) Dans son travail de recherche (Nakache 2007), propose un logiciel de traitement automatique du langage médical à des fins de codage du PMSI pour aider les praticiens à choisir le code PMSI en temps réel. En plus, une mesure d'évaluation des algorithmes standards de classification a été proposée. Les problématiques traitées sont liées à la difficulté de codage et en vue de faciliter le travail du clinicien qui est confronté à la difficulté du codage des séjours. En effet, dans le secteur de la réanimation (où les codifications peuvent être différentes pour un même Compte Rendu Hospitalier (CRH) qui lui est rédigé par le praticien, en langage naturel), le CRH contient 10 FINESS : Fichier National des Etablissements Sanitaires et Sociaux 11 CIM 10 : Classification International de Maladies version 10 56

57 x x x x spécifique aux services de réanimation. Dans son travail de recherche (Choquet 2011), propose une plateforme d'interopérabilité sémantique pour l'échange d'information de manière générale et plus spécifiquement dans le domaine des maladies infectieuses. Cette plateforme permet le partage des connaissances médicales interprétables par la machine. Il propose aussi, une méthode de stockage de l'information et de la connaissance issue de l'ingénierie de l'informatique décisionnelle et du web sémantique. Ainsi, il traite la problématique de partage : les modèles, la sémantique et la qualité. Ce travail concerne plus le niveau «décision médicale» mais propose une solution qui peut le intègre la dimension sémantique au usages différents. 3.3 Synthèse domaine des EDS. Cette problématique récurrente dans ce domaine : «utilisé par des praticiens, par des statisticiens du domaine de la santé publique, des directeurs des hôpitaux, etc. En plus, ces travaux se focalisent sur la partie conception de exploitation par des utilisateurs finaux. Pour résumer, nous dressons un tableau comparatif des travaux examinés précédemment, Tableau 4. Ce tableau montre les éléments principaux traités par ces travaux de recherche. Voici les critères de comparaison des travaux étudiés : (1) Propose une méthodologie de conception du utilise les données des fichiers et nomenclature du PMSI (DPMSI) (3) Résous le problème relevant un besoin de sémantique par il propose une méthode (5) propose une Tableau 4 : Tableau de synthèse ED de santé du domaine de la recherche. Travaux\Critères MEDS DPMSI BS SO AE (Serna Encinas, 2005) (Berndt, Hevner et al. 2003) (Nakache, 2007) (Choquet, 2011) x x x x 57

58 4 Conclusion Dans ce chapitre, nous avons introduit les principaux concepts reliés aux EDs composants majeur du SID et nous nous sommes intéressés aux SIDs dans le domaine de la santé, que les travaux de la communauté de recherche spécialisée en SID et ontologie pour les SIDs. Cette présentation nous a permis de positionner le contexte général des travaux qui seront présentés dans ce qui suit. permet une analyse des données intégrées, non volatiles, historisées, orientées objectif, réalisable avec souplesse sur plusieurs niveaux de granularités. Néanmoins, cette analyse hétérogènes (ex. métier, culture, étude) santé. PMS - à- peut à un autre du fait de leurs backgrounds différents. allons montrer que les ontologies, qui ont déjà contribué à la résolution de problèmes sémantiques sur différents niveaux du SID, peuvent aussi être utilisées pour aider à des EDs par des utilisateurs de backgrounds différents. Le chapitre 3 porte sur la conception des EDs, le chapitre 4 sur la personnalisation des EDs et enfin le chapitre. 58

59

60 60

61

62 Chapitre 3 : Résumé. conception pour les réutiliser tout au long du cycle Sommaire 1 Introduction Les démarches Démarche ascendante Démarche descendante Démarche hybride Modèles entité/association Modèles conceptuels spécifiques Modèles orientés objet Modèles à base ontologique Modèle standard Modèles de but Modèles de requête Modèles structuré Formalisation des sources de données Synthèse sur la conception des EDs de santé Conclusion

63 1 Introduction Selon (Schiefer, List et al. 2002) (SID) échouent et 80% ne répondent pas aux besoins des utilisateurs, du fait que les concepteurs de SID commencent leurs projets par une modélisation conceptuelle ou sans analyser les besoins (Mazón, Trujillo et al. 2005). Cet échec est aussi dû à une mauvaise communication entre les informaticiens et les utilisateurs. Les alyse (Golfarelli, Maio et al. 1998), et que concevoir un ED est une tâche cruciale pour sa réussite (Golfarelli 2010). Selon (Nemati, Steiger et al. 2002) disposition des analystes les connaissances nécessaires pour les aider à la prise de connaissances pour les réutiliser et améliorer la prise de décision. t, dans la section 2, nous présentons les démarches de : démarche basée sur les sources de données, démarche basée sur les besoins et démarche hybride. Dans la section 3, nous présentons les modèles de conception des EDs. Puis, dans la section 4, nous abordons les principaux modèles 5, nous présentons une étude comparative des travaux en se évidence le manque de réuti 6. 2 Les démarches : la démarche ascendante (basée sur les sources), la démarche descendante (basée sur les besoins des utilisateurs), et la démarche hybride (basée sur les sources et les besoins des utilisateurs). Démarche ascendante Cette démarche permet de définir des modèles conceptuels en se basant sur les sources 63

64 démarche ascendante a été proposée par Bill Inmon (Inmon 1992), pionnier du domaine des EDs. Des travaux plus récents (Golfarelli, Maio et al. 1998), (Blaschka, Sapia et al ), (Tryfona, Busborg et al. 1999), proposent des modèles de représentation des concepts défini avec le formalisme entité association. En général, la formalisation des connaissances est faite en se basant majoritairement sur des ontologies. Le premier travail sur la conception des EDs à base ontologique est apparue en 2007 (Romero and Abelló 2007), les auteurs proposent une méthode de conception semi- sources de données hétérogènes. Cette démarche ascendante peut devenir coûteuse lorsque le périmètre des sources est large, et de plus, les résultats obtenus peuvent ne pas correspondre aux attentes des utilisateurs finaux. Démarche descendante analyses aux besoins basée sur une démarche descendante a été proposée par Ralph Kimball, (Kimball 1996). rche, (Prat and Akoka 2002), (Tsois, Karayannidis et al. 2001). Les besoins peuvent être exprimés par les utilisateurs sous forme de requêtes, tables, diagramme de classes, etc. mise en correspondance des besoins et des sources de données existantes alimentant Démarche hybride La démarche deux précédentes. Les travaux de (Lujan- mora and Trujillo 2003), (Ghozzi, Ravat et al. 2005), (Soussi, Feki et al. 2005), proposent un schéma cohérent qui tient compte à la fois des sources de données et des besoins des utilisateurs. Plusieurs approches de mapping entre les sources et les besoins sont envisageables : approche directe (Hüsseman, Lechtenbörger et al. 2000), approche a posteriori (Bonifati, Cattaneo et al. 2001), approche médiane (Phipps and Davis 2002), approche a priori (Romero and Abelló 2006) travaux seront évoqués dans la sous- section 4.2. Cette démarche présente beaucoup correspondance entre les sources et les besoins doit être effectuée. Une démarche hybride, basée sur les ontologies, et proposée par Khouri et Bellatreche (Khouri and Bellatreche 2010), exploitent les connaissances reliées aux besoins et aux sources recueillies dans la phase de conception, les formalisent et les informatisent. Ce travail ontologie qui définit les sources et une ontologie qui spécifie les besoins des utilisateurs. 64

65 aux utilisateurs, même non informaticiens, de concevoir un ED adapté à leurs besoins en fonction des sources existantes. De plus, il propose de réutiliser les connaissances dans la 3 Le modèle c des modèles conceptuels qui diffèrent principalement dans la possibilité de représenter les Selon leurs paradigmes, ces travaux peuvent être classés en quatre catégories: les modèles entités/association, les modèles orientés objet, les modèles à représentation spécifiques et les modèles à base ontologiques. Nous développons pour chaque paradigme deux ou plusieurs travaux de recherche. Modèles entité/association Plusieurs travaux proposent des nouveaux modèles de représentation des concepts de données. Les auteurs de Tryfona et al. (Tryfona, Busborg et al. 1999) proposent un modèle conceptuel «starer» qui se base sur le modèle entité/association des sources de graphique du modèle multidimensionnel. Dans la même lignée, nous citons aussi, le travail de Sapia et al. (Sapia, Blaschka et al. 1998) qui propose le modèle «ME/R et al. (Cavero, Piattini et al. 2001) qui propose le modèle «ravaux (Sanchez, Cavero et al. 1999), (Franconi and Sattler 1999), (Hüsseman, Lechtenbörger et al. 2000), (Moody and Kortink 2000) et (Vrdoljak, Banek et al. 2003). En résumé, les modèles de conceptions multidimensionnelles basées sur le paradigme - ci en intégrant les faits et les dimensions. La différence principale entre un modèle classique et les modèles multidimensionnels est surtout au niveau du groupement et de l multidimensionnel difficile à valider par les utilisateurs surtout pour les non informaticiens. Modèles conceptuels spécifiques La recherche de Golfarelli et al. (Golfarelli, Maio et al. 1998) propose une représentation dimensional fact model» établi à partir 65

66 des modèles entité/association des sources de données. Il propose une nouvelle dont la racine est la table des faits et les branches sont les dimensions et leurs hiérarchies. Cette propose aussi une méthodologie de construction du mo Les auteurs de (Vassiliadis, Bouzeghoub et al. 2002, Vassiliadis, Simitsis et al. 2005) se sont intéressés à la modélisation reliée à la phase ETL des données et proposent un modèle intitulé «Arktos t de décrire des traitements spécifiques, qui sont parfois difficiles à comprendre par des non informaticiens. Il ne ées. Dans le même contexte on peut citer (Hüsseman, Lechtenbörger et al. 2000), (Tsois, Karayannidis et al. 2001). Modèles orientés objet Les modèles orientés objets se basent sur le paradigme objet et utilisent le langage de modélisation graphique Unified Modeling Language (UML). Plusieurs travaux de recherche ont proposé des modèles multidimensionnels en se basant sur le concept objet, cer (Romero and Abelló 2007), (Khouri and Bellatreche 2011) représentation des données. Nous présentons brièvement dans cette section quelques modèles. Les auteurs de (Lujan- mora and Trujillo 2003), (Trujillo, Palomar et al. 2001), proposent un modèle multidimensionnel «GOLD» orienté objet. Ce modèle étend le modèle UML classique en intégrant les packages munis de stéréotypes spéciaux pour représenter les éléments du multidimensionnel (package fait, package dimension et package étoile). Le fait est représenté avec le stéréotype «Fact», il contient des attributs ou des mesures. Les dimensions sont représentées avec le stéréotype «Dimension». Les niveaux de granularité sont représentés avec le stéréotype «Base», ces classes sont organisées suivant des hiérarchies. Les agrégations non pertinentes figurent dans une note UML. Le roll- up est représenté avec le stéréotype «RollupTo», il définit la relation entre les présenter les dérivations à partir des sources de données. Abellò et al. (Abelló A., Samos J. et al. 2001), proposent le modèle multidimensionnel «YAM». Il est basé sur le méta- modèle du diagramme de classes UML. Ce modèle permet de présenter plusieurs types de hiérarchies, les relations entre les tables de fait, les relations m- n entre les tables des faits comme dans le travail de (Tryfona, Busborg et al. 1999) et les dimensions. Ainsi, il permet de présenter les modèles en constellation et en flocon de neige. 66

67 En résumé, les modèles conceptuels multidimensionnels orientés objet, (Lujn- mora, Trujillo et al. 2002), (Abelló, Samos et al. 2006), (Prat and Akoka 2002), se focalisent sur ED. Ils utilisent le modèle UML Modèles à base ontologique Nebot et al. (Nebot, Berlanga et al. 2009) proposent un framework dirigé par les ontologies, qui permet de construire une ontologie multidimensionnelle intégrée, en anglais Multidimensional Integrated Ontology (MIO), incluant les concepts, les relations et les individus qui représentent les dimensions et les mesures d'analyse. Le schéma de ionnelles (ex. additivité). Il présente également, comment les données instances d'un MIO peuvent être traduites dans des cubes OLAP pour des fins d'analyse. Khouri et al. (Khouri, Bellatreche et al. 2012) proposent une démarche de conception «sémantique er la globalité des connaissances tout au long du cycle de vie Ce travail propose de stocker les connaissances reliées aux sources de données mapping entre les sources et les be On peut aussi citer, le travail de Prat et al. (Prat, Akoka et al. 2011). Celui- ci propose des règles de tran entrepôt de données à une ontologie en OWL- DL. Au- delà des capacités de raisonnement de logique de description, OWL- DL est utilisé comme un moyen de présenter le modèle multidimensionnel avec des techniques du Web sémantique. Prat et al. (Prat, Megdiche et al. 2012) - DL pour effectuer du raisonnement, en particulier pour vérifier les modèles multidimensionnels et leur summarizability, par résultats corrects. 4 Dans cette section nous présentons les principaux modèles de formalisation des connaissances reliées aux besoins des utilisateurs et aux sources de données utilisées es besoins des (Gam and Salinesi 2006), (Giorgini, Rizzi et al. 2005) ojet. Le SID permet 67

68 (stratégiques et tactiques) ce qui rend sa réussite plus difficile. Alors, il est important ls des décideurs et de la prise Winter et al. (Winter and Strauch 2003) besoins est composé des cinq tâches suivantes besoins à satisfaire et (5) spécifier formellement les besoins de manière à faciliter la validation des besoins par les utilisateurs. Ils existent plusieurs modèles de formalisation des besoins : Modèle standard, ces modèles sont basés sur les formalismes comme UML, entité- association, modèle de but ces modèles modèle de requête ces modèles sont basés sur des requêtes comme SQL ou MDX, modèle structuré ces modèles sont basés sur les ontologies ou XML Modèle standard Certaines mé des interviews et questionnaires, puis pour formaliser ceux- ci elles utilisent des formalismes tels que les modèles tâche acteur (Cavero, Piattini et al. 2001) et les cas (Prat and Akoka 2002), (Lujan- mora and Trujillo 2003). Dans Bruckner et al. (Bruckner, List et al. 2001, List, Bruckner et al. 2002), les auteurs comparative des trois démarches de développement de SID en se basant sur les paramètres suivantes niveaux Ils identifient trois groupes de besoins qui sont : - Le groupe décision : regroupe tous les objectifs de haut- niveau auquel doit répondre le SID. - Le groupe utilisateur : représente les tâches que les utilisateurs sont capables et non fonctionnels des utilisateurs du SID - Le groupe système : comprend des besoins fonctionnels et non- fonctionnels liés à fonctionnalités que doit remplir le SID afin que les utilisateurs accomplissent leurs tâches. La classification des besoins est judicieuse et pertinente en vue de définir les priorités. du SID (Annoni 2007). 68

69 Dans le travail de Soussi et al. (Soussi, Feki et al. 2005), une structure appelée tableau n- expressive, elle représente les concepts de faits, de dimensions, de mesures, paramètres, hiérarchies et attributs faibles. Ces tableaux n- dimensionnels sont formalisés sous forme de diagrammes de classes pour créer un référentiel. Mais, cette structure est trop complexe pour être définie par les utilisateurs finaux. Pour simplifier cette tâche les auteurs ont développé un outil qui présente par applications métiers les concepts multidimensionnels définis pour celles- ar la suite. Les modèles standards de formalisation des besoins SID ne définissent pas des priorités parmi les besoins, sauf dans le travail de Bruckner et al. (Bruckner, List et al. 2001, List, Bruckner et al. 2002). Ces modèles ne proposent pas de guide pour la confrontation des besoins, sauf dans le travail de Soussi et al. (Soussi, Feki et al. 2005). De même, ils utilisent des modèles avec lesquels les utilisateurs ne sont pas familiers, ce qui peut poser, par la suite un problème au niveau de la validation du schéma par les décideurs (Winter and Strauch 2003). Ce modèle proposé par Soussi et al. (Soussi, Feki et al. 2005) offre la Cependant pour ce modèle standard, la majorité des tâches ne favorisent pas leur et al. (Bruckner, List et al. 2001, List, Bruckner et al. 2002) pour assurer une fiabilité et une bonne qualité du SID Modèles de buts Les auteurs Bonifati et al. (Bonifati, Cattaneo et al. 2001) utilisent un modèle de buts nommé GQM pour représenter les besoins. Ils utilisent deux formulaires avec des champs présenté les tâches liées à sa des décideurs. Les concepteurs obtiennent le schéma multidimensionnel à partir des schémas des sources. Le modèle GQM est ensuite transformé en modèle conceptuel afin de comparer les schémas des sources et des besoins. Le travail de Yu (Yu 2011) propose le Framework standardisé «Framework i*» qui traite besoins : (1) «la phase initiale» qui consiste à analyser et modéliser les intérêts des 69

70 environnements, et (2) «la phase finale» qui consiste à vérifier automatiquement la complétude et la consistance des besoins. Giorgini et al. (Giorgini, Rizzi et al. 2005) des décideurs qui intègre des concepts organisationnels du processus métier. Les auteurs distinguent les besoins organisationnels (ensemble des besoins relatifs aux acteurs physiques et logiciels), des besoins décisionnels (ensemble des besoins relatifs aux décideurs). Cette méthode repose sur une approche orientée agent, basée sur le Framework i*. Ce Framework se base sur deux notions principales Dans Gam et al. (Gam and Salinesi 2006, Gam and Salinesi 2006), les auteurs utilisent le intentions et les stratégies de mises en place pour parvenir au but. Les modèles de buts se basent sur les besoins exprimés en langage naturel et les formalisent (Bonifati, Cattaneo et al. 2001) Modèles de requêtes SQL, MDX) ou même les ontologies pour représenter les besoins. Des travaux de recherche comme celle de Phipps et al. (Phipps and Davis 2002) utilisent les requêtes pour valider les schémas candidats en les testant grâce à des requêtes avec les clauses «Select» et «From et al. (Ghozzi, Ravat et al. 2005) utilisent les requêtes pour représenter les besoins exprimés en langage naturel. Elles sont définies suivant les clauses : - Analyse : en répondant à la question «Quoi» pour définir les données. - En fonction : en répondant aux questions «Qui, Où, Quand» pour déterminer les paramètres - Pour : en répondant aux questions «Pour qui, Quelles données» pour définir les A partir de ces requêtes, les auteurs définissent les besoins pour déterminer les concepts multidimensionnels. Puis, ils dérivent un schéma en étoile à partir des besoins. Parallèlement, ils définissent un schéma en étoile à partir du schéma des sources de données. intuitive pour les concepteurs décisionnels qui maîtrisent en général le langage - informaticiens ne sont pas familiers avec 70

71 les langages de requêtes. Cependant, ces méthodes basées sur des modèles de requêtes ne guident pas la collecte et la confrontation des besoins. De plus, elles ne différencient de requêtes pour la formalisation des besoins est une bonne idée dans le sens où la D pourrait être automatisée Modèles structuré Certains travaux formalisent les besoins dans des langages structurés (ex. OWL, XMl). Citons notamment les travaux de Nebot et al. (Nebot, Berlanga et al. 2009) qui proposent ontologie formalise les connaissances reliées aux besoins par des expressions de logique de description. Le travail de Romero et al. (Romero, Simitsis et al. 2011) propose de formaliser les besoins dans un fichier XML. Le fichier présente les concepts multidimensionnels. Formalisation des sources de données Dans la majorité des travaux de recherche autour des entrepôts de données, les sources de données sont généralement des bases de données relationnelles. Certains travaux - structurées (Vrdoljak, Banek et al. 2003), des annotations du web sémantique (Nebot, Berlanga et al. 2009) ou des bases de données à bases ontologiques (N. Berkani, S. Khouri et al. 2012), (Khouri, Bellatreche et al. 2012). Il existe plusieurs types de représentation des sources de données pour aider à la considèrent le schéma logique (M. Jensen, T. Holmgren et al. 2004), (Song, Khare et al. 2007), (Mazón, Trujillo et al. 2007), (Carmè, Mazón et al. 2010) sur le schéma conceptuel souvent représenté en formalisme entité/association (Sanchez, Cavero et al. 1999), (Franconi and Sattler 1999), (Hüsseman, Lechtenbörger et al. 2000), (Moody and Kortink 2000), (Vrdoljak, Banek et al. 2003). Des méthodes plus récentes (Romero and Abelló 2007), (Nebot, Berlanga et al. 2009), (N. Berkani, S. Khouri et al. 2012), (Bellatreche, Khouri et al. 2013) (Khouri, Bellatreche et al. 2012). : (i) approche directe : orientée sources de données, (ii) approche a posteriori, (iii) approche médiane orientée sources et besoins. - Approche directe : orientée sources de données (Hüsseman, Lechtenbörger et al. 2000), (M. Jensen, T. Holmgren et al. 2004), (Song, Khare et al. 2007) - Approche a posteriori : orientée sources et besoins (Bonifati, Cattaneo et al. 2001). schéma des besoins. Un schéma final est généré en se basant sur les sources et les besoins. 71

72 - Approche médiane orientée sources et besoins : plusieurs solutions sont envisageables validé en fonction des besoins, comme dans le travail de Giorgini et al. (Giorgini, Rizzi et al. 2005) puis, validé en fonction des sources, comme dans Phipps et al. (Phipps and Davis 2002). (iv) approche a priori un mapping entre les sources et les besoins est (Romero and Abelló 2010), (Khouri, Bellatreche et al. 2012). 5 Synthèse sur la conception des EDs de santé Pour mieux positionner notre contribution, nous avons comparé quelques travaux de recherches (présentés dans le tableau ci- dessous) en fonction de critères que nous avons définis. Ce comparatif est illustré dans le tableau ci- dessous. Ces critères de comparaison sont les suivants : Démarche, formalisation des connaissances et réutilisation des connaissances. La «démarche orientée besoins» ou «orientée sources». La «formalisation des connaissances» permet r si les connaissances reliées aux sources ou aux besoins sont formalisées. La «réutilisation des connaissances spécifions la réutilisation au niveau de la, intégration des données et. 72

73 Tableau 5 : Comparaison des démarches de conception d'un ED. Démarche Travaux de recherche/ Critère de comparaison Démarche ascendante Démarche descendante Démarche hybride Classique (Blaschka, Sapia et al ), (Tryfona, Busborg et al. 1999), (Golfarelli, Maio et al. 1998), (Inmon 1992) A base ontologique (Romero and Abelló 2007) Classique (Prat and Akoka 2002), (Tsois, Karayannidis et al. 2001), (Kimball and Ross 1996) Classique (Romero and Abelló 2006) (Ghozzi, Ravat et al. 2005), (Soussi, Feki et al. 2005), (Lujan- mora and Trujillo 2003), (Phipps and Davis 2002), (Bonifati, Cattaneo et al. 2001) A base ontologique Orientée sources X X - X X Orientée besoins - - X X X Formalisation des connaissances - X - - X Réutilisation des connaissances Pour la conception - X - - X - X - - X (Khouri and Bellatreche 2010)

74 6 Conclusion Nous avons présenté dans ce chapitre des travaux relatifs à la conception des EDs qui nous s différentes formalisation et ré- exploiter les connaissances. En plus, ces dernières années, la recherche autour des EDs a principalement porté sur des aspects techniques, notamment liés à la conception ion des EDs. nous parait aussi judicieuse. Dans le chapitre suivant, nous nous intéressons à différents travaux de particulièrement associés à la personnalisation des EDs. 74

75 Chapitre 4 : Résumé spécifiquement grâce à des approches de personnalisation des EDs. Dans un premier temps, après avoir présenté les travaux effectués sur la personnalisation en informatique, nous nous intéressons au rôle du profil utilisateur dans une telle approche. Dans un deuxième temps, nous présentons un comparatif de certains travaux de personnalis Sommaire 1 Introduction La personnalisation dans les EDs Rôle du profil utilisateur De la personnalisation à la recommandation Approches de personnalisation dans les EDs Synthèse sur la personnalisation des EDs Conclusion

76 1 Introduction ontologies peuvent être utilisées tout au long du cycle de vie du SID. Notamment, n 2, la personnalisation dans les EDs. Puis, avant de conclure, dans la section 3, nous présentons notre synthèse. 2 La personnalisation dans les EDs Dans la section 2.1, nous présentons la personnalisation en générale, puis nous nous intéressons au rôle du profil utilisateur dans cette personnalisation. Après, dans la section 2.2, nous effectuons une présentation générale de la personnalisation et évoquons la recommandation spécifiquement dans le domaine des EDs. Enfin, nous définissions la personnalisation et la recommandation, selon utilisations dans ce manuscrit. Rôle du profil utilisateur Personnalisation en IHM, BD, RI différentes communautés de recherche, notamment dans Homme- Machine (IHM), des Bases de Données (BD) et de la Recherche informations qui vont permettre au système la personnalisation. Dans ce cas, la s résultats selon les préférences rsonnelles contenues dans le profil utilisateur. Dans le domaine de la RI, le profil utilisateur peut être représenté de différentes façons. Dans certains cas, le profil utilisateur peut être confondu avec la requête de il est défini par un vecteur de mots- clés, avec éventuellement un poids associé à chaque mot- clé (Pretschner and Gauch 1999 ). Une autre alternative consiste à stocker dans le profil utilisateur les statistiques de lecture, etc. (Bradley, Rafter et al. 2000). Ces informations permettent par la 76

77 (Cherniack, Galvez et al. 2003). Dans le domaine de BD, le profil utilisateur peut contenir par exemple les - ci. Par exemple, les prédicats souvent utilisés dans les requêtes des utilisateurs ou les ordres dans ces prédicats (Koutrika and Ioannidis 2004). Dans le domaine BD, la notion de profil utilisateur apparait comme étant à la base de la personnalisation, mais elle reste non définie de façon standard. Ainsi, le travail de Bouzeghoub et al. (Bouzeghoub and Kostadinov 2005) contenu du profil peut être utilisé de différentes façons. Il peut remplacer, enrichir la requête (ex. en ajoutant de nouveaux mots- clés) ou être utilisé pour adapter les résultats, dans leur contenu (ex. filtrage) ou dans leur forme de présentation. La personnalisation nécessite une description des utilisateurs pour mieux les connaitre. Cette description peut être exprimée en tant que profil utilisateur. Bien profil regroupe généralement un ensemble de caractéristiques qui serviront à configurer ou adapter le sy Voici quelques informations composant le profil : - Données personnelles (ex. sexe, date de naissance) - Données professionnelles (ex. métier, statut, compétences) - Historique comportementale décrivant les actions fréquentes effectuées sur le système - De la personnalisation à la recommandation Personnalisation exploiter un profil utilisateur (Korfhage 1997). On peut parler de personnalisation, nformation en communautés de recherche en RI et BD (Ioannidis and Koutrika 2005), très peu de propositions ont eu lieu en système OLAP, citons cependant les travaux de (Rizzi, 77

78 Abello et al. 2006), (Bentayeb, Boussaid et al. 2009). Dans la communauté de recherche sur les bases de données multidimensionnelles les chercheurs se sont (Favre 2007), (Garrigos, Pardillo et al. 2009) consistant à personnaliser la visualisation de la requête OLAP (Bellatreche, Giacometti et al. 2005) ou du résultat obtenu (Golfarelli 2010), (Xin, Han et al. 2006), (Jerbi, Ravat et al. 2008), (Jerbi, Pujolle et al. 2010) chercheurs se sont intéressés à la recommandation de requêtes OLAP, visant à et al. (Giacometti, Marcel et al. 2009) objectifs nous semblent concerner une personnalisation centrée sur les données, soit en amont avec la personnalisation du schéma de données, soit en aval, avec la personnalisation de la visualisation des résultats des requêtes. Le troisième objectif porte sur la recommandation de méthode de traitement de ces données (ex. requêtes OLAP). ateur, plusieurs mécanismes de personnalisation existent. Les auteurs de (Pretschner and Gauch 1999) proposent une cinquantaine lassification des approches existantes. Une autre classification des mécanismes de personnalisation basés sur le profil utilisateur est proposée par (Jerbi 2012), selon les catégories suivantes : - pertinentes) en affinant la requête avant son exécution afin de réduire le résultat (Koutrika and Ioannidis 2004) requête appliquer un traitement sur le résultat pour éliminer les résultats non pertinents (Bradley, Rafter et al. 2000). - Tri : Re- ordonnancer le résultat pour présenter les informations les plus pertinentes en premier. - Recommandation : Proposer les éléments d'information qui pourraient intérêts des utilisateurs. Le système ainsi personnalisé fournira des résultats plus pertinents (Domshlak et Joachims, Recommandation La personnalisation des EDs par recommandation peut être associée à divers travaux tels que Blashka et al. (Blaschka, Sapia et al ), (Chatzopoulou, Eirinaki et al. 2009), (Giacometti, Marcel et al. 2009). Dans ces travaux, on peut distinguer deux catégories de méthodes filtrage collaboratif (Negre 2011). Les méthodes basées sur le contenu recommandent des objets similaires. Cette recommandation est basée sur les 78

79 et al. (Jerbi, Pujolle et al. 2011) comparent certains de ces travaux en prenant en considération trois aspects principaux : (i) les objectifs de personnalisation, la personnalisation de schémas ou de requêtes (le résultat ou la visualisation), (ii) le modèle retenu pour définir Dans le cadre de notre travail nous considérons que : - - La personnalisation - ci. la recommandation effectue une expansion du résultat en se basant sur le 3 Approches de personnalisation dans les EDs Dans la communauté de recherche sur les bases de données multidimensionnelle les chercheurs se sont intéressés à la personnalisation sur différents niveaux : la personnalisation du schéma des sources des données, la personnalisation ou Nous présentons dans cette section les principaux travaux effectuée par Jerbi et al. (Jerbi, Ravat et al. 2009). façon générale les travaux retenus selon des critères que nous intéresse, relatif à proche global de Bellatreche et al. (Bellatreche, Giacometti et al. 2005, Bellatreche, Giacometti et al. 2006) traitent la personnalisation des requêtes et la visualisation du résultat. Par exemple, pour deux profils Dans cette partie, nous intéressons uniquement à la partie concernant la personnalisation des requêtes. Par exemple, prenons le cas où un utilisateur souhaite connaître le montant du chiffre d'affaires détaillé par catégorie de produits, par année et par région. Il existe de nombreuses présentés dans la Figure 12. Le profil utilisateur responsable des ventes dans la région nord, sera plus intéressé par la visualisation 1. Pour le profil d'utilisateur responsable des ventes récentes de boisson et denrées alimentaires toute région, i sera la plus indiquée. 79

80 Figure 12 : Personnalisation de la visualisation des requêtes OLAP (Bellatreche, Giacometti et al. 2005). de personnalisation est centrée sur s du profil. Elle se base sur la requête ponctuelle émise sans considérer les requêtes précédentes. profil et une contrainte de visualisation, il retourne une requête personnalisée par utilisateurs. Golfarelli (Golfarelli 2010) présente une approche de personnalisation des tuples - ble des de personnalisation est raitement de personnalisation est élaborée en se basant sur ces préférences et retourne les résultats adéquats. prend en entrée les préférences définies par 80

81 sont les plus adaptés. Les préférences sont exprimées par les utilisateurs sur les requêtes. Le travail de Ravat et al. (Ravat, Teste et al. 2007) propose une approche de personnalisation de requête qui se focalise su Les auteurs traitent la personnalisation au niveau de la navigation. Cette approche se rapproche davantage de ce qui se fait en IHM. Il (W Choong, A Giacometti et al. 2007) partage des de personnalisation ésentées comme des coefficients de préférences. prend en entrée attributs de dimensions à afficher. Ainsi, Garrigos et al. (Garrigos, Pardillo et al. 2009) particularité de cette approche est que le mécanisme de personnalisation débute à la phase de conception. de personnalisation première étape commence dès la phase de conception il propose de définir un (ECA) précisant les actions de personnalisation à effectuer. La deuxième étape est au moment de. Elle permet de fournir une visualisation du de de cette visualisation fonction des règles spécifi (ex. pour la dimension «Groupe homogène de malade code, libellé, borne basse, borne haute, tarif, tarif borne basse, tarif borne haute, etc.» selon les règles dans le profil utilisateur les attributs affiché dans le schéma nombre de séjours par groupe homogène de malade, afficher uniquement les attributs «code, libellé» ), 81

82 un modèle personnalisé pour un chef de service (Structure : Service), pour un chef de pôle (Structure Giacometti et al. (Giacometti, Marcel et al. 2009), (Giacometti, Marcel et al. 2009) yse est basé uniquement sur une succession de requêtes. approche de personnalisation historique des requêtes effectuées par les utilisateurs. Cette approche ne prend pas en compte les utilisateurs lors de la recommandation. prend une entrée à des analyses précédentes. Il retourne un ensemble de requêtes recommandées en se basant sur la trace des analyses précédentes. La méthode de calcul de distance (Levenshtein 1996) Jerbi et al. (Jerbi, Pujolle et al. 2010, Jerbi 2012) proposent une démarche de personnalisation générique basée sur les préférences approche de personnalisation est orientée sur utilisateur. Cette l et au contexte de 4 Synthèse sur la personnalisation des EDs Nous comparons dans les tables ci- dessous les travaux de recherche autour de la personnalisation des EDs. La comparaison est effectuée selon deux critères que nous dénommons approche globale et algorithme. Pour chacun de critères nous dressons un tableau comparatif en se basant sur des points jugés important dans ces axes. Approche globale : chacun des travaux. Concernant chercheurs se sont intéressés à la «personnalisation du schéma des sources des données besoins spécifiques des utilisateurs, «la per données» consistant à personnaliser la visualisation de la requête et «la recommandation de requêtes OLAP» visant à 82

83 les travaux selon ses trois axes. Concernant le, la personnalisation peut se baser sur avons retenue, sont orientées : (1) Utilisateur ; (2) Historique : orientées données internes (ex. métadonnées) (Sarawagi, Agrawal et al. 1998). Critère «Algorithme» la méthode de calcul et la méthode de tri de chacun des travaux. Concernant x. requêtes, préférences, instances, etc.) et son mode de sortie (ex. tuples, requêtes, Schéma). Concernant la méthode de calcul, nous avons présenté personnaliser. Concernant la méthode de tri, nous avons sélectionné aussi ce critère, qui permet de spécifier la méthode adoptée pour trier les objets à personnaliser et de renvoyer les meilleurs. 83

84 Tableau 6 : Synthèse "Approche globale". Objectif Approche Personnalisation de requêtes Recommandation de requêtes Personnalisation du schéma de l'ed Bellatreche et al. x Utilisateur Golfarelli et al. x Utilisateur Ravat et al. x Utilisateur Garrigos et al. x Utilisateur Giacometti et al. x Historique Jerbi et al. x x Utilisateur Nous constatons, dans le Tableau 6, que les travaux de recherche sur la personnalisation dans le domaine des EDs concernent les us constatons aussi que les approches se basent majoritairement sur les utilisateurs. 84

85 Tableau 7 : Synthèse "Algorithme". Bellatreche et al. Golfarelli et al. Ravat et al. Garrigos et al. Giacometti et al. Jerbi et al. Algorithme Entrée Sortie Méthode de calcul Méthode de tri Requête Profil Requête Calcul de relation d'ordre Préférences Contrainte de visualisation Préférences Tuples Graphe de dominance Dominance de préférence Instance de l'ed Profil utilisateur Requête Règle ECA Score Ensemble de règle ECA Profil utilisateur Schéma de l'ed Règle ECA Règle satisfaite Ensemble de règles ECA Analyse courante Levenshtein Proche de la requête Requête Instance de l'ed Hamming courante Schéma de l'ed Requête OLAP Profil utilisateur Résultat de la requête Recommandation Score de préférence Adéquation au profil Adéquation contexte Nous constatons, dans le Tableau 7 les résultats concernent les différentes phases du SID (ex. conception, exploitation, etc.). Pour effectuer la personnalisation certains travaux ont repris des techniques du domaine de RI (ex. Levenshtein). Enfin, dans ces recherches, les résultats sont triés en se basant sur des techniques variées. 85

86 5 Conclusion ED, proposent des approches de personnalisation. Nous avons distinguée trois objectifs de ces approches, les travaux portant sur : la personnalisation du schéma des sources des requêtes OLAP. Pour les travaux étudiés, nous avons commencé par présenter une synthèse des ensemble de critères pertinents, qui nous ont permis de mieux analyser les travaux et de positionner nos contributions. Nous avons présenté des tableaux comparatifs recensant les travaux étudiés en fonction des critères que nous avons retenus. nalyse de ces travaux, plusieurs constats peuvent être faits : Le premier constat, confirme que la plupart d, la personnalisation des EDs ne prennent pas en compte la sémantique. Le deuxième constat, est La majorité des travaux sont centrés utilisateurs. Ces travaux proposent la personnalisation utilisateur. La requête OLAP personnalisée nécessite une exécution avec un système OLAP, afin de retourner un résultat personnalisé, spécifiquement des tables multidimensionnelles personnalisées. Le troisième constat, les techniques de personnalisation uti s domaines informatiques (IHM, RI et BD) pour faciliter la personnalisation des résultats une approche sémantique. Malgré que, les ontologies ont déjà prouvé leurs utilités dans le domaine des EDs pour résoudre le problème de sémantique et de formalisation des connaissances, les travaux dans ce domaine ont porté essentiellement sur des aspects de insi, les différentes approches de sémantique des utilisateurs, et à celui de la complexité du domaine abordé. Dans le chapitre suivant nous présentons appréhender de façon satisfaisante la sémantique dans notre problématique. 86

87 Chapitre 5 : Résumé. Pour résoudre des problèmes sémantiques les ontologies ont déjà prouvé leur efficacité dans le définition des ontologies. Puis, nous présentons les méthodes existantes de constructi Sommaire 1 Introduction Définition des ontologies ? Taxonomie des ontologies Les ontologies Linguistique (OL) Les ontologies Conceptuelles (OC) Les ontologies en informatique Langages de représentation des ontologies Construction des ontologies Cycle de vie des ontologies Méthodes de construction des ontologies Méthode de Gruninger et Fox (TOVE) Méthode METHONTOLOGY Méthode OntoClean Méthode Unified Process for ONtologie Building (UPON) Outils pour les ontologies Conclusion

88 1 Introduction un autre. Pour faciliter la recherche et la compréhension des ressources les utilisateurs ont besoins de sémantique. Les ontologies ont montré leur efficacité dans plusieurs domaines pour résoudre les problématiques reliées à la sémantique, notamment à la personnalisation. Dans ce chapitre nous décrivons les principales notions autour des ontologies. Nous commençons, dans la section 2, par une présentation générale des ontologies, définition, présentation de quelques formalismes, méthode de modélisation. Puis, dans la section 3, nous présentons littérature et nous présentons quelques 2 Définition des ontologies Dans cette section, dans un premier temps, nous définition les ontologies en général. Puis nous nous intéressons particulièrement à leurs définitions en informatique, les composants et les langages de représentations ? Le terme «ontologie» trouve son origine dans une branche de la philosophie nommée la «métaphysique» qui étudie les principes de la réalité et a pour objet de définir la nature 12 l'étude de l'être en tant qu'être» c'est- à- dire l'étude des propriétés générales de tout ce qui est. Dep traitement symbolique des connaissances, le but premier dans les attendus des créateurs ce soit pour faire interagir et interopérer des machines entre elles ou faire interagir des le domaine de aux systèmes. 12 étant», participe présent du verbe «être» est l'étude de l'être en tant qu'être, c'est- à- dire l'étude des propriétés générales de tout ce qui est. 88

89 2.2 Taxonomie des ontologies Les ontologies ont été uti de la linguistique et des bases de données. Dans la littérature deux catégories principales sont identifiées (Rochfeld and Tardieu 1983) : Ontologie Linguistique (OL) et relations linguistiques les reliant. Les OC décrivent un ensemble de concepts (et non pas de termes) et de relations. Ils existent deux catégories de concepts dans les OC : les concepts primitifs et les concepts définis (Gruber 1993). Les concepts primitifs présentent unique. Les concepts primitifs sont utilisés par le domaine des BDs pour leurs conceptions. Les concepts définis travail de (Pierra 2003) présente les ontologies avec un modèle en oignon constitué de trois catégories : Ontologie Conceptuelle Canonique (OCC), Ontologie Conceptuelle Non Canonique (OCNC) et OL, présentées dans la Figure Les ontologies Linguistique (OL) Figure 13 : Modèle en oignon (Pierra 2003). Les OLs présentent le sens des mots et les relations entre ces mots (synonyme, antonyme, 13. La construction de telles ontologies pourrait être effectuée de manière semi- de documents du domaine, puis validées et structurées par un expert du domaine (Teguiak. 2012). Nous citons parmi ces outils Text2Onto (Philipp Cimiano and Völker. 2005)

90 2.2.2 Les ontologies Conceptuelles (OC) Les ontologies conceptuelles manipulent des concepts, constituent des spécifications explicites de conceptualisation. Elles permettent de définir formellement les concepts représentations linguistiques. (Pierra 2003) distingue les deux catégories suivantes : Les Ontologies Conceptuelles Canoniques (OCC): Ce sont les ontologies ne contenant que des concepts primitifs. Ces ontologies sont utilisées dans la conception des BD. Les OCC fournissent une base formelle pour modéliser et définir un domaine. Par exemple, nous considérons une OCC avec la classe Personne caractérisée par deux propriétés Nom et Sexe (masculin ou féminin). Les Ontologies Conceptuelles Non Canoniques (OCNC): Ce sont les ontologies contenant des iés par des relations particulièrement aux concepts définis. Les OCNC fournissent des mécanismes permettant de présenter les connaissances selon plusieurs conceptualisations. Par exemple, prenons le concept primitif Personne spécialisé par deux concepts définis Homme (Personne de sexe masculin) et Femme (Personne de sexe féminin). Les langages OWL- DL et OWL 2.3 Les ontologies en informatique (Gruber 1993) une spécification d'une conceptualisation. [...] Une conceptualisation est une vue abstraite et simplifiée du monde que l'on veut représenter». Cette définition a été ensuite étendue par (Guarino N. and Giaretta P. 1995) (Jean S., Pierra G. et al. 2007) caractérise une ontologie comme une représentation formelle, éfinition les termes les plus importants sont : - Formelle - Explicite contexte implicite. - Référençable - Consensuelle la connaissance reliée à un domaine et la rendre manipulable avec des systèmes par les êtres humains. 90

91 2.4 : les concepts et leurs propriétés, les relations entre ces concepts, et les axiomes. Ces composants permettent de modéliser un domaine. Voici les définitions de chacun de ces composants : - Les concepts : de manière globale ils recouvrent o Un ou plusieurs termes : exprimant en langage naturel le concept o Une intention : décrivant en termes de propriétés et relations la signification du concept o Une extension ou réalisation : décrivant les objets individus de ce concept - - concepts (ordonnés par la relation de subsumption) - Les propriétés : décrivent les caractéristiques du concept - Les relations : représentent les associations entre les concepts (autres que la subsomption) - Les axiomes : sont les assertions du domaine. Elles permettent, avec les règles, de déduire des nouvelles connaissances et de vérifier la cohérence de 2.5 Langages de représentation des ontologies La modélisation conceptuelle et sémantique des ontologies nécessite une visualisation intuitive des ontologies, pour pouvoir les étudier, échanger, et utiliser. Les ontologies peuvent être utilisées dans plusieurs contextes et pour différentes raisons (Guarino N. and Giaretta P. 1995). Ainsi, plusieurs formalismes de représentation, outils et approches ologies, nous présentons dans cette section le modèle PLIB, RDF, RDF Schema, DAML+OIL et OWL. PLIB (Pierra 2008) : est un langage conçu initialement pour caractériser de manière langage est existant dans un domaine du monde réel (Pierra 2003). Une ontologie PLIB permet de définir les concepts, propriétés, de domaines de valeurs et d'instances (Pierra 2002). Elle permet de définir la hiérarchisation des concepts et des pr concepts sont identifiés de manière unique par un GUI (Globally Unique Identifier) pour (Pierra 2008). Resource Description Framework (RDF) : développé par le World Wide Web Consortium (W3C). Il a pour objectif de rendre les connaissances compréhensibles par les agents électroniques effectuant des recherches 91

92 ajoutant de méta- informations. RDF ajoute une couche au- dessus de XML (extensible Markup Language) pour traiter ces méta- informations. RDF décrit les ressources simplement et clairement en utilisant des triplets constitués triplet (sujet, prédicat, objet). RDF permet de décrire des ressources simplement et sans ambiguïté. Toute ressource est décrite par des triplets. ne permet pas de définir des classes et des propriétés. RDF Schema ou RDF(S) (Brickley D. and Guha R. 2002) : as de constructeurs pour modéliser un domaine. Pour combler le manque, W3C a étendu RDF en proposant RDFS qui contient de nouveaux ontologie sur le WEB, en ajoutant un ensemble de constructeurs. concepts et de relations entre les concepts. Néanmoins, ce langage est limité et ne permet s besoins de définition de connaissances plus complexes, les langages DAML+OIL ou OWL ont été proposés. DAML+OIL (DARPA Agent Markup Language + Ontology Inference Layer) (Connolly D., van Harmelen F. et al. 2001) : est un langage qui est apparu suite à la fusion des travaux de recherche DARPA Agent Markup Language (DAML) et Ontology Inference Layer (OIL). DAML mise en place par le ministère de la défense américain, il offre une sémantique t la complémentarité des concepts. Le langage DAML +OIL a été considéré comme une base pour le W3C pour la construction de son langage OWL (Ontology Web Language) (Bechhofer S., van Harmelen F. et al. 2004) : est un donc OWL est un ensemble de triplet sujet- prédicat- objet. Il est inspiré de DAM+OIL. Au départ, OWL a pour objectif principal de publier et partager les ontologies sur le web sémantique. OWL décrit les propriétés et les concepts, ainsi que les relations entre les concepts. OWL ajoute divers constructeurs sur les propriétés et les concepts, par exemple les équivalences, symétries, différences, cardinalités, etc. Il existe trois sous- langages se présentant avec une expressivité croissante, les voici respectivement: - OWL Lite : est un langage le plus simple syntaxiquement, il permet de crée des hiérarchies de concepts sur lesquelles des contraintes simples peuvent être définies. 92

93 OWL- importante que celui- ci. Il permet de garantir la complétude des raisonnements et leur décidabilité (leur calcul se fait en une durée finie) (Coret, Richard et al. 2006). OWL- Full: - DL. Entre les sous- langage le plus complexe. Néanmoins, il ne garantit pas la complétude des raisonnements ni leur décidabilité. différents. Ils établissent un compromis, plus le langage est expressif moins son pouvoir permettant de manipuler des ontologies (modifier, charger, définir des taxonomies, etc.), fournir une vue détaillée pour chaque concept dans une ontologie. 3 Construction des ontologies Dans la littérature, selon Gómez- Pérez et al. (Gómez- Pérez, Fernández- López et al. 2004), construction des ontologies. 3.1 Cycle de vie des ontologies Les ontologies sont utilisées comme des composants dans des systèmes pour répondre à n utilisés en génie proposé dans (Borgo 2008), (R. Dieng, O. Corby et al. 2001). Il considère une étape initiale étapes sont illustrées dans la Figure 14 celle- et, parfois, en partie reconstruite. Le processus de, qui peut être intégré au cycle de vie de (Gandon 2002), repose sur les étapes suivantes 93

94 Evaluation des besoins Figure 14 : Les étapes du cycle de vie des ontologies. Selon le travail de (Bachimont. 2000), les besoins se déclinent en 3 aspects: - (Fernandez, Gómez- Pérez et al. 1997). - Le domaine de connaissance, il doit être décrit avec précision. - Les utilisateurs, il faut les identifier, cela facilitera, en accord par la phase de conceptualisation. Conceptualisation La conception dans un corpus caractérisant le domaine. Ce travail doit être effectué par un expert du modélisation informelle, ou semi- formelle, partiellement cohérente. Ontologisation Cette étape consiste à construire une ontologie, proprement dit. Elle consiste à effectuer une formalisation partielle permettant de construire une ontologie en respectant généraux, Gruber (Gruber 1993) propose 5 critères permettant de guider le processus 94

95 -, indépendamment du choix - La cohérence nt pour effectuer des inférences cohérentes en se basant sur la consistance logique des axiomes. - -, pour offrir une bonne portabilité - Un Vocabulaire minimal, pour offrir une expressivité maximale pour les termes de nte, et comporte aussi, la partie documentation et évaluation du processus de construction. Feranandez et al. (Fernandez, Gómez- Pérez et al. 1997) Opérationnalisation connaissances formel et opérationnel. L'ontologie doit aussi inclure des mécanismes de ontologie opérationnelle. 3.2 Méthodes de construction des ontologies Dans cette section nous présentons quelques méthodes majeures de construction (Gruber 1993), (M. Uschold and Gruninger 1996) et (Guarino 1998). Ces travaux insistent tous sur la définition des concepts, limitation des ambiguïtés), et sur la nécessaire séparation des Néanmoins, on ne retrouve pas dans la littérature un consensus sur une modèle standard (Rieu 1999). Plusieurs méthodes de construction inger et Fox, METHONTOLOGY, OntoClean et Unified Process for ONtologie Building Méthode de Gruninger et Fox (TOVE) Gruninger et al. (Gruninger and Fox 1995) proposent le projet TOVE, la méthode proposée par les auteurs est inspirée des techniques de développement de systèmes de base de connaissances. Les étapes proposées sont, principalement, les suivantes : 95

96 96 - Spécifier les scenarii les plus importants, ou même, les applications possibles de l'ontologie. - Identifier les questions de compétences, competencies questions, ce sont les questions auxquelles le système doit répondre en utilisant les ontologies. - Extraire les concepts et les axiomes de l'ontologie, les extraire à partir des résultats précédents. Cette méthode utilise la logique de premier ordre pour proposer une représentation en modèles formels Méthode METHONTOLOGY Fernandez et al. (Fernandez, Gómez- Pérez et al. 1997) a proposé la méthode la gestion de projet (planification, assurance qualité), de développement (spécification, conceptualisation, formalisation, implémentation, maintenance) et des activités de support (intégration, évaluation, documentation). Les étapes proposées sont les suivantes: - Spécification : produire un document de spécification de la future ontologie. formalisation à employer, sont décrits par ce document. - Acquisition de connaissances ie et leur connaissances, par exemple, les réunions de brainstorming, les interviews connaissance peuvent a priori être utilisées. - Conceptualisation : structurer la connaissance du domaine en un modèle conceptuel. - Intégration : envisager les ontologies existantes qui pourraient être intégrées tion par exemple, des ontologies génériques ou des ontologies de haut niveau. - Implantation comme LOOM, Ontolingua et aussi Prolog ou C++. - Evaluation ue son environnement logiciel - Documentation : valider et vérifier les documentations. Généralement les documentations sont incomplètes, pourtant la documentation est primordiale imposent la rédaction de documentations à la fin de chacune des phases de la à son évaluation. De plus, les concepteurs soulignent clairement le fait de réutiliser des ontologies existantes.

97 Méthode OntoClean La méthode OntoClean de Kassel (Kassel 2002) repose sur la définition de caractéristiques des concepts et permet de structurer des ontologies en imposant instances, ces caractéristiques aussi appelées méta- propriétés sont les suivantes (Guarino and Welty 2000): - : est une propriété attribuée à un concept instances de ce concept. Equivalente à la clef primaire des tables dans les BDs relationnelles. - La rigidité : est une propriété essentie Par exemple, pour le concept «personne» la propriété «être un humain» est rigide, mais «être un étudiant» est non rigide. - unité : est une propriété attribuée à un concept, uniquement, si chacune de ses instances forme «un tout». Par exemple, le concept «océan» est unité car océan pacifique», etc. sont des entités à part entière. - La dépendance tité. Par exemple, «Séjour patient «Séjour Etablissement de santé» (et inversement). En se basant sur ces quatre méta- propriétés, des contraintes peuvent être définies sur les relations de subsomption entre les concepts. OntoClean, vérifie la validité de toutes les caractéristiques, puis de tester la cohérence de la hiérarchie des concepts Méthode Unified Process for ONtologie Building (UPON) Les auteurs de (Nicola, Missikoff et al. 2005) proposent UPON, une approche de orientées utilisateurs. Voici les étapes à suivre : - : en se basant sur le résultat des réunions entre les experts de modélisation et les utilisateurs. Cette étape consiste à spécifier les utilisation. - boards (J.Krebs 2005), en créant un Lexique de l'application (LA), en identifiant les questions de compétence, competency questions (M. Gruninger and M.S. Fox 1995) - les besoins ontologiques. Ainsi, les engagements ontologiques provenant de la définition des champs d'application de l'ontologie sont étendus, par la réutilisation des ressources existantes et en affinant les concepts. Le LA est enrichi par un Lexique du Domaine (LD) plus général pour construire le Lexique de Référence

98 (LR), cela en utilisant des ressources des documentaires existantes, telles que, rapports techniques manuels, des normes, des glossaires, etc. Le LR est ensuite utilisé pour produire le Glossaire de Référence (GR) en ajoutant des définitions aux termes. - Le design du workfow : en se basan hiérarchique des termes et de leur structuration avec des attributs et des axiomes. ais plutôt conceptuelle. - : en utilisant un langage standard, rigoureux et formel. Ils ont opté pour OWL- DL. - Le test : en respectant les quatre caractéristiques suivantes, la qualité syntactique, Synthèses majorité de ces méthodes. Dans notre travail de recherche nous allons construire nos trois automatiquement. Ci- dessous un tableau des synthèses des méthodes de construction. différentes langages de formalisation, par exemple, RDF, OWL, etc. Ces outils sont décrits plus spécifiquement dans la partie suivante. 98

99 Tableau 8 : Synthèse méthode de construction d'ontologie. Méthode/Critères Spécification des besoins Technique de représentation formelle Technique TOVE Logique du premier ordre - METHONTOLOGY Document Modèle conceptuel - OntoClean Meta- propriétés des concepts Contraintes sur les liens de subsumption Règles de cohérence logiques UPON Modèle conceptuel (UML) Outils pour les ontologies conceptuel annoté avec des concepts ontologiques. Ces outils permettent : formalisation (RDF, OWL, etc.). Nous citons, Profile UML- DL, ODM, OntoUml et OWLGrEd qui se base sur les diagrammes de class UML pour visualiser les ontologies OWL. Les ex. propriétés avec plus d'une affirmation de domaine, les relations de sous- propriété, etc.), ils sont rtains langages peuvent de quelques un de ces outils. OntoEdit (Ontology Editor) proposé par Sure et al. (Sure, Angele et al. 2002) est un la logi t un plug- OWL, RDFS et FLogic. Protege ontologies, proposé par Noy et al (Noy, Ferguson et al. 2000). Le modèle de connaissance de cet outil est issu du modèle des frames et contient des classes (concepts), des slots (propriétés) et des facettes (valeurs des propriétés et contraintes), ainsi que des instances des classes et des propriétés. De nombreux plug- - in 99

100 - ins de visualisation et de raisonnements (Fact++ et ODE Madrid. ODE permet de créer une ontologie en se basant sur la méthode METHONTOLOGY. WebODE, successeu (Arpirez, Cororcho et al. 2003) tologies, importer et exporter les ontologies dans des formats variés. Il se situe dans le cadre de la logique des frames (concepts et attributs) avec des relations entre concepts et des raisonner dans un - format OWL. WebOnto, Web, proposé par Domingue et al. (Domingue and Tadzebao 1998). Le langage Operational Conceptual Modeling Language (OCML) est le modèle de connaissance utilisé, OilEd (Oil Editor) est un édi Logiques de Description, il est proposé par Bechhofer et al. (Bechhofer, Horrocks et al. 2001) ONTOLINGUA et al. (Farquhar, Fikes et al. 1997). (Farquhar, Fikes et al. 1997). OWLGrEd, utilise une syntaxe textuelle OWL Manchester 14 permettant de créer, éditer et visualiser une ontologie, proposé par Liepins et al. (Liepins, Cerans et al. 2012). OWLGrEd OWL comme des classes UML, les data properties comme des attributs des classes, les object properties comme des associations, individuals comme des objets et les cardinalités et restrictions des associations entre classe de domaine comme des multiplicités UML. Comparatif des outils de constru critères de comparaison suivants : 14 OWL 2 Manchester Syntax, manchester- syntax/ 100

101 - exemple le langage Description Logique (DL), UML, etc. - Edition - utilisateur. - Outils graphiques : Pour les outils intégrants (ou via des plugg- in) des outils de - Logique des frames : concernant les outils basés sur la logique des frames (ex. des classes, des slots, etc.). - Langage généré : précisant quelques langages générés pa etc.). - Alignement et fusion fusionner plusieurs ontologies. - Test de consistance et inférences : pour les outils intégrant des raisonneurs (ex. FACT) et offrant la possibilité de tester les connaissances. Le tableau ci- présentés précédemment. Outils/Critères OntoEdit Formalisation d'expression Tableau 9 : Comparaisons des outils de construction d'ontologies. Edition Collaborative (commercial) Outil graphique (visualisat ion) x Logique des frames x Langage généré OWL, RDFS, FLogic OWL, RDF Alignement et fusion Teste de la consistance et raisonnement Protégé Mono- utilisateur x x x ODE Mono- utilisateur x OWL x x WebOnto Collaborative x OCML RDF, OilED DAML, DAMl +OIL et Mono- +OIL, LD utilisateur OWL, x SHIQ ONTOLINGUA ONTOLINGUA Collaborative OWLGred UML Mono- utilisateur x OWL, UML 101

102 4 Conclusion Les besoins identifiées dans la littérature, les schémas conceptuels et les démarches la personnalisation dans le domaine des EDs. Dans ce chapitre, nous avons introduit. Nous avons défini les notions majeures reliées aux ontologies, p Dans la troisième partie du manuscrit nous présentons notre contribution qui consiste principalement à : 1. Proposer basant sur les ontologies. conceptuel et les ressources seront stockés dans des ontologies et reliés à 2. Définir une approche de personnalisation dirigée par les ontologies. Notre personnalisation qui retourne un ensemble de ressources candidates nous proposons de décrire sémantiquement la ressource recommander des ressources pour compléter sées. 102

103

104 104

105

106 Chapitre 6 : Résumé. Pour assister les utilisateurs de backgrounds sémantique support sémantique, nous proposons un système de personnalisation basé sur des ontologies. Ce chapitre, ne introduction à chacun de ces composants qui seront traités plus en détails dans les chapitres suivants. Sommaire 1 Introduction Architecture générale du système de personnalisation proposée Personnalisation de la recherche des ressources Description sémantique Recommandation de ressources Les acteurs impliqués par le système de personnalisation Conclusion

107

108 1 Introduction Les EDs offrent un environnement homogène de données. Les ressources issues de cet ED, ont des backgrounds différents. Alors que la plupart des institutions partagent ses ressources (sur des plateformes commerciales, par mail ou sur le réseau intranet) avec leurs utilisateurs, les conséquences de l'absence d'un soutien efficace facilitant la recherche et la compréhension du contenu ne ressource ne sont pas considérées. Outre, le manque de sémantique, le problème de base, face à n'importe quel utilisateur, à son objectif. La solution sémantique qui sera appropriée dans ce cas, doit assister les utilisateurs pour leur proposer des ressources susceptibles de les intéresser. P nécessaire pour améliorer la recherche et la personnalisation de ressources une Les objectifs principaux de cette aide sont (Figure 15) : - en retournant - Pallier le manque de sémantique des ressources en enrichissant leur description avec la sémantique nécessaire. - Etendre la personnalisation afin de recommander des ressources de consultation, et en exploitant les relations sémantiques entre cette ressource et les concepts des ontologies. Figure 15 : Objectifs visés. concepts et les relations entre elles. Cette description facilite la manipulation sémantique 108

109 relations sémantiques des ontologies pour déduire des nouvelles relations entre Dans un premier temps, la section 2 de notre système de personnalisation basé sur les ontologies (OPS) et nous introduisons chacun de ses composants. Dans un deuxième temps la section 3, présente les différents acteurs impliqués dans la mis exploitation du système. 2 Architecture générale du système de personnalisation proposée Le Système de Personnalisation basé sur les Ontologies, (OPS - Ontologies based Personnalization System) que nous proposons a pour objectif de personnaliser la rents stockés dan Rappelons que ces utilisateurs ont des backgrounds différents, caractéristique de notre des ressources. Pour stocker et exploiter cette sémantique, nous avons retenu une approche basée sur les ontologies. Figure 16 une BC moteur de personnalisation. 109

110 Figure 16: Architecture du système de personnalisation basé sur les ontologies. - La BC domaine (OD OED) tantes (OR). Ces ontologies sont développées dans le langage OWL. - Le moteur de personnalisation apporte, au travers de diverses interactions avec les Dans notre approche, nous proposons deux stratégies : - La première stratégie elle permet de personnaliser les ressources en se basant sur la correspondance entre les mots clefs sateur et les concepts correspondants elle offre une liste de recommandation des ressources se base sur la recherche de concepts et les relations sémantiques dans les ontologies. -. Cette stratégie ne se limite pas à la description des éléments composant la ressource (ex. définition, unités de mesures, etc.) mais 110

111 stratégie fournie une description sémanti 2.1 Base de connaissance ontologique (BC) de décrire formellement les concepts, et les relations entre les concepts relatifs à cette sémantique. Architecture de la BC e des trois ontologies suivantes : - Ontologie domaine ontologie regroupe le vocabulaire des concepts liés à un domaine, et vise précisément à homogénéiser le vocabulaire liés au domaine. Les concepts de - : décrit sémantiquement la structur - ci. - Ontologie ressources : décrit les ressources, elle associe aussi à chaque ressource un objectif. 2.2 Moteur de personnalisation exploitant la BC précédente. attend du système une ressource reliée à des concepts de son domaine en adéquation avec les du système une ressource qui réponde à son besoin, il cherche à savoir si cette ressource est exhaustive vis à vis de son besoin (ex. objectif, dernière date de mise à jour). Enfin, peut avoir Aussi, pour répondre à ces diverses questions trois fonctions de recherche sont assurées par le moteur de personnalisation : 1. Personnalisation de la recherche des ressources Recommandation de ressources complémentaires Personnalisation de la recherche des ressources propose de façon techniques de matching et de tri pour retourner un ensemble de ressources ordonnées. 111

112 2.2.2 Description sémantique des concepts reliés aux ressources sont utilisées pour donner : (1) une vue cartographique (globale) de la ressource en montrant la relation entre les concepts composant la OD OED OR, et (2) une description précise de tous les éléments de la ressource (ex. objectif, concepts du domaine impactés, date de mise à jour, méthode de calcul). enrichie avec des connaissances pour enlever toute ambiguïté. Les éléments de s ressources. Les concepts de la ressource qui sont éder à la définition détaillée du concept en considération Recommandation de ressources complémentaires. Le raisonnement sur les ontologies nous permet de recommander aux utilisateurs des ressources, Figure 17. Grâce aux ontologies, le moteur de personnalisation permet la recommandation de nouvelles ressources en se basant sur le voisinage de concepts (ex. mesure de similarité sémantique). Figure 17 : Vue globale : Recommandation à base sémantique des ressources. Rencours». 112

113 3 Les acteurs impliqués par le système de personnalisation s intervenants dans la phase de conception dans la. 3.1 Les acteurs de la conception de la BC. Nous avons conçu un ED autour du PMSI selon une méthode hybride (orientée sources et sémantique. Pour pallier le manque de sémantique nous avons réfléchi à une BC qui fournit des connaissances aux utilisateurs appartenant à des «backgrounds» différents. créer notre BC, cette étude a été effectuée par les utilisateurs finaux, experts métiers et Figure 18. Figure 18 : Acteurs participant à la création de la BC. 1. qui a des connaissances approfondies de celui- experts métiers pourraient aussi participer à la validation. 2. s ressources auxquels vont contribuer le. 3. Les concepts reliés au domaine du PMSI sont générales à tous les utilisateurs. Donc, ous les utilisateurs peuvent contribuer à la conceptualisation. 113

114 La définition et la validation des ontologies est un travail effectué par des informaticiens et non informaticiens. 3.2 Les utilisateurs du système uvent être interprétés différemment - Figure 19, sont plus particulièrement concernés par notre système. Figure 19 les utilisateurs finaux qui sont les acteurs intéressés par les ressources issues des EDs (décideur, gestionnaire, personnels administratifs et médicaux) : ils ont des qui sont les experts informatique en charge de la conception et mise acteurs sont intéressés par son modèle conceptuel à des fins de conception, de 4 Conclusion Nous avons présenté dans ce chap système de personnalisation sémantique que nous proposons pour aider les utilisateurs à utiliser des ressources disponibles pour exploiter un ED effet, notre approche offre des solutions de description sémantique pour Dans les chapitres suivants nous présentons en détails les composants du système. Dans le chapitre 7 nous sp de façon détaillée le moteur de personnalisation et son fonctionnement. 114

115

116 Chapitre 7 : Résumé. Dans ce chapitre nous présentons la BC du système OPS. La BC rassemble la sémantique dans trois ce chapitre nous présentons en détail cette BC, not chacune des ontologies ainsi que leur mapping. Sommaire 1 Introduction Considérations méthodologiques Ontologie de domaine Niveau 1 : PMSI règlementaire Niveau 2 : PMSI extra- règlementaire Niveau 3 : extra- PMSI : travail préliminaire Ontologie des ressources Interconnexion des ontologies Conclusion

117 1 Introduction lusieurs méthodes de oposées se nécessaire à collecter et le niveau de formalisation. Les méthodes que basées sur deux étapes principales : la spécification informelle puis la formalisation de essources en se basant sur la construite s sera construite au fur et à mesure, chaque nouvelle ressource Dans ce chapitre, nous décrivons en détail les trois ontologies de la BC du système OPS. La section 2 présente la méthode de construction des ontologies que nous avons retenue. La section 3 section 4 en fait de même pour ection 5 pour l ressources. Avant de conclure, la section 6, présente la méthode que nous avons retenue pour interconnecter les trois ontologies (mapping des 3 ontologies). 2 Considérations méthodologiques.. Pour construire intuitive littérature, il existe plusieurs langages de représentation des ontologies, dont certains sont inspirés du domaine du génie logiciel, confronté à ce même problème. 2.1 Classification des ontologies Selon Psyché et al. (Psyché, Mendes et al. 2003), les ontologies peuvent être classées en plusieurs types selon leurs objets de conceptualisation : ontologie de domaine, ontologie dans la littérature (Roussey, Pinet et al. 2011), (Borgo 2008), (Gómez- Pérez, Fernández- López et al. 2004), (Lassila O., McGuinness et al ),. Chacune de ces classifications se auteurs de Roussey et al. (Roussey, Pinet et al. 2011) proposent une classification basée 117

118 118 sur deux dimensions : (Langage naturel, langage formel, langage logiciel et information) et (domaine, référence, application et fondamentale). Nous intéressons à la dimension de cette classification Dans ce contexte, d ontologies logicielles définis avec des langages semi- formels, inspirés des langages (Roussey, Pinet et al. 2011). Ontologies logicielles (software ontologies) Elles fournissent un schéma conceptuel dont l'objectif principal est la description, le stockage de données et la manipulation de données. Elles sont utilisées pour des activités de développement de logiciels, dans le but de garantir la cohérence des données. Elles sont définies avec les langages de modélisation conceptuelle, utilisée pour la conception de logiciel et de base de données, par exemple, Entité- Relation ou Orienté Objet. Plusieurs travaux sont proposés dans le contexte des ontologies logicielles (Aybuke and Claes 2005). Elles sont généralement exprimé dans le langage UML, Ontologies formelles (formal ontologies) Elles exigent une sémantique claire pour définir les concepts, des motivations univoques pour faire la distinction entre les concepts adoptés ainsi que des règles strictes sur la façon de définir les concepts et les relations. Ceci est obtenu en utilisant une logique formelle (ex. logique de premier ordre ou logique de description). Le but n'est pas uniquement de teur lors de la manipulation de formule logique. Il existe différents langages formels utilisés pour décrire l'ontologie, par exemple, les Logiques de Description (DL), les Graphes Conceptuels (CG), la logique du premier ordre (FOL), etc. Il existe plusieu sur les modèles XML, RDF, DAML+OIL, OWL. 2.2 à OWL Unified Modeling Language (UML) est un standard utilisé pour modéliser les systèmes our visualiser, spécifier et construire des composants logiciels. UML est un formalisme semi- formel. UML propose différents diagrammes par exemple le diagramme de classes, etc. Cependant, UML ne suffit pas pour présenter tous les détails pour effectuer des raisonnements complexes (Baader, Calvanese et al. 2003) par exemple, déduire des connaissances, faire des rai les environnements professionnels et académiques, tant par des informaticiens que des non informaticiens. Les utilisateurs sont plus familiarisés avec les notations UML adéquat pour la représentation des ontologies (semi- formelle relevant de vocabulaires partagés) n domaine particulier.

119 Ces dernières années, des milliers d'ontologies ont été développées et certainement es dans le futur (B. Neumayr, S. Anderlik et al. 2012). des éditeurs graphiques, est essentielle. Les ontologies sont en règle générale décrites avec le langage Web Ontology Language (OWL). Ce format est très uniforme, facile à présentation en terme des niveaux d'abstraction, comme les concepts, les individus et les forme graphique soit utile, elle doit regrouper les concepts et les relier, comme ce qui est proposé dans les diagrammes de classes UML. Cependant, les outils de visualisation de l'ontologie les plus courants, comme par exemple IsaViz (N. Berkani, S. Khouri et al.), OWLViz (Bellatreche L., Nguyen Xuan D. et al.), Growl (Arvidsson and Flycht- Eriksson), Welkin (Jean S., Pierra G. et al.) permettent de visualiser les ontologies en présentant chaque triplet de connaissance sous forme de triplets constitutés par une arc annoté entre eux. De ce fait, l'information est volumineuse et répartie sur une grande surface, rendant la structure difficile à percevoir. Beaucoup de concepts des langages basés sur les ontologies sont semblables à ceux des diagrammes de classes UML (IBM 2006). Par exemple, le travail de recherche de (Pinet F, Ventadour P et al. 2006) un diagramme de classe UML. De plus, un profil, UML pour OWL 15 a été défini afin de «Top Braid Compositeur» ( - Recuerda et al. 2003) propose également la notation UML diagramme de classes pour OWL. Enfin, (Liepins, Cerans et al. 2012) propose un éditeur «OWLGred» qui facilite la créatio - versa. Il propose un 2.3 OWLGred 16 basé sur UML. Les éléments communs avec UML sont les suivantes : - Les concepts : présentés par des classes. Les concepts regroupent un ensemble - Les propriétés de données : représentées en - Les propriétés de l'objet entre concepts. - Les individus : représentés comme des objets. - Les restrictions de cardinalité : représentées comme les cardinalités des associations UML. 15 UML profile,

120 s (Barzdins, Barzdins et al. 2010, Barzdins, Cerans et al. 2010), OWLGrEd enrichit le diagramme de classe UML avec des nouvelles notations pour la visualisation des - Champs dans la classe : pour les concepts équivalents, super- concepts et concepts disjoint, les expressions sont écrites avec «Manchester OWL syntax». - Champs dans les associations et attributs pour les équivalent, disjoint et super propriétés et champs pour les caractéristique des propriétés, par exemple, transitive, etc. - Classes anonymes : contenant les concepts équivalents. - Connecteurs (lignes) pour visualiser les disjoint binaire, équivalent, etc. des axioms. - Boxes avec connecteur pour les axioms à n- aray disjoint, équivalent, etc. - Connecteurs (lignes) pour visualiser les restrictions sur object property, some, only, exactly, ainsi que les restrictions sur les cardinalités. Protégé. OWLGrEd peut être utilisé pour créer une ontologie puis enregistrer celle- ci - être même exportée vers Protégé pour interroger, analyser ou visualiser une ontologie existante sous format OWL, de même une ontologie créée avec Protégé peut être importée et visualisée avec OWLGrEd. Voici un tableau de correspondances 17 Constructeurs OWL Concepts Constructeurs UML Individus Instance Hiérarchies des concepts

121 Object properties Object properties assertion Datatypes Data Properties Concepts complexes Property Restriction 2.4 méthodes de construction. Pour construire nos ontologies, nous allons suivre la : - Evaluation des besoins : identifier connaissance et les utilisateurs - Conceptualisation - Ontologisation : construire une ontologie semi- formelle. Pour mettre en place cette - Opérationnalisation connaissances formel et opérationnel. Dans automatiquement en OWL, puis, manipulée et enrichie avec Protégé Processus et outils utilisés pour la création des ontologies Dans notre travail de recherche, pour la construction et la validation de la BC nous utilisons exprimé sous forme de diagramme de classe UML à OWL, et l 121

122 pour créer et gérer les ontologies. Dans un premier temps pour naviguer dans 19 Protégé), pour requêter avec SPARQL, pour raisonner avec SWRL. Ainsi, l étapes de la méthodologie de construction sont réévaluées. Figure 20 illustre le passage de UML à OWL et vice- versa. Figure 20 : Construction des ontologies. 3 Ontologie de domaine «OD» ensemble de concepts, des individus et des relations, afin de créer et D vise à «rassembler et unifier le terme lié à un domaine D sont les suivantes : - spect linguistique (définition, concepts équivalents, etc.). - Associer à chaque concept un ensemble de concepts qui permettent de le définir et - Structurer les concepts hiérarchiquement. Plusieurs types de relations sémantiques so ED R

123 123 Dans la littérature, il existe plusieurs types de représentation du langage médical, qui sont utilisés dans les systèmes d'information pour la génétique, la médecine, etc. Les différentes techniques existantes ont été déjà classifiées par (Nakache 2007) ainsi : - Le thésaurus exemple, Medical Subject Headings (MESH) est un thésaurus conçu en 1960 par la National Library of Medicine Medline. - Le catalogue uvent utilisé pour la tarification. Par exemple, dans le cadre du PMSI le codage des actes médicaux se base sur la Classification Commune des Actes Médicaux (CCAM). - Le dictionnaire sens et leurs définitions. Par exemple, les dictionnaires ADM, Internist/ Quick Medical Reference (QMR), DXplain, AI/RHEUM. - Les terminologies organisé et structuré. - Les nomenclatures : ce sont des systèmes de noms utilisés dans une branche de connaissance particulière. Par exemple, SNOMED qui est un système multi- axial (topographie, étiologie, morphologie, fonction). Il existe aussi la Nomenclature Générale des Actes Professionnels (NGAP) utilisée pour la tarification. - Le méta- thésaurus UMLS - ensemble des représentations précédentes. Pour représenter le langage médical, Unified Medical Language System (UMLS) est un projet, des Etats- Unis, de la National Library of Medicine (NLM) né en Il est construit à partir du MeSH auquel on a rajouté un réseau sémantique, étendu objectif est de constituer un langage unifié à partir des classifications, thésaurii, nomenclatures, etc. existants. 3.1 Evaluation des besoins et conceptualisation Dans cette sous- conceptualisation. Notre OD reliés au PMSI et la nomenclature CIM10. Nous avons réalisé une ontologie de domaine décrivant les concepts médicaux. Nos principales sources sont les suivantes : - Ontologie autour du PMSI - Terminologies extraites de la CIM 10 Ontologie autour du PMSI Dans notre approche, OD définit la sémantique autour des concepts reliés à un domaine du management hospitalier du PMSI. Aucune ontologie de domaine ne décrit cet aspect. Aussi, nous avons développé une ontologie spécifique au PMSI qui a été élaborée en se basant sur des documents officiels portant sur le domaine du PMSI et sur les connaissances des experts du domaine. Nous nous sommes inspirés notamment du (GMSIH 2005).

124 Avec les experts du domaine PMSI reliés au modèle du PMSI, les niveaux sont les suivants: Niveau 1 : PMSI réglementaire (les concepts PMSI), cf. Figure 21. Niveau 2 : PMSI entités extra- réglementaire (les concepts dérivés du PMSI). Niveau 3 : Entités extra- PMSI (les autres concepts du parcours patient reliés au PMSI). 124 Figure 21: 3 niveaux de l'ontologie de domaine. Uniquement les niveaux 1 et 3 sont pris en compte dans notre ontologie de domaine autour du PMSI Niveau 1 : PMSI règlementaire Définition PMSI règlementaire : «ceux- ci permettant de répondre à un besoin règlementaire». Par exemple, le concept «Résumé standardisé de séjour» et sont des concepts Utilisateurs Dans ce contexte nous avons : - Type 1 : les médecins produisant les fichiers PMSI - Type 2 : le corps administratif produisant les fichiers PMSI Concepts reliés aux utilisateurs du Type 1 aux utilisateurs du type 1, des utilisateurs médecins, nous avons suivi les étapes suivantes : - Etape 1 : Du séjour au fichier, pour modéliser les fichiers RUM, RSS, RSA, GHM, etc. - Etape 2 : Cas particulier des séances, pour modéliser les fichiers séances - Etape 3 : Cas particulier des naissances, pour modéliser les fichiers reliés à la naissance - Etape 4 : Eléments en plus des «groupes homogènes» FICHCOMP, pour modéliser les fichiers complémentaires

125 Concepts reliés aux utilisateurs du Type 2 Pour concevo des utilisateurs du corps administratif, nous avons modélisé les fichiers ainsi que le chainage et les relations exitants entre eux (VIDHOSP, ANOHOSP, HOSPPMSI). Dans le modèle conceptuel PMSI, nous distinguons les concepts reliés aux utilisateurs du type 1 et les utilisateurs du type 2 par les couleurs. Concept Referentiel Fichier PMSI Personnel médical Unité de soins Personnel non médical DIM Information partie médicale CIM10 CCAM Information partie administrative RUM Numéros administratif de séjour Numéro RSS VIDHOP Numéros administratif de séjour HOSPMSI RSS GHM ANO GHS RSA FICHCOMP ANOHOP ANO FICHCOMPA LPP UCD Autres Figure 22 : Modèle PMSI niveau Niveau 2 : PMSI extra- règlementaire Définition PMSI extra- réglementaire : «utilisation étendue du PMSI réglementaire. Il présente répondants aux besoins médico- économiques informations métiers pour extraire des connaissances à partir des données, uniquement PMSI. Cela englobe les outils à la disposition des utilisateurs (DIM et avec autorisation). Formalisation a formalisation, par exemple avec les logiques de descriptions Niveau 3 : extra- PMSI Définition Extra- PMSI : «des concepts extra- PMSI articulés avec les données du PMSI.» passer. 125

126 Formalisation : Pour formaliser les concepts et les relations des concepts reliés au PMSI aux autres concepts extra PMSI mais reliés au domaine du PMSI, nous aurions recours au langage UML ou au langage de description logique. documents officiels autour du PMSI (GMSIH 2005), (santé 2013). Ontologie CIM10 nomenclature des causes de décès, date de 1853, réalisé par W. Farr. Il faudra attendre classification complète des maladies. La France utilise la Classification Internationale des Maladies version 10 (CIM- 10 en anglais International Classification of Diseases, ICD), pour coder les diagnostics et la Classification Commune des Actes Médicaux (CCAM) pour coder l de plusieurs pays du monde, par exemple, le système canadien ICD10- AM (AM pour Australian Modification) qui intègre les actes ou la CIM10- CA pour son adaptation Canadienne. La CIM- 10 est un catalogue hiérarchisé et codifié des maladies. Elle couvre environ codes sur une hiérarchie des codes de 5 niveaux. Mais, dans la majorité des cas uniquement les 4 premiers niveaux sont utilisés, ce qui couvre diagnostics. Les A00 à B99». Voici le détail de ce second niveau de hiérarchie : A00- A09 A15- A19 A20- A28 A30- A49 A50- A64 A65- A69 A70- A74 A75- A79 A80- A89 A90- A99 B00- B09 B15- B19 B20- B24 B25- B34 B35- B49 B50- B64 B65- B83 B85- B89 B90- B94 B95- B97 B99 Maladies intestinales infectieuses Tuberculose Certaines anthropozoonoses bactériennes Autres maladies bactériennes Infections dont le mode de transmission est essentiellement sexuel Autres maladies à spirochètes Autres maladies à Chlamydia Rickettsioses Infections virales du système nerveux central Fièvres virales transmises par des arthropodes et fièvres virales hémorragiques Infections virales caractérisées par des lésions cutanéo- muqueuses Hépatite virale Maladies dues au virus de l'immunodéficience humaine [VIH] Autres maladies virales Mycoses Maladies dues à des protozoaires Helminthiases Pédiculose, acariase et autres infestations Séquelles de maladies infectieuses et parasitaires Agents d'infections bactériennes, virales et autres Autres maladies infectieuses 126

127 harmoniser les échanges électroniques, il existe une norme internationale la HL7 20. Voici la synthèse, de (Nakache 2007), des codifications retenues par pays : Figure 23 : Codage des maladies dans les différents pays (Nakache 2007). 20 Health Level 7 (HL7) est une organisation qui définit un ensemble éponyme de spécifications techniques pour faciliter les échanges éléctroniques de données cliniques, financières et administratives entre systèmes d'information hospitaliers (SIH). Site web : 127

128 3.2 Ontologisation D PMSI. Elle se présente D modélisée en UML est validée par les experts du domaine, elle peut être automatiquement transformée en ontologie formelle en langage OWL. La méthodologie utilisée pour élaborer cette ontologie est illustrée dans la Figure Opérationnalisation Figure 24 d Cette ontologie peut être enrichie (Lassila O., McGuinness et al. 2001), manipulée et visualisée, notamment pour ajouter des définitions, de la en OWL dans Protégé et validée avec les experts du métier. La Figure 25 présente un extrait de cette ontologie visualisée avec le pluggin OntoGraph sous Protégé. 128 Figure 25

129 4 4.1 Evaluation des besoins et conception Dans cette sous- section nous commençons par présenter une étude de cas des besoins décisionnels pour concevoir un ED autour du PMSI. Dans le cadre de cette thèse, nous avons du concevoir un ED autour du PMSI. Dans la suite du mémoire, nous considérons cette ED pour présenter nos exemples : travail préliminaire nous nous sommes basées sur une démarche de conception hybride. Voici quelques ent. : ces indicateurs présentent les ressources en fonction des différents - Le nombre de lits de type Médecine, Chirurgie, Obstétrique (MCO), pour indiquer la capacité d'une unité médicale à recevoir de patients. - Les pr Indicateurs de demande d'être traitée. Ils sont principalement basés soit sur l'âge du patient ou sur le mode de sortie : - Le séjour est décrit et analysé selon les groupes homogènes de maladies. - Les principales spécialités d'un pôle. Indicateurs de flux de patients : ces indicateurs présentent la cause de l'hospitalisation (la provenance) et la destination des patients : - Quelle est la provenance des mères? - Quelle est la destination de la mère après l'accouchement? est présenté dans le Tableau

130 Tableau 10 Structure Temps GHM Classification CIM10 Age Sexe Mode d'entrée Mode de sortie Nombre de séjours Nombre de jour (PMSI) Valorisation T2A Nombre de lits x x x x x x x x x x x x x x x x x x Pour valider Figure 26 ensemble de table de fait F, de dimensions D, de mesures M: - F= {F_Activité} - D= {D_Temps, D_Structure_Hopital, D_Classification_internationale_des_maladies, D_Mode_Sortie, D_Groupe_Homogène_de_malades, D_Age} - Figure 26 : Modèle conceptuel de l'ed autour du PMSI OED» décrit sémantiquement la structure du modèle conceptuel de différents concepts métiers et les Nous nous sommes basés sur les règles de transformation décrites par (Prat, Akoka et al. 2011) pour passer ie formelle exprimée en OWL- 130

131 dimension devient une classe en OWL- DL, les règles de transformation appliquées sont les suivantes : A_Dimension. A_D_Structure_Hopital A_Dimension. A_D_Temps A_Dimension. Dimension_D_Age A_Dimension. Dimension_D_Classification_internationale_des_maladies A_Dimension. Dimension_D_Mode_Sortie A_Dimension. Dimension_Groupe_homogène_de_malade A_Dimension. lyse et les tables de dimensions représentent les axes d'analyse privilégiés. La table de faits, centre du modèle multidimensionnel, stocke les indicateurs élémentaires, dits «mesures». Les dimensions forment des hiérarchies, structurées en différents niveaux de granularité. Cette ontologie classifie les : - Table de dimension «A_Dimension». - Niveau de dimension «A_DimensionLevel». - Tables de faits «A_Fact». - Hiérarchie«A_Hierarchy». - Mesure «A_Measure». Ces concepts parents sont présentés dans la Figure 27. Figure 27 : Concepts de l'ontologie de l'entrepôt de données avec Protégé. Les relations entre les concepts et sous- concepts sont définies avec des relations ED D R. Par exemple, la table de fait est reliée à différentes dimensions, en se basant sur les règles de transformations de Prat et al. (Prat, Akoka et al. 2011), les concepts représentants les tables de faits et de dimensions sont présentés comme suit : - La table des faits avec le concept «Fact_Actvite_PMSI», sous- concepts de «Fact». - Les dimensions sont des sous- concepts du concept «Dimension». - Pour définir la relation entre les tables de dimensions et la table de faits un object property «dimensionedby». Pour montrer la relation entre la table de fait et les dimensio Figure

132 Figure 28 : Extrait de l'ontologie de l'ed, de la table des faits aux dimensions (Protégé). 4.2 Ontologisation ED nous utilisons un processus spécifique pour passer du schéma - DL. Ce passage est basé sur les règles de transformation spécifiques décrites par (Prat, Akoka et al. 2011). Les auteurs ont mis en place des règles de transformation pour enrichir sémantiquement et stocker un outil en Java et OWLAPI qui prend en compte ces règles de transformation pour le Pour appliquer ces règles de transformation, il a fallu identifier les tables de faits, les mesures, les dimensions et les niveaux hiérarchiques grâce à des conventions de ex. le nom des tables dimensions commencent par un «D_»). Nous avons réalisé un programme (avec Java et OWL API) qui prend en entrée le script faits, dimensions, mesures) ainsi que leurs relations, et produisant en sortie une ontologie ntrepôt en OWL en appliquant les règles de transformation définies par (Prat, Akoka et al. 2011). La Figure 29 décrit ce processus. 132

133 sémantiquement, peut être visualisé en UML avec OWLGred. 4.3 Opérationalisation Figure 29 ED, les concepts sont enrichis sémantiquement. La Figure 30, qui sont des sous concepts de «A_DimensionLevel». Elle représente chacun de ces n dimensions à un autre. Pour le même exemple, la Figure 31 permet de visualiser les niveaux de dimension avec le pluggin OntoGraf de Protégé. 133 Figure 30 : Extrait du schéma de l'ed en UML avec OWLGred.

134 Figure 31 : Extrait du schéma de l'ed avec Protégé/OntoGraf. 5 Ontologie des ressources 5.1 Evaluation des besoins OR errogation des données OLAP. Ces propositions opérateurs interactifs facilitant la navigation au sein des données multidimensionnelles (Abelló, Samos et al. 2003). Différentes études comparatives ont été réalisées dans (Abelló, Samos et al. 2006) (Rafanelli 2003) (Torlone 2003) (Ravat F, Teste O et al. 2008). re relationnelle pour le modèle en cube afin de créer des opérateurs pour la manipulation OLAP (Agrawal, Gupta et al. 1997, Datta and Thomas 1999) (Gray, Bosworth et al. 1996) (Li and Wang 1996, Gyssens and Lakshmanan 1997). Pour les requêtes des bases de données multidimensionnelles certains SGBD ont ajouté les opérateurs Roll- up et Cube (Gray, Bosworth et al. 1996) à la syntaxe de SQL, syntaxe de type SQL, comme le langage MDX proposé par Microsoft et utilisé par divers serveurs OLAP (SQL serveur de Microsoft, Mondrian, Oracle). 134

135 R sont les suivantes : - Classifier les ressources selon leurs types Utiliser plusieurs types de relations pour re ED R. Même si le modèle multidimensionnel est basé sur la métaphore du cube ou hypercube, il existe plusieurs visualisations des ressources de natures différentes (tableau multidimensionnel, histogramme, graphique, etc.). La visualisation la plus commune est le tableau multidimensionnel, exemple Figure 32. Figure 32: Tableau multidimensionnel. R Cependant, dans ce travail de recherche, nous nous focalisons principalement sur les TM. : s qui aide à la prise de décision. Un support peut être un tableau (multidimensionnel ou à 2 dimensions), un graphe (histogramme, courbe, etc.) ou un rapport. Les types de support sont aussi variés, tels des fichiers Excel, PDF, SharePoint, etc. Définition du tableau multidimensionnel (TM) : Le TM présente les données selon (Gyssens and Lakshmanan 1997), (Lehner 1998) permettant de visualiser une tranche du cube. 5.2 Conceptualisation Les resso comprendre le éléments de description sémantique, par exemple : le mode de calcul, l'unité de mesure, la période de calcul, la date de création, la Taxonomies des ressources prenons en compte dans notre ontologie de ressources : (i) les ressources opérationnelles qui 135

136 requête OLAP) et (ii) les ressources conceptuelles qui sont les ressources qui sont utilisées par les utilisateurs finaux (ex. fichier Excel). Conceptualisation sont ajoutées progressivement et référencées R récupérées par le système OPS, et par les utilisateurs finaux. Les ressources sont manager nts suivants, présentés dans la Figure 33 : - Ressource : Les éléments de descriptions spécifiques à une ressource : o Identifiant de la ressource (ID_Ressource): La clef primaire pour identifier une ressource. o Objectif : de la ressource. o Lien vers la ressource : o Nom du fichier : de la ressource. o Date de validité : de chacun des éléments de la ressource. o Date de mise à jour : de chacun des éléments de la ressource. o Date de création : de chacun des éléments de la ressource. - Critères de création de la ressource : Les critères pris en compte pour la construction de la requête source de la ressource sont stockés. - Personne ces personnes sont les suivantes : o Créateur : Le nom de la personne ou de externe) définissant les critères de calculs et la mise en place de la requête source de la ressource. Par exemple, la Fédération Française des Réseaux de Santé en Périnatalité publie des études régionales pour calculer le cs, les actes et autres renseignés dans le PMSI. o Auteur : Le nom des personnes (agent APHM) qui ont participé à la mise en place de la ressource. o Coordinateur : Le responsable de la ressource et le garant des données adresse de bureau et le numéros de téléphone du coordinateur sont nécessaire pour répondre aux questionnements des utilisateurs. - Keywords : Les mots clefs décrivant la ressource (ils appartiennent de domaine). - Mesures : Les informations reliées à la mesure a o Unité de mesure : des mesures (ex. euros, jours). o Méthode de calcul : des mesures calculées. o Période de calcul : des mesures de la ressource. 136

137 Figure 33. Modèle de l'ontologie des ressources. 5.3 Ontologisation Pour d R, comme pour l'ontologie de domaine, nous utilisons UML pour les mêmes raisons. Les ressources conceptuelles (ressources orientées utilisateur) sont ressources opérationnelles. 5.4 Opérationalisation R avec OWLGred, chaque ressource est enrichie sémantiquement. 137

138 Figure 34 R avec Protégé/OntoGraf. 6 Interconnexion des ontologies Pour s trois ontologies est guidée par des liens de mapping spécifiques que nous avons définis une mappings utilisant ces relations sémantiques dans des raisonnements. Dans la littérature, il existe plusieurs méthodes pour représenter le mapping des ontologies, par exemple OWL (Ehrig 2007), RDF/XML (Euzenat) ou OntoMerge(Dou, Drew et al. 2003). Notons que dans la littérature, il existe aussi différentes approches voir outils de mapping, par exemple, Prompt (Noy and Musen 2003), QOM (Ehrig and Staab 2004), FCA- Merge (Stumme and Maedche 2001), IF- Map, Glue (Doan, Madhavan et al. 2002), RinMOM (Tang, Li et al. 2006), CTXMatch (Bouquet, Serafini et al. 2003). De notre travail, la mise en correspondance entre les ontologies est basée sur la combinaison de plusieurs stratégies. D décrites dans la sous- section 6, de similarité entre les concepts qui seront abordées dans le chapitre suivant. Ces la BC, qui peut être alors vue comme une seule ontologie. 138

139 Mapping La mise en correspondance ou «mapping» entre ces trois ontologies est primordiale pour effectuer du raisonnement basé sur les relations. Pour interconnecter les trois ontologies Figure 35, nous avons défini de relations sémantiques entre les concepts de chacune des ontologies. Pour effectuer ce mapping nous avons considéré les ontologies deux à deux. Ces trois mapping sont : - Mapping 1 (OED - OD) - Mapping 2 (OR - OED) - Mapping 3 (OR - OD) 6.1 Mapping 1 (OED- OD) Figure 35 : Les liaisons entre ontologies. OD est OED OD et vice- versa. Voici la démarche de mapping (OED- OD): - Travail préliminaire ED D - ED D : Mapp(CED, D, hasdomainconcept), CED est un concept de ED, D est un ensemble de concepts D. Un concept CED ED peut être ED. Lors du Mapp(CED, D, hasdomainconcept ED est relié à un ou plusieurs concepts de D avec la relation sémantique hasdomainconcept Formalisation Mapp (CED, D, hasdomainconcept) - CED ER, CID OED - D = {CD1, CD2, Di} où D OD est un ensemble de concepts D - hasdomainconcept est la relation sémantique entre CED et CD 6.2 Mapping 2 (OR- OED) OED vers les ressources conceptuelles et opérationnelles. Un concept lié à une ressource peut être lié à un ou plusieurs concept(s) de OED. Par exemple, une requête OLAP est reliée à chacun de ses 139

140 - à- dire, à un ensemble de mesures et niveaux de dimension. Les OED OR. Voici la démarche de mapping (OED- OR): - Travail préliminaire R ED - et OR : Mapp(CID, ED, hasmultidimensionalconcept), CID est le identifiée par son nom. Chaque concept CID est associé ED. ED est un ensemble de dimensions DED et de mesures MED. Lors du Mapp(CID, ED, hasmultidimensionalconcept), CID est référencé par un ensemble de dimensions et de mesure avec la relation sémantique hasmultidimensionalconcept Formalisation Mapp (CID, ED, hasmultidimensionalconcept) - CID R, CID OR - ED = {CED1, CED2, EDi} où i [1..n], CEDn OED - hasmultidimensionalconcept est la relation sémantique entre CID et CEDn 6.3 Mapping 3 (OR- OD) Chaque ressource CID de OR D. Voici la démarche de mapping (OR- OD) : - Travail préliminaire R D - R et OD : Mapp(CID, D, haskeywords), CID est le concept identifiant R. D est un ensemble de concepts D relié à CD. Un concept CID de OR R. Lors du Mapp(CID, D, haskeywords), chaque concept CID est rélié à un ou plusieurs concepts D Formalisation Mapp (CID, D, haskeywords) - CID OR, CID OR - D = {CD1, CD2, Di} i [1..n], CDn OD - haskeywords est la relation sémantique entre CID et CDn 6.4 Fichier de paramétrage de mapping concepts des ontologies on les enregistre dans un fichier de paramétrage que nous avons créé. Ce dernier permet de faciliter le raisonnement et de généraliser Figure 36 présente la définition du fichier XML en XSD. 140

141 Figure 36 : Fichier de paramétrage de mapping sous format XSD. La Figure 37 présente un exemple sous format XML de trois mappings suivants : - Mapping 1 (OED- OD) : Mapp (D_CIM10, Classification internationale de maladies dixième version, has Domain Concept) - Mapping 2 (OR- OED) : o Mapp (Ressource1, D_CIM10, has Multidimensional Concept) - Mapping 3 (OR- OD) : o Mapp (Ressource1, Accouchement, has Keywords) o Mapp (Ressource1, Suivi activité, has Keywords) 141 Figure 37 : Extrait du fichier de paramétrage des liens, XML.

142 7 Conclusion ces trois ontologies : OD, OED et OR, ainsi que les mappings réalisés entre elles. Chacune des ontologies est créée selon un processus différent. Puis, les techniques de recherche basée sur les correspondances sémantique, que ce soit au niveau de la similarité textuelle ou des relations entre concepts, sont décrites pour trouver les ressources qui répondent aux besoins des utilisateurs. Cette recherche est réalisée en trois étapes, le filtrage syntaxique, la mesure de similarité syntaxique combinée et le raisonnement sur la BC. Les relations sémantiques entre les concepts seront utilisées pour personnaliser des ressources selon le profil En résumé, voici une présentation générale des apports de la BC par rapport au système : - Une ontologie de domaine du PMSI pour décrire les concepts et terminologies utilisés dans le domaine du PMSI

143 Chapitre 8 : Résumé. par les ontologies de la BC. Il propose deux fonctions de recherche : (i) personnalisation de ressources à partir de concepts de la BC en se basant sur le besoin et le profil utilisateur (ii) recommandation de se de la ressource techniques de person Sommaire 1 Introduction Cadre général de la personnalisation Terminologies et définitions Etude de cas Recherche personnalisée des ressources Processus général de personnalisation Définition du profil utilisateur Définition générale du profil Profil pour la personnalisation Gestion de la Confidentialité Les techniques basées sur les correspondances syntaxiques Les techniques basées- raisonnement Filtrage de la requête Conceptualisation de la requête Distance de Jaro- Winkler Personnalisation (matching et ranking) Matching (mise en correspondance) Ranking (Tri du résultat) Recommandation de ressources complémantaires Définition des concepts reliés au CA Recommandation naïve

144 4.3 Recommandation Best- CR Recommandation par Best- TO Conclusion

145

146 1 Introduction Après avoir défini les éléments nécessaires pour la personnalisation des ressources nous assurons les fonctionnalités de personnalisation et la recommandation dans le système de personnalisation basé sur les ontologies, OPS. Dans la section 2 nous introduisons quelques terminologies et définitions liées à notre approche, ainsi que Dans la section 3, nous définissons le mécanisme de la personnalisation, et dans la section 4, nous définissons les trois catégories de recommandation et le mécanisme que nous proposons. 2 Cadre général de la personnalisation Le système OPS que nous proposons a pour objectif de (i) personnaliser la recherche de isateur, (iii) lui recommander de nouvelles Chaque recherche effectuée par un utilisateur exprimé en termes, est traduite en termes de concepts de la BC. Nous rappelons que la BC prend en considération les connaissances connaissances sont stockées dans la BC sous forme de trois ontologies OD, OED et OR interconnectées avec des relations sémantiques. La mise en correspondance des trois 2.1 Terminologies et définitions Avant de définir le processus de personnalis nous commençons par un ensemble de définitions. Certaines de ces définitions seront détaillées dans les sections et sous- sections suivantes : Besoin : t = {t1, Au Ressource : La ressource est un outil ou un moyen pour effectuer une analyse (ex. fichier Excel connecté à un cube, tableau multidimensionnel stocké en PDF). Ressource candidate est présentée par le système OPS par un lien vers une ressource, ce lien est stocké dans R. 146

147 Profil : Il n de : La conceptualisation de requête se base sur des pour trouver la correspondance entre un «terme» de la requête exprimant le besoin et un «concept» de la BC. Matching : Le terme matching est utilisé dans ce manuscrit pour désigner la correspondance entre des concepts. Le matching est utilisé pour trouver la un concept identifiant R que le système trouve une ressource). basent essentiellement sur le matching. (CA) BC auquel une ressource est reliée. La personnalisation : Il consiste à répondre au besoin par un ensemble de ressources adaptées au mieux à son profil. rticule autour de deux processus distribués : un processus de personnalisation proprement dit ou recherche personnalisée de ressources, et un processus de recommandation de ressources complémentaires. La personnalisation se base sur un appariement (matching) entre les concepts associés au personnalisation stocke le CA de la ressource retenue. Le processus de recommandation, à Cette expansion permet au système de recommander de nouvelles ressources à La Figure 38 schématise les processus de personnalisation et de recommandation lors de la recherche 147 Figure 38 : Cadre général de la personnalisation.

148 Dans les sections suivantes nous décrivons en détail, le CA), le profil utilisateur, les techniques de matching utilisées, et enfin les mécanismes de personnalisation et de recommandation mis en. 2.2 Etude de cas Afin de mieux illustrer le fonctionnement du moteur de personnalisation de notre système OPS, nous présentons une étude de cas. Gynécologie (ORG). Pour s par césarienne par rapport aux autres : «le». Lors Hôpital», les mots clefs «CIM10» (diagnostic) et «CCAM» (actes) et aux ressources créées par la Fédération Française des Réseaux de Santé en Périnatalité (FRSP). Une interface graphique pour la configuration du profil utilisateur est présentée dans le chapitre suivant. Besoin : ccouchement par année > par ontologies : - ED : o Dimension : <Hopital> - D : <CIM10>, <CCAM> - R : Créateur = <Fédération Française des Réseaux de Santé en Périnatalité> Rappelons que, selon le type de source de données et les critères pris en compte lors de résultats différents. sur les critères définis par le Créateur = <Fédération Française des Réseaux de Santé en Périnatalité>. Pour calculer le issu des données PMSI, té en Périnatalité, les critères à retenir à partir du PMSI dans la requête source, sont les suivantes : - Code en Z37._ dans les diagnostics associés (DA) «ET» - Codes Actes CCAM («OU») o Pour les accouchements par césarienne : JQGA002, JQGA003, JQGA004, JQGA005 o Pour les accouchements par voie naturelle : JQGD001, JQGD002, JQGD003, JQGD004, JQGD005, JQGD007, JQGD008, JQGD10, JQGD012, JQGD013 o Pour les extractions instrumentales : JQGD006, JQGD009, JQGD011 «ET» 148

149 - plusieurs critères pour identifier les séjours de périnatalité : (i) scientifiquement 28ème semaine d'aménorrhée et le 8e jour suivant la naissance, et (ii) FRSP, aux diagnostics et aux actes analyse efficace des données nécessite une description sémantique des critères retenus. Dans les sections qui suivent nous nous basons sur cette étude de cas pour présenter les exemples. 3 Recherche personnalisée des ressources La personnalisation Cette section présente le mécanisme de personnalisation. Figure 39 : Contenu de la section. 3.1 Processus général de personnalisation Le mécanisme de personnalisation est dirigé par les ontologies, il se base sur les concepts identifiés dans la requête exprimant le besoin et les intérêts récurrents issus du profil personnalisation ajoute aux concepts de la requête, les concepts définis dans le profil utilisateur. Puis, la requête est reformulée et exécutée et retourne un ensemble de ressources pertinentes triées. Les trois étapes de la personnalisation, schématisées dans la Figure 40 sont les suivantes : - Filtrage - Conceptualisation : Conceptualiser la requête exprimant le besoin, à partir de vecteur de termes qui sera transformé en vecteur de concepts issus de la BC (les trois ontologies). - Personnalisation du résultat (Matching et Ranking) : a. Matching : Trouver la correspondance entre les vecteurs de concepts et les liens vers les ressources candidates. Le matching prend en compte le 149

150 vecteur de concepts de la requête conceptualisée et le vecteur de concepts du profil utilisateur pour retourner grâce à ces vecteurs de concepts, un ensemble de ressources pertinentes. Les identifiants et les liens vers les R. b. Ranking (Trier le résultat) : Trier les ressources par ordre décroissant basé sur le nombre de concepts compatibles entre le besoin et la ressource. Ainsi, les résultats affichés en premier sont les résultats correspondants en même temps au besoin et au profil. Dans cette section nous commençons par définir le profil utilisateur, le centre du mécanisme de personnalisation, ainsi que, ces intérêts récurrents, dans la sous- section 3.2 dans la sous- section3.3. Puis, nous présentons notre technique de filtrage de termes du besoin, dans la sous- section 3.4. Après, nous présentons la conceptualisation de la requête dans la sous- section 3.5. Finalement, nous présentons la personnalisation des ressources grâce aux techniques de matching et de ranking, dans la sous- section3.6. Figure 40 : Schématisation du processus de personnalisation des résultats dans la recherche de ressources. 150

151 3.2 Définition du profil utilisateur (Garrigos, Pardillo et al. 2009) besoins spécifiques des utilisateurs Définition générale du profil : - : Les informations majeures sont alors les données démographiques, les données correspondant au métier, les données de connexions - S (minimum 1 concept par ontologies) concepts à partir de la 1 concept de chaque ontologie de la BC. rêts récurrents Profil pour la personnalisation Pour expliciter le fonctionnement du moteur de recherche nous définissons dans ce qui suit uniquement les concepts du profil utilisateur qui seront utilisés par le moteur de - à- dire les concepts définissant les intérêts r sur les concepts de la BC, Figure 41 concepts suivants : - : concepts métiers. - : concepts multidimensionnels. Par exemple, sur les niveaux de dimensions et les mesures. - Par exemple, Créateur de la ressource, critères de création de la requête. Définition : Un profil utilisateur = {Cm, CmultiDim, Cressources} est un ensemble de concepts de la BC représentant les intérêts récurrents choisis par un utilisateur. Les concepts Cm multidim ressources 151

152 Figure 41 : Profil utilisateur et les concepts de la BC. Formalisation = {Cm, CmultiDim, Cressources} - Cm = {cm1 mn des concepts métier Cmi, où Cmi OD - CmultiDim = {CdimensioLevel, Cmeasure (Dimension_Level) CdimensioLevel = {cdimensiolevel1 dimensioleveln} ou des mesures C Cmeasure = {cmeasure 1 measure n}, où cdimensioleveli et cmeasurei OED - Cressources = {cressources1 ressourcesn} est défini par un ensemble de de mise à jour, etc.) où cressourcesi OR Revenons à notre exemple (section 2.2), voici la formalisation du profil. Exemple chef de pôle ORG= {Cm_chef de pôle ORG = {CIM10, CCAM}, CmultiDim_chef de pôle ORG = {CdimensioLevel= {Hôpital}}, Cressources_chef de pôle ORG = {cressources1créateur = { FRSP }}} Gestion de la Confidentialité Dans le domaine hospitalier, la confidentialité est primordiale pour respecter le droit des ucune autorisation) aux fonctionnalités des outils, aux tables des bases de données et aux ressources responsable sécurité des données, responsables outils de la direction informatique et les experts (délégués) des métiers. sont identifiées (étiquetées). Tous les liens vers les ressources sont affichés mais pour les 152

153 3.3 mettre en correspondance des termes et des concepts ou des concepts entre eux. Dans cette sous- section nous présentons brièvement les techniques existantes dans la littérature. Dans la section 3.5 et la section 3.6 moteur de personn Les techniques basées sur les correspondances syntaxiques les concepts. Ils reposent sur une combinaison de techniques issues de plusieurs domaines, RI, statistiques et de l'intelligence artificielle (Lin 2007). Nous présentons brièvement certaines de ces techniques. Les techniques utilisées dans le domaine de RI et de statistiques permettent de déterminer la correspondance entre les termes et les concepts, elles sont connues pour détecter les similitudes entre les chaines de caractères. Dans les premiers travaux en RI, (Belkin and Croft 1987) distinguent deux principales techniques de recherche basées sur le : appariement exact ou appariement partiel. Le appariement exact est la technique la plus simple et la plus utilisée. Elle consiste à retrouver les correspondances entre les termes et les concepts. est une technique un peu plus complexe mais qui des notions de métriques statistiques, par exemple, mesure TF- IDF, mesure vectorielle, etc. Ces techniques peuvent être renforcées en utilisant les ressources complémentaire comme les ontologies, dictionnaires et thésaurus qui ajoutent la sémantique pour trouver les correspondances (Lin 1998, Cohen and William 2003, Lin 2007, Zhong, Li et al ) Les techniques basées- raisonnement entre les concepts. Elles reposent principalement sur le raisonnement sémantique entre les concepts. Par exemple : - L'utilisation de relations (Lin 2007) : si deux relations et des concepts connexes sont similaires, les deux concepts peuvent être similaires ou équivalents. - Règle sibling concepts (Lin 2007) : prend en considération les relations des enfants Sibling concepts C1 et C2, et deux autres concepts C 3 et C4. Si C1 C3 alors C2 C4. - Super (sub)- concepts (Lin 2007): si les super- concepts ou sub- concepts (sous- concepts) de deux concepts sont similaires, les deux concepts comparés peuvent être également similaires. - Formules logiques : le langage formel de logique de description peut être utilisé pour représenter la connaissance. La déduction de nouveaux faits peut être s (forward chaining, backward chaining). Le raisonnement est principalement réalisé à l'aide de 153

154 154 raisonneurs ou de systèmes experts (Parsia and Sirin 2000, Corby, Dieng- kuntz et al. 2004). 3.4 Filtrage de la requête La technique de filtrage est une transformation typique en recherche d'information, habituellement utilisée pour réduire la taille du texte, pour simplifier la mise en demande en : - Entrée : Ensemble de termes. - Action : Filtrage. - Sortie : Vecteur de termes. Le processus de filtrage effectue les actions suivantes: - Tokenisation: la chaîne lexicale se transforme en un ensemble de jetons, Token. Exemple: < année > - > <accouchement> <par> <hôpital> <par> <année > - Suppression des stop words : en utilisant une liste de mots à éliminer, stop words, généralement utilisés pour la connexion des mots dans une chaîne lexicale, par exemple, et, ou, par, de, etc. et en supprimant les symboles : Exemple: <hôpital> <par> <année > - > <Pourcentage> < accouchement > < type > <accouchement> <hôpital> <année >. 3.5 Conceptualisation de la requête La conceptualisation de requête se base sur des techniques de matching pour passer ensemble de «vecteur de termes» à un ensemble de «vecteur de concepts» de la BC. La première étape, après le filtrage, consiste à «conceptualiser la requête» exprimant le : - Entrée ReqTermes = {T1, et vecteur de concepts de la BC. - Action : Trouver les concepts correspondants dans la BC. - Sortie : Vecteur de concepts conceptualisée. Nous utilisons des techniques de matching les concepts correspondants dans la BC. Les hypothèses de correspondances possibles sont respectivement : 1. xact Winkler, détaillée dans la sous- section 3.5.1suivante. - dessous) prend en compte les deux hypothèses.

155 Algorithme 1 Input : Tj is a given term in the query, Set of concepts ConceptBC {C1, C2, C3,..., Cn} where i [1..n] Output : Conceptualized term FromTermsToConcepts (Tj){ If (Tj = Ci) a Ci ; If (Tj <> Ci) { Check distance de Jaro- Winkler (Ci, ConceptBC) ; Retrieve Similar_concept; a Similar_concept; } Return a } Distance de Jaro- Winkler Si aucun matching la BC, nous utilisons appliquons un matching partiel basé sur la technique de Jaro- Winkler. Distance de Jaro La distance de Jaro calcule la distance de jaro entre deux chaines de caractères et. La distance de Jaro est : Où : = est le nombre de caractères correspondants entre et = est le nombre de caractères de = est le nombre de caractères de s entre les caractères de et, - à- dire le nombre de fois où les caractères de et sont différents, puis ce nombre divisé par deux retourne le nombre de transpositions. Les deux chaines de caractères sont considérées identiques, si leur éloignement ne dépasse pas : 155

156 Distance de Jaro- Winkler La distance de Jaro- Winkler calcule la distance entre deux chaines de caractères et, elle utilise un coefficient de préfixe qui privilégie les chaînes de caractères commençant par un préfixe de longueur. La distance de Jaro- Winkler est : Où : = est la distance de jaro = est la longueur maximale du préfixe commun entre deux chaines de caractères, la valeur recommandée est - à- dire, les chaines qui seront favorisées, ont un préfixe commun de 4. = est le coefficient de préfixe, il est défini par winkler par une valeur de 0.1 Pour réduire le champ de résultat et augmenter sa fiabilité, un seuil de «0.75» a été défini pour retourner les résultats les plus élevés. Après le calcul de la distance de Jaro- Winkler, nous effectuons également une recherche de correspondances sémantiques pour identifier les concepts équivalents aux concepts identifiés, par exemple, recherche de synonymes, équivalences, sigles, abréviations, etc. : <nb> - > <nombre> Exemple de synonyme : <Patient> - > <Malade> Pour illustrer le matching, prenons les deux exemples suivants : - Exemple 1 : deux chaines de caractère S1 et S2. Soit S1 = {Séjour} issue de la requête utilisateur et S2 = {Séjour} de la BC - Exemple 2 : deux chaines de caractère S3 et S4. Soit S3 = {accoucher} issue de la requête utilisateur et S4 = {accouchement} de la BC. Exemple 1 : deux chaines de caractère S1 et S2 Soit deux chaines de caractères S1 = {Séjour} issue de la requête utilisateur et S2 = {Séjour} de la BC. Test matching exact: S1 = S2 est un matching exact. Exemple 2 : deux chaines de caractère S3 et S4 Soit deux chaines de caractères S3 = {accoucher} issue de la requête utilisateur et S4 = {accouchement} de la BC. Test matching exact : S3 S4, dans ce cas le matching partiel est appliqué. Test matching partiel: Pour le test de matching partiel, nous avons choisi la technique de Jaro- Wincler. Pour calculer la distance de Jaro- Winkler distance de Jaro. 156

157 Calcul de la distance de Jaro Pour S3 = {accoucher} et S4 = {accouchement} = 9 = 12 = 0 Pour calculer de caractères correspondants entre et nous dressons leur table de A C C O U C H E R A C C O U C H E M E N T La distance de Jaro entre les chaînes et est définie par : Calcul de la distance de Jaro- Winkler La distance de Jaro- Winkler avec avec un préfixe de longueur = 3 devient : > 0.75 alors nous considérons les deux chaines de caractères S3 et S4 sont similaires. 3.6 Personnalisation (matching et ranking) de personnalisation consiste à identifier les ressources candidates correspondantes aux concepts de la requête personnalisée, grâce à des techniques de matching. Puis, les ordonnancer par ordre décroissant grâce à des techniques de ranking. Dans cette sous- section, nous présentons les techniques de matching et de ranking utilisées Matching (mise en correspondance) Cette étape consiste à trouver les ressources candidates (grâce aux identifiants des R). Le matching est effectué entre le vecteur de concepts de R, exemple 157

158 Figure 42 matching demande en : - Entrée : Vecteur de concepts de la requête conceptualisée ReqConcepts = {C1, C2, vecteur de concepts issue de la BC - Action R. - Sortie : Identifiants des ressources candidates RessourceID = {CR_ID1, CR_ID2 R_IDz}. Figure 42 : Ressource candidate dans la BC. Nous utilisons des techniques de matching pour trouver la correspondance entre un concept de requête conceptualisée et un concept identifiant de ressource. Les hypothèses de correspondances possibles sont respectivement : concept proche, Cw synonyme 21 de C1, est relié à un matching (ci- dessous) prend en compte les deux hypothèses de correspondances entre les concepts. Algorithme 2 : R Input : A given concept from the query Ci, Set of concepts ConceptBC = {C1, C2, C3,..., Cn} where i [1..n] Output : Concept Ci and ressource identifier Resource_ID = {CR_ID} 21 Nous parlons ici de synonyme en général pour faire référence à tous les équivalents et les écritures 158

159 Check_resource (Concept Ci){ For each Ci in ConceptBC { If (Ci is linked to a resource) Return Ci and Resource_ID ; If (Ci is not linked to a resource) { Check_synonym (Ci) ; If synonym of Ci exist and is linked to Resource_ID Return synonym of Ci and Resource_ID; } } } Du matching au nombre de concepts par ressource candidate Suite à candidates. Pour chaque ressource candidate, calculer le nombre de concepts partagés avec le profil et le besoin. Pour chaque ressource candidate : (i) Calculer le nombre de concepts partagés avec la requête conceptualisée, (ii) calculer le nombre de concepts partagés avec le profil utilisateur. Figure 43 : Schématisation du processus de matching au nombre de concepts par ressource candidate. 159

160 3.6.2 Ranking (Tri du résultat) Pour chaque ressource candidate identifiée lors du matching, nous calculons le taux moyen de correspondance (NC) avec le profil et le besoin (grâce au nombre de concepts partagés calculés pour la requête conceptualisée par profil). Puis, nous effectuons un tri du résultat par ordre décroissant de NC. Le taux moyen de correspondance NC est défini par : Où : = nombre de concepts qui correspondent entre ressource et besoin = nombre de concepts qui correspondent entre ressource et profil = total concepts identifiés dans la requête définissant le besoin et les concepts définis dans le profil utilisateur Exemple de recherche personnalisée Revenons à notre exemple (section 2.2), <Pourcentage> <accouchement> < hôpital > <année>. Le besoin personnalisé inclut les concepts dans le profil utilisateur. Voici un exemple avec en entrée le besoin et le profil, et en sortie un ensemble de ressources. Nous présentons cet exemple via les deux étapes, matching, puis le résultat du tri. Exemple : Résultat Matching Entrée : 1. Besoin = {pourcentage, accouchement, hôpital, année}, 2. Profil utilisateur, chef de pôle ORG= {Cm_chef de pôle ORG = {CIM10, CCAM}, CmultiDim_chef de pôle ORG = {CdimensioLevel= {Hôpital}}, Cressources_chef de pôle ORG = {cressources1créateur = { FRSP }}}, 3. Base de connaissances BC Sortie 22 : Nous considérons les ressources suivantes : - R1 = {Cm= {accouchement, hôpital}, CmultiDim= {{DimensionLevel= {hôpital, année, CIM10}, measure= {pourcentage patient}}, Cressources {créateur= {FRSP}, Date de } - R2 = {Cm= {études national accouchement}, CmultiDim= {{DimensionLevel= {établissement, année, GHM}, measure= {pourcentage patient}}, Cressources {créateur= {FRSP}, Da } 22 Les concepts : En italique représentent les concepts en commun avec le besoin. En souligné représentent les concepts en commun avec le profil utilisateur. 160

161 - R3 = {Cm= {accouchement}, CmultiDim= {{DimensionLevel= {hôpital, année, CIM10}, measure= {pourcentage patient}}, Cressources {créateur= {service décisionnel}, } Exemple : Résultat tri Entrée : 1. Besoin = {pourcentage, accouchement, hôpital, année} 2. Profil utilisateur chef de pôle ORG= {Cm_chef de pôle ORG = {CIM10, CCAM}, CmultiDim_chef de pôle ORG = {CdimensioLevel= {Hôpital}}, Cressources_chef de pôle ORG = {cressources1créateur = { FRSP }}} 3. Résultat du matching () Sortie : Ensemble de résultat trié Calcule du NC : R1 : NCR1 = 1 R2 : NCR2 = R3 : NCR3 = Tri et affichage les ressources par ordre décroissant : 1. R1 2. R3 3. R2 4 Recommandation de ressources complémantaires (Thalhammer, Schrefl et al. 2001, Dittrich, Kossmann et al ) requête, observe le résultat, puis définit la requête suivante. Dans notre travail, nous considérons que la requête correspond à un besoin pour lequel on peut retourner une - à- dire, pour Figure 44 : Contenu de la section. 161

162 La recommandation. Le mécanisme de recommandation se base sur le CA de la ressource retenue. Nous avons choisi de prendre uniquement le CA de la ressource retenue pour recommander des en cours de consultation pas besoin de reprendre en compte le profil utilisateur. Le résultat retourné est un résultat trié selon le taux de recouvrement de la ressource candidate par rapport à la ressource retenue par Figure 45. La Figure 46 schématise le processus de recommandation en se basant sur BC. Figure

163 Figure 46 : Recouvrement entre les trois ressources (R1, R2 et R3). Pour rendre la recommandation fiable selon le trois catégories de recommandation : - Recommandation naïve : elle calcule le nombre des concepts en commun avec le CA en cours. Le système recommande des ressources par ordre décroissant du nombre de concepts en commun. - Recommandation Best- CR : elle basant sur sa relation sémantique avec le CA candidat. Puis, le taux de compatibilité «Compatibility Rate ( )» est calculé par CA candidat (ressource candidate). Le système recommande des ressources par ordre décroissant de. - Recommandation par type de concepts : elle classifie les ressources selon trois types, ou. Puis, calcule le nombre des concepts en afficher les ressources qui partagent des concepts multidimensionnels ( ) en commun avec les concepts multidimensionnels du CA en cours. 4.1 (CA) Chaque ressource est reliée à un ensemble de concepts de la BC que nous appelons CA de at qui sera utilisé dans la recommandation de candidate. Dans ce qui suit nous définissons le CA et présentons un mode de représentation explicite du CA présenter une tranche du cube de données. Une ressource représente un. de s transition à un autre, en nt des concepts avec les concepts du CA en cours. 163

164 4.1.2 nous proposons un formalisme graphique présenté dans la Figure 47. Le travail de (Jerbi 2012) propose aussi un formalisme graphique et - ci dont nous nous sommes inspirés. (dimensions) par un rond blanc et les aussi les relations sémantiques entre la ressource et les concepts des ontologies. Figure 47 : Représentation graphique d'un CA. La Figure 48, présente un extrait du CA de la ressource conceptuelle multidimensionnel (format Excel) calculant le no mois et par diagnostic en se basant sur la classification de la CIM10, nous la présentons Cet exemple présente la ressource «Ressource1» reliée aux dimensions «CIM10», «Pôle» et «Mois mesure «nombre de séjours ED. Elle est reliée aux mots clefs «accouchement D. Enfin, elle a pour créateur le «Service décisionnel» et date de création «01/01/2014», ces inform R. 164

165 Figure 48 : Exemple d'arbre de CA (A) et une ressource d'analyse (B) Définition des concepts reliés au CA Nous considérons et les éléments qui la concepts du domaine concernés, et les descriptions sémantiques de la ressource. encours est défini par (Rencours, relié, D, ED) où Rencours identifie la ressource en cours, relié R, D D et ED ED. Formalisation CAencours (Rencours, relié, D, ED) - Rencours = {CencoursID, Cencours_elements}, CencoursID est unique, Cencours_elements = {Créateur, Nom des auteurs, Coordinateur, Adresse, Numéros de téléphone, Keywords, Objectif, Unité de mesure, Méthode de calcul, Période de calcul, Date de création, Date de mise à jour, Date de validité} - relié = {CreliéID1, CreliéID2 reliéidi} i [1..n], CreliéIDn OR - D = {CD1, CD2, Di} i [1..n], CDn OD - ED = {MED, DED } où MED = {MED1, MED2 EDi} et DED = {DED1, DED2 EDi} i [1..n], MEDn OED et DEDn OED Revenons à notre exemple (section 2.2), voici la formalisation du CA. Exemple CAencours = {Cm= {accouchement, hôpital}, CmultiDim= {{DimensionLevel= {hôpital, année, CIM10}, measure= {pourcentage patient}}, Cressources {créateur 165

166 4.2 Recommandation naïve La recommandation naïve prend en effectue un matching exact entre les concepts de ce contexte et les concepts des autres. En fonction du nombre de concepts qui matchent, le système calcule le nombre de concepts en commun avec le CA en cours. Puis, les ressources sont triées par ordre décroissant du taux moyen de concepts correspondant ( utilisé pour le tri des ressources dans la partie personnalisation). Notons que les ressources en entrée sont les résultats de la partie matching de la personnalisation. Les ressources recommandées Rrecommandée seront affichées avec un pourcentage. Par exemple, consulté la ressource «R1». Exemple : Recommandation naïve Entrée : 1. Rencours «R1» = {Cm= {accouchement, hôpital}, CmultiDim= {{DimensionLevel= {hôpital, année, CIM10}, measure= {pourcentage patient}}, Cressources {créateur= }, 2. Résultat du matching de la personnalisation sans R1 () Sortie : Ensemble de ressources triées par NC % : 1. R3 = {Cm= {accouchement}, CmultiDim= {{DimensionLevel= {hôpital, année, CIM10}, measure= {pourcentage patient}}, Cressources {créateur= {service décisionnel}, } 2. R2 = {Cm= {études national accouchement}, CmultiDim= {{DimensionLevel= {établissement, année, GHM}, measure= {pourcentage patient}}, Cressources {créateur= {FRSP } Détails calcul du % de concepts en communs : Calcul NC pourcentage : R2 : NCR2 % = * 100 = 57,1% R3 : NCR3 %= * 100 = 71,4% Tri et affichage les ressources par ordre décroissant avec le pourcentage NC : 1. R3 : NCR3 %= 71,4% 2. R2 : NCR2% = 57,1% 4.3 Recommandation Best- CR La recommandation Best- CR prend en se base sur le taux de compatibilité «Compatibility Rate ( )» entre les concepts des deux ressources Rencours et Rrecommandée que nous définissons dans cette section. Pour rendre le résultat de la recommandation plus fiable, nous proposons de se baser sur le poids du type de concept partagé. 166

167 Nous considérons, que selon le type de concept en commun entre Rrecommandée et Rencours la une Rrecommandée ayant une mesure ou une dimension en commun avec Rencours est plus définir un poids qui diffère selon le type de relation sémantique existant entre concepts données liées à chaque type de relation. Pour identifier le type de concept, il suffit de consulter le nom de la relation sémantique existante entre une ressource et un concept. Voici respectivement par ordre les relations sémantiques, reliant la ressource à un - avec la relation sémantique «hasmultidimensionalconcept» - avec la relation sémantique «hasequivalentdatapropertyvalue» - avec la relation sémantique «haskeywords» Les relations sémantiques hasmultidimensionalconcept et haskeywords ont été déjà définies lors de la création de la BC. Par contre, la relation sémantique hasequivalentresourceconcept sera identifiée en effectuant un matching exact entre les attributs (les valeurs de dataproperty) de la Rrecommandée et Rencours. Pour calculer le score par ressource candidate nous nous sommes inspirés du travail de (Alexopoulos, Pavlopoulos et al. 2011) qui attribue un poids à un résultat selon la Relation Sé Soit RSED la relation sémantique entre un concept en cours et un concept candidat Conceptcandidat ED, RSR la relation sémantique entre un concept en cours et un concept candidat Conceptcandidat R, RSD la relation sémantique entre un concept en cours et un concept candidat Conceptcandidat D. Voici respectivement les poids dédiés à chacune des realtions : Poids de RSED : (Conceptcandidat, hasmultidimensionalconcept)=0.8 Poids de RSR : Conceptencours (Conceptcandidat, hasequivalentresourceconcept)=0.5 Poids de RSD : (Conceptcandidat, haskeywords)=

168 La formule pour calculer le score par ressource est défini par : Où : = nombre de concepts RSED = nombre de concepts RSR = nombre de concepts RSD = nombre total de concepts Les ressources en entrée sont les résultats de la partie matching de la personnalisation. Ce résultat est trié par le score «SC» des ressources. Le Taux de Compatibilité est affiché avec chaque ressource. Pour réduire le champ de résultat et augmenter sa fiabilité, un seuil de «0.75» a été défini pour retourner les résultats les plus élevés. Exemple : Recommandation Best- CR Entrée : 1. Rencours «R1» = {Cm= {accouchement, hôpital}, CmultiDim= {{DimensionLevel= {hôpital, année, CIM10}, measure= {pourcentage patient}}, Cressources {créateur= }, 2. Résultat du matching de la personnalisation sans Rencours () Sortie : ensemble de ressources trié par CR % 1. R3 = {Cm= {accouchement}, CmultiDim= {{DimensionLevel= {hôpital, année, CIM10}, measure= {pourcentage patient}}, Cressources {créateur= {service décisionnel}, } 2. R2 = {Cm= {études national accouchement}, CmultiDim= {{DimensionLevel= {établissement, année, GHM}, measure= {pourcentage patient}}, Cressources {créateur= {FRSP } Détails du calcul du taux de compatibilité CR% Calcul SC : Pour R2 : = 1 = 2 = 1 = 1+2+1=4 =0.55 Pour R3 : = 1 = 4 = 0 = 1+4+0=5 =0.56 Calcul CR : Tri et affichage les ressources par ordre décroissant avec le pourcentage NC : 1. R3 : NCR3 %= 56% 2. R2 : NCR2% = 55% 168

169 4.4 Recommandation par Best- TO La recommandation BEST- TO prend en Elle retourne des ressources classées par type de concepts (ou ce que nous appelons aussi TO ressources, définis selon le type de concepts en communs. Nous proposons les trois groupes suivants : - «Concepts clefs D - «ED - «Propriétés R Notons que les ressources en entrée sont les résultats de la partie matching de la personnalisation. Ces résultats sont triés par où est le nombre de concept en commun par type de concept. Recommandation Best- TO Entrée : 1. Rencours «R1» = {Cm= {accouchement, hôpital}, CmultiDim= {{DimensionLevel= {hôpital, année, CIM10}, measure= {pourcentage patient}}, Cressources {créateur= }, 2. Résultat du matching de la personnalisation sans R1 () Sortie : ensemble de ressources trié par NCT «Concepts clefs»: 1. R2 = {Cm= {études national accouchement}, CmultiDim= {{DimensionLevel= {établissement, année, GHM}, measure= {pourcentage patient}}, Cressources {créateur= {FRSP } 2. R3 = {Cm= {accouchement}, CmultiDim= {{DimensionLevel= {hôpital, année, CIM10}, measure= {pourcentage patient}}, Cressources {créateur= {service décisionnel}, }» : 1. R2 et R3 «Propriétés des ressources» 1. R3 2. R2 Détails calcul Calcul NCT, tri et affichage les ressources par groupe de concept : «Concepts clefs»: 1. R2 ( = 1) 2. R3 ( = 0)» : 1. R2 et R3 ( = 1) «Propriétés des ressources» : 169

170 1. R3 ( = 4) 2. R2 ( = 2) 5 Conclusion Dans un filtrage, une conceptualisation de la requête et un matching de la requête conceptualisée avec les trois ontologies de la BC. Enfin, un ranking (tri) est effectué en récurrents du profil utilisateur couvrant la ressource. s ressources complémentaires. Pour cela, il élabore le contexte de la ressource sélectionnée par didates qui sont reliées à des concepts de ce contexte. Enfin, OPS effectue un ranking sur le résultat. Le mécanisme de recommandation proposé intègre trois catégories : recommandation naïve, recommandation Best- CR et recommandation Best- TO. Le tableau ci- dessous présente une synthèse de ce que nous proposons par rapport aux critères de comparaison que nous avons défini dans le chapitre 4 «La personnalisation». Tableau 11. Synthèse «notre proposition». Notre approche Algorithme Entrée Sortie Méthode de calcul Personnalisation de requêtes BC Profil utilisateur Ensemble de ressources (trié) Recommandation de requêtes (3 catégories) naiive Best- CR Best- TO Ensemble de ressources (trié) BC CA en cours Ensemble de ressources (trié) Taux NC Taux NC Score SC Trois ensembles de ressources (trié) Nombre de concept en communs NCT Personnalisation du schéma de l'ed Perspective mécanismes de personnalisation et de recommandation que nous avons présenté dans ce chapitre. 170

171

172 Chapitre 9 : Résumé. Ce chapitre présente la plateforme logicielle baptisée système «OPS», que nous avons réalisée au comment nous avons mis mment Sommaire 1 Introduction Choix techniques Architecture technique du système Configuration du profil lors de la première connexion Scenarii Scenario 1 : Profil chef de Pôle Obstétrique, Reproduction et Gynécologie Scenario 2 : Profil agent de la Direction des Affaires Financières (DAF) Scenario 3 : Profil pharmacien Conclusion

173 1 Introduction Dans ce chapitre nous présentons le prototype de notre système OPS. Nous présentons, êt de la personnalisation grâce à trois s Ces scenarii sont relatifs à trois profils métiers qui ont les mêmes besoins au départ mais 2 Choix techniques OWLGred pour la conception et Protégé n. Pour manipuler les mapping entre les ontologies stockées en XML, nous avons utilisé Altova XMLSpy qui est un éditeur sont effectués en utilisant OWL API. hage des ressources est effectué avec Apache POI qui est une API java pour la manipulation des documents Microsoft en général et en particulier des fichiers Excel. 3 Architecture logicielle du système itation pertinentes. Pour chaque profil utilisateur, le système retourne un ensemble de ressources trié selon s niveaux : Aide à trouver une ressource pertinente. Affiche des définitions et description sémantique de la ressource.. de configuration du profil lors de la première connexion. 173

174 Architecture du système Figure 49 présente : - Environnement de stockage : contient la BC et le profil utilisateur - Moteur de personnalisation - Interface Figure 49 : Architecture du système. Les différentes fonctionnalités offertes par notre système sont illustrées dans le : 174

175 Figure 50 : Fonctionnalité du système (use case). Dans cette figure, - Configurer le profil : pour réaliser la configuration des intérêts récurrents et choisir le type de recommandation. - Recherche de ressource : pour accéder aux fonctionnalités de personnalisation, de description sémantique et de recommandation de ressources. 4 illustrer la personnalisation et la recommandation de notre système implémentées dans notre prototype. 4.1 Configuration du profil lors de la première connexion Un module de configuration du profil utilisateur permet aux usagers de définir : 1. Les intérêts récurrents : indique un concept représentant un intérêt récurrent (à partir des concepts de BC ou directement par saisie manuelle), puis le Figure 51, montre une impression utilisée pour renseigner les intérêts récurrents. 175

176 Figure 51 : Profil utilisateur : définition des intérêts récurrents. 2. La nature de la recommandation attendue (la personnalisation étant proposée par : o Recommandation naïve basée sur le nombre de concepts total en commun entre deux ressources. o Recommandation Best- CR basée sur le poids des relations sémantiques et - à- dire p paramétrables. o Recommandation par Best- TO basée sur le nombre de concepts en commun type de concept - à- dire par ontologi La Figure 52, montre une impression une catégorie de recommandation. 176

177 4.2 Scenarii Figure 52 : Profil utilisateur : choix d'une catégorie de recommandation. Pour valider notre approche, nous présentons trois scenarii. Avec les experts PMSI de utilisateurs différents appartenant à des métiers ées trois profils : - Chef de Pôle Obstétrique, Reproduction et Gynécologie (ORG), - Agent de la Direction des Affaires Financières (DAF), - Pharmacien. Dans cette section nous présentons 3 scénarii pour répondre à la demande de ces trois utilisateurs qui sont de métiers et de niveaux hiérarchiques différents Scenario 1 : Profil chef de Pôle Obstétrique, Reproduction et Gynécologie Obstétrique, Reproduction et Gynécologie (ORG). Dans le par mois. Définition du profil : - sont au niveau hiérarchique : Pôle ORG et mois - Les concepts reliés au métier sont «accouchement» et «CIM10» - Les ressources créées par la «Fédération Française des Réseaux de Santé en Périnatalité» et «étude régionale» 177

178 ressources. Ces concepts sont définis de la manière suivante : - CmultiDim= ; Mesure = { }} - Cm Cressources = { Fédération Française des Réseaux de Santé en Périnatalité } Recherches personnalisées. En entrée, le «taux de césariennes programmé par type s par hôpital». Voici le résultat de cette personnalisation : sateur a choisi la ressource «Taux_césarienne_par service_annee.xls» correspondant à la première ligne de résultat, le système va alors lui proposer quelques ressources en recommandation. Recommandation de ressources complémentaires. Suite à la personnalisation et la validation de la re basée sur le CA de la ressource. 178

179 4.2.2 Scenario 2 : Profil agent de la Direction des Affaires Financières (DAF) la Direction des Affaires Financières (DAF). Dans le cadre de santé (dans le P aux séjours de périnatalité Définition du profil : - Les : aucune indication - Les concepts reliés au métier sont «(CA)» - Les ressources : aucune indication Ces choix concernent des concepts métier. Ces concepts sont définis de la manière suivante : - CmultiDim= { } - Cm - Cressources = { } Exemple En entrée, taux de césariennes programmé par type s par hôpital. Voici le résultat de cette personnalisation : 179

180 aura les caractéristiques de la ressource et une recommandation, comme présenté précédemment (interface de recommandation dans la sous- section 0) Scenario 3 : Profil pharmacien recherche est ses rec Définition du profil : - : aucune indication - Le concept relié au métier est - Les ressources : aucune indication ressources. Ces concepts sont définis de la manière suivante : - CmultiDim= {{ }} - Cm - Cressources = {{ }} 180

181 Exemple personnalisation En entrée, taux de césariennes programmé par type s par hôpital. Voici le résultat de cette personnalisation: 5 Conclusion Nous avons présenté dans ce chapitre OPS, système de personnalisation dirigée par des ontologies pour aider les utilisateurs de Le Ce prototype doit aider des nécessaire à la compréhension de leur contenu. Ce système propose en plus la recommandation de nouvelles ressources susceptibles En résumé, le prototype OPS propose : ontologies. - - Un support sémantique basé sur des ontologies pour améliorer la recherche et la - Une gestion de - Un alignement des ressources avec chaque profil utilisateur. - les utilisateurs finaux.

182 Le prototype est actuellement en cours de validation auprès des différents utilisateurs. En 182

183 hospitalière, dans le cadre de la nouvelle gouvernance, et en se limitant au périmètre du Programme de Médicalisation des Systèmes d'information (PMSI). Dans les sections suivantes nous présentons un bilan de notre contribution et nous évoquons quelques perspectives à notre travail de recherche. 1 Bilan de la contribution onnel Nous avons proposé urces sémantique dans des contextes du management hospitalier est, d'une part, de définir les structures sémantiques appropriées répondant aux objectifs du travail, et d'autre part, Comparés aux travaux existants relatifs aux exploitation des EDs, les points forts de notre approche sont : La sémantique apportée par ces ontologies : elle joue un rôle important pour la ED. Notre approche est dirigée par les ontologies pour la personnalisation des ressources. Les ontologies proposées : elles décrivent trois activités distincts (domaine, ED et ressources) connexes permettant ainsi leur ré- Nous capitalisons dans ces ontologies les concepts métiers, les concepts dérivant, La personnalisation de la recherche de ressources : orientée vers les centres : basées sur un taux de recouvrement entre les concepts des ressources. 183

184 Nous avons proposé un système nommé Ontologies- based Personnalization System (OPS). Celui- ci de Connaissances (BC) exploitée par un moteur de personnalisation. La BC est composée des trois ontologies que nous avons développées : une ontologie de. pour une ressource particulière, une recommandation de ressources complémentaires considérée selon trois stratégies possibles. Afin de valider nos propositions, un prototype du système OPS a été développé avec un moteur de personnalisation a été implémenté en Java et exploitant une base de connaissance constituée des trois ontologies en OWL interconnectées. Nous avons illustré APHM. finaux de backgrounds différents à trouver une ressource correspondant à leur besoin et, le plus important, comprendre le contenu de la ressource en ajoutant la sémantique de leur description (ex. critères prise en compte dans la requête source, sources de données, créateur). En fait, pour résoudre le problème sémantique relié à la diversité des domaines dans les hôpitaux, on opte pour une capitalisation des ressources en facilitant leur exploitation. 2 Perspectives Plusieurs perspectives peuvent être envisagées dans la continuité de ce travail. Plusieurs points méritent un approfondissement, dans cette section nous présentons brièvement quelques perspectives qui nous paraissent être les plus importantes. : - - s de profils mé opérationnalisation dans OPS. contextes de recherche de ressources similaires. Au niveau de la BC : 184

185 - eur connexion. Les concepts et instances des trois ontologies peuvent évoluer, ceci soit pour intégrer des nouveaux concepts métiers, soit de nouvelles des consé approfondie. Au niveau du système : down, roll up) possibles pour répondre à un besoin spécifique. patrons types pour les requêtes. Cette assistance permettra de mieux capturer le partir directement des concepts de l Etendre le profil utilisateur données démographiques, les données correspondant au métier). Le profil utilisateur que nous proposons intègre uniquement les concepts décrivant les intérêts des intérêts récurrents et ainsi pour faciliter ou automatiser la configuration du profil utilisateur. : - - Etudier de ressource basée sur les étapes de ces processus. 185

186 Articles dans des journaux internationaux L. El Sarraj, B. Espinasse, T. Libourel «An Ontology- Driven Personalization Approach for Data Warehouse Exploitation», IARIA Journals, (In press) Articles dans des conférences internationales avec comité de lecture et actes L. El Sarraj, B. Espinasse, T. Libourel, S. Rodier, «Towards Ontology- Driven Approach for Data Warehouse Analysis», The Eighth International Conference on Software Engineering Advances, ICSEA 2013, Venice, Italy, October 27 - November 1, S. Khouri, L. El Sarraj, L. Bellatreche, B. Espinasse, N. Berkanil, S. Rodier, T. Libourel, «CiDHouse: Contextual SemantIc Data WareHouses», DEXA 2013, Prague, Czech Republic, August 26-29, Articles publiés dans des revues avec comité de lecture non répertoriées L. El Sarraj, S. Rodier, B. Espinasse (2011), «Entrepôt de données autour du PMSI pour le», Techniques Hospitalières, TH 729, Sept.- Oct. 2011, pp Article dans des conférences nationales avec comité de lecture et actes avec ISBN L. El Sarraj, B. Espinasse, T. Libourel, «données dirigée par les ontologies : Application au management hospitalier», 14, Vichy, 5 et 6 juin S. Bimonte, O. Boussaid, L. El Sarraj, «New Conceptual Modeling Requirements for Stream Data Warehouses», INFORSID 2012, Montpellier, France. L. El Sarraj, B. Espinasse, T. Libourel, S. Rodier, «Entrepôts de données de santé autour du PMSI», Poster à INFORSID 2011, Lille, mai Publications dans des ateliers avec comité de lecture L. El Sarraj (2012) «Entrepôt de données pour l'aide à la décision dans le domaine de la santé». JDL6, Carqueiranne, 31 Mai- 1er Juin L. El Sarraj (2012) «Entrepôt de données autour du PMSI». 16es journées STP du GdR MACS à Albi, mars

187

188 Abelló, A., J. Samos and F. Saltor (2003). Implementing operations to navigate semantic starschema. Workshop on Data Warehousing and OLAP (DOLAP). Abelló, A., J. Samos and F. Saltor (2006). "YAM2 : A Multidimensional Conceptual Model Extending UML." Information Systems 31(6): Abelló, A., J. Samos and F. Saltor (2006). YAM2: a multidimensional conceptual model extending UML. Information Systems. Abelló A., Samos J. and S. F. (2001). A Framework for the Classification and Description of Multidimensional Data Models. Proceedings of the 12th International Conference on Database and Expert Systems Applications. Agrawal, R., A. Gupta and S. Sarawagi (1997). Modeling Multidimensional Databases. Data Engineering (ICDE) Alexopoulos, P., J. Pavlopoulos, M. Wallace and K. Kafentzis (2011). Exploiting ontological relations for automatic semantic tag recommendation. Proceedings of the 7th International Conference on Semantic Systems. Graz, Austria, ACM: sociaux (ANAP)." 2013, from ANAP "Glossaire : GMSIH." ANAP. "Nos mission." from ANAP. "Système d'information." from Annoni, E. (2007). Éléments méthodologiques pour le développement des systèmes décisionnels dans un contexte de réutilisation. Thèse de doctorat Université Toulouse 1. Arpirez, J., O. Cororcho, M. Fernandez-Lopez and A. Gómez-Pérez (2003). "WebODE in a nutshell." AI Magazine 24(3): Arvidsson, F. and A. Flycht-Eriksson (2008). "Ontologies I ". Aybuke, A. and W. Claes (2005). "Engineering and Managing Software Requirements." Springer. B. Neumayr, S. Anderlik and M. Schrefl (2012). Towards ontology-based olap: datalog-based reasoning over multidimensional ontologies. Proceedings of the fteenth international workshop on Data warehousing and OLAP (DOLAP), New York, NY, USA, ACM. Baader, F., D. Calvanese, D. L. McGuinness, D. Nardi and P. F. Patel-Schneider (2003). "The Description Logic Handbook : Theory, Implementation, and Applications." Cambridge University Press Bachimont., B. (2000). en ingénierie des connaissances. Ingénierie des connaissances : évolutions récentes et nouveaux défis, Eyrolles. Barzdins, J., G. Barzdins, K. Cerans, R. Liepins and A. Sprogis (2010). OWLGrEd: a UML Style Graphical Notation and Editor for OWL 2.. In Proc. of OWLED Barzdins, J., K. Cerans, R. Liepins and A. Sprogis (2010). UML Style Graphical Notation and Editor for OWL 2. pringer Bechhofer, S., I. Horrocks, C. Goble and R. Stevens (2001). OilEd: a Reasonable Ontology Editor for the Semantic Web -Verlag LNAI. Bechhofer S., van Harmelen F., Hendler J., Horrocks I., McGuinness D. L., Patel-Schneider P. F. and Stein L. A. (2004). "OWL Web Ontology Language Reference." 2013, from Belkin, N. J. and W. B. Croft (1987). Retrieval techniques. Annual review of information science and technology, vol. 22, Elsevier Science Inc.: Bellatreche, L., A. Giacometti, P. Marcel and H. Mouloudi (2006). Personalization of MDX Queries. XXIIèmes journées Bases de Données Avancées (BDA 06), Lille, France. 188

189 Bellatreche, L., A. Giacometti, P. Marcel, H. Mouloudi and D. Laurent (2005). A personalization framework for OLAP queries.. Bremen, Germany: Bellatreche, L., S. Khouri and N. Berkani (2013). Semantic Data Warehouse Design: From ETL to Deployment à la Carte. Database Systems for Advanced Applications. W. Meng, L. Feng, S. Bressan, W. Winiwarter and W. Song, Springer Berlin Heidelberg. 7826: Bellatreche L., Nguyen Xuan D. and D. H. Pierra G. (2006). "Contribution of ontology-based data modeling to automatic integration of electronic catalogues within engineering databases." Computers in Industry Journal Elsevier 57( 8-9): Bentayeb, F., O. Boussaid, C. Favre, F. Ravat and O. Teste (2009). Personnalisation dans les entrepôts de données : bilan et perspectives. Entrepôt de Données et Analyse en ligne (EDA). Berndt, D. J., A. R. Hevner and J. Studnicki (2003). "The Catch data warehouse: support for community health care decision-making." Decision Support Systems 35(3): Blaschka, M., C. Sapia and G. Hofling (1999 ). On schema evolution in multidimensional databases. Conference on Data Warehousing and Knowledge Discovery (DaWaK), Springer Bonifati, A., F. Cattaneo, S. Ceri, A. Fuggetta and S. Paraboschi (2001). Designing Data Marts for Data Warehouses. ACM Transactions on Software Engineering and Methodology. Vol. 10, No. 4: Borgo, S. (2008). Ontologies for Urban Development. Bouquet, P., L. Serafini and S. Zanobini (2003). Semantic Coordination: A New Approach and an Application. The Semantic Web - ISWC D. Fensel, K. Sycara and J. Mylopoulos, Springer Berlin Heidelberg. 2870: ). Grenoble, France: Bradley, K., R. Rafter and B. Smyth (2000). Case-Based User Profiling for Content Personalisation. International Conference on Adaptive Hypermedia and Adaptive Web-Based Systems (AH 00), Trento, Italy, Springer. Brickley D. and Guha R. (2002). RDF Vocabulary Description Language 1.0 : RDF Schema W3C. Bruckner, R., B. List and J. Schiefer (2001). Developing requirements for data warehouse systems with use cases. the Seventh Americas Conference on Information Systems, AMCIS, Boston, Massachusetts, USA. Carayon, F. and C. Baude (2013). médicale et à sa facturation en médecine, chirurgie, obstétrique et odontologie. France, Ministère des affaires sociales et de la santé. Bulletin officiel. Carmè, A., J.-N. Mazón and S. Rizzi (2010). A Model-Driven Heuristic Approach for Detecting Multidimensional Facts in Relational Data Sources. Data Warehousing and Knowledge Discovery. T. Bach Pedersen, M. Mohania and A. Tjoa, Springer Berlin Heidelberg. 6263: Cavero, J. M., M. Piattini and E. Marcos (2001). Midea : A multidimensional data warehouse methodology. I C E IS: Chatzopoulou, G., M. Eirinaki and N. Polyzotis (2009). Query Recommendations for Interactive Database Exploration. SSDBM: Cherniack, M., E. F. Galvez, M. J. Franklin and S. Zdonik (2003). Profile-Driven Cache Management. International Conference on Data Engi-neering (ICDE 03), Bangalore, India. Choquet, R. (2011). Partage de données biomédicales : modèles, sémantique et qualité. Doctorat, Université Pierre et Marie Curie, Paris 6. Codd, E. F. (1993). "Providing OLAP (On-Line Analytical Processing) to User-Analysts : an IT mandate." Technical report. Cohen, A. and W. William (2003). A Comparison of String Distance Metrics for Name-Matching Tasks. IJCAI- 03 Workshop on Information Integration. 189

190 Connolly D., van Harmelen F., Horrocks I., McGuinness D. L., Patel-Schneider P. F. and Stein L. A. (2001). "DAML+OIL Reference Description." Retrieved 2013, from Corby, O., R. Dieng-kuntz and C. Faron-zucker (2004). Querying the Semantic Web with the CORESE search engine, IOS Press. Coret, P., J. Richard, E. Talavet and T. Trofimoya (2006). "Intro Technical report. Datta, A. and H. Thomas (1999). "The cube data model: A conceptual model and algebra for online analytical processing in data warehouses." Decision Support Systems (DSS) 27(3): Debonnets, T. (2007). "Présentation de la réforme de la gouvernance hospitalière, les pôles d'activité." Retrieved 12/12/2011, 2011, from Degoulet, P. (2001). Systèmes d'information Hospitaliers. Dittrich, J.-P., D. Kossmann and A. Kreutz (2005). Bridging the gap between OLAP and SQL. Proceedings of the 31st international conference on Very large data bases. Trondheim, Norway, VLDB Endowment: Doan, A., J. Madhavan, P. Domingos and A. Halevy (2002). Learning to map between ontologies on the semantic web. Proceedings of the 11th international conference on World Wide Web. Honolulu, Hawaii, USA, ACM: Domingue, J. and Tadzebao (1998). WebOnto: Discussing, Browsing and Editing Ontologies on the Web. 11th Knowledge Acquisition for Knowledge- Dou, D., M. Drew and P. QI (2003). Ontology translation on the semantic Web. Berlin, ALLEMAGNE, Springer. Ehrig, M. (2007). Ontology Alignment: Bridging the Semantic Gap, Springer. Ehrig, M. and S. Staab (2004). QOM-quick ontology mapping. Third International Semantic Web Conference (ISWC) Hiroshima, Japan, LNCS. El Sarraj, S. Rodier and B. Espinasse (2011). "Entrepôt de données autour du PMSI pour le pilotage Techniques Hospitalières: Euzenat, J. An API for ontology alignment. Proc. 3rd international semantic web conference (ISWC), Springer Verlag. Fabbe-Costes, N. and C. Romeyer (2004). "La traçabilité des activités de so hospitaliers : état des lieux." Logistique hospitalière: Farquhar, A., R. Fikes and J. Rice (1997). "The Ontolingua Server: a tool for collaborative ontology construction." International Journal of Human-Computer Studies 46(6): Favre, C. (2007). Évolution de schémas dans les entrepôts de données : mise à jour de hiérarchies de dimension pour la personnalisation des analyses. Fernandez, M., A. Gómez-Pérez and N. Juristo (1997). METHONTOLOGY: from ontological art towards ontological engineering Franconi, E. and U. Sattler (1999). A Data Warehouse Conceptual Data Model for Multidimensional Aggregation : a Preliminary Report. Italian Association for Artificial Intelligence AI*IA Notizie. 1: G.NISAND PMSI et systemes d'information hospitalier. Gam, I. and C. Salinesi (2006). INFORSID Hammamet (Tunisie): pages Gam, I. and C. Salinesi (2006). A Requirement-driven Approach for Designing Data Warehouses REFSQ'2006. Luxembourg. Gandon, F. (2002). Ontology Engeneering: a survey and a return on experience. Rapport de recherche INRIA. Garrigos, I., J. Pardillo, J.-N. Mazon and J. Trujillo (2009). A Conceptual Modeling Approach for OLAP Personalization. Conceptual Modeling-ER Verlag Berlin Heidelberg, Springer. 5829:

191 Ghozzi, F., F. Ravat, O. Teste and G. Zurfluh (2005). Méthode contrainte.. Cépadues, Revue des Nouvelles Technologies de RN T I-B-1: Giacometti, A., P. Marcel and E. Negre (2009). Recommending Multidimensional Queries DaWaK: Giacometti, A., P. Marcel, E. Negre and A. Soulet (2009). Query recommendations for OLAP discovery driven analysis. DOLAP, Hong Kong, China. Giorgini, P., S. Rizzi and M. Garzetti (2005). Goal-Oriented Requirement Analysis for Data Warehouse Design.. Bremen, Germany. GMSIH (2005). "Pilotage des Etablissements de Santé - Définition des projets Pilotage ". ) - GMSIH. (2006). "Kit de base des tableaux de bord des établissements de santé." from m Golfarelli, M. (2010). From user requirements to conceptual design in data warehouse design a survey. Data Warehousing Design and Advanced Engineering Applications: Methods for Complex Construction, IGI Global. Golfarelli, M., D. Maio and S. Rizzi (1998). "The dimensional fact model : A conceptual model for data warehouses." Int. J. Cooperative Inf. Syst 7(2-3): Gómez-Pérez, A., M. Fernández-López and O. Corcho. (2004). Ontological Engineering with Examples from the Areas of knowledge Management, e-commerce and Semantic Web. Gray, J., A. Bosworth, A. Layman and H. Pirahesh (1996). "Data Cube : A Relational Aggregation Operator Generalizing Group-By, Cross-Tab, and Sub-Total." Data Min. Knowl. Discov.: Gruber, T. (1993). "A translation approach to portable ontology specification." Knowledge Acquisition 5(2): Gruninger, M. and M. Fox (1995). The logic of enterprise modelling. Reengineering the Enterprise, J. Brown, D. Guarino, N. (1998). Some ontological principles for designing upper level lexical resources,. 1st International Conference on Language Resources and Evaluation. Guarino, N. and C. Welty (2000). Identity, Unity, and Individuality: Towards a Formal Toolkit forontological Analysis. Proceedings of the European Conference on Artificial Intelligence (ECAI). Guarino N. and Giaretta P. (1995). Ontologies and knowledge bases, towards a terminological clarification. Towards very large knowledge bases: knowledge building and knowledge sharing, IOS Presse. Gyssens, M. and L. V. S. Lakshmanan (1997). A foundation for multi-dimensional databases. Conf. on Very Large Data Bases (VLDB), Intl. Haouet, I. and T. Nobre (2011). "Quelle démarche pour l'introduction d'un outils de pilotage stratégique à l'hopital? le cas d'un Balanced scorecard dans un CHU francophone." Hüsseman, B., J. Lechtenbörger and G. Vossen (2000). Conceptual Data Warehouse Design Proceedings of the International Work Stockholm, Sweden. IBM (2006). "IBM: Ontology Definition Metamodel." Inmon, W. H. (1992). Building the data warehouse. New York, NY, USA., John Wiley & Sons. Ioannidis, Y. and G. Koutrika (2005). Personalized Systems : Models and Methods from an IR and DB Perspective. VLDB:

192 192 J.Krebs. (2005). "Form feeds function:the role of storyboards in requirements elicitation." from / 128.ibm.com/developerworks/rational/library/dec05/krebs/index.htmS. Jean S., Pierra G. and Ait-Ameur Y. (2007). "Domain Ontologies : a Database-Oriented Analysis." Springer 1: Jerbi, H. (2012).. Doctorat, Université Toulouse 1 Capitole (UT1 Capitole). Jerbi, H., G. Pujolle, F. Ravat and O. Teste (2010). Personnalisation de Systèmes OLAP Annotés. INFORSID. Marseille, France. Jerbi, H., G. Pujolle, F. Ravat and O. Teste (2011). "Recommandation de requêtes dans les bases de données multidimensionnelles annotées." Revue des Sciences et Technologies de l'information, Ingénierie des Systèmes d'information 16(1): p Jerbi, H., F. Ravat, O. Teste and G. Zurfluh (2008). Management of Context-Aware Preferences in Multidimensional Databases.. ICDIM Jerbi, H., F. Ravat, O. Teste and G. Zurfluh (2009). Preference-Based Recommendations for OLAP Analysis. Proceedings of the 11th International Conference on Data Warehousing and Knowledge Discovery. Linz, Austria, Springer-Verlag: Recuerda, Dimitar Manov and M. Ehrig (2003). "D4.2.1 State-of-the-art survey on Ontology Merging and Aligning V1." Semantically Enabled Knowledge Technologies (SEKT). Kaplan, R. S. and D. P. Norton (1996). "The Balanced Scorecard." Harvard business review. Kassel, G. (2002). OntoSpec : une méthode de spécification semi-informelle d'ontologies. Actes des 13èmes journées francophones d'ingénierie des Connaissances (IC). Khouri, S. and L. Bellatreche (2010). A methodology and tool for conceptual designing a data warehouse from ontology-based sources. DOLAP, Toronto, Canada. Khouri, S. and L. Bellatreche (2011). "Valorisation des besoins des utilisateurs dans le processus de conception et " JFO. Khouri, S., L. Bellatreche and P. Marcel (2012). Une démarche de conception d'un Entrepôt Sémantique Matérialisant les Données et les Besoins. Ingénierie des Systèmes d'information. matérialisant les données et les besoins." Ingénierie des Systèmes d'information. Networking and Information Systems. 17/5: Kimball, R. (1996). The data warehouse toolkit: Practical Techniques for Building Dimensional Data Warehouses, John Wiley and Sons. Kimball, R. and M. Ross (1996). The data warehousing toolkit. New York, John Wiley&Sons. Koh. Korfhage, R. R. (1997). Information Storage and Retrieval. Koutrika, G. and Y. Ioannidis (2004). Personalization of Queries in Database Systems. XXth International Conference on Data Engineering (ICDE 04), Boston, Massachusetts, USA, IEEE Computer Society. Lachèze-Pasquet, P. and D. Stringre (1999). l'administration de l'hôpital. Paris, Berger-Levrault. Lassila O., McGuinness and Deborah L. (2001). The Role of Frame-Based Representation on the Semantic Web. K. S. Laboratory. Lehner, W. (1998). Modelling Large Scale OLAP Scenarios. Advances in Database Technology (EDBT), Intl Levenshtein, V. I. (1996). Binary codes capable of correcting deletions, insertions, and reversals. Rapport technique.

193 193 Li, C. and X. S. Wang (1996). A Data Model for Supporting On-Line Analytical Processing. Conf. on Information and Knowledge Management (CIKM). Liepins, R., K. Cerans and A. Sprogis (2012). Visualizing and Editing Ontology Fragments with OWLGrEd. I- SEMANTICS Lin, D. (1998). An Information-Theoretic Definition of Similarity. Proceedings of the Fifteenth International Conference on Machine Learning, Morgan Kaufmann Publishers Inc.: Lin, F. (2007)., Jonkoping, Sweden. Lin, S. and D. E. Brown (2003). Criminal Incident Data Association Using the OLAP Technology Symposium in Intelligence and Security Informatics (ISI 03), Tucson, Arizona, USA, Springer. List, B., R. M. Bruckner, K. Machaczek and J. Schiefer (2002). "A comparison of data warehouse development methodologies case study of the process warehouse." Lujan-mora, S. and J. Trujillo (2003). "A Comprehensive Method for Data Warehouse Design." DMDW. Lujn-mora, S., J. Trujillo and I. Song (2002). Multidimensional modeling with UML package diagrams 21st Int. Conf. on Conceptual Modeling. M. Gruninger and M.S. Fox (1995). Methodology for the design and evaluation of ontologies. Workshop on Basic Ontological Issues in Knowledge Sharing in IJCAI 95, Montreal, Canada. M. Jensen, T. Holmgren and T. Pedersen (2004). "Discovering multidimensional structure in relational data.." Data Warehousing and Knowledg ediscovery. M. Uschold and M. Gruninger (1996). " Ontologies: principles, methods, and applications." Knowledge Engineering Review 11(2): Mazón, J.-N., J. Trujillo and J. Lechtenbörger (2007). "Reconciling requirement-driven data warehouses with data sources via multidimensional normal forms." Data Knowl. Eng. 63(3): Mazón, J.-N., J. Trujillo, M. Serrano and M. Piattini (2005). Designing datanwarehouses : from business requirement analysis to multidimensional modeling. 13th IEEE International Requirements Engineering Conference Workshop on Requirements Engineering for Business Needs and IT Alignment (REBNITA). Messaoud, R. B., S. L. Rabaséda, R. Missaoui and O. Boussaid (2007). OLEMAR : an On-Line Environment for Mining Association Rules in Multidimensional Data. Data Mining and Knowledge Discovery Technologies Idea Group Inc.: 35. Ministère du travail de l'emploi et de la santé (secteur santé). (2011). "Enquête nationale gouvernance hospitalière 2011, les résulats." Retrieved 2012, from Moody, D. L. and M. A. R. Kortink (2000). "From enterprise models to dimensional models : a methodology for data warehouse and data mart design." Jeusfeld: 5. N. Berkani, S. Khouri and L. Bellatreche (2012). Generic methodology for semantic data warehouse design: From schema definition to etl. Intelligent Networking and Collaborative Systems (INCoS). Nakache, D. (2007). Extraction automatique des diagnostics à partir des comptes rendus médicaux textuels. Doctorat, Conservatoire National des Arts et Métiers. Nebot, V., R. Berlanga, J. Pérez, M. Aramburu and T. Pedersen (2009). "Multidimensional integrated ontologies: A framework for designing semantic data warehouses." Journal on Data Semantics X III. Negre, E. (2011). Quand la recommandation rencontre la personnalisation. RSTI-TSI: Nemati, H. R., D. M. Steiger, L. S. Iyer and R. T. Herschel (2002). "Knowledge warehouse: an architectural integration of knowledge management, decision support, artificial intelligence and data warehousing." Decision Support Systems 33(2): Nicola, A., M. Missikoff and R. Navigli (2005). A Proposal for a Unified Process for Ontology Building: UPON. Database and Expert Systems Applications. K. Andersen, J. Debenham and R. Wagner, Springer Berlin Heidelberg. 3588: Nobre, T. (2000). Quels tableaux de bord de pilotage pour l'hôpital? 21ème congres de l'afc. France

194 194 Nobre, T. and N. Biron (2002). Revue Finance Contrôle Stratégie. Noy, N., R. W. Ferguson and M. A. Musen (2000). The Knowledge Model of Protégé-2000: Combining Interoperability and Flexibility. 12th European Knowledge Acquisition Workshop (EKAW'00). Noy, N. F. and M. A. Musen (2003). "The PROMPT suite: interactive tools for ontology merging and mapping." Int. J. Hum.-Comput. Stud. 59(6): Parsia, B. and E. Sirin (2000). "Pellet : An OWL DL Reasoner." Philipp Cimiano and J. Völker. (2005). "Text2onto." NLDB: Phipps, C. and K. Davis (2002). Automating Data Warehouse Conceptual Schema Design and Evaluation. DMDW: Pierra, G. (2002). Un modèle formel d'ontologie pour l'ingénierie, le commerce électronique et le Web sémantique: Le modèle de dictionnaire sémantique PLIB. Journées Scientifiques WEB SEMANTIQUE, Paris. Pierra, G. (2003). Context-Explication in Conceptual Ontologies: The PLIB Approach. CE'2003, Special track on Data Integration in Engineering, Portugal. Pierra, G. (2008). Chapter Context representation in domain ontologies and its use for semantic integration of data. Journal of data semantics (jods), Berlin, Heidelberg, Springer-Verlag. Pierra, G. (2008). "Context Representation in Domain Ontologies and its Use for Semantic Integration of Data." Journal Of Data Semantics (JoDS) 10( ). Pinet F, Ventadour P, Brun T, Papajorgji P, Roussey C and V. F (2006). Using UML for ontology construction: A case study in agriculture. 7th AOS Workshop on Ontology-Based Knowledge Discovery: Using Metadata & Ontologies for Improving Access to Agricultural Information, Bangalore, India. tliers dans des cubes de données : une aide à la navigation.. C. B-3: Prat, N. and J. Akoka (2002). From uml to rolap multidimensional databases using a pivot model. 8èmes Journées Bases de Données Avancées: page 24. Prat, N., J. Akoka and I. Comyn-Wattiau (2011). Transforming multidimensional models into OWL-DL ontologies. RCIS. Prat, N., I. Megdiche and J. Akoka (2012). Multidimensional Models Meet the Semantic Web: Defining and Reasoning on OWL-DL Ontologies for OLAP. DOLAP, Hawaii, USA. Pretschner, A. and S. Gauch (1999). Personalization on the Web. Technical report, In- formation and Telecommunication Technology Center, Department of Electrical Engineering and Computer Science, The University of Kansas. Pretschner, A. and S. Gauch (1999 ). Ontology Based Personalized Search. XIth IEEE International Conference on Tools with Artificial Intelligence (ICTAI 99), Chicago, Illinois, USA. Psyché, V., O. Mendes and J. Bourdeau (2003). formation à distance tion pour R. Dieng, O. Corby, F. Gandon, A. Gibon, J. Golebiowska, N. Matta and M. Ribière. (2001). Méthodes et outils pour la gestion des connaissances : une approche pluridisciplinaire du knowledge management (2ième édition). Rafanelli, M. (2003). Operators for Multidimensional Aggregate Data. Chapitre V, Multidimensional Databases: Problems and Solutions IGI Publishing Group. Ravat F, Teste O, Tournier R and Z. G (2008). "Algebraic and graphic languages for OLAP manipulations." Intl. Journal of Data Warehousing and Mining (IJDWM) 4(1 ): Ravat, F., O. Teste, G. Zurfluh and (2007). Personnalisation de bases de données multidimensionnelles. XXVème de Décision (INFORSID 07), Perros- Guirec, France.

195 195 Remoleur, M. (2005). "Pilotage des établissements de santé : La mise en place de taleaux de bord prospectifs équilibrés : une solution pour une gestion hospitalière multidimensionnelle tourné vers l'avenir!." de conception. Mémoire d'habilitation à Diriger des Recherches. I. d. Grénoble. Rizzi, S., A. Abello, J. Lechtenborger and J. Trujillo (2006). Research in data warehouse modeling and design: dead or alive? DOLAP, Arlington, VA, USA Rochfeld, A. and H. Tardieu (1983). Merise: An information system design and development methodology. Information & Management. Romero, O. and A. Abelló (2006). Multidimensional Design by Examples. Data Warehousing and Knowledge Discovery. I. Proc., Springer of L N CS: Romero, O. and A. Abelló (2007). Automating Multidimensional Design from Ontologies. DOLAP, Lisbon, Portugal. Romero, O. and A. Abelló (2010). "Automatic validation of requirements to support multidimensional design." Data & Knowledge Engineering 69(9): Romero, O., A. Simitsis and A. Abelló (2011). " Gem : requirement-driven generation of etl and multidimensional conceptual designs." Data Warehousing and Knowledge Discovery: Roussey, C., F. Pinet, M.-A. Kang and O. Corcho (2011). "An Introduction to Ontologies and Ontology Engineering." Advanced Information and Knowledge Processing 1: Sanchez, A., J. M. Cavero, A. de miguel and P. Martinez (1999). Idea : A conceptual multidimensional data model and some methodological implications. CIICC Cancun, Mexico. santé, M. d. a. s. e. d. l. (2013). médicale et à sa facturation en médecine, chirurgie, obstétrique et odontologie. Sapia, C., M. Blaschka, G. Höfling and B. Dinter (1998). "Extending the E/R Model for the Multidimensional Paradigm." Springer Verlag. Sarawagi, S., R. Agrawal and N. Megiddo (1998). Discovery-Driven Exploration of OLAP Data Cubes. VIth International Conference on Extending Database Technology (EDBT 98). Valencia, Spain, Springer. 1377: Schiefer, J., B. List and R. M. Bruckner (2002). A holistic approach for managing requirements of data warehouse systems. 8th Americas Conference on Information Systems, AMCIS, Dallas, TX, USA. Serna Encinas, M. T. (2005). expérimentation. Docteur, Université Joseph Fourier. Song, I.-Y., R. Khare and B. Dai (2007). SAMSTAR: a semi-automated lexical method for generating star schemas from an entity-relationship diagram. DOLAP, ACM. Soussi, A., J. Feki and F. Gargouri (2005). Approche semi-automatisée de conception de schémas multidimensionnels valides. Ière journée sur les Entre. C. Editions. B-1: Stumme, G. and A. Maedche (2001). FCA-MERGE: bottom-up merging of ontologies. Proceedings of the 17th international joint conference on Artificial intelligence - Volume 1. Seattle, WA, USA, Morgan Kaufmann Publishers Inc.: Sure, Y., J. Angele and S. Staab (2002). OntoEdit: Guiding Ontology Development by Methodology and Inferencing. Confederated International Conferences CoopIS, DOA and ODBASE, Springer-Verlag LNCS. Tang, J., J. Li, B. Liang, X. Huang, Y. Li and K. Wang (2006). "Using Bayesian decision for ontology mapping." Web Semant. 4(4): Teguiak., H. V. (2012). une approche basé sur les transformations de modèles. PhD thesis. Thalhammer, T., M. Schrefl and M. Mohania (2001). "Active data warehouses: complementing OLAP with analysis rules." Data & Knowledge Engineering 39:

196 Torlone, R. (2003). Conceptual Multidimensional Models. Chapitre III, Multidimensional Databases: Problems and Solutions, Maurizio Rafanelli (Ed.), Idea Publishing Group (IGP). Trujillo, J., M. Palomar, J. Gómez and I. Song (2001). "Designing Data Warehouses with OO Conceptual Models." special issue on Data Warehouses 34(12): Tryfona, N., F. Busborg and J. Christiansen (1999). starer: A Conceptual Model for Data Warehouse Design International Workshop on Data Warehousing and Olap (DOLAP). Kansas City, Missouri, USA. Tsois, A., N. Karayannidis and T. K. Sellis (2001). Mac : Conceptual data modeling for olap. 3rd International Workshop on Design and Management of Data Warehouses (DMDW 2001). Theodoratos 5. Vassiliadis, P., M. Bouzeghoub and C. Quix (2002). "Towards quality-oriented datawarehouse usage and evolution.." Inf. Syst. 25(2): Vassiliadis, P., A. Simitsis, P. Georgantas, M. Terrovitis and S. Skiadopoulos (2005). "A generic and customizable framework for the design of etl scenarios." Inf. Syst 30(7): Vrdoljak, B., M. Banek and S. Rizzi (2003). Designing web warehouses from xml schemas. DAWAK. W Choong, A Giacometti, D Laurent, P Marcel, E Negre and N. Spyratos (2007). Context-based Exploitation of DataWarehouses. IIIèmes journées francophones sur les Entrepôts Winter, R. and B. Strauch (2003). "A method for demand-driven information requirements analysis in data warehousing projects." HICSS: 231. Xin, D., J. Han, H. Cheng and X. Li, A (2006). Answering top-k queries with multi-dimensional selections: The ranking cube approach. VLDB: Yu, E. S.-K. (2011). "Modelling strategic relationships for process reengineering." Social Modeling for Requirements Engineering. Zhong, Q., H. Li, J. Li, G. Xie, J. Tang, L. Zhou and Y. Pan (2009). A gauss function based approach for unbalanced ontology matching. Proceedings of the 2009 ACM SIGMOD International Conference on Management of data. Providence, Rhode Island, USA, ACM:

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS Nazih Selmoune (*), Zaia Alimazighi (*) [email protected], [email protected] (*) Laboratoire des systèmes

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

Les Entrepôts de Données. (Data Warehouses)

Les Entrepôts de Données. (Data Warehouses) Les Entrepôts de Données (Data Warehouses) Pr. Omar Boussaid Département d'informatique et de Sta5s5que Université Lyon2 - France Les Entrepôts de Données 1. Généralités, sur le décisionnel 2. L'entreposage

Plus en détail

Système d Information Hospitalier L expérience du Centre Hospitalier Ibn Sina (CHIS)

Système d Information Hospitalier L expérience du Centre Hospitalier Ibn Sina (CHIS) Séminaire SIM 07 FMP de Fès, le 02 juin 2007 Système d Information Hospitalier L expérience du Centre Hospitalier Ibn Sina (CHIS) Auteurs : Mme Drissia ELACHEJAI Ingénieur en chef Centre Hospitalier Ibn

Plus en détail

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Solutions PME VIPDev Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Cette offre est basée sur la mise à disposition de l ensemble de nos compétences techniques et créatives au service

Plus en détail

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016 Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques

Plus en détail

Modélisation Multidimensionnelle des Tableaux de Bord Prospectifs

Modélisation Multidimensionnelle des Tableaux de Bord Prospectifs Modélisation Multidimensionnelle des Tableaux de Bord Prospectifs Zaia Alimazighi (*), Nazih Selmoune (*) (Alimazighi, Selmoune)@wissal.dz (*) Laboratoire des systèmes informatiques (LSI), Faculté d Electronique

Plus en détail

Chapitre 9 : Informatique décisionnelle

Chapitre 9 : Informatique décisionnelle Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle

Plus en détail

STACCINI Pascal UFR Médecine Nice Université Nice-Sophia Antipolis

STACCINI Pascal UFR Médecine Nice Université Nice-Sophia Antipolis 3.2 : S initier à l organisation, la mise en œuvre et l utilisation d un système d information Chapitre 3 : Systèmes d information Systèmes d information hospitaliers (S.I.H.) STACCINI Pascal UFR Médecine

Plus en détail

QU EST-CE QUE LE DECISIONNEL?

QU EST-CE QUE LE DECISIONNEL? La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce

Plus en détail

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la

Plus en détail

Intelligence Economique - Business Intelligence

Intelligence Economique - Business Intelligence Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit

Plus en détail

Entreposage de données complexes pour la médecine d anticipation personnalisée

Entreposage de données complexes pour la médecine d anticipation personnalisée Manuscrit auteur, publié dans "9th International Conference on System Science in Health Care (ICSSHC 08), Lyon : France (2008)" Entreposage de données complexes pour la médecine d anticipation personnalisée

Plus en détail

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Le tout fichier Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché

Plus en détail

Le tableau de bord de la DSI : un outil pour mieux piloter son informatique.

Le tableau de bord de la DSI : un outil pour mieux piloter son informatique. Le tableau de bord de la DSI : un outil pour mieux piloter son informatique. Introduction Face à l évolution constante des besoins fonctionnels et des outils informatiques, il est devenu essentiel pour

Plus en détail

Hôpital performant et soins de qualité. La rencontre des extrêmes estelle

Hôpital performant et soins de qualité. La rencontre des extrêmes estelle Hôpital performant et soins de qualité. La rencontre des extrêmes estelle possible? 18 octobre 2012 Professeur Philippe KOLH CIO, Directeur du Service des Informations Médico-Economiques CHU de LIEGE Plan

Plus en détail

BUSINESS INTELLIGENCE

BUSINESS INTELLIGENCE GUIDE COMPARATIF BUSINESS INTELLIGENCE www.viseo.com Table des matières Business Intelligence :... 2 Contexte et objectifs... 2 Une architecture spécifique... 2 Les outils de Business intelligence... 3

Plus en détail

Un projet multi-établissements de territoire en Franche-Comté

Un projet multi-établissements de territoire en Franche-Comté Un projet multi-établissements de territoire en Franche-Comté Dr Denis BABORIER CH LONS-LE-SAUNIER 31 Août 2009 La géographie du projet ISYS Projet d informatisation du système de soins Franche-Comté EMOSIST-fc

Plus en détail

Urbanisation des SI-NFE107

Urbanisation des SI-NFE107 OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle

Plus en détail

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres [email protected] LIA/Université d Avignon Cours/TP

Plus en détail

Bases de Données Avancées

Bases de Données Avancées 1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,

Plus en détail

Présentation à la Direction des Santé Achats de la Société Générale. Asurances, soins, biens médicaux

Présentation à la Direction des Santé Achats de la Société Générale. Asurances, soins, biens médicaux Présentation à la Direction des Santé Achats de la Société Générale 2003 Asurances, soins, biens médicaux Une culture globale et entrepreneuriale orientée client Innovation et fonctionnement en réseau

Plus en détail

Master Informatique Aix-Marseille Université

Master Informatique Aix-Marseille Université Aix-Marseille Université http://masterinfo.univ-mrs.fr/ Département Informatique et Interactions UFR Sciences Laboratoire d Informatique Fondamentale Laboratoire des Sciences de l Information et des Systèmes

Plus en détail

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL Présenté par Hana Gara Kort Sous la direction de Dr Jalel Akaichi Maître de conférences 1 1.Introduction

Plus en détail

Programme Hôpital numérique

Programme Hôpital numérique Programme Hôpital numérique Boite à outils pour l atteinte des pré-requis Fiches pratiques Octobre 2012 Direction générale de l offre de soins Sommaire 1. LE PROGRAMME HOPITAL NUMERIQUE... 3 2. LE SOCLE

Plus en détail

Business Intelligence avec SQL Server 2012

Business Intelligence avec SQL Server 2012 Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Extrait Alimenter l'entrepôt de données avec SSIS Business

Plus en détail

WHITE PAPER Une revue de solution par Talend & Infosense

WHITE PAPER Une revue de solution par Talend & Infosense WHITE PAPER Une revue de solution par Talend & Infosense Master Data Management pour les données de référence dans le domaine de la santé Table des matières CAS D ETUDE : COLLABORATION SOCIALE ET ADMINISTRATION

Plus en détail

Business & High Technology

Business & High Technology UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...

Plus en détail

S8 - INFORMATIQUE COMMERCIALE

S8 - INFORMATIQUE COMMERCIALE S8 - INFORMATIQUE COMMERCIALE Les savoirs de l Informatique Commerciale doivent être abordés en relation avec les autres savoirs (S4 à S7). Les objectifs généraux sont : o de sensibiliser les étudiants

Plus en détail

Référentiel métier de Directeur des Soins en établissement et en institut de formation mars 2010

Référentiel métier de Directeur des Soins en établissement et en institut de formation mars 2010 Référentiel métier de Directeur(trice) des soins Ce référentiel intègre à la fois le métier Directeur(trice) des soins en établissement et celui de Directeur(trice) des soins en institut de formation paramédicale.

Plus en détail

Didier MOUNIEN Samantha MOINEAUX

Didier MOUNIEN Samantha MOINEAUX Didier MOUNIEN Samantha MOINEAUX 08/01/2008 1 Généralisation des ERP ERP génère une importante masse de données Comment mesurer l impact réel d une décision? Comment choisir entre plusieurs décisions?

Plus en détail

Business Intelligence avec SQL Server 2012

Business Intelligence avec SQL Server 2012 Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Table des matières Les éléments à télécharger sont disponibles

Plus en détail

BRANCHE DU NÉGOCE ET PRESTATIONS DE SERVICES

BRANCHE DU NÉGOCE ET PRESTATIONS DE SERVICES Septembre 2014 CARTOGRAPHIE DES MÉTIERS DES PRESTATAIRES BRANCHE DU NÉGOCE ET PRESTATIONS DE SERVICES DANS LES DOMAINES MÉDICO-TECHNIQUES www.metiers-medico-techniques.fr CPNEFP de la branche Négoce et

Plus en détail

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012 CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2012 AGENDA Qui sommes nous? Présentation de Keyrus Keyrus : Expert en formations BI Nos propositions de formation 3 modes de formations Liste des

Plus en détail

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................

Plus en détail

Prestations d audit et de conseil 2015

Prestations d audit et de conseil 2015 M. Denis VIROLE Directeur des Services +33 (0) 6 11 37 47 56 [email protected] Mme Sandrine BEURTHE Responsable Administrative +33 (0) 3 87 62 06 00 [email protected] Prestations

Plus en détail

La fonction d audit interne garantit la correcte application des procédures en vigueur et la fiabilité des informations remontées par les filiales.

La fonction d audit interne garantit la correcte application des procédures en vigueur et la fiabilité des informations remontées par les filiales. Chapitre 11 LA FONCTION CONTRÔLE DE GESTION REPORTING AUDIT INTERNE Un système de reporting homogène dans toutes les filiales permet un contrôle de gestion efficace et la production d un tableau de bord

Plus en détail

ETL Extract - Transform - Load

ETL Extract - Transform - Load ETL Extract - Transform - Load Concept général d analyse en ligne (rappels) Rémy Choquet - Université Lyon 2 - Master 2 IIDEE - 2006-2007 Plan Définitions La place d OLAP dans une entreprise OLAP versus

Plus en détail

BI = Business Intelligence Master Data-Science

BI = Business Intelligence Master Data-Science BI = Business Intelligence Master Data-Science UPMC 25 janvier 2015 Organisation Horaire Cours : Lundi de 13h30 à 15h30 TP : Vendredi de 13h30 à 17h45 Intervenants : Divers industriels (en cours de construction)

Plus en détail

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Introduction à l Informatique Décisionnelle - Business Intelligence (7) Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence

Plus en détail

Méthodologie de conceptualisation BI

Méthodologie de conceptualisation BI Méthodologie de conceptualisation BI Business Intelligence (BI) La Business intelligence est un outil décisionnel incontournable à la gestion stratégique et quotidienne des entités. Il fournit de l information

Plus en détail

BI2 : Un profil UML pour les Indicateurs Décisionnels

BI2 : Un profil UML pour les Indicateurs Décisionnels BI2 : Un profil UML pour les Indicateurs Décisionnels Sandro Bimonte Irstea, TSCF, 9 Av. Blaise Pascal, 63178, Aubière, France [email protected] Thème de Recherche MOTIVE www.irstea.fr 2 Plan Motivations

Plus en détail

Projet de santé. Nom du site : N Finess : (Sera prochainement attribué par les services de l ARS) Statut juridique : Raison Sociale :

Projet de santé. Nom du site : N Finess : (Sera prochainement attribué par les services de l ARS) Statut juridique : Raison Sociale : Projet de santé Nom du site : N Finess : (Sera prochainement attribué par les services de l ARS) Statut juridique : Raison Sociale : Adresse du siège social : Téléphone : Mail : Version : Etablie en date

Plus en détail

PÉRENNISER LA PERFORMANCE

PÉRENNISER LA PERFORMANCE PÉRENNISER LA PERFORMANCE La recherche de performance est aujourd hui au cœur des préoccupations des organisations : succession des plans de productivité et de profitabilité, plans de reprise d activités,

Plus en détail

Business Intelligence : Informatique Décisionnelle

Business Intelligence : Informatique Décisionnelle Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données

Plus en détail

L information et la technologie de l informationl

L information et la technologie de l informationl L information et la technologie de l informationl CRM & informatique décisionnelled CRM CRM & informatique décisionnelle. d 1 2 3 Les Les fondements managériaux managériaux du du CRM. CRM. Les Les fondements

Plus en détail

LES ENTREPOTS DE DONNEES

LES ENTREPOTS DE DONNEES Module B4 : Projet des Systèmes d information Lille, le 25 mars 2002 LES ENTREPOTS DE DONNEES Problématique : Pour capitaliser ses informations, une entreprise doit-elle commencer par mettre en œuvre des

Plus en détail

ADDITIF AU RAPPORT DE CERTIFICATION V2010 CLINIQUE CHIRURGICALE DU LIBOURNAIS

ADDITIF AU RAPPORT DE CERTIFICATION V2010 CLINIQUE CHIRURGICALE DU LIBOURNAIS ADDITIF AU RAPPORT DE CERTIFICATION V2010 CLINIQUE CHIRURGICALE DU LIBOURNAIS 119 rue de la marne - 33500 - Libourne NOVEMBRE 2014 SOMMAIRE PREAMBULE 1. Présentation du document 2. Les niveaux de certification

Plus en détail

Organiser une permanence d accès aux soins de santé PASS

Organiser une permanence d accès aux soins de santé PASS Établissements de santé Droits et accueil des usagers Organiser une permanence d accès aux soins de santé PASS Recommandations et indicateurs Préface Faire face aux inégalités de santé qui touchent tout

Plus en détail

1 Introduction. Business Intelligence avec SharePoint Server 2010

1 Introduction. Business Intelligence avec SharePoint Server 2010 Business Intelligence avec SharePoint Server 2010 1 Introduction Dans le chapitre précédent, nous avons créé une collection de sites et activé les fonctions de restitution décisionnelles du serveur SharePoint

Plus en détail

Objectif : Passer de l analyse métier et fonctionnelle à la définition des applications qui

Objectif : Passer de l analyse métier et fonctionnelle à la définition des applications qui Formation PARTIE 1 : ARCHITECTURE APPLICATIVE DUREE : 5 h Objectif : Passer de l analyse métier et fonctionnelle à la définition des applications qui automatisent les fonctions Définir une architecture

Plus en détail

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1 La Geo-Business Intelligence selon GALIGEO avec ESRI 2005 session «Décisionnel» 26/10/2005 1 La Business Intelligence : Une Définition La Business intelligence permet l utilisation des données opérationnelles

Plus en détail

THOT - Extraction de données et de schémas d un SGBD

THOT - Extraction de données et de schémas d un SGBD THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) [email protected], [email protected] Mots clefs : Fouille d information, base de données, système

Plus en détail

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données : Page 1 of 6 Entrepôt de données Un article de Wikipédia, l'encyclopédie libre. L'entrepôt de données, ou datawarehouse, est un concept spécifique de l'informatique décisionnelle, issu du constat suivant

Plus en détail

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Tassadit BOUADI 22 Juin 2010, Saint Jacut 1 Plan Introduc

Plus en détail

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

PARTENARIAT DE L OBSERVATOIRE TECHNOLOGIQUE

PARTENARIAT DE L OBSERVATOIRE TECHNOLOGIQUE PARTENARIAT DE L OBSERVATOIRE TECHNOLOGIQUE Gouvernance du Système d Information Comment bien démarrer? Page 1 Soirée «Gouverner son informatique et sa sécurité : le défi des entreprises» CLUSIS / ISACA

Plus en détail

MYXTRACTION. 2009 La Business Intelligence en temps réel

MYXTRACTION. 2009 La Business Intelligence en temps réel MYXTRACTION 2009 La Business Intelligence en temps réel Administration Qui sommes nous? Administration et management des profils Connecteurs Base des données Gestion des variables et catégories de variables

Plus en détail

La place de la Géomatique Décisionnelle dans le processus de décision

La place de la Géomatique Décisionnelle dans le processus de décision Géomatique décisionnelle La place de la Géomatique Décisionnelle dans le processus de décision - Arnaud Van De Casteele Mines ParisTech - CRC Arnaud {dot} van_de_casteele {at} mines-paristech.fr Les rencontres

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre [email protected] Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

10 USAGES DE QLIK POUR AFFINER VOS ANALYSES FINANCIÈRES. Customer Success Stories 2015

10 USAGES DE QLIK POUR AFFINER VOS ANALYSES FINANCIÈRES. Customer Success Stories 2015 10 USAGES DE QLIK POUR AFFINER VOS ANALYSES FINANCIÈRES Customer Success Stories 2015 10 USAGES DE QLIK POUR AFFINER VOS ANALYSES FINANCIÈRES Ces exemples d applications et de développements sur mesure

Plus en détail

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Classe de terminale de la série Sciences et Technologie du Management et de la Gestion Préambule Présentation Les technologies de l information

Plus en détail

Théories de la Business Intelligence

Théories de la Business Intelligence 25 Chapitre 2 Théories de la Business Intelligence 1. Architectures des systèmes décisionnels Théories de la Business Intelligence Depuis les premières requêtes sur les sources de données OLTP consolidées

Plus en détail

PLATEFORME MÉTIER DÉDIÉE À LA PERFORMANCE DES INSTALLATIONS DE PRODUCTION

PLATEFORME MÉTIER DÉDIÉE À LA PERFORMANCE DES INSTALLATIONS DE PRODUCTION PLATEFORME MÉTIER DÉDIÉE À LA PERFORMANCE DES INSTALLATIONS DE PRODUCTION KEOPS Automation Espace Performance 2B, rue du Professeur Jean Rouxel BP 30747 44481 CARQUEFOU Cedex Tel. +33 (0)2 28 232 555 -

Plus en détail

Référentiels d Interopérabilité

Référentiels d Interopérabilité INFORMATION HOSPITALIERE STANDARDISEE Formation Maîtrise d Ouvrage Hospitalière Informatisation du circuit du médicament & des dispositifs médicaux Référentiels d Interopérabilité 7 ème édition : 14 janvier

Plus en détail

La problématique. La philosophie ' ) * )

La problématique. La philosophie ' ) * ) La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 3 - Data

BI = Business Intelligence Master Data-ScienceCours 3 - Data BI = Business Intelligence Master Data-Science Cours 3 - Datawarehouse UPMC 8 février 2015 Rappel L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage

Plus en détail

Le pilotage des collaborations et l interopérabilité des systèmes d information Vers une démarche intégrée

Le pilotage des collaborations et l interopérabilité des systèmes d information Vers une démarche intégrée Colloque : Systèmes Complexes d Information et Gestion des Risques pour l Aide à la Décision Le pilotage des collaborations et l interopérabilité des systèmes d information Vers une démarche intégrée BELKADI

Plus en détail

PROGICIELS DE GESTION INTÉGRÉS SOLUTIONS DE REPORTING

PROGICIELS DE GESTION INTÉGRÉS SOLUTIONS DE REPORTING PROGICIELS DE GESTION INTÉGRÉS SOLUTIONS DE REPORTING 8 rue de Prague 75012 Paris [email protected] DES SOLUTIONS SIMPLES ET INNOVANTES POUR LA GESTION ET LE PILOTAGE DE VOTRE ACTIVITÉ CONCEVOIR TRÉSORERIE

Plus en détail

Les entrepôts de données

Les entrepôts de données Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction

Plus en détail

La solution IdéoSanté une suite Web 2.0

La solution IdéoSanté une suite Web 2.0 La solution IdéoSanté une suite Web 2.0 SQLI et la santé : Une Histoire Des engagements dans la durée Etapes clés de l industrialisation de la suite Idéo santé Conseil SIS MOA, Urbanisation Réseaux de

Plus en détail

LES RÉFÉRENTIELS RELATIFS AUX ÉDUCATEURS SPÉCIALISÉS

LES RÉFÉRENTIELS RELATIFS AUX ÉDUCATEURS SPÉCIALISÉS LES RÉFÉRENTIELS RELATIFS AUX ÉDUCATEURS SPÉCIALISÉS 1. RÉFÉRENTIEL PROFESSIONNEL D ÉDUCATEUR SPÉCIALISÉ 2. RÉFÉRENTIEL ACTIVITÉS 3. RÉFÉRENTIEL DE 4. RÉFÉRENTIEL DE CERTIFICATION 5. RÉFÉRENTIEL DE FORMATION

Plus en détail

C ) Détail volets A, B, C, D et E. Hypothèses (facteurs externes au projet) Sources de vérification. Actions Objectifs Méthode, résultats

C ) Détail volets A, B, C, D et E. Hypothèses (facteurs externes au projet) Sources de vérification. Actions Objectifs Méthode, résultats C ) Détail volets A, B, C, D et E Actions Objectifs Méthode, résultats VOLET A : JUMELAGE DE 18 MOIS Rapports d avancement du projet. Réorganisation de l administration fiscale Rapports des voyages d étude.

Plus en détail

DESCRIPTIF DE MODULE S5 GSI

DESCRIPTIF DE MODULE S5 GSI Option SIM DESCRIPTIF DE MODULE S5 GSI : Gouvernance et Systèmes d Information COORDONNATEUR DU MODULE : Département : Ce module a pour but d enseigner les méthodes, les règles et les pratiques nécessaires

Plus en détail

Ici, le titre de la. Tableaux de bords de conférence

Ici, le titre de la. Tableaux de bords de conférence Ici, le titre de la Tableaux de bords de conférence pilotage d entreprise, indicateurs de performance reporting et BI quels outils seront incontournables à l horizon 2010? Les intervenants Editeur/Intégrateur

Plus en détail

La B.I. au secours des Managers de transition 72

La B.I. au secours des Managers de transition 72 T r i b u n e Depuis quelques années, la demande d interventions ponctuelles en Supply Chain est croissante. Améliorer la gestion des flux de l entreprise, piloter un projet ambitieux de restructuration

Plus en détail

UDSG CLASSIFICATION DOSSIER DOCUMENTAIRE

UDSG CLASSIFICATION DOSSIER DOCUMENTAIRE UDSG CLASSIFICATION DOSSIER DOCUMENTAIRE 2 SOMMAIRE I. LES FAMILLES PROFESSIONNELLES... 5 II. LES FONCTIONS GENERIQUES... 12 FAMILLE ETUDES ET CONCEPTION......... 15 ASSISTANT D ETUDES ET CONCEPTION...16

Plus en détail

Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel

Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Avant-propos 1. À qui s'adresse ce livre? 9 2. Les pré-requis 10 3. Les objectifs du livre 10 Introduction 1. Présentation du décisionnel 15 1.1 La notion de décideur 15 1.2 Les facteurs d'amélioration

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Data warehouse (DW) Le Data warehouse (entrepôt de données) est une collection de données orientées sujet, intégrées, non volatiles

Plus en détail

UE 8 Systèmes d information de gestion Le programme

UE 8 Systèmes d information de gestion Le programme UE 8 Systèmes d information de gestion Le programme Légende : Modifications de l arrêté du 8 mars 2010 Suppressions de l arrêté du 8 mars 2010 Partie inchangée par rapport au programme antérieur Indications

Plus en détail

Yourcegid Secteur Public Finances : Une réponse globale aux nouveaux enjeux de la fonction publique. Collectivités. Finances

Yourcegid Secteur Public Finances : Une réponse globale aux nouveaux enjeux de la fonction publique. Collectivités. Finances Yourcegid Secteur Public Finances : Une réponse globale aux nouveaux enjeux de la fonction publique Collectivités Finances Parce que votre organisation est unique, parce que vos besoins sont propres à

Plus en détail

BTS Comptabilité et Gestion SOMMAIRE

BTS Comptabilité et Gestion SOMMAIRE BTS Comptabilité et Gestion SOMMAIRE ANNEXE I : RÉFÉRENTIELS DU DIPLÔME... PAGE 2 I a. Référentiel des activités professionnelles...page 3 I b. Référentiel de certification... page 21 I c. Lexique....

Plus en détail

PROFIL DE POSTE AFFECTATION. SERIA (service informatique académique) DESCRIPTION DU POSTE

PROFIL DE POSTE AFFECTATION. SERIA (service informatique académique) DESCRIPTION DU POSTE PROFIL DE POSTE BAP : CORPS : NATURE : SPÉCIALITÉ : E ITRF Externe IGR 2, Chef de projet développement ÉTABLISSEMENT : Rectorat SERVICE : VILLE : SERIA (service informatique académique) DESCRIPTION DU

Plus en détail

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21 IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances

Plus en détail

Présentations personnelles. filière IL

Présentations personnelles. filière IL Présentations personnelles filière IL Résumé Liste de sujets de présentations personnelles. Chaque présentation aborde un sujet particulier, l'objectif étant que la lecture du rapport ainsi que l'écoute

Plus en détail

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013 Cube de textes et opérateur d'agrégation basé sur un modèle vectoriel adapté Text Cube Model and aggregation operator based on an adapted vector space model Lamia Oukid, Ounas Asfari, Fadila Bentayeb,

Plus en détail

Ministère de la santé, de la jeunesse, des sports et de la vie associative

Ministère de la santé, de la jeunesse, des sports et de la vie associative Ministère de la santé, de la jeunesse, des sports et de la vie associative Direction de l'hospitalisation et de l'organisation des soins Sous-direction qualité et fonctionnement des établissements de santé

Plus en détail

En synthèse. HVR pour garantir les échanges sensibles de l'entreprise

En synthèse. HVR pour garantir les échanges sensibles de l'entreprise En synthèse HVR pour garantir les échanges sensibles de l'entreprise Le logiciel HVR fournit des solutions pour résoudre les problèmes clés de l'entreprise dans les domaines suivants : Haute Disponibilité

Plus en détail

Evry - M2 MIAGE Entrepôt de données

Evry - M2 MIAGE Entrepôt de données Evry - M2 MIAGE Entrepôt de données Introduction D. Ploix - M2 Miage - EDD - Introduction 1 Plan Positionnement du BI dans l entreprise Déclinaison fonctionnelle du décisionnel dans l entreprise Intégration

Plus en détail

ISTEX, vers des services innovants d accès à la connaissance

ISTEX, vers des services innovants d accès à la connaissance ISTEX, vers des services innovants d accès à la connaissance Synthèse rédigée par Raymond Bérard, directeur de l ABES, à partir du dossier de candidature d ISTEX aux Initiatives d excellence et des réunions

Plus en détail

Analyse comparative entre différents outils de BI (Business Intelligence) :

Analyse comparative entre différents outils de BI (Business Intelligence) : Analyse comparative entre différents outils de BI (Business Intelligence) : Réalisé par: NAMIR YASSINE RAGUI ACHRAF Encadré par: PR. L. LAMRINI Dans le domaine d économies des Big Data et Open Data, comment

Plus en détail

COMPTE RENDU D ACCREDITATION DE L'HOPITAL ET INSTITUT DE FORMATION EN SOINS INFIRMIERS CROIX-ROUGE FRANÇAISE

COMPTE RENDU D ACCREDITATION DE L'HOPITAL ET INSTITUT DE FORMATION EN SOINS INFIRMIERS CROIX-ROUGE FRANÇAISE COMPTE RENDU D ACCREDITATION DE L'HOPITAL ET INSTITUT DE FORMATION EN SOINS INFIRMIERS CROIX-ROUGE FRANÇAISE Chemin de la Bretèque 76230 BOIS-GUILLAUME Mois de juin 2001 SOMMAIRE COMMENT LIRE LE «COMPTE

Plus en détail

ET DE LA STRATEGIE. Note de Synthèse. Domaine : Financement Version : 1 Mise à jour : 04/03/2012

ET DE LA STRATEGIE. Note de Synthèse. Domaine : Financement Version : 1 Mise à jour : 04/03/2012 DIRECTION DES AFFAIRES INSTITUTIONNELLES ET DE LA STRATEGIE Note de Synthèse CAMPAGNE TARIFAIRE 2012 : ENVELOPPE MIGAC Domaine : Financement Version : 1 Mise à jour : 04/03/2012 Diffusion: Vos contacts

Plus en détail

Business Intelligence avec SQL Server 2014 Maîtrisez les concepts et réalisez un système décisionnel

Business Intelligence avec SQL Server 2014 Maîtrisez les concepts et réalisez un système décisionnel Avant-propos 1. À qui s'adresse ce livre? 9 2. Les pré-requis 10 3. Les objectifs du livre 11 Introduction 1. Présentation du décisionnel 13 1.1 La notion de décideur 14 1.2 Les facteurs d'amélioration

Plus en détail

Catalogue Formation «Vanilla»

Catalogue Formation «Vanilla» Catalogue Formation «Vanilla» Date : octobre 2009 Table des matières Liste des Formations...2 Contenu des formations...3 Vanilla FastTrack...3 Vanilla Architecture...5 Enterprise Services...6 BIPortail...7

Plus en détail

GUIDE METHODOLOGIQUE

GUIDE METHODOLOGIQUE GUIDE METHODOLOGIQUE AIDE A LA MISE EN PLACE D UNE POLITIQUE «QUALITE ET RISQUES» EN ETABLISSEMENT DE SANTE Février 2006 Direction des Activités Médicales et de la Qualité Cellule Qualité, Risques et Vigilances

Plus en détail