303 Schedae, 2007 Prépublication n 46 Fascicule n 2 Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes Samya Sagar, Mohamed Ben Ahmed Laboratoire de Recherche en Informatique Arabisée et Documentique Intégrée (RIADI) École Nationale des Sciences de l Informatique Campus Universitaire de la Manouba, 2010 La Manouba, Tunis, Tunisie Samya.Sagar@riadi.rnu.tn, Mohamed.benahmed@riadi.rnu.tn Résumé : Les données géographiques sont un ensemble d informations renseignant sur les objets observés à la surface terrestre, ces données sont définies par leur position géographique, leur forme, leur description ainsi que leur évolution dans le temps. Ces données sont très complexes à modéliser et la multi-représentation qui est intrinsèque à ce type de données, est généralement négligée dans les modèles de données existants. Nous proposons dans cet article une solution pour répondre à certains problèmes décisionnels s appuyant sur des sources hétérogènes de l environnement géographique ; une solution basée sur un modèle adapté à la multi-représentation des données géographiques et ce, en proposant une extension à GML. Cette extension permet à notre modèle d être générique, en ce sens qu il est destiné à unifier l hétérogénéité des représentations des données spatio-temporelles en vue de les intégrer dans une plate-forme médiatrice entre ces données et des applications dédiées. Mots-clés : modèle générique, données spatio-temporelles, GML étendu, multireprésentation. 1 Introduction Vu la complexité des entités spatiales, plusieurs interprétations ou représentations d une entité peuvent être définies et maintenues par diverses applications. Il est donc nécessaire de définir des modèles de données spatiales puissants pour permettre une gestion cohérente de plusieurs représentations des mêmes entités spatiales et la gestion d objets spatiaux dynamiques. L objectif de la multi-représentation est de stocker ces différentes représentations potentielles d un même phénomène dans une base de données unique. Les modèles capables d atteindre un tel objectif et d assurer le maintien de plusieurs représentations des mêmes données sont appelés des modèles multi-représentation [1]. Samya Sagar, Mohamed Ben Ahmed «Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes»
304 Nous proposons dans cet article un modèle générique de données spatio-temporelles qui soit adapté au stockage de représentation multiple des objets géographiques. 2 Travaux liés à la multi-représentation spatiale Pour la gestion de la multi-représentation dans les bases de données spatiales, certaines solutions ont été proposées, telles que : Solution à base de vue ; Dans les systèmes d information géographique, la notion de vue est étendue à la notion de vue spatiale pour permettre la représentation des données géographiques selon différents points de vue. La composante spatiale des éléments des vues spatiales doit être la même que celle des éléments de base dont la vue est dérivée. Par conséquent, le mécanisme de vue spatiale n est pas approprié si la nouvelle représentation spatiale souhaitée n est pas copiable d une représentation déjà connue [2]. Dans ce cas, la nouvelle représentation ne peut que s ajouter à l existante pour constituer une représentation de base ; Solution à base d ontologie ; Les ontologies spatiales sont utilisées pour représenter à un niveau d abstraction élevé des concepts spatiaux en termes génériques [3, 4]. Comme pour la solution à base de vue, cette solution ne garantit pas la gestion efficace de la propagation efficace des mises à jour ; Solution à base de rôle : Le concept de rôle a été utilisé dans les bases de données classiques pour modéliser les différents rôles, facettes ou aspects d une entité [5]. Cette notion est très peu utilisée par la communauté des SIGs. 3 Description de la solution proposée pour la multi-représentation spatiale La solution, que nous proposons dans cet article, est une solution à base d intégration. L intégration de plusieurs bases de données géographiques décrivant un même espace géographique consiste à produire [6], une description unifiée des schémas des bases de données d origine (le schéma fédéré), des règles de traduction pour la migration des données et des liens entre différentes représentations d objets qui modélisent les mêmes entités réelles (exemple : appariement géométrique). L objectif est de rendre interopérable des bases de données initialement indépendantes pour permettre une réutilisation des données mémorisées dans chacune de ces bases de données. La base de données ainsi construite par intégration peut être considéré comme une base de données multi-représentation. Le schéma fédéré décrit pour chaque entité réelle une représentation unifiée de toutes ses représentations possibles. Le modèle ainsi proposé est un modèle de représentation unique et générique pour divers types de données géographiques et ce, en proposant en plus de la prise en compte de la dynamique des données géo-référencées une quadruple flexibilité : une flexibilité géographique, une flexibilité temporelle, une flexibilité sémantique et une flexibilité graphiques. 4 Modèle générique : GML-étendu Le modèle que nous proposons se base sur l extension du standard GML pour prendre en compte la multi-représentation. Nous allons ajouter à ce format les éléments qui nous semblent nécessaires pour le stockage de données spatio-temporelles avec leurs représentations multiples, à savoir ; la sémantique, la temporalité, la géométrique et le graphique. La
305 version de GML qui sera utilisée est la version 3.0 7]. Comme tout schéma d application, notre modèle utilise des classes prédéfinies de GML. Dans notre modèle nous introduisons deux classes d entités qui héritent de la classe AbstractFeatureCollection, illustrées dans la figure 1. La première classe est la collection générique qui inclut toutes les autres entités qu on décrit dans notre modèle ; cette classe a été appelée country. La deuxième classe est la classe geoobject, classe qui correspond dans notre modèle aux représentations des objets géographiques du monde réel. Il est une bonne pratique dans la création de schémas d application en GML de restreindre le type d entités dont les instances peuvent être des membres d une certaine collection d entités. Ainsi, un «filtre d entités» sous forme d une association est introduit entre la classe country et la classe geoobject à l aide de la classe d association countrymember. Fig. 1 : Filtre d entités entre les classes contry et geoobject. De même un filtre d entités est ajouté pour relier les quatre classes ; semantic, graphic, geometry et time, à la classe geoobject par une classe d association qui est la classe geoobjectmember. Cette relation est de type 1:1, ce qui veut dire que toute entité de la classe geoobject est associée à exactement une entité de quatre entités : une à la classe semantic, une à la classe graphic, une à la classe geometry et une à la classe Time. Les classes semantic, graphic, geometry et time représentent respectivement les quatre volets de la multi-représentation à savoir le volet sémantique, le volet graphique, le volet Pour définir toutes les sémantiques attachées à un objet géographique dans le contexte d une application donnée, nous avons introduit la classe category qui hérite de la classe String. La sémantique d un objet géographique est composée de toutes les catégories auxquelles cet objet peut s attacher, d où la relation de composition d une multiplicité de type un (1) à plusieurs (1 *). La partie graphique de la représentation d un objet géographique est composée de tous les symboles qui peuvent être utilisés pour représenter graphiquement l objet sur une carte. D où, l introduction de la relation de composition entre la classe graphic et une classe symbol, dérivée de la classe String, dont la multiplicité est de type un (1) à plusieurs (1 *). Schedae, 2006, prépublication n 46, (fascicule n 2, p. 303-307).
306 Pour la partie géométrique de la représentation d un objet géographique, nous nous sommes fortement inspiré du modèle MADS [8], qui permet de définir des types abstraits spatiaux sous forme d une hiérarchie composée de géométrie simple et de géométrie complexe. D où la relation de composition entre la classe geometry et les deux nouvelles classes simplegeometry et complexgeometry. La géométrie d un objet géographique doit obligatoirement être soit simple soit composée, pour cela nous ajoutons la contrainte «une seule instance d une classe parmi les deux doit être présente». Dans notre modèle nous avons défini les classes pointgeometry, linegeometry et polygeometry pour une géométrie simple et, multipointgeometry, multilinegeometry et multipolygeometry pour une géométrie complexe. Ces classes héritent toutes de la classe AbstractGeometry et référent chacune à la propriété géométrique correspondante, prédéfinie en GML, c est-àdire respectivement gml : PointProperty, gml : LineStringProperty, gml : PolygonProperty, gml : MultiPointProperty, gml : MultiLineStringProperty et gml : MultiPolygonProperty. Pour pouvoir définir l aspect temporel dans notre modèle, nous nous sommes appuyés aussi sur le modèle conceptuel MADS [8], qui offre une hiérarchie de types abstraits temporels assez représentative. Nous introduisons deux classes qui permettent de décrire les caractéristiques temporelles de données géographiques. Ces classes sont : simpletime et complextime. La classe simpletime permet de définir qu un objet géographique peut être représenté dans un instant, classe instant, ou dans un intervalle, classe interval. Les classes instant et interval référent chacune à la propriété temporelle correspondante, prédéfinie en GML, c est-à-dire respectivement gml : TimeInstant et gml : TimePeriod. La partie de temps complexe indique qu un objet géographique peut exister à des instants divers, classe instantset, et/ou à des intervalles divers, classe intervalset. Les classes insant, interval, instantset, et intervalset héritent de la classe AbstractTime. Les classes geometry, semantic, graphic, time, simplegeometry, complexgeometry, simpletime et complextime héritent à leur tour de la classe prédéfinie AbstractFeature. 5 Conclusion Nous avons proposé, dans cet article, une extension du format GML pour prendre en compte la multi-représentation des informations géographiques et ce à quatre niveaux ; géométrique, temporel, sémantique et graphique. Ce modèle permettra ainsi de regrouper dans une même structure les différentes représentations d un même objet géographique. Cette structure ajoutée au format d échange GML permettra à notre intergiciel, proposé dans [9], de jouer pleinement son rôle de médiateur entre les diverses hétérogénéités informationnelles et applicatives, augmentant par là même la capacité des organisations à partager l information géographique. 6 Références [1] S. Spaccapietra, C. Parent, C. Vangenot, GIS Databases : Frome Multiscale to MultiRepresentation, Proceeding of the International Workshop on Emerging technologies for Geo-Based Applications, May 22-25 2000, Ascona, Switzerland, EPFL-DI-LBD Publisher. [2] C. Vangenot, Représentation multi-résolution, Concepts pour la description de bases de données avec multi-représentation, Les nouveaux usages de l information géographique, Actes des Journées Cassini 1998, Revue Internationale de Géomatique, Vol. 8, N 1-2/1998, pp. 121-147. [3] F. T. Fonseca, M.J. Egenhofer, Ontology-Driven Geographic Information Systems, 7th. ACM Symposium on Advances in Geographic information Systems, Kansas City, MO. C. Banzer Medeiros (ed.), pp. 14-19, November 1999. [4] D. Benslimane, E. Leclercq, M. Savonnet, M.N. Terrasse, K. Yétongnon, On the definition of generic multi-layered ontologies for urban applications, International Journal of Computers, Environment and Urban Systems, Volume 24, Elsevier Science Ltd, England, pp. 191-214, 2000.
307 [5] L. Qing, H. Frederick, Lochovski, ADOME : An Advanced Object Modeling Environment, IEEE Transaction on knowledge and data engineering, vol. 10, NO. 2, pp. 255-276, 1998. [6] T. Devogele, C. Parent, S. Spaccapietra, On Spatial data integration, International Journal of Geographic Information Systems, V. 12, N 4, pp. 335-352, 1998. [7] Open GIS Consortium, Inc, Geography Markup Language (GML) Implementation. Specification, version 3.0, 2003. http://www.opengis.org/docs/02-023r4.pdf [8] C. Parent, S. Spaccapietra, E. Zimány, P. Domini, C. Plazanet, C. Vangenot, N. Rognon, P. Crausaz, MADS : un modèle conceptuel spatio-temporelles, Revue Internationale de Geomatique, Vol. 7, N 3-4, 1997. [9] S. Sagar, M. Ben Ahmed, Une plate-forme intergicielle d aide à la décision basée sur l analyse de sources hétérogènes spatio-temporelles, In 7th Conference Internet & Information Systems in the Digital Age (IBIMA), Brescia, ITALY ; 14 16 décembre 2006. Schedae, 2006, prépublication n 46, (fascicule n 2, p. 303-307).
308