Etat de l art des systèmes d information géographique Hervé Brunel 3 avril 2005
Cette étude a été réalisée dans le cadre de l examen probatoire au mémoire d ingénieur, spécialité systèmes d information. Elle sera présentée au jury du CNAM qui se réunira le 12 avril 2005 à 15h30 à Bourges. Ce jury sera présidé par Mme Marie-Christine Costa, CNAM Paris. Il sera composé de : M. Frédéric Kratz, professeur des universités, directeur du CEP de Bourges M. Daniel Devaux, ingénieur, directeur des systèmes d information du Conseil général du Cher, M. Claude Leblanc, ingénieur, responsable local de la filière informatique 2
Résumé La mise en oeuvre des systèmes d information géographique touche tous les domaines d activités. Ces outils intéressaient à l origine les gestionnaires institutionnels, les opérateurs de réseau, les analystes de territoires, ils sont de plus en plus utilisés dans les domaines de la marquétique, des sciences sociales mais aussi de la logistique. La présente étude décrit les concepts propres à ce type de système d information, tant en ce qui concerne la composante textuelle, que celles qui touchent à la localisation et aux relations entre ces deux entités. Un éclairage particulier est apporté à la prise en compte de la notion de connaissance. Sont présentés ensuite les principaux composants d un SIG : référentiels géométriques, représentation graphique, l acquisition et le système de données, ainsi que ses fonctionnalités. Les domaines d application d un SIG sont traités au travers des usages possibles et des types d utilisateurs. Un accent a été apporté sur le degré de maturité des SIG. Un volet de l étude a dressé l état de l art en 2004, en présentant les principaux systèmes du marché, leurs caractéristiques, leur prix et leurs champs d utilisation. Enfin, les axes de développement de ce domaine de l information géographique ont été abordés, ils dessinent certainement les caractéristiques des outils qui seront commercialisés dans les années à venir. L ouverture au public, la mise à disposition des données au public impacteront les caractéristiques des outils en développement. Ces tendances consacrent leur ouverture sur Internet. Une meilleure intégration des systèmes d aide à la décision contribueront très certainement à leur positionnement au coeur du système d information des organisations territoriales. 3
Table des matières Résumé 3 Introduction 6 1 Les concepts 7 1.1 Information géographique et représentation................ 7 1.1.1 Le texte géographique....................... 8 1.1.2 La représentation cartographique.................. 8 1.1.3 La conception cartographique................... 9 1.2 Modèle conceptuel de l information géographique............. 10 1.2.1 Lien entre objets géographiques et localisation.......... 10 1.2.2 Le modèle géométrique....................... 11 1.2.3 La prise en compte de la connaissance dans l information géographique.............................. 11 1.3 Conclusion sur les concepts......................... 11 2 Les principaux composants d un S.I.G. 12 2.1 Les référentiels cartographiques...................... 12 2.1.1 Les référentiels géométriques................... 12 2.1.2 Les référentiels indirects...................... 12 2.2 La représentation graphique........................ 13 2.2.1 Le mode raster ou mode tramé (ou matriciel)........... 13 2.2.2 Le mode vecteur.......................... 14 2.2.3 Relations spatiales entre objets................... 14 2.3 L acquisition des données.......................... 14 2.3.1 Les données existantes de description de territoire......... 15 2.3.2 Les autres modes d acquisition................... 15 2.3.3 Le géoréférencement........................ 16 2.4 Le support logique de l information.................... 16 2.5 Les fonctionnalités d un SIG........................ 17 2.6 L organisation................................ 17 2.7 Conclusions en ce qui concerne les composants.............. 18 3 Les domaines d application des S.I.G. 18 3.1 Les usages possibles d un SIG....................... 18 3.2 Les utilisateurs des SIG........................... 19 3.2.1 Suivi, évaluation et définition de politique............. 19 3.2.2 Gestion opérationnelle....................... 19 3.2.3 La recherche............................ 20 3.3 Les degrés de maturité dans l usage des SIG................ 20 4 L état de l art et les limites actuelles des S.I.G. 21 4.1 Les caractéristiques d un système d information géographique...... 21 4.2 Les principales solutions du marché.................... 22 4.2.1 Arc/ESRI.............................. 22 4
4.2.2 Intergraph.............................. 22 4.2.3 MapInfo............................... 22 4.2.4 MacMap.............................. 23 4.2.5 GéoConcept............................. 23 4.2.6 Star Informatic........................... 23 4.2.7 GeoMap............................... 24 4.2.8 GeoCT, Grass............................ 24 4.2.9 Apic................................. 24 4.2.10 Savane............................... 25 4.3 Conclusions en ce qui concerne les principaux produits inventoriés.... 25 5 Les perspectives de développement 25 5.1 L ouverture sur le monde.......................... 26 5.1.1 L ouverture sur l Internet, et d autres modes de type nomade... 26 5.1.2 L interopérabilité.......................... 26 5.1.3 Le développement des outils d interrogations........... 26 5.2 Une meilleure intégration des outils d aide à la décision.......... 26 5.3 Une prise en compte des données de toute nature............. 27 5.4 Conclusion sur les perspectives de développement............. 27 Conclusions 28 Bibliographie 29 Liste des figures 31 ANNEXES 32 5
Introduction Les systèmes d information géographique tirent leur spécificité des liens qu ils établissent entre informations caractéristiques des composants d un territoire et ce territoire. La définition de chacun des composants, système d information et information géographique contribue à en préciser le contour : - système d information : ensemble de composants inter-reliés qui recueillent de l information, la traitent, la stockent et la diffusent afin de soutenir la prise de décision et le contrôle au sein de l organisation.[wat03] - information géographique : L information est dite géographique lorsqu elle se rapporte à un ou plusieurs lieux de la surface du globe terrestre. Cette information possède la caractéristique d être localisée, repérée ou géocodée[dp96]. Un système d information géographique a donc comme finalité de renseigner sur un territoire en localisant les informations pour aboutir à un processus de décision. Si on attache systématiquement aujourd hui la technologie informatique à la notion de système d information, il est important de mesurer combien cette notion est attachée à l activité humaine et plus précisément aux organisations. L information géographique a, de la même manière, été développée pour asseoir les visées expansionnistes à chaque étape de l histoire des civilisations et particulièrement au cours des épisodes belliqueux....celui qui ne connait pas la topographie des montagnes et des forêts, des passes dangereuses et des marais, ne peut faire avancer ses armées. Celui qui n utilise pas les guides locaux ne peut pas tirer parti du terrain. De ces quatre ou cinq points, celui qui n en connait pas un, ne possédera jamais l armée d un hégémon... Sun-Zi[SZ98] Ce sont bien les liens entre les informations elles-même et leur localisation qui fournissent les éléments nécessaires à la prise de décision. La cartographie a apporté un premier niveau de réponse technologique à ce besoin. Elle a permis de localiser avec une précision de plus en plus grande, la localisation des informations dont le caractère était stratégique. L étude réalisée décrira les concepts mis en oeuvre dans de tels systèmes d information. Elle devra préciser le périmètre recouvert par les S.I.G., ce en quoi il s agit d un système d information, et les singularités de ce type de système d information. Elle s attachera ensuite à dresser l état de l art en 2004 sur ce domaine, en l illustrant par des applicatifs reconnus sur le marché et leurs principales caractéristiques, ainsi que les tendances technologiques. L étude abordera ensuite les perspectives de développement pour les SIG, au regard des attentes que leurs concepts ont générées, qu il s agisse de l évolution des référentiels géographiques, de la prise en compte d autres dimensions comme celle du temps, mais aussi de tendances qui placeraient le SIG au coeur de systèmes d information d organisation territoriale. 6
FIG. 1 L approche multi-domaines 1 Les concepts L histoire des civilisations met en évidence le lien entre les hommes et les territoires 1. Les lieux de vie, espaces de conquêtes, de conflits plus ou moins limités par des frontières, les territoires prennent aujourd hui de nouvelles dimensions et significations. La mondialisation tend à faire disparaître ces frontières, mais nombre d organisations, qu elles soient économiques, administratives, sociales, culturelles s attachent à une dimension régionale. L organisation française en est un exemple : elle n arrive pas encore à réduire son nombre de communes qu elle a inventé de nouveaux découpages : communautés de communes, d agglomérations pays et on réfléchit même à regrouper les régions, sans évoquer la suppression des départements. L abolition des frontières contribue à la reconfiguration des organisations culturelles et sociales. Le territoire est devenu de plus en plus un lieu de projets[doc03] où différents acteurs représentent des communautés d intérêts différents, à l intérieur d un espacetemps pour un but partagé. Quelque soit la configuration de ou des organisations actrices des projets, chacune a besoin de maîtriser les informations attachées à ce territoire pour concevoir les stratégies, en simuler les conséquences et en piloter la mise en oeuvre. 1.1 Information géographique et représentation L information géographique s apparente à la relation entre des données descriptives d un objet et de sa localisation géométrique sur la Terre. Il y a ainsi mise en correspondance de 2 types de données et de deux modes de représentation : le texte géographique chargé de sémantique la carte géographique 1 Territoire : étendue de pays qui ressort à une autorité, une autorité quelconque. Cette définition est interessante, courte, elle consacre bien les liens entre territoire et pouvoir, quelqu il soit. 7
1.1.1 Le texte géographique Le texte géographique a plusieurs dimensions. Il nous fournit des informations typologiques : la nature de l habitat, par exemple, (qui peut être défini à partir de types prédéfinis et de répartition statistique), des informations quantitatives (population, surface d un territoire...), mais aussi d informations qualitatives (descriptions de paysages, d organisations urbaines...). L organisation des informations dans le texte géographique et l utilisation de tous les outils de la langue en cours permettront de définir une grammaire géographique. Il sera alors possible de procéder par le langage écrit à la description d un territoire par la construction d un modèle.... le texte géographique classique est travaillé par un projet d exhaustivité, de clôture de son objet. Tout se passe comme si le discours devait réitérer la contrée, ou, c est l alternative de la géomorphologie régionale, en dévoiler les invisibles fondements.[woo00] L avantage de cette méthode tient dans son approche systémique. Elle est cependant limitée en dimension. Très rapidement le caractère qualitatif rendra difficile l approche quantitative, sauf à rechercher les éléments dans le modèle et donc à en faire une lecture très cartésienne. D autres caractéristiques peuvent influer la perception du modèle. Il y a confrontation de deux fonctions du langage : la composante idéationnelle : à qui est attachée l expression du contenu [MHD01] la composante textuelle est attachée à la construction des textes [MHD01] La construction du modèle représentant le territoire nécessite une organisation du texte reposant sur un modèle d architecture textuelle (cette organisation s applique d ailleurs à tout texte). Le texte géographique montre ainsi ses limites, il est adapté à la description, mais difficilement exploitable pour l explorer et en extraire des informations rapidement. La lisibilité du modèle d architecture textuelle peut nuire à la richesse du modèle et donc à la description du territoire, à ses composants et aux phénomènes qui y sont attachés. Les grammairiens évoquent pour ce type de modèle[woo00], la notion de cohabitation sereine. A contrario lorsqu il y a interdépendance des phénomènes, il sera difficile de disposer d une telle cohabitation. Le texte géographique est malgré tout le meilleur garant de la sémantique de l information dont il est le média. L information géographique tire sa source de l observation du monde réel où l incertitude est omni-présente [Jea04]. 1.1.2 La représentation cartographique La représentation cartographique comme support de la connaissance semble avoir préexisté à l écriture. Ainsi les premières fresques représentaient souvent des scènes de la vie courante et étaient essentielles pour assurer l existence de ses concepteurs. Ces fresques permettaient de fixer des informations à transmettre de génération en génération. Ces informations touchaient à la navigation, mais aussi à la délimitation et au partage de territoires de chasse. Ces scènes étaient représentées sur fonds d itinéraires, de repères géographiques. La première carte daterait de 3000 ans avant Jésus-Christ. L invention de la carte précède celle de l écriture. Les traces de ces deux médias ont été découvertes en Mésopothamie. L évolution des civilisations a vu la cartographie évoluer, la taille des territoires représentés augmenter et la symbolique utilisée se préciser. 8
La civilisation grecque a donné ses bases scientifiques à la cartographie. L évolution de cette technique a été rendue possible par la maîtrise de plus en plus grande des outils mathématiques et géométriques. De Pythagore (au début du Vème siècle avant Jésus- Christ), persuadé de la sphéricité de la Terre, à nos jours, ces progrès n ont pas été linéaires. Ils ont du franchir des obstacles dressés par les religions occidentales, fragilisées par ces découvertes. C est au XVIème siècle qu apparait le premier canevas de projection 2 conçu par Mercator 3. La géodésie 4, véritable science apparue au XVIIème siècle avec les travaux de Snellius, Picard et Cassini [Jod04], a permis de résoudre le problème de dimensions et de celui de la forme de la Terre. Nous reviendrons plus loin dans l étude sur les référentiels géométriques de la Terre. Au delà des problèmes de repérage géométrique, la cartographie est donc un moyen d expression graphique indispensable à la géographie. Elle a rapidement dépassé le simple recueil des éléments nécessaires à la connaissance scientifique de la Terre, pour devenir à la fois instrument d investigation et de contrôle. La cartographie permet sans l apport d information textuelle, d étudier, de vérifier les incidences de la juxtaposition de plusieurs facteurs qui auront été sélectionnés pour leur caractère déterminant sur l évolution d un phénomène. L avantage de la carte sur le texte réside dans la possibilité de représenter en même temps analyse et synthèse. Elle permet l analyse spatio-temporelle des facteurs déterminants de l évolution d un ou de plusieurs phénomènes. Nous avons mesuré, dans la section précédente, la difficulté de confrontations aux fins d analyse, de facteurs dont les portées se recoupent. 1.1.3 La conception cartographique L élaboration d une carte est avant tout un acte de conceptualisation ou se mèlent des niveaux de précision et d abstraction très différents : précision de la carte topographique : son niveau de détail est adapté à l échelle de représentation. Cette adaptation pose le problème de la pertinence des modes d agglomération de données de type identique lors du changement d échelle. La carte topographique sert de référentiel géométrique aux autres données. classification et simplification des objets et des phénomènes représentés. Là aussi les choix nécessaires à l agglomération de données identiques ou à la sélection de données pertinentes lors d un changement d échelle sont fondamentaux. Il en va de la lisibilité de la carte et de son adaptation à la problématique pour laquelle elle est conçue. l expression graphique met en oeuvre une palette de couleurs, de formes. Elle ne doit pas répondre à un souci d esthétisme, mais au souci de compréhension de la carte. La complexité des choix est croissante avec la nécessité de représenter des phénomènes précis, mais aussi des données qualitatives, imprécises lorsqu il s agit de tendances. 2 Représentation plane de la Terre, la surface de projection est un cylindre tangent à l équateur terrestre. Ce mode de représentation est limité aux environs de l équateur. Au delà des lattitudes supérieures à 60, l échelle déforme de matière importante les représentations 3 Mathématicien et géographe flamand du XVIème siècle 4 Science de la forme et des dimensions de la terre[duf01] 9
1.2 Modèle conceptuel de l information géographique La réalité physique de l information géographique est décrite par un volet géométrique et un volet sémantique. Cette information, nous l avons constaté dans la section précédente, repose sur deux dimensions : l une sémantique, l autre géométrique. La modélisation de ce type d informations nécessite de déterminer au préalable un ensemble d hypothèses simplificatrices qui permettront de décrire l univers du territoire. Ces hypothèses toucheront tous les objets de cet univers. La cartographie sera elle aussi impactée. L évolution de la géographie et de la cartographie dépendent des avancées technologiques. L introduction des technologies de l information a conduit à une nouvelle science : la géomatique. Celle-ci est définie comme l ensemble des techniques de traitement informatique des données géographiques et dont le but premier est l automatisation de la cartographie 5. La difficulté réside dans la quantité de plus en plus grande d informations dont il est possible de disposer et de la complexité non moins importante des interactions des phénomènes. Le développement des relations de toute nature, et surtout économiques, en rend son fonctionnement global de plus en plus systémique. L évolution technologique ne limite plus les possibilités de traitement. La difficulté est ailleurs, elle réside beaucoup plus dans la construction du modèle. Ce dernier doit prendre en compte la nécessité de confronter des points de vue de plus en plus nombreux sur la base d informations, elles aussi en nombre croissant. 1.2.1 Lien entre objets géographiques et localisation Le lien entre objet et localisation devient plus important, la localisation intervient de façon essentielle dans la définition et l interprétation d un objet. Exemple : l objet route n a pas de sens en lui-même, s il ne supporte aucun trafic. Son importance et le rapport entre ses caractéristiques et son environnement ou avec l importance des pôles qu il relie, définiront son adéquation à la fonction attendue. Objet n * attribut 1 * attribut 2 * attribut 3 - - * méthode 1 * méthode 2 - - Objet m * attribut 1 * attribut 2 * attribut 3 - - * méthode 1 * méthode 2 - FIG. 2 Relations entre objets et territoires Un objet géographique spécifique peut être lui-même le produit d autres objets géographiques. On comprend aussi qu un territoire est un objet complexe composé des objets géographiques qui y sont implantés, des relations qu ils entretiennent entre eux et avec des objets implantés sur d autres territoires. La modélisation de la réalité géographique est complexe, elle doit permettre l approche globale mais aussi des relations quasiment 5 Journal Officiel du 14 février 1994 10
illimitées entre objets. Il est cependant nécessaire d exprimer la réalité géographique sous forme d une schématisation d où on peut extraire les données qui en dépendent. La relation entre objet et localisation est résolue simplement lorsque l on considère que cette dernière est un attribut de l objet. Cet attribut a une fonction particulière car il influe le comportement de l objet (il y a une dépendance fonctionnelle entre l espace et le temps avec le comportement de l objet). Cette constatation modifie la définition de l objet géographique : ainsi un objet géographique a la particularité d associer une localisation géographique et quelques fois temporelle à l ensemble des attributs qui constituent la description non localisée de ces objets. L attribut donnant la localisation est appelé attribut de localisation, pour le distinguer des autres attributs qui constituent l information descriptive [Sou] Il restera à définir le système de référence absolu ou relatif, c est l objet de la phase suivante. Elle est liée à l usage du SIG et à la technologie employée. 1.2.2 Le modèle géométrique C est une représentation graphique qui doit rendre compte de la position et de la forme des objets géométriques ainsi que des relations spatiales entre ces objets. Le système de coordonnées sera alors à adapter au type de forme. 1.2.3 La prise en compte de la connaissance dans l information géographique L évolution de l entropie du système terre, conduit la géographie à s intéresser aussi à la connaissance pour établir un lien entre concepts du monde réel et modèles théoriques. La modélisation de la connaissance fait l objet de méthodes d analyse et de conceptualisation spécifiques. 6. Ces méthodes s intéressent à l exploration, à la découverte du système de connaissances sur plusieurs échelles simultanément. Le caractère multidimensionnel des connaissances nécessite ce type d approche, pour les étudier sans les réduire ni les mutiler. L introduction de la connaissance en tant que telle dans un système d information géographique n a de sens que si elle facilite la compréhension des phénomènes et des relations entre objets. Elle renforce la sémantique des objets. Un système d information géographique est pour moi un système de gestion de connaissances à part entière, il se contruit comme une ontologie. Cette construction ou ontologisation consiste en la construction de concepts hiérarchisées et de leurs relations et aussi pour chacun d eux de la définition d attributs.[mai04] 1.3 Conclusion sur les concepts Cette première partie de l étude nous a permis de mesurer la dualité de l information géographique sous forme textuelle et de sa localisation. La qualité des analyses qui seront menées par la suite, et elles sont la finalité su SIG, dépendra en partie de la profondeur de la sémantique des informations prises en compte. La cartographie apportera une dimension supérieure à la représentation des données extraites contribuant à l illustration de la problématique analysée. Là aussi, les choix d informations graphiques seront déterminants pour l illustration des résultats. 6 MKSM : Methodology for knowledge system management, cette méthode a été conçue par Jean-Louis Ermine au CEA, 11
La construction du SIG nécessite la détermination d un modèle des données. Cette première étape d abstraction passera par l inventaire des données, la détermination des typologies, des relations, des dépendances de ces objets entre eux, des informations qui seront attributs d objet ainsi que des formes géométriques associées le cas échéant. Cette démarche s apparente à une démarche conceptuelle classique. Dernier aspect remarquable : un système d information géographique est un système de connaissances. Les premières étapes de sa construction peuvent s appuyer pour partie sur les méthodes de construction, en particulier, en ce qui concerne la construction des ontologies. 2 Les principaux composants d un S.I.G. Les concepts définis, nous nous attacherons à décrire les principaux composants d un SIG, au travers de leurs aspects logique et organisationnel. 2.1 Les référentiels cartographiques Tout support d information géographique doit, pour être exploitable, préciser le référentiel géographique auxquels seront rattachés les informations. Plusieurs types existent, l un est direct, il a un caractère géométrique et l autre est indirect, il se réfère à un ou plusieurs autres référentiels, il s agit en particulier de référentiel administratif. 2.1.1 Les référentiels géométriques Nous l avons évoqué précédemment au 1.1.2, la géodésie a permis de décrire la forme, les dimensions de la Terre et au final une surface mathématique de référence : l ellipsoïde de référence 7. Ainsi les coordonnées d un point de la surface terrestre y sont définies par la longitude 8, la lattitude 9 et l altitude par rapport à un niveau 0, niveau moyen des océans 10. Les référentiels géodésiques ont ainsi évolué au fil du temps. Les représentations géographiques doivent donc préciser le référentiel utilisé. Ce référentiel est lui même défini par le référentiel géodésique, l ellipsoïde et la projection cartographique utilisés ainsi que le type correspondant de coordonnées. En France, le référentiel géographique est le RGF93 (Réseau géodésique français) depuis l année 2000[God04]. 2.1.2 Les référentiels indirects Ce type de référence fait appel à une description sous forme de texte de la localisation. Les positions relatives des objets ne sont pas explicites. Il est nécessaire pour exploiter ce type de référence de disposer d un dispositif intermédiare donnant la correspondance entre ce système textuel et un référentiel géographique. Le cadastre est un exemple illustrant ce concept : les parcelles sont repérées sur les actes adminstratifs, ou sur la matrice cadastrale avec un numéro de parcelle, une section cadastrale, d autres attributs dont 7 ellipsoïde de révolution ou sphère aplatie aux pôles 8 angle orienté formé par le plan vertical passant par le point et le centre de la Terre, et le plan vertical défini comme base et passant par Greenwich. 9 angle orienté formé par le plan méridien du point, entre l équateur et la normale à l ellipsoïde en ce point 10 géoïde ou surface de niveau du potentiel de la pesanteur passant par le zéro du nivellement 12
FIG. 3 Référentiel géodésique et projection cartographique le nom de propriétaire, la surface... Le plan cadatral permet de localiser la parcelle à partir de son numéro et de sa section. Le cadatre est actuellement en cours de numérisation par les service fiscaux. A l échéance de cette opération, les parcelles seront directement localisables. Des dispositifs assurent le lien entre référentiels indirects et localisation : à titre d exemple la base de données Géoroute 11 de l IGN permet de localiser les voies de circulation avec les numéros d îlot de chaque côté de la voie. Cette application développée par l IGN est destinée à alimenter des systèmes de guidage embarqué. 2.2 La représentation graphique La géographie fait appel, au travers de la cartographie, aux vertus représentatives de l image. Qu il s agisse du fond topographique ou des objets que le SIG représente, cette dimension graphique est l axe essentiel pour l utilisateur. Deux modes techniques permettent de mettre en oeuvre cette représentation : le mode raster et le mode vecteur. Il est possible de passer d un mode à l autre : on parle alors de vectorisation ou de rasterisation. Ce pont possible entre les deux modes facilitent entre autres l acquisition de données : une carte numérisée peut être ensuite vectorisée avec identification des formes qu elle contient. 2.2.1 Le mode raster ou mode tramé (ou matriciel) La surface de l objet est composée par des points jointifs ou pixels. De leur résolution dépend la finesse de la représentation. La position est définie par rapport à la maille de la matrice nécessitant de repasser par un deuxième système de référence pour localiser en absolu le pixel. Ce mode de représentation est le plus proche de l informatique. Chaque pixel porte une information identifiant sa couleur et l entité à laquelle il est rattaché. Ainsi une ligne ou une surface sont elles-mêmes définies par l ensemble des pixels contigus dont la valeur de rattachement est identique. Plusieurs couches d information composées de pixels peuvent être superposées représentant chacune un thème particulier. A ce stade, la description des objets est implicite. Un lien peut être établi entre le fichier raster et une 11 http ://intercarto.com/imgs/fr/ign/pdf/georoute descriptif technique.pdf 13
table de données, il permet la description explicite des pixels, mais aussi le traitement des informations du fichier graphique. La relation spatiale entre les objets est implicite. 2.2.2 Le mode vecteur L image est décrite par un ensemble d objets : les SIG retiennent trois primitives de base qui permettent de recomposer la géométrie des objets, il s agit de : 1. des objets ponctuels 2. des objets linéaires 3. des objets surfaciques Objet ponctuel Objet linéaire Objet surfacique FIG. 4 Les objets de base en mode vecteur Un objet ponctuel sera localisé par un seul triplet de coordonnées. 12. Un objet linéaire est une suite ordonnée de points. Chaque point est relié au suivant par un segment de ligne définie mathématiquement. Un objet surfacique est défini comme étant l intérieur de son contour. Il est donc délimité par un objet linéaire fermé sur lui-même. On peut par extension définir des spécialisations d objet surfacique. Par exemple un objet surfacique à trou est défini comme un objet surfacique dont une partie intérieure est délimitée par un objet linéaire fermé. Un objet volumique est un objet composé d objets surfaciques. La description des objets est explicite. Une couche d informations regroupe un ensemble d objets qu on souhaite représenter simultanément. La position des objets est exprimée par des coordonnées attachées à un système de positionnement. 2.2.3 Relations spatiales entre objets Les relations spatiales entre objets sont, soit de type booléen (intersection, inclusion, adjacence par exemple), soit de type flou lorsque les critères de la relation doivent être précisés (par exemple, la notion de proximité). Dans ces deux cas les relations peuvent être soit explicites (recalculées à chaque usage) ou implicites (calculées une fois et stockées). Les deux modes de relations spatiales sont utilisées entre les objets. Bien que, par nature, la description des formes issues du mode raster soit implicite, il est possible de rendre leurs relations explicites. C est la théorie des graphes qui fournit les outils nécessaires à cette transformation. 2.3 L acquisition des données La construction d un SIG est basée sur un ensemble de données cartographiques, et textuelles dont une partie importante est fournie par des organismes spécialisés. Les don- 12 on peut même imaginer réduire à deux les coordonnées, si l objet est attaché au sol support ; dans ce cas c est le référentiel du sol qui fournira l atitude 14
nées plus spécifiques feront ensuite l objet d acquisition par différents moyens en fonction de leur échelle et de leurs quantités. 2.3.1 Les données existantes de description de territoire Nous limiterons notre présentation, qui n a de valeur que d illustration et non d inventaire, à la situation française. Ainsi l Institut Géographique National (IGN) fournit la majorité des données nécessaires : La base de données cartographiques : BDCARTO. C est la couverture cartographique à l échelle 1/50 000ème. Elle contient des données de niveau sémantique qui décrivent les infrastructures de transport, les caractéristiques géographiques et administratives du territoire français. Prix 99 000 euros pour la France entière.[ign01] La base de données topographiques : BDTOPO. C est la description topographique du territoire français avec une précision métrique. Le relief est décrit sous forme de modèle numérique de terrain. Prix 1 900 000 euros pour la France entière, 9 euros / km2 hors urbain, 18 euros / km2 en zone urbaine à l échelle d un département.[ign02] La base de données altimétriques : BDALTI. C est la couverture en courbes de niveau du territoire français. Cette base de données est la base de la BDTOPO. Prix 80 000 euros pour la France entière. [IGN98] La base de données routières : GEOROUTE. C est la couverture du routier français en milieu urbain et interurbain, avec une précision de l ordre 5 à 10 m en zone urbaine et de 10 à 40 m en zone interurbaine. Prix de la couverture de la France entière au 01/01/2005 : 40 000 euros.[ign99] D autres organismes fournissent aussi des données qui font référence dans des domaines plus spécifiques. A ce titre on peut citer CORINE Land Cover, qui a pour objet de fournir une information géographique homogène sur l occupation du sol des pays de l Union Européenne 13, le fichier de recensement de l INSEE qui permet d identifier la répartition des populations en précisant la composition socio-professionelle, le fichier FAN- TOIR 14 est réalisé, par la Direction générale des impôts, à partir des toponymes des voies, lieux-dits, ensembles immobiliers et pseudo-voies transmis par les collectivités locales, les fichiers de l INSEE qui permettent de localiser les données économiques et socioprofessionnelles, les données de l environnement gérées par les services déconcentrés du ministère de l écologie et de l environnement durable (fichiers NATURA 2000 15, ZICO 16, ZNIEFF 17,RAMSAR 18. L ensemble de ces données permettent de construire le cadre de références et d informations de base d un SIG. Les autres données nécessaires peuvent faire l objet d autres modes d acquisition 2.3.2 Les autres modes d acquisition La démarche conceptuel permettra de définir les classes d objet nécessaires au SIG ainsi que leurs attributs. En dehors des sources de données citées précédemment, il sera 13 http ://www.ifen.fr/donindic/donnees/corine/3clature.htm 14 Fichier annuaire topographique initialisé réduit 15 recensement des zones d habitat naturel protégées 16 Zone importantes pour la conservation des oiseaux 17 Zone naturelle d intérêt faunistique et floristique 18 Ramsar du nom de la ville d Iran où a été signée la convention de protection des zones humides utilisées comme habitat par les oiseaux le 2 février 1971 15
nécessaire de procéder à l acquisition directe des informations définies par la conceptualisation. Deux méthodes sont encore possibles : s il s agit de données à grande échelle, il pourra être fait recours aux fournisseurs de données par télédetection, par la numérisation ou par vectorisation : la télédétection spatiale. Le développement et la maîtrise des satellites d observation de la Terre depuis plus de 30 ans a permis de fournir les données précises en matière géographique. Ces inforamtions sont essentiellement de deux types : des images et des données de géolocalisation, grace en autre à l avènement du GPS 19. L échelle d observation est mondiale et le rafraichissement des données peut être constant. Ainsi des sociétés comme Spot-Image 20, Landsat 21 se sont spécialisées dans la fourniture de ces informations. Le niveau de résolution peut être très élevé, inférieur au mètre, elles permettent aussi l extraction d informations détaillées dans les domaines de la défense, de la surveillance, du géo-marketing, de la planification urbaine, de l étude des grandes infrastructures... Ces données sont fournies sous des formats directement importables dans les SIG. La numérisation des informations. Elle est souvent réalisée à partir d un dispositif de numérisation (table à numériser). Outre la saisie des inforamtions définissant les formes géométriques et géographiques par leurs coordonnées, il est nécessaire de saisir le contenu de l information sémantique (attributs et relations). Ces informations sont, dans ce cas, saisies en mode vecteur. Il est possible de procéder par scannage, les fichiers résultats sont alors vectorisés pour en extraire les informations isolées (voir Relations spatiales entre objets). 2.3.3 Le géoréférencement Les données produites par la télédétection et la saisie directe doivent être modifiées pour correspondre parfaitement au modèle et au référentiel géodésique. A cet effet, le SIG possède des fonctions de déformation qui permettent, à partir du recalage d une partie des informations sur des points d appui, de recaler l ensemble de l image. Le géoréférencement se décompose en une déformation de l image et un rééchantillonage de celle-ci.[oli98] 2.4 Le support logique de l information Nous avons pu constater qu au delà de leur représentation graphique, les données géographiques étaient porteuses d attributs et de relations. Nous avons pu mesurer également combien les informations géographiques se comportaient comme des objets (au sens informatique du terme), avec des types différents et des méthodes (modes de représentation pour un point, un objet différent, un objet linéaire, un objet surfacique). Les notions d encapsulation, d héritage y sont présentes. Ces caractéristiques conduisent à imaginer que le SGBD est le support d information adapté et qu au regard des particularités ci-dessus énoncées, un SGBD orienté objets présenterait des fonctionnalités pertinentes. Ce dernier n assure pas les contraintes d intégrité comme le fait un SGBD relationnel, à contrario il permet une modélisation plus complexe. Son langage de requête ne présente pas non plus 19 Global positionning system 20 http ://www.spotimage.fr/html/ 21 http ://www.landsat.com/landsat.html 16
les mêmes performances que SQL [etb97] Une alternative réside dans l extension du modèle relationnel pour qu il puisse intégrer des types propres à la géolocalisation, et donc des attributs qui prennent leurs valeurs dans un espace de dimension 2 à 3. Cette extension du modèle peut être réalisée artificiellement, en utilisant trois attributs dont la concaténation définira une clé de localisation. Plusieurs éditeurs de SGBD ont modifié leur produit pour y intégrer cette particularité. C est le cas d IBM avec DB2 Spatial [IBM02] Extender 22, Oracle Spatial et Oracle Locator 23. SQL a officiellement intégré cette évolution avec une version spécifique : SQL/MM qui introduit de nouveaux types abstraits de données : géométriques, topologiques, métadonnées.[eis02] 2.5 Les fonctionnalités d un SIG On peut rapidement décrire les fonctions attendues d un SIG, la littérature dans le domaine évoque les 5 A d un SIG. 1. Abstraire : Le module d abstraction regroupe les outils de définition des données. A ce titre des fonctionnalités de conception du schéma conceptuel des données peuvent y être intégrées. D autres fonctions permettent de construire les dictionnaires de données et de contraintes à partir du SCD. 2. Acquérir : Ce module intègre deux types d outils, les fonctions d importation de données, et les fonctions de numérisation. Ces fonctions sont complétées par des outils de géoréférencement, et de contrôle sémantique. 3. Archiver : Ce module s appuie sur le support de stockage d informations évoqué au paragraphe précédent, pour les données sémantiques voir pour les données graphiques, l utilisation d un logiciel de CAO/DAO et une alternative possible pour gérer ces dernières données. Les fonctions d interrogation sont traitées par un langage assertionnel qui transforment les termes de la requête de l utilisateur en élément d algèbre relationnel. 4. Analyser : Ce module contient les fonctions qui différencient les SIG entre eux. A ce titre on peut remarquer les fonctions de manipulation de données qui ne génèrent pas de nouvelles connaissances, les fonctions d analyse, ce sont celles qui évoluent le plus vers des outils d aide à la décision, et dernier domaine de développement qui sera traité dans un des paragraphes suivants, la notion de généralisation. 5. Afficher : ce module intègre tous les outils de restitution des traitements, leur finalité tient dans la matérialisation physique des phénomènes spatiaux, et de leur interaction avec les données sémantiques, un mode hypertexte peut être retenu. 2.6 L organisation Comme tout système d information, la mise en place, la gestion, l exploitation d un SIG nécessite une démarche de projet et des moyens à mettre en oeuvre. A chaque étape, 22 Cette solution a appliqué l extension des types à ceux des primitives géométriques des SIG, il permet aussi facilement l intégration de données à priori non-sig dans un SIG, cet outil semble utiliser à cet effet l artifice des trigers 23 http ://www.oracle.com/technology/products/spatial/pdf/10g spatial locator twp.pdf. Ce produit intègre les types correspondants aux trois primitives géométriques des SIG, la notion d index spatiaux et d opérateurs spatiaux dans une version spécifique de SQL 17
une organisation spécifique sera mise en oeuvre : pilotage, étude, groupes de travail mais aussi formation et évaluation composeront les clés de cette mise en oeuvre. Cette démarche prend içi une dimension particulière au regard de la multiplicité des types de données qu un SIG peut accueillir. 2.7 Conclusions en ce qui concerne les composants L ensemble des composants que nous avons présentés dans cette partie met en évidence la mécanique d un SIG tant dans sa dimension purement technique que dans son approche logique. La complexité et, la richesse des informations à gérer doivent être prises en compte dès les étapes de conception du modèle. 3 Les domaines d application des S.I.G. Les deux sections précédentes nous ont permis d appréhender les concepts et les éléments composants un SIG. Ainsi nous avons pu mesurer comment l information géographique pouvait être modélisée avec la description d un territoire par des entités, l importance de leur localisation et de leurs relations. L utilisation d un SIG sera donc à priori pertinente pour tous les domaines dans lesquels des entités, objets, informations localisables sur un territoire, permettent par leur connaissance d aboutir à des processus de décision. Un premier essai de typologie pourraît être bâti sur le degré d utilisation, entre outil de connaissance et outil d aide à la décision. 3.1 Les usages possibles d un SIG Un système d information géographique s intéresse aux relations possibles entre entités et territoires. Une entité est assimilable à un objet. Elle sera donc décrite et localisée par des attributs, et des relations avec d autres entités. On pourra s intéresser : FIG. 5 Trois utilisations possibles La gestion d un objet en particulier. Ce premier usage permet une forme d accès à l objet soit par le système d information classique, soit par l interface graphique. C est un premier usage possible du SIG, il offre une alternative au système de requête classique. Il offre de plus la représentation cartographique des résultats des requêtes. 18
L évaluation. Ce mode d utilisation regroupera les fonctions de recensement, qu il s agisse d un objet spécifique, d un ensemble d objets appartenant à une classe d objets localisés sur un territoire donné. La recherche. Dans ce mode d utilisation, ce sont les fonctions, d exploration qui permettront de découvrir des relations entre données seules ou entre données et localisation qui seront mises en oeuvre, mais aussi des fonctions de simulation (avec prise en compte d interaction entre les objets). Ces 3 modes d utilisation ne sont pas exclusifs l un de l autre. On peut facilement imaginer qu il y ait progressivité qui conduise au passage d un mode à l autre. Les utilisations de SIG pourront être liées à la gestion d objet, au simple recensement, à la recherche de relations entre objets, à la recherche de tendances et aussi d évolutions dans le temps. Ces usages peuvent être directement liés à l activité et aux finalités de l organisation qui l utilisera, mais d une certaine manière à la maturité du système d information. 3.2 Les utilisateurs des SIG L approche par les modes d utilisation apportent un premier éclairage quant aux possibilités fonctionnelles d un SIG. Une typologie des utilisateurs précise le périmètre et illustre les cas d utilisation possibles. 3.2.1 Suivi, évaluation et définition de politique. Il s agit plus particulièrement d ontologie spatiale destinée à mesurer l intensité et comprendre la nature de phénomènes. A ce titre on trouve toutes les applications dans le domaine de l urbanisme, de la politique du logement, mais aussi de l environnement... De nouveaux débouchés apparaissent dans ce domaine, ils caractérisent aussi une évolution possible des SIG. Les agglomérations importantes (de plus de 100 000 habitants) doivent avoir réalisées une cartographie des zones de bruit. La directive européenne 24 qui a institué cette obligation précise aussi que la définition de plans de lutte contre le bruit doit être terminée avant 2012 (2007 pour les agglomérations de plus de 250 000 habitants). Le SIG devient, pour les agglomérations qui ont décidé de l utiliser comme support d information, outil de dialogue. En effet le nombre d interlocuteurs est de plus en plus important au fur et à mesure de la démarche. La prise en compte d informations de natures différentes, la capacité de synthèse de ce type de système d information et les possibilités de représentation ont convaincu de nombreux élus de son intérêt[les05]. Ce type d utilisation des SIG, est celui des grandes administrations de l Etat, mais aussi celui des collectivités locales. 3.2.2 Gestion opérationnelle. Il s agit d une utilisation plus classique d un système d information, le SIG y apporte la localisation des objets, qu ils soient statiques ou dynamiques. Les gestionnaires 24 2002/49/CE 19
de territoire, tels les DIREN 25, les DDAF 26, les DRIRE 27 y trouvent un support pour la gestion des risques (inondations, zones instables, avalanches, SEVEZO...), mais aussi de périmètres protégés (zone d intérêt écologique, zone de captage, zone littorale...) ou des secteurs d application de réglement particulier (Zone PAC, ). Les gestionnaires de réseau utilisent le SIG pour suivre l évolution des caractéristiques dans le temps d objets souvent linéaires, qu il s agisse d opérations de maintenance, d entretien ou de modernisation, mais ausi pour mesurer l interaction avec les composantes de l environnement du réseau (gestionnaire de réseaux d eau potable, électrique, télécommunication mais aussi viaire). Les gestionnaires d autoroutes et les centre régionaux d information routière utilisent des SIG pour prendre en compte en temps réel les volumes et caractéristiques du trafic afin de décider de mesures de délestage, d intervention. L alimentation en temps réel du SIG s opère par des dispositifs de mesure de trafic et de vitesse implantés dans la chaussée, des analyseurs de mouvement et de détection d incidents implantés tout au long des voies importantes (ces dispositifs mettent en oeuvre des outils différents et complémentaires : ANITA : analyse d itinéraires alternatifs, bases de données évènementielles...) La logisitique y trouve de plus en plus un outil qui facilite la prise de décision. Le suivi des moyens de transport (camions, trains, bateaux) couplé avec le développement des puces RFID 28, permet un traçage précis des marchandises mais aussi une optimisation des transports en fonction des données de trafic. 3.2.3 La recherche C est certainement un nouveau secteur de développement pour les SIG. Il utilise les possibilités de recherche de relations à priori non identifiées entre objets. C est le domaine de la mercatique, et des sciences sociales en général. Ce sont les fonctions qui permettent de découvrir des relations entre objets et donc des phénomènes qui seront alors utilisées. Ces fonctions s appuyent sur les opérateurs topologiques qui caractérisent les intersections élémentaires entre deux objets d un plan ou d un espace [djm]. Une subtilité est employée pour identifier des objets voisins qui échappent aux intersections évidentes, il s agit de la notion de seuil, une frontière plus ou moins large qui entoure l enveloppe extérieure de l objet. On étudie alors sur la base de cette quasi enveloppe, les nouvelles valeurs d intersections, il est alors possible d étudier des zones plus floues de voisinage[gir04]. 3.3 Les degrés de maturité dans l usage des SIG Dans les domaines couvrant les trois modes définis précédemment, le niveau d utilisation peut être très variable. Il est conditionné par les ambitions qui ont conduit à la mise en place du SIG. En effet si l utilisation des données aux fins de missions opérationnelles apparait comme assez simple, elle nécessite la mise en place d une démarche classique de projet informatique, en particulier en ce qui concerne la construction du modèle de 25 Direction tégionale de l environnement 26 Direction départementale de l agriculture et de la forêt 27 Direction régionale de l industrie de la recherche et de l environnement 28 Radio frequency identification data 20
données, mais aussi des traitements et de l organisation à mettre en oeuvre. La qualité du pilotage sera d autant plus garante de la réussite du projet que les interlocuteurs seront nombreux et d horizons différents. Si les SIG peuvent être utilisés comme support de concertation dans les domaines de l urbanisme, de l aménagement par exemple, les décideurs seront enclin à s appuyer sur les données issues des synthèses et des restitutions pour argumenter leur décision[emm04]. Dans cet exemple choisi, c est la maturité de ces technologies et de leur emploi qui permet, après l utilisation des fonctions d analyse spatiale, de mettre en oeuvre des processus de décision. On est bien au delà des simples finalités de gestion. La valeur du SIG reposera sur la pertinence des informations d autant plus que la durée de vie des objets est limitée dans le temps. Cet aspect pose le problème de l identification précise des fournisseurs de données au stade de l analyse préalable à la mise en oeuvre du SIG. L utilisation des données dans des modes plus avancés du SIG, qu il s agisse de ses fonctions d évaluation ou de recherche, voir de simulation, nécessitent en préalable que les interlocuteurs construisent ensemble le système d information attaché à la problématique à traiter. Ce mode d utilisation nécessite, de plus, qu il existe une vraie cohérence entre les différentes couches d information. L approche de conceptualisation si elle reste classique, y prend une intensité supérieure : lors de l étude préalable à la mise en oeuvre du SIG, la détermination du périmètre pertinent qui conduira à la maîtrise de l univers du discours sera complété par l analyse du discours [Lef04]. Cette dernière consiste en l identification du besoin par une analyse sémantique par la mise en évidence des relations sémantiques entre les acteurs et les données géographiques. Il est nécessaire de définir un référentiel culturel commun. 4 L état de l art et les limites actuelles des S.I.G. Le marché de l édition informatique propose de nombreux outils qui permettent de mettre en oeuvre un système d information géographique. Nous avons, dans cette partie de l étude, dressé un tour d horizon de ces produits. Nous nous sommes tout d abord attachés à définir les caractéristiques communes de ces produits. 4.1 Les caractéristiques d un système d information géographique Nous avons abordé précédemment quels étaient les composants d un SIG. Cette approche s était attachée au niveau logique. Il s agira içi de s attacher aux caractéristiques physiques. 1. Le module d acquisition de données. Il permet d intégrer dans le SIG les images et les données. A cet effet, il dispose de fonctions d importation d images, de géoréférencement, de construction de classe d objets et d objets. Ce module sera complété de fonctions d importation de données. La capacité à lire des formats différents caractérisera le logiciel. 2. Le module traitement de l information : on y trouvera toutes les fonctions d analyse spatiale. Elles doivent permettre d identifier la distribution spatiale d un phé- 21
nomène, de la comparer à des formes de référence dont les lois de répartition sont connues, mais aussi de mesurer l homogénéité spatiale (détermination d ensembles homogènes à partir de la corrélation d attributs et de la notion de voisinage), mise en évidence et analyse des relations entre les variations de la localisation et variations d un ou de plusieurs attributs descriptifs. 3. Le module restitution : ce module contiendra les fonctions de représentation des données et en particulier celles qui permettent de cartographier les données. mise en forme, édition,cartographie... Ils se différencieront par la possibilité de représenter en 3D les cartes, l export de données géoréférencées avec le format utilisé qui conditionnera la réutilisation possible du document, la richesse des possibilités d associer des symboles, des formes, des couleurs avec des objets et de leurs relations. 4.2 Les principales solutions du marché 4.2.1 Arc/ESRI La société ESRI est un des éditeurs incontournables du marchés des SIG. Elle propose plusieurs architectures différentes. Un ensemble d outils qu y s apparentent à des progiciels, ils assurent toutes les fonctions que nous avons abordées ci-avant : ArcGis Desktop. Des bibliothèques qui permettent de construire des applications SIG spécifiques : ArcGis Engine Des serveurs permettant de construire un SIG centralisé : ArcGis Server. Les produits Arc/ESRI permettent d utiliser les bases de données Oracle, Oracle Locator ou Spatial, DB2, Informix, MS SQL Server et aussi MS Access, ils supportent SQL/MM et permettent d exporter des géodatabases au format XML. Les licences simple utilisateur sont vendues entre 1500 et 20 000 euros selon les fonctionnalités. 4.2.2 Intergraph Cet éditeur détient la plus grosse part du marché des SIG. Il a aussi segmenté son offre en proposant des solutions de natures différentes : Une solution de librairies qui permet de construire des SIG spécifiques : Geomedia Objects Une solution dédiée à la logistique avec gestion des communications : I/CAD Une solution d outil individuel de SIG disposant d un client universel de données SIG : Geomedia 4.2.3 MapInfo C est un éditeur qui offre qui propose une solution orientée micro-ordinateur et plutôt mono-poste. Son produit de référence MapInfo-Professionnal est complété par une offre de modules spécialisés : ChronoMap permet de déterminer les zones d achalandises, les calculs d éloignement. ChronoVia permet le calcul d itinéraires, l optimisation de tournées. 22
Vertical Mapper permet l analyse 3D, la construction de modèle numérique de terrain, la détermination de la répartition des richesses sur une agglomération, l optimisation de l implantation des relais de transmission. Géocodeur Universel permet le géocodage de gros volumes d adresses Le prix public d une licence mono-utilisateur s élève à 3250 euros. 4.2.4 MacMap Cet éditeur présente une alternative aux outils puissants et coûteux énumérés ci-avant. MacMap fonctionne sous l environnement Mac O.S.. Il offre des fonctions d interrogation, de géocodage, de représentation et de lecture de fichiers externes. Il est qualifié de mini-sig. Le prix public d une licence mono-utilisateur s élève à environ 3500 euros en version limitée en nombre d objets manipulés, ou à 5000 euros sans limite de capacité. 4.2.5 GéoConcept Cet éditeur a développé un concept conforme à ses concurrents. Sa particularité tient à la fois dans un ensemble d outils classiques d un SIG et d un coeur applicatif ouvert sur des développements. Il dispose lui-même de modules complémentaires : Virtual Géo permet la représentation 3D en temps réel des données du SIG. Publisher for Geoconcept offre des fonctionnalités complémentaires d édition cartographique. Ce module génère des fichiers swf et XML permettant d intégrer les données dans d autres applications (Web en particulier). De plus une version serveur a été développée. GeoConcept Enterprise Solution permet de centraliser les données et est compatible avec les SGBD Oracle, MS SQL Server, Sybase, DB2. Une version tournée vers l Internet a été conçue avec GeoConcept Internet Server. L ensemble des produits s intègre totalement avec les produits Microsoft. L éditeur commercialise aussi des solutions orientées métier avec des applications tournés vers la logistique, la défense, la gestion des territoires. 4.2.6 Star Informatic C est là un des autres leaders dans le domaine des systèmes d information géographique. Cet éditeur, comme ces concurrents directs, a choisi de proposer plusieurs solutions adaptées à des besoins différents. Un ensemble de fonctionnalités sont communes à tous les produits. Star Gis. C est la version bureautique de l éditeur. C est outil est très orienté vers la plateforme et les produits Microsoft. Win Star. C est la version SIG professionnel de l éditeur. Il offre des fonctions d interrogation très devéloppées. Comme pour ses concurrents, Star a ouvert le coeur de son applicatif professionnel en livrant les API permettant ainsi aux développeurs de spécialiser l applicatif pour répondre à des besoins précis. Star Next. L éditeur a choisi de développer son offre vers le secteur Internet/intranet avec ce produit. Particuliarité affichée par rapport avec ses concurrents : une compatibilité avec OpenGis. Je n ai pas trouvé de prix publics des produits Star Informatic. 23
4.2.7 GeoMap Cet éditeur a choisi une technologie objets. Pour l ensemble de ces modules il a choisi l environnement des produits AutoDesk, en particulier AutoCad Map. L applicatif central Geomap Gis contient toutes les fonctions nécessaires à l exploitation des données, il est ouvertement orienté réseau, avec une architecture produits Microsoft, l affichage Web est réalisé avec la technologie Active X. Les interfaces administrateur et utilisateur utilisent MapGuide, viewer compatible AutoDesk. Cet solution est remarquable pour son ouverture sur de nombreux formats : données Raster : TIF NB et Couleur, SUN, SPOT, RLC, HRF, PCX, BMP, données Vecteur : DWG, DXF, EDIGEO, DGN, MIF-MID ( MapInfo ), ARC Info. Des solutions métier ont aussi été développées dans le domaine de la gestion de réseau, des télécommunications de l immobilier, et de l urbanisme. 4.2.8 GeoCT, Grass GeoCT est un ensemble d outils pour manipuler des données géographiques : extraction depuis un entrepôt de données hétérogène, opérations spatiales, productions de plans. CT signifie "Collectités Territoriales". J ai choisi de faire référence à cet outil, car il présente la particularité d être développé sous licence logiciels libres et d être orienté vers les collectivités locales. Grass est édité sous la même licence, il présente un niveau de maturité supérieur. Il dispose d une très grande palette de compatibilité tant avec les formats de fichiers raster que vectoriel. Il existe d autres SIG, open-source : MapServer, PhpGis, ou des librairies comme GDAL ou OGR qui permettent le développement d application SIG. 4.2.9 Apic La société Apic, maintenant fusionnée avec Star, propose ses propres solutions. La stratégie est légèrement différente. Apic a développé un moteur, à la manière de Géoconcept, Apic-Space. Ce moteur est conçu avec une architecture objets. Il gère son propre format de données, Apic ou le format Oracle. Il dispose d un langage de programmation lui conférant la fonction de générateur d applications, il est interfaçable en C++ et SQL. Il utilise les formats d échanges EDIGEO, NTF, DXF, GDF. A partir de ce moteur des solutions prêtes à l emploi ont été développées : APIC-Compose, ce module permet la conception cartographique. APIC-Explore, c est le module d interrogation. APIC-Edit, c est le module de saisie et de mise à jour de l information géographique. APIC-Visu, ce module est consacré à la représentation des résultats du module d interrogation. L ensemble des modules compose l applicatif APIC 4. Cet éditeur a aussi choisi de proposer des applicatifs métiers : URBAPRO, gestion du droit des sols, DocuWare, outil de gestion spatiale des objets, APIC-réseaux, pour la gestion des réseaux d eau et d assainissement... APIC a aussi exploré le champ de l Internet avec APIC/Web, extension d APIC qui permet l affichage sur Internet et Intranet des données du SIG. Je n ai pas trouvé de prix publics des produits APIC. 24
4.2.10 Savane Ce logiciel a été développé par un géographe, Marc Souris. Il comporte tous les modules classiques d un SIG : géoréférencement, gestion des données textuelles, outils de mesure, calculs et analyse spatiale. Il dispose d une librairie de développement. Il permet d utiliser des données issues de SGBD utilisant ODBC, DAO ou ADO. Il dispose d un module qui en permet la consultation depuis Internet. Le coût d une licence s élève à 500 euros. 4.3 Conclusions en ce qui concerne les principaux produits inventoriés La particularité des applicatifs qui se partagent l essentiel du marché touche essentiellement à la modularité. Un moteur très souvent orienté objets, permet une adaptation aux différentes problématiques où les SIG peuvent amener des réponses en terme de système d information à part entière. Les grandes fonctions Savane Star Informatic Recherc he Geomap Intergraph ARC/ESRI Evaluation MapInfo Logiciels Open source Gestion MacMap Gestion opérationnelle Interropérabilité Développement Les domaines d utilisation FIG. 6 Cartographie des applicatifs On note au travers de ce rapide aperçu des perspectives qui représentent pour partie les caractéristiques des applicatifs à venir : ouverture sur les multi-données, orientation Web, développement réseau, avec une grande ouverture sur les formats de fichiers. Les solutions de taille importante sont ouvertes sur les standard de SGBD. La proposition de véritables outils de décision n est pas patente. 5 Les perspectives de développement Nous avons pu mesurer dans le cadre de cette étude, le décalage qui existe entre les fonctionnalités des outils proposés par le marché et celles qui sont attendues dans le domaine des systèmes d information géographique. L évolution du contexte technologique, économique et social dessine lui aussi des pistes de développement pour ces outils. La demande s articule, à mon sens, autour de trois axes : l ouverture sur le monde, une meilleure intégration des outils d aide à la décision, une capacité plus grande à intégrer des données de toute nature. 25
5.1 L ouverture sur le monde Il s agit essentiellement de la capacité des systèmes à valoriser les données qu ils gèrent. Nous avons pu constater que les éditeurs avaient exploré la voie de l Internet, mais il reste celui de l interopérabilité, du développement des outils d interrogation vers des langages plus naturels. 5.1.1 L ouverture sur l Internet, et d autres modes de type nomade Outre la possibilité de consulter des données de SIG sur le Web, les SIG devront intégrer les technologies qui commencent à émerger dans le domaine de la connaissance. Il s agit des Web services, de l intégration du protocole SOAP. Ils doivent aussi s appuyer sur les technologies d informations réparties et des systèmes embarqués. Outre l aspect, c est un des débouchés commerciaux des SIG. La production de données géographiques touchera les domaines de la navigation assistée. 5.1.2 L interopérabilité La possibilité d exploiter les données provenant d un SIG dépend en partie des formats d échange que ce dernier gère nativement ou génère pour l exportation. Nous avons pu constater que de produits présentent de nombreux formats de fichier en exportation. Un consortium, l OpenGis 29, réunit des éditeurs logiciels, des constructeurs, des organisations gouvernementales, des constructeurs informatiques et des producteurs de données géographiques (Spot Image, Landsat...). Cette organisation produit les spécifications d architecture logicielle, de formats de fichiers, des balises spécifiques pour le Web, donnant de réelle capacité d interopérabilité aux systèmes qui y souscrivent. D autres organismes oeuvrent sur le même domaine ; EUROGI 30, en particulier rassemble des associations travaillant sur le domaine de l information géographique de chacun des pays européens (Afigeo en France). La France a elle même produit une norme de présentation de données géographiques reprise par plusieurs des SIG présentés, il s agit d Edigeo 31. 5.1.3 Le développement des outils d interrogations Le succès de l utilisation des SIG et de leur intégration comme véritable système d organisation dépendra en partie de leur capacité à rendre l information facilement accessible. L introduction de nouvelle interface, de nouveau langage, est une des pistes explorée. A titre d exemple, le langage LVIS[MAA00] permet à l utilisateur de procéder à des analyses spatiales à l aide d icones qui modélisent des concepts. Ce langage est destiné aux non informaticiens, il prend en compte la gestion des ambiguités. 5.2 Une meilleure intégration des outils d aide à la décision Nous avons évoqué la notion de maturité des SIG. Leur statut de véritable système d information d une organisation ne peut être acquis que dans la mesure où ils offriront, au delà des tâches de gestion, les outils qui permettent de définir des stratégies, de prendre 29 http ://www.opengeospatial.org/ 30 http ://www.eurogi.org 31 AFNOR NF-Z13-15 26
des décisions. A cet effet, ils doivent intégrer des systèmes d aide à la décision. Des travaux ont été réalisés dans ce domaine en associant des outils de modélisation, des systèmes multi-acteurs avec des SIG [AT04]. 5.3 Une prise en compte des données de toute nature La richesse d un SIG repose sur la finesse de la modélisation d une problématique et d un territoire. La capacité à intégrer des données d origine de plus en plus large sera une des conditions de de la qualité et de la pertinence des productions du SIG. Cette capacité pourra être complétée par des fonctionnalités qui permettent au SIG de changer d échelle de territoire. Il s agit d intégrer les travaux concernant la généralisation et la fusion de données[hm02] : la décomposition de phénomènes en composantes, l affectation de coefficient de probabilité, l application de règle de fusion permettent de définir des scénarios avec des niveaux de probabilité. L utilisation de ces outils mathématiques concerne aussi le champ de l aide à la décision. Un autre aspect de la pluralité des données à intégrer concerne leur caractère dynamique. Outre la nécessité d outils fournissant en temps réel et sous des formats compatibles, les SIG doivent pouvoir traiter ces données dans la même échelle de temps. 5.4 Conclusion sur les perspectives de développement L ensemble des thèmes ci-dessus abordés, s il présente des aspects fonctionnels différents et répond à des préoccupations orientées soit par la technologie, soit par des besoins spécifiques, converge aussi vers le thème de l aide à la décision. Interface langage naturel Fusion de données Aide à la décision Prise en compte de données dynamiques FIG. 7 Convergence des développements 27
Conclusions L information géographique est fortement attachée à la notion de territoire. La construction d un système d information géographique nécessite, pour les maîtres d ouvrage et les utilisateurs, de maîtriser quelques concepts fondamentaux. Il s agit en particulier de la notion d objet géographique, de l incidence de la localisation sur son état, de la relation qu il entretient avec les autres objets situés sur ou hors territoire objet du SIG. Les acteurs de la construction du SIG doivent s accorder au préalable sur les finalités du système à construire (processus de gestion), de décision ou d évaluation. Cette étape est essentielle, elle en déterminera le périmètre et le contenu détaillé. Elle sera aussi la garantie de l implication des différents acteurs. Cette finalité sera caractérisée par les dimensions données au système d information : gestion de données géolocalisées, évaluation de données, systèmes d aide à la décision. Le sujet de cette étude, à l issue du cycle B du CNAM, m a permis de mettre en perspective nombre des connaissances acquises particulièrement en ce qui concerne les systèmes d information, la recherche opérationnelle, la méthodologie des systèmes et le génie logiciel. Cette synthèse porte sur deux dimensions : l aspect méthodologique, de la conceptualisation à la production, l ensemble des unités de valeur fournit les outils nécessaires à la conduite et la réalisation de projet. l aspect culturel : à titre personnel, ce cursus de formation à transformé mon approche de la gestion de projet. J y ai appris à maîtriser l équilibre entre les approches systémique et analytique selon les étapes et les enjeux du projet. L objet de l étude, en lui-même, présente une dimension directement opérationnelle pour mon activité professionnelle. Dans le cadre de la mise en oeuvre actuelle de cette nouvelle étape de décentralisation qui transfert aux Départements, entre autres moyens, la majeure partie des services chargés de l entretien du réseau routier, avec la charge d une grande partie du réseau routier national. Je travaille actuellement, à l organisation du service qui en aura la charge. Cette organisation territoriale s appuyera en partie sur un système d information à dimension géographique. L étude réalisée met en évidence les capacités existantes et potentielles de ce type de système d information : mise en perspective d un domaine d activités, d une problématique par rapport à un contexte global. Cette approche enrichit le modèle et rend compte d une manière plus réaliste de la complexité d un système. Elle met aussi en évidence, la nécessaire clarification des processus de décision et leur intégration dans l outil. La prise en compte de la complexité s appuie sur les mécanismes de découverte, de limites floues mais aussi de prise en compte de la gestion de connaissances. L étude met en évidence la perspective d une meilleure prise en compte des processus de décision dans ce type d outils. J ai pu constater dans le cadre de mon activité professionnelle, la limitation de l usage du SIG aux activités de gestion. Ce déficit d intégration tient en partie au manque de définition des finalités imparties à ce système, et aussi pour une part au manque d ergonomie des outils d interrogation. Cette constation se traduit dans les axes de recherche universitaire, et aussi dans l évolution des produits du marché. 28
Bibliographie Références [AT04] [djm] [Doc03] Dominique Hervé Aurélie Toillier. Dynamique d uasge des terres et gestion concertée des ressources naturelles. 2004. S. dromard J. melounou. Les sig comme outils collectifs de construction de l espace. Contribution à une réflexion sur les limites actuelles et les perspectives futures. Christophe Carriou Doctorant. Le territoire createur de connaissances : Une ambition extravagante? In Concentration et ségrégation, dynamiques et inscriptions territoriales. Association de Science Régionale De Langue Française, 2003. CREREG UMR CNRS 6585 Rennes. [DP96] Michèle Béguin Denise Pumain. La représentation des données géographiques. 1996. [Duf01] Jean-Philippe Dufour. Introduction à la géodésie. Paris Hermès Science Publications, 2001. [Eis02] Jim Milton Andrew Eisenberg. Sql multimedia and application packages, sql/mm. 2002. [Emm04] Emman. Systèmes d information géographique pour la gestion et l aménagement urbain, note de synthèse. 2004. [etb97] Bruno Defude et Tarik Branki. Accès réparti à l information. 1997. [Gir04] [God04] [HM02] Etienne Girard. Usage de la cognition spatiale pour localiser les lieux d activité lors d une enquête origine-destination. Faculté de foresterie et de géomatique, Université Laval, Québec, Juillet 2004. p10-21. Vincent Godard. Fiche mémo 2.3 du cours sig - les référentiels géographiques. 2004. Vincent Nedelec Samuel Corgne Vincent Dubreuil Laurence Hubert-Moy. Fusion de données de télédétection à l aide de la théorie des évidences, application au mato grosso en vue d une spatialisation de la déforestation. 2002. [IBM02] IBM. DB2 Spatial extender - User s Guide and References. IBM, version 8 edition, 2002. [IGN98] IGN. BdAlti - Descriptif technique, edition 2 edition, Janvier 1998. [IGN99] IGN. Georoute - Descriptif technique, Novembre 1999. [IGN01] IGN. BdCarto - Descriptif technique. IGN, edition 2 edition, Juillet 2001. [IGN02] IGN. BdTopo - Descriptif technique. IGN, edition 1.0 edition, Décembre 2002. [Jea04] Robert Jeansoulin. Présentation du programme actuel de recherche de robert jeansoulin. 2004. [Jod04] Serge Jodra. Forme et dimensions de la terre, histoire de la géodésie. http ://www.cosmovisions.com/geodesiechrono.htm, 2004. 29
[Lef04] Cristelle Roux Alain Lefebvre. Identification des besoins en information géographique. 2004. [Les05] Emmanuelle Lesquel. Cartographie du bruit, mode d emploi. 2005. [MAA00] Ahmed Lbath Marie-Aude Aufaure, Christine Bonhomme. Lvis : Un langage visuel d interrogation de bases de données spatiales. 2000. [Mai04] Hervé Brunel Philippe Maillet. Gestion des connaissances et économie. juin 2004. Bourges. [MHD01] Marie-Paule Péry-Woodley Mai Ho-Dac, Anne Le Draoulec. Cohabitation des dimensions temps, espace et «phénomènes» dans un texte géographique. 2001. [Oli98] [Sou] Sébastien Oliveau. Logiciels de cartographie et sig : principes d utilisation. 1998. Marc Souris. Les principes des systèmes d information géographique. Principes, algorithmes et architecture du système Savane. [SZ98] Sun-Zi. L art de la guerre. Edition Economica, 1998. p140. [Wat03] [Woo00] Jacky Akoka Isabelle Comyn Wattiau. Cours du cnam - cycle c sur les systèmes d information. 2003. Marie-Paule Péry Woodley. Approche en corpus de l organisation textuelle. Mémoire présenté pour l obtention d une habilitation à diriger des recherches en linguistique, 2000. p14. 30
Table des figures 1 L approche multi-domaines......................... 7 2 Relations entre objets et territoires..................... 10 3 Référentiel géodésique et projection cartographique............ 13 4 Les objets de base en mode vecteur..................... 14 5 Trois utilisations possibles......................... 18 6 Cartographie des applicatifs........................ 25 7 Convergence des développements..................... 27 31
ANNEXES A1 - Un article témoignage 32
A2 - Le référentiel géodésique 33
A3 - Méthode de construction d un système de connaissances L ontologisation consiste en la construction de concepts hiérarchisés et de leurs relations et aussi pour chacun d eux de la définition d attributs. Les ontologies doivent être construites sur des champs de connaissances dont la sémantique peut être formalisée rigoureusement. Le découpage en domaine est ainsi une étape importante de l analyse. Ce découpage est la définition du périmètre pertinent sur lequel on pourra définir une spécificité, une «culture professionnelle». La difficulté de ce découpage réside dans la nature holistique des connaissances, en effet il existe des données dont l étendue générale dépasse le cadre limité du domaine étudié. Ce sont des connaissances d ordre général qui participent à la compréhension des connaissances du domaine étudié. Plusieurs types de domaine peuvent être définis, ils permettent de fixer le périmètre des ontologies : ontologie de concepts de bas niveau, objets matériels, concepts simples ontologie de concepts de haut niveau : notions générales d objets, d états, d évènements de contexte. On trouve dans ces dernières des ontologies qui s appliquent à tous les domaines des connaissances et qui leur fournissent les primitives cognitives, par exemple des ontologies de domaines liés aux processus de raisonnement. Une ontologie peut aussi être définie par son niveau de détail, sa granularité. Cette notion est liée aux précédentes, les ontologies de haut niveau ont une granularité moins fine que les ontologies spécifiques. L ontologie de l ontologie... L ontologie est porteuse de ses propres concepts, nous les décrivons ici. La notion de concept C est le lien qui établit la relation entre une connaissance et un objet. Un objet est défini par 2 données : l intention du concept : c est la donnée sémantique du concept l extension du concept : c est l ensemble des objets manipulés par le concept : ses instances. L organisation des concepts Les concepts d un domaine de connaissances sont organisés en réseau, structuré hiérarchiquement et liés par des propriétés. La hiérachisation des concepts est réalisée par une propriété appelée subsomption : elle lie deux concepts par une relation d inclusion. Un concept est défini par un ensemble de propriétés : la généricité, l identité, la rigidité, l anti-rigidité, l unité complétées par celles qui s appliquent à 2 concepts : équivalence, disjonction et dépendance. Les propriétés peuvent s appliquer à elles-mêmes : il s agit de méta-propriétés 3233 L intention d un concept est complétée par des attributs. Des liens peuvent être définis entre les instances d un concept, il s agit de relations. Celles-ci sont caractérisées par un terme, par le nombre d instances liées, leur type et l ordre de lecture de la relation. Les propriétés d une relation : symétrie, réflexivité, transitivité cardinalité entre deux relations : incompatibilité, inverse, exclusivité entre une relation et des concepts : lien relationnel, restrictions de la relation Un autre volet de l analyse ontologique consiste 32 http ://aristote1.aristote.asso.fr/presentations/cea-edf-2003/cours/jeanbezivin/cours09.v1-01.ppt 33 http ://www.ccic-cerisy.asso.fr/connaissances03.html 34
à identifier les connaissances implicites, celles qu il est inutile d exprimer et qui seront intégrées au système de base de connaissances78, de celles qui seront exprimées. L ontologisation, deuxième étape de la construction d un système de gestion de la connaissance, dispose de méthodes. Nous en citons deux : METHODONLOGY79 ONTOSPEC80 Au-delà de l emploi d une méthode, cette élaboration repose sur un travail d experts et de dialogue avec les acteurs du domaine pour lequel on veut construire un système à base de connaissances. Il existe aussi des outils d aide à la construction et surtout à la validation des ontologies, comme Ontology Manager, JOE (Java Ontology Editor)81... L étape suivante est la traduction de l ontologie dans un système opérationnel. 35
A4 - Un article sur les SIG en collectivités locales 36
A5 - Captures d écran de SIG 37