Organisation flexible de données géographiques pour la recherche d information O. Bedel* S. Ferré*, O. Ridoux*, E. Quesseveur** Journées Géomatiques de l Ouest La Rochelle, Juin 2007 * **
Organiser ses données géographiques Majorité des données structurées en couches thématiques Visualisation cartographique aisée Outils de traitement adaptés (algèbre de carte...) Solutions d archivage et de diffusion variées SGBD spatial, fichiers, webservices... Cependant, Schéma attributaire commun à tous les objets d une couche impose un même niveau de description à chaque objet Organisation peu flexible 2
Rechercher parmi ses données géographiques Par des requêtes, essentiellement Langage de requêtes expressif (SQL spatial) «SELECT nom, tel, adr, prix_nuit, DISTANCE(geom, geom_garelarochelle) AS Dist FROM lyr_hotel WHERE ville = La Rochelle ORDER BY Dist» Interface assistant la saisie de requêtes Mais pas d assistance pour raffiner une requête / réduire son résultat Par navigation, de façon limitée Choix des couches à considérer Sélection d une zone d intérêt sur la carte (zoom, déplacement...) Mais pas de navigation parmi les propriétés attributaires et spatiales 3
Les Systèmes d Information Logiques (SIL) Systèmes d information organiser, mettre à jour, interroger, naviguer parmi des données logiques décrire les données (descripteurs) et les retrouver (raisonnement) Une organisation dirigée par les données Regroupement flexible des données (description commune) Interrogation et Navigation étroitement liées réponse d une requête = données + incréments de requêtes Incréments de requêtes = liens de navigation pertinents (raffinent, sans réponse vide) maximaux calculés automatiquement (à partir des structures de données du SIL) 4
Motivations Organiser les données géographiques dans un Système d Information Logique (SIL) Modèle de données centré sur l entité géographique Expressivité des logiques pour décrire et retrouver les entités Interrogation et navigation combinées faciliter l exploration des données géographiques en bénéficiant d outils cartographiques usuels Utilisation d une interface de webmapping existante (MapServer) Compatibilité avec formats géographiques standards (GML) GEOLIS 5
Plan Contexte et Motivations Un jeu de données à explorer : la base «Rongeurs» Organisation et recherche d information dans GEOLIS GEOLIS en action (Démo) Conclusion et perspectives de recherche 6
Le jeu de données «Rongeurs» Étude de la répartition de rongeurs en Afrique soudano sahélienne Facteurs influant sur la présence d espèces Mouvements de population Programme de recherche mené par l Institut de recherche pour le développement (IRD) 7
Caractéristiques du jeu de données Base décrivant les caractéristiques de rongeurs capturés 1 table recensant 20585 rongeurs renseignés par 39 attributs biométrie : âge, poids, sexe... phylogénie : famille, genre, espèce... localisation : position GPS, lieu de capture (désert, village )... année de capture Base collectée et maintenue depuis plus de 60 ans Description des données hétérogènes (synonymes, valeurs manquantes, erronées ) Échantillonnage imparfait de la zone étude (périodes et zones d ombre) Exploration non triviale 8
GEOLIS : Organisation des données Modèle de données Chaque rongeur est décrit par une formule logique FID Famille Sexe Poids Âge Sous_famille 5 Muridae F 27,50 Adulte Dendromurinae 6 Muridae f 47,00 Adulte? Gerbillinae Famille:``Muridae`` AND Sexe:``F`` AND Poids:27.5 AND Age: ``Ad`` AND Sous_famille:``Dendromurinae`` AND position:( 8.05,12.55) AND Propriété logique : propriété valuée de la forme attribut:valeur Extraction automatique des descriptions logiques depuis la couche géographique de description des rongeurs (GML) 9
Logiques et description Les logiques pour définir et raisonner sur les domaines de valeur des descriptions des rongeurs Attributs numériques : logique d intervalles Poids:125 Poids: in (100..150) Poids:>=100 Coordonnées (géographiques ou graphiques) : logique de position y x y1 x1 x2 y2 x3 y3 x4 y4 annee_lattitude(1988,14 ) annee_lattitude(1980..1990,13..15 ) 10
11
Requête courante 12
Visualisation cartographique des rongeurs décrits par la requête Projection graphique à 2 dimensions des rongeurs décrits par la requête 13
Arbre de navigation présentant : les propriétés raffinant la requête courante le nombre de rongeurs partageant ces propriétés 14
L arbre de navigation Propriétés logiques partagées par tous les rongeurs de la requête courante discriminantes (incréments des requêtes) partiellement ordonnées Choix de l utilisateur : biometrie > Age, dateobservation > annee_capture Lié à la logique Poids:[10.0,30.0] > Poids:10, Poids: > Poids:[0.0,10.0] Compte des rongeurs partageant la propriété [ requête courante / totalité des données ] Arbre mis à jour à chaque pas de navigation 15
GEOLIS : Illustration de fonctionnement 16
Saisie manuelle d une requête 17
Sélection d un incrément dans l arbre 18
Sélection d un incrément graphique 19
GEOLIS : Modèle de navigation 3 vues corrélées Modification manuelle de la requête courante Requête courante (Working query) Description des rongeurs sélectionnés Mise à jour raffinement par incrément graphique Visualisation (Carte et graphique 2D) résultat de la requête Mise à jour raffinement par incrément Arbre de navigation (Navigation tree) Incréments de navigation pertinents Répartition des valeurs 20
Démo de GEOLIS 21
Conclusion Nouveau mode d exploration de données géographiques Navigation dans les données géographiques Aide à la construction de requêtes pertinentes (arbre de navigation) Raffinement par incréments graphiques (carte, graphique) Répartition des valeurs attributaires (arbre de navigation) Meilleure appréhension du jeu de données Accès rapide à l information recherchée Combinaison d un SIL et d outils de visualisation (cartographique et graphique) Interaction dynamique entre chaque composant Couplage orthogonal 22
Questions? Plus de détails sur les Systèmes d Information Logiques http://www.irisa.fr/lis/ Une démo de GEOLIS en ligne http://lfs.irisa.fr/demo area/geolis/ 23
Perspectives de recherche Augmenter l expressivité de GEOLIS Ajout de logiques spatiales (aire, périmètre, forme, ) Ajouts des relations spatiales dans GEOLIS distance, direction, relations topologiques (inclusion, intersection ) Développer les capacités de fouilles de données Rechercher les règles d association spatiales : A B Qu est ce qui caractérise les rongeurs que l on retrouve près des agglomérations?? distancemax_ville<=5km La position des points d eau influe t elle sur la répartition de l espèce huberti??rs(hydro) Espece: huberti 24
Architecture de GEOLIS Combinaison de technologies existantes LISFS, Système de fichiers logiques (Linux) MapServer, moteur de webmapping GML, standard pour l échange de données géographiques 25