ANALYSE DE DONNÉES SPATIOTEMPORELLES IMPARFAITES DANS UN SIG ARChÉOLOGIqUE



Documents pareils
Introduction au datamining

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

MODÈLES ET MÉThODES POUR L INFORMATION SPATIO-TEMPORELLE ÉvOLUTIvE

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Intelligence Inventive & Mapping des réseaux de Recherche. Expernova & Active Innovation Management GFII 5 Mars 2015

La classification automatique de données quantitatives

sentée e et soutenue publiquement pour le Doctorat de l Universitl

AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES

APPORT DES RESEAUX BAYESIENS DANS LA PREVENTION DE LA DELINQUANCE

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

APPROCHE DE LA SURVEILLANCE DES SYSTEMES PAR RESEAUX DE PETRI SYNCHRONISES FLOUS

MERLIN GESTION PATRIMONIALE. Groupe GESTION PATRIMONIALE. Définition d un programme de renouvellement

Principe et règles d audit

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Introduction à la méthodologie de la recherche

ACCOMPAGNEMENT A LA CERTIFICATION ISO 9001 DE L AGENCE POUR LA RECHERCHE ET L INNOVATION EN CHAMPAGNE-ARDENNE - CARINNA

CHAPITRE 5. Stratégies Mixtes

TRAVAUX DE RECHERCHE DANS LE

Aggregation of expert opinions and uncertainty theories

LIVRE BLANC Décembre 2014

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

Représentation et analyse des systèmes linéaires


«Innovation Intelligence» La valorisation des données massives au service des partenariats R&D. Expernova Université d été GFII

Corps des nombres complexes, J Paul Tsasa

Incertitude et variabilité : la nécessité de les intégrer dans les modèles

Arithmétique binaire. Chapitre. 5.1 Notions Bit Mot

DÉVERSEMENT ÉLASTIQUE D UNE POUTRE À SECTION BI-SYMÉTRIQUE SOUMISE À DES MOMENTS D EXTRÉMITÉ ET UNE CHARGE RÉPARTIE OU CONCENTRÉE

LE MÉTIER DE CONSULTANT Principes, méthodes, outils

Entreposage de données complexes pour la médecine d anticipation personnalisée

un module de simulation des évolutions urbaines Présentation

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Filtrage stochastique non linéaire par la théorie de représentation des martingales

I- Définitions des signaux.

GEOCONCEPT. Les données font leur révolution! Production et rendu cartographiques : du cloud computing au SaaS

2 Moodle Guide 2c : banque de questions et activité Test. Version du service

Prédiction de couverture de champ radioélectrique pour les réseaux radiomobiles : L apport du Système d Information Géographique ArcInfo 8

Chaînes de Markov au lycée

CARTOGRAPHIE EN LIGNE ET GÉNÉRALISATION

Utilisation du SIG dans une entreprise industrielle pour l analyse et la prise de décision

Modélisation géostatistique des débits le long des cours d eau.

TerrOïko : JEU en collaboration avec la SEEM

Bio-Rad Laboratories CONTRÔLE DE QUALITÉ. Le logiciel de Bio-Rad pour une gestion experte du contrôle de qualité

Transmission d informations sur le réseau électrique

Introduction: 1. définition d un ETL 2. importance et diversité des données spatiales utilitédes ETL géographiques

Business Intelligence

COURS EULER: PROGRAMME DE LA PREMIÈRE ANNÉE

Apprentissage Automatique

Analyse d images. Edmond.Boyer@imag.fr. Edmond Boyer UFRIMA 1

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

DÉPLOIEMENT DE QLIKVIEW POUR DES ANALYSES BIG DATA CHEZ KING.COM

Une méthode d apprentissage pour la composition de services web

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

L image-prix de la gamme de produits: jugement du prix moyen et mémorisation des prix

Chapitre 2 : communications numériques.

Intégration de la dimension sémantique dans les réseaux sociaux

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

La révision des indices du cours du franc suisse, nominaux et réels, pondérés par les exportations

Extraction d informations stratégiques par Analyse en Composantes Principales

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Cyril HÉDOIN 12bis Grande Rue TINQUEUX 28 ans

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

BASE CONCEPTUELLE POUR L ANALYSE DES INCERTITUDES

Validation probabiliste d un Système de Prévision d Ensemble

«Une bonne thèse répond à une question très précise!» : comment l enseigner?

Format de l avis d efficience

Le Futur de la Visualisation d Information. Jean-Daniel Fekete Projet in situ INRIA Futurs

Fonctions de plusieurs variables

ÉVALUATION FORMATIVE. On considère le circuit électrique RC représenté ci-dessous où R et C sont des constantes strictement positives.

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

> innovation. Action «Normalisation» descriptif

TABLE DES MATIERES. C Exercices complémentaires 42

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Attitude des ménages face au risque. M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014

Mario Geiger octobre 08 ÉVAPORATION SOUS VIDE

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues

Contribution sur le thème relatif au point de vue et au rôle des actuaires vis-à-vis des nouvelles normes comptables

Intelligence d affaires nouvelle génération

1 Description générale de VISFIELD

Dans ce document, on décrit les indices des prix des biens de la TIC qui sont produits, ainsi que les sources de données et la méthodologie.

Modélisation et Simulation

EVOLUTION SPATIO-TEMPORELLE DE L OCCUPATION DES ESPACES SUR LE TRIANGLE MARNAIS

ASSURER LA QUALITE DES RESULTATS D ESSAI ET D ETALONNAGE Assuring the quality of test and calibration results

Cours d Analyse. Fonctions de plusieurs variables

Introduction au Data-Mining

Rédiger et administrer un questionnaire

Représentation des Nombres

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Le cycle de traitement de la situation 1/2

Optimisation et programmation mathématique. Professeur Michel de Mathelin. Cours intégré : 20 h

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

GKR. Geological Knowledge Representation Base de connaissances métallogéniques

Mastère spécialisé MS : «Ingénierie de l innovation et du produit nouveau

Transcription:

ANALYSE DE DONNÉES SPATIOTEMPORELLES IMPARFAITES DANS UN SIG ARChÉOLOGIqUE par Cyril de Runz IUT de Reims, rue des Crayères, BP 1035 51687 Reims cedex 2 cyril.de-runz@univ-reims.fr Web : www.univ-reims.fr/crestic Face à la patrimonialisation des ressources archéologiques et grâce au développement de l informatique, l utilisation des systèmes d information géographique devient essentielle pour l exploitation des données archéologiques. Pour cela, il s avère nécessaire de modéliser, d analyser et de visualiser l information archéologique en prenant en considération l aspect temporel et spatial mais surtout les imperfections de ces données archéologiques. Ce travail élabore une démarche qui contribue à une meilleure gestion des données spatiotemporelles imparfaites dans un SIG archéologique. Dans cette démarche scientifique, les concepts théoriques de taxonomie de l imperfection et de représentation des données imparfaites permettent d abord la modélisation des données archéologiques. Afin de considérer la spécificité de leur caractère temporel impliquant une gestion plus flexible du temps, un indice quantifiant l antériorité est introduit. L aspect lacunaire de l information est aussi considéré à travers une méthode d interrogation exploitant les géométries (ligne par exemple) à faire émerger. Enfin, des outils originaux d exploration et de visualisation de données archéologiques sont exposés afin de mieux définir les éléments les plus représentatifs. Par une approche interdisciplinaire liant informatique et géographie, cette thèse développe une vision transversale autour de la gestion des connaissances imparfaites dans le temps et l espace. Cette approche est illustrée par l utilisation de données archéologiques dans un SIG. Introduction Face aux restructurations des espaces urbains (réhabilitation, nouveaux modes de transports), les acteurs de l archéologie urbaine ont besoin d avoir des outils intelligents d interrogation et de visualisation dans des buts de prévision, de prescription et de hiérarchisation des phases de fouilles à l échelle urbaine. Dans ce contexte, l exploitation de systèmes d information géographique (SIG) s est généralisée en archéologie (Conolly et Lake, 2006). Seulement, si l utilisation d un SIG est un apport certain, il est nécessaire de prendre en compte la nature complexe de l information archéologique (temporelle, spatiale et imparfaite) tout comme il est important de considérer l incertitude et la qualité de l information géographique (Devillers et Jeansoulin, 2005). Dans ce cadre, nous proposons des réponses aux questions suivantes : Quelle théorie de représentation et quelle modélisation choisir pour l information archéologique dont nous disposons? Quels outils sont nécessaires à l analyse de données spatiotemporelles imparfaites en vue de la généralisation de l information archéologique? Quelle visualisation choisir pour faciliter la compréhension humaine de l information? Ainsi, la première question porte sur l étude du caractère imparfait des données archéologiques afin d expliciter la modélisation des données dans le SIG (section 2). La seconde question porte sur le positionnement temporel et spatiotemporel des objets à une échelle différente de celle de la collecte mais aussi sur les relations spatiotemporelles entre objets afin de faciliter la mise en perspective de l information disponible (section 3). La troisième question porte sur le mode de visualisation de l information facilitant l approche humaine de l information disponible en tenant compte de son imperfection (section 4). La section 5 présentera la conclusion. CFC (N 215- Mars 2013) 51

Modélisation de données imparfaites dans un SIG archéologique Les données archéologiques sont par nature imparfaites. En se reposant sur (Fisher et al., 2006 ; Bouchon-Meunier, 1995), on peut distinguer quatre types d imperfection : l incertitude, l imprécision, l incomplétude et l ambigüité. Nous proposons, durant ce travail, d affiner la granularité de cette description. Ainsi, l imprécision peut être due au vague et à l approximation, tandis que l absence et la lacune sont les principales sources d incomplétude. Pour l ambiguïté, nous nous sommes reportés à (Fisher, 1999) pour définir les sous-types conflit et non spécificité. Cette description est, à l origine, la typologie proposée dans la figure 1a. À l aide de cette description de la nature des données, nous proposons une taxonomie (fig.1b) qui associe à l incertitude, l imprécision et l ambiguïté, une ou plusieurs théories de représentation des données. Ainsi, les données incertaines seront modélisées par des probabilités, les données vagues par des ensembles flous (Zadeh, 1965), les données approximatives par des ensembles approximatifs, les données donnant lieu à conflit par des fonctions de croyance et les données non-spécifiques par des distributions possibilistes. En utilisant cette taxonomie, la théorie des ensembles flous a été utilisée pour la représentation des données de rues datant de l époque romaine à Reims car elles sont vagues tant spatialement que temporellement. L originalité de mon travail est de considérer simultanément les imperfections spatiales et temporelles et donc de traiter les données de manière complexe. Analyse de données imparfaites dans un SIG archéologique Comme l interrogation et l analyse multi-sources de données sont deux des intérêts classiques de l utilisation d un SIG archéologique, nous proposons deux nouveaux outils pour l interrogation spatio-temporelle. Le premier adapte un outil classique déterminer l antériorité à une date donnée au cadre de l imprécis. Dans cette optique, nous avons défini un indice de position, dans une paire de nombres flous, entre un des deux ensembles flous et le maximum des deux. En effet, comparer deux nombres flous, à l instar d une comparaison entre intervalles, n admet pas d ordre naturel. Notre indice quantifie l antériorité entre deux ensembles flous et permet de relativiser l aspect binaire de la décision sur l antériorité. Il est basé sur l indice de Kerre (1982). Cela permet aux experts d avoir une vision relative du comportement temporel des objets stockés dans le système à l aide d une interrogation selon ce critère dans le SIG. La figure 2 illustre les résultats obtenus pour les données portant sur les tronçons de rues romaines trouvés à Reims et pour une date DRef représentée par un nombre flou triangulaire, c est-à-dire un ensemble flou convexe, normalisé (il existe une valeur du domaine pour laquelle la fonction d appartenance vaut 1), caractérisé par une fonction d appartenance linéaire continue par morceau et il n existe qu une seule et unique valeur du domaine pour laquelle la fonction d appartenance vaut 1. Le second présente une méthode d interrogation spatiotemporelle sous critère de forme. Le principe général de cette méthode est d utiliser une connaissance experte sur la forme des objets (linéarité pour les rues romaines) et une date en entrée, pour construire un accumulateur de Hough (1962) en adéquation avec la forme recherchée sur chacune des caractéristiques, d agréger les accumulateurs puis de sélectionner des cellules pour la visualisation. Cette approche scénarise la complétion de données lacunaires et imprécises et permet la fusion de données grâce à une information de forme. La figure 3 illustre les résultats obtenus pour le troisième siècle à Reims. Analyse de données imparfaites dans un SIG archéologique L exploration et la visualisation des données ont pour objectif d extraire de nouvelles connaissances d une base de données ainsi que d en fournir une représentation graphique (carte thématique, schéma...) simplifiant leurs analyses. Le premier angle étudié est le positionnement temporel des objets. Le processus proposé se base sur l indice d antériorité pour la construction d un graphe pondéré sur l ensemble des données. Ce graphe permet d obtenir la position temporelle de chacun des objets archéologiques relativement à l ensemble des données et à chacune d elles. Ces positions permettent de dégager une structure temporelle de l ensemble des objets stockés dans le SIG et des éléments particuliers : le plus antérieur, le plus postérieur, l élément médian temporellement (fig. 4). La seconde carte a pour but l extraction des éléments les plus représentatifs d une base de données archéologiques. Pour cela, nous avons adapté l ap- 52 CFC (N 215- Mars 2013)

proche de (Blanchard et al., 2005). Nous nous basons sur la définition de dissimilarités entre objets, ces dissimilarités permettant à chaque donnée de classer l ensemble des autres. Les éléments les plus représentatifs sont ceux ayant les meilleurs scores sur l ensemble des rangs obtenus, ils sont appelés VMRM (vecteurs de meilleur rang moyen). Cette méthode m a permis d obtenir des éléments caractéristiques de la base de données (fig. 5). La dernière carte a pour objectif la visualisation des données descriptives (information temporelle ou autres) de la base de données. Pour cela, nous avons adapté une méthode orientée-pixel (Blanchard et Herbin, 2004) pour la visualisation de quantités floues. Des vecteurs d évaluation obtenus à l aide de méthodes de défuzzification classique sont fournis en entrée du processus de visualisation. J ai appliqué cette approche à la visualisation des périodes d activité des objets archéologiques ce qui m a permis d extraire visuellement des groupes de périodes d activité de formes et dates proches (fig. 6). Conclusion Ce travail présente, dans un premier temps, une grille de lecture guidant des choix de théorie de représentation et de modélisation en fonction de l information archéologique dont nous disposons (section 2). Dans un second temps, nous avons introduit des outils nécessaires à l analyse de données spatiotemporelles imparfaites en vue de la généralisation de l information archéologique (section 3). Enfin, par la démarche analytique proposée dans la section 3 et les approches exploratoires présentées dans la section 4, nous avons proposé des modes de visualisation en vue de faciliter la compréhension humaine de l information. Ces méthodes, appliquées au contexte archéologique, peuvent aussi être pertinentes pour l analyse et la visualisation de données en géographie et en informatique. Ces recherches ont donc permis d élaborer une démarche pour la modélisation, des méthodes pour l analyse et une approche pour la visualisation de données spatiotemporelles imparfaites dans un SIG, à l exemple des données archéologiques. Les travaux effectués contribuent à une meilleure gestion des imperfections de l information archéologique à l aide de concepts aussi variés que : taxonomie de l imperfection dans le contexte archéologique, représentation des données imparfaites, indice d antériorité, accumulation dans un espace des paramètres, appariement, rangs des données, graphes orientés pondérés, représentativité des données, visualisation par une image couleur. Remerciements Ce travail est extrait de notre thèse, intitulée «Imperfection, temps et espace : modélisation, analyse et visualisation dans un SIG archéologique», soutenue à l Université de Reims Champagne- Ardenne en 2008 sous la co-direction de Michel Herbin et Frédéric Piantoni et du co-encadrement de Éric Desjardin que nous remercions infiniment. Nous remercions également le SRA de la DRAC Champagne-Ardenne et l INRAP pour l accès à leur données et Dominique Pargny pour son soutien dans le cadre du projet SIGREM. CFC (N 215- Mars 2013) 53

Bibliographie Blanchard F., herbin M., 2004, «L image couleur pour visualiser des données multidimensionelles», Traitement du signal, 21, p. 453-460. Blanchard F., herbin M., Akdag h., 2005, A New Fuzzy Representation for Connecting Data to a Sample, MENDEL 2005, 11th International Conference on Soft Computing, Brno, Czech Republic, p. 114-119. Bouchon-Meunier B., 1995, Logique floue et applications, Paris, Addison Wesley. Conolly J., Lake M., 2006, Geographical Information Systems in Archaeolgy, Cambridge, Cambridge University Press. De Runz C., 2008, Imperfection, temps et espace : modélisation, analyse et visualisation dans un SIG archéologique, Reims, thèse de doctorat soutenue le 25 novembre 2008, Université de Reims Champagne-Ardenne, http://theses.univreims.fr/exl-doc/ged00000848.pdf. Devillers R., Jeansoulin R., 2005, Qualité de l information géographique, Hermès science publications. Fisher P. F., 1999, Models of uncertainty in spatial data, dans Longley, P., Goodchild, M. F., Maguire, D., Rhind, D., dir., Geographical Information Systems: Principles, Techniques, Management and Applications, New York, EUA: John Wiley & Sons, Vol. 1, p. 191-205. Fisher P. F., Comber A., Wadsworth R., 2006, Approaches to Uncertainty in Spatial Data, dans Devillers, R., Jeansoulin, R., Fundamentals of Spatial Data Quality. London, RU: ISTE, p. 43-59. hough P. v., 1962, Method and means for recognizing complex patterns, Brevet n US 3 069 654. Kerre E. E., 1982, The use of fuzzy set theory in electrocardiological diagnostics, dans M. Gupta, & E. Sanchez, Approximate Reasoning in Decision-Analysis. North-Holland Publishing Company. p. 277-282. Zadeh L., 1965, Fuzzy sets Information and control, vol. 8., p. 338 353 54 CFC (N 215- Mars 2013)

a) b) Figure 1 : a) Typologie de l imperfection des données archéologiques ; b) Taxonomie de l imperfection de l information archéologique CFC (N 215- Mars 2013) 55

Figure 2 : Carte des tronçons de rues romaines trouvés à Reims selon l évaluation de l antériorité de DRef à la période d activité de ces objets. Plus la valeur de l antériorité pour un objet est proche de 1 plus nous pouvons supposer que la date DRef est antérieure à la période d activité du dit objet. Ainsi DRef n est pas antérieure aux périodes d activité des objets ayant une valeur de degré d antériorité égale à 0 (objet colorié dans le gris le plus clair) et est antérieure aux périodes d activité des objets ayant une valeur de degré d appartenance égale à 1 (objets en noir). Ici, DRef est défini telle que la confiance est maximale dans la présence de l objet pour l an 200, et que l objet était possiblement présent entre l an 1 et l an 400 56 CFC (N 215- Mars 2013)

Figure 3 : Pré-cartes issues d interrogations spatiotemporelles sous critère de forme pour le troisième siècle Figure 4 : Carte des tronçons de rues romaines trouvés à Reims avec identification des objets (tronçons de rues). Les tronçons de rues dont les périodes d activité ont une position particulière dans l ensemble des périodes d activité des objets sont représentés à l aide de symboles spécifiques, par exemple l objet (le tronçon de rue) temporellement médian est représenté à l aide d un triangle CFC (N 215- Mars 2013) 57

Figure 5 : Carte des tronçons de rues romaines trouvés à Reims avec identification des différents Vecteurs de Meilleur Rang Moyen (VMRM) Fig. 6 : Visualisation des objets de BDFRues par une image couleur des représentations de leurs périodes d activité 58 CFC (N 215- Mars 2013)