Fouille de données multi-stratégies pour l'extraction de connaissances à partir d'images de télédétection Cédric WEMMERT* Alexandre BLANSCHE* Anne PUISSANT** *LSIIT UMR 7005 CNRS/ULP Apprentissage et Fouille de données *IDEES-GEOSYSCOM Université de Caen
Plan de la présentation Contexte : plate-forme pour l'extraction et la qualification de la végétation urbaine à partir d'une base de connaissances et d'images (ACI Masse de données) Classification multi-stratégies Pondération automatique des attributs par apprentissage génétique 2
Contexte Multiplication des images satellites avec des résolutions spatiale, spectrale et temporelle complémentaires Planification urbaine : Besoin d'informations spatialisées harmonisées, cohérentes et mises à jour régulièrement Besoin de localiser, identifier et analyser les objets urbains à différentes échelles d'étude (du 1/5000 e au 1/25000 e ) 3
2 km 1 km THR Objets géographiques ASTER 15m SPOT 20m Zones HR Landsat ETM 30m 4
Méthodes actuelles Stratégies différentes selon le type d'images Images HR Images THR Classification spectrale Classification zonale pixel objet 5
Méthodes actuelles Méthode unique pour un type d'images Image satellite 1 segmentation Régions 2 caractérisation BD Régions 3 classification Objets géographiques Extrait de la thèse de Puissant A. (2003) 6
Méthodes actuelles Extraction mono-formalisation des objets à partir d'une scène : comportement spectral des objets indicateur géométriques relations spatiales entre les objets Prise en compte des données multi-sources par fusion des données images ou des résultats 7
Méthode proposée Extraction multi-formalisation des objets à partir d'une scène : 1) Structuration d'une base de connaissances (images, 'objets', ontologie, etc.) 2) Construction des objets par méthodes morphologiques multivaluées 3) Classification hybride des données guidée par les connaissances ACI Masse de données FoDoMuSt : Fouille de données multi-stratégies pour extraire et qualifier la végétation urbaine à partir de bases de données images http://lsiit.u-strasbg.fr/afd/sites/fodomust/fr-accueil.php 8
Méthode proposée Masse de données Classes thématiques segmentation Classificati on hybride Surfaces minérales Ontologie Espace urbain Surfaces végétales Espace rural = conceptualisation des connaissances BD des régions 9
Classification hybride Choix initiaux importants famille de classifieurs méthode de classification paramètres pour la méthode choisie Résultats différents suivant ces choix (hiérarchie, partitionnement, etc.) Limites de certaines méthodes (complémentarité?) 11
Classification hybride Choix initiaux importants famille de classifieurs méthode de classification paramètres pour la méthode choisie Résultats différents suivant ces choix (hiérarchie, partitionnement, etc.) Limites de certaines méthodes (complémentarité?) combinaison de ces méthodes atténuation de l'importance des choix initiaux compensation mutuelle des limites des méthodes utilisées 12
Le système samarah Système multi-agents composé de : plusieurs méthodes de classification non supervisée K-means Cobweb S.O.M. etc. un protocole de collaboration permettant la convergence des résultats des différentes méthodes vers une solution unique en fonction d'un critère de qualité statistique une méthode de vote multi-point de vues permettant la construction d'un résultat unique 13
Le système samarah kmeans kohonen cobweb 14
Le système samarah kmeans nouveau kmeans kohonen nouveau kohonen cobweb nouveau cobweb 15
Le système samarah... kmeans kmeans final... kohonen kohonen final... cobweb cobweb final 16
Le système samarah... kmeans kohonen...... kmeans final kohonen final Méthode de vote Résultat unifiant cobweb cobweb final 17
Travaux en cours... Convergence des résultats suivant un critère purement statistique Intégration de la connaissance du domaine pour l'évaluation des résultats Prise en compte de l'utilisateur : que cherche-t-il dans ces images??? 18
Travaux en cours... Classification multi-sources multi-résolutions Utilisation pour chaque agent de données différentes Comparaison des objets selon une représentation commune : résolution la plus élevée (très coûteux en temps de calcul) objet réel 19
Travaux en cours... Classification de plus haut niveau Passer du niveau pixel au niveau région Tenir compte des informations spatiales et non uniquement spectrales (notion de voisinage) 20
Travaux en cours... 21
Travaux en cours... segmentation SEGMENT 1 - position - taille - moyenne radio - voisinage -...... BD objets 22
Travaux en cours... segmentation SEGMENT 1 - position - taille - moyenne radio - voisinage -...... BD objets classification hybride BD connaissances - exemples - ontologie - rêgles -... 23
Travaux en cours... segmentation SEGMENT 1 - position - taille - moyenne radio - voisinage -...... BD objets labellisation / évaluation classification hybride BD connaissances - exemples - ontologie - rêgles -... 24
Travaux en cours... segmentation SEGMENT 1 labellisation / évaluation - position -Remises taille en cause - moyenne radio possible - voisinage de la segmentation ou -... de la classification... BD objets classification hybride BD connaissances - exemples - ontologie - rêgles -... 25