Optimisation de la géométrie du voisinage pour la segmentation d images texturées



Documents pareils
Principe de symétrisation pour la construction d un test adaptatif

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Filtrage stochastique non linéaire par la théorie de représentation des martingales

MCMC et approximations en champ moyen pour les modèles de Markov

Introduction au Data-Mining

Modélisation géostatistique des débits le long des cours d eau.

Introduction au Data-Mining

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Laboratoire 4 Développement d un système intelligent

Ne cherchez plus, soyez informés! Robert van Kommer

Introduction au datamining

Laboratoire d Automatique et Productique Université de Batna, Algérie

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Apprentissage Automatique

La classification automatique de données quantitatives

Quantification Scalaire et Prédictive

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

INF6304 Interfaces Intelligentes

Classification Automatique de messages : une approche hybride

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

Modélisation du comportement habituel de la personne en smarthome

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE

TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes

Reconnaissance de gestes : approches 2D & 3D

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Une méthode d apprentissage pour la composition de services web

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Projet de Traitement du Signal Segmentation d images SAR

AGROBASE : un système de gestion de données expérimentales

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Object Removal by Exemplar-Based Inpainting

Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Évaluation de la régression bornée

Le modèle de Black et Scholes

CONFERENCE PALISADE. Optimisation robuste d un plan d expériences par simulation Monte-Carlo Concepts de «Design Space» et de «Quality by Design»

Programmation linéaire

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Détection et suivi d'objets dans une séquence d'images par contours actifs

L approche de régression par discontinuité. Thomas Lemieux, UBC Atelier de formation du Congrès de l ASDEQ Le 18 mai 2011

Exercices Corrigés Premières notions sur les espaces vectoriels

Modélisation aléatoire en fiabilité des logiciels

4.2 Unités d enseignement du M1

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

Programmes des classes préparatoires aux Grandes Ecoles

I. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):

Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données

Vérification audiovisuelle de l identité

BIG Data et R: opportunités et perspectives

La Recherche du Point Optimum de Fonctionnement d un Générateur Photovoltaïque en Utilisant les Réseaux NEURO-FLOUS

Exemple PLS avec SAS

Analyse d images. Edmond.Boyer@imag.fr. Edmond Boyer UFRIMA 1

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1

R-ICP : une nouvelle approche d appariement 3D orientée régions pour la reconnaissance faciale

TP N 57. Déploiement et renouvellement d une constellation de satellites

Travaux pratiques avec RapidMiner

Entreposage de données complexes pour la médecine d anticipation personnalisée

Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Cours d Analyse. Fonctions de plusieurs variables

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Echantillonnage Non uniforme

Vers une Optimisation de l Algorithme AntTreeStoch

Deuxième Licence en Informatique Data Warehousing et Data Mining La Classification - 1

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Traitement bas-niveau

Une application des algorithmes génétiques à l ordonnancement d atelier

Programmation linéaire

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

TABLE DES MATIERES. C Exercices complémentaires 42

ÉVALUATION DES RÉTROACTIONS DONNÉES PAR UN LOGICIEL D AIDE À L APPRENTISSAGE DE L ÉCRITURE MANUSCRITE

Fonctions de plusieurs variables

CarrotAge, un logiciel pour la fouille de données agricoles

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

A GRASPxELS approach for the Job Shop with generic time-lags and new statistical determination of the parameters

!-.!#- $'( 1&) &) (,' &*- %,!

Les algorithmes de base du graphisme

Optimisation de la compression fractale D images basée sur les réseaux de neurones

Apprentissage statistique dans les graphes et les réseaux sociaux

Sélection de Caractéristiques pour le Filtrage de Spams

Analyse de la dynamique d un lit fluidisé gaz-solide en interaction acoustique avec son système de ventilation : comparaison théorie/expérience.

INTELLIGENCE ECONOMIQUE : ENJEUX ET RETOUR D EXPERIENCE PILOTE DANS SEPT PMI DE BOURGOGNE

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Extraction de caractéristiques visuelles d'images médicales pour la recherche par similitude et l'aide au diagnostic

Folio Case User s Guide

Moments des variables aléatoires réelles

Transcription:

Optimisation de la géométrie du voisinage pour la segmentation d images texturées Pierre Beauseroy & André Smolarz Institut des Sciences et Technologies de l Information de Troyes (FRE 73) Université de Technologie de troyes 1, rue Marie Curie BP 00, 10 Troyes Cedex pierre.beauseroy@utt.fr ou andre.smolarz@utt.fr Résumé Généralement, lors de la segmentation, chaque pixel d une image texturée est classé à partir d informations provenant de son voisinage. L objectif de ce travail est d étudier l impact de la géométrie du voisinage, choisie pour une taille donnée, sur les performances de classification. Cet article présente une approche utilisant les SVMs pour l étape d apprentissage des textures et de classification des pixels. Les paramètres du classifieur et la géométrie du voisinage sont conjointement optimisés à partir de données étiquetées. L étude expérimentale montre clairement que la géométrie influe considérablement sur la qualité des résultats. L amélioration des performances de classification peut être obtenue par optimisation de la géométrie du voisinage, limitant par voie de conséquence sa taille et permettant une segmentation plus précise. Abstract Usually, when segmenting textured images each pixel is classified according to its neighborhood. This paper is a study of neighborhood s geometry impact for a given number of neighbors on classification results. We propose a new approach using SVMs for learning textures and pixels classification. Parameters of classifier and neighborhood s geometry are jointly optimized based on labelled data. Experiments clearly show that neighborhood s geometry have a great influence on classification results. Better results can be achieved when optimizing neighborhood s geometry. As a consequence, for given performances the number of neighbors can be reduced and the resulting segmentation is improved. Mots clés Image, Segmentation, Texture, SVM, Classification, Apprentissage, Optimisation Keywords Image, Segmentation, Texture, SVM, Classification, Learning, Optimisation 1 Introduction Pour segmenter une image en régions homogènes au sens de la texture, il est nécessaire de classer les pixels de l image. Depuis les travaux de Haralick & al. (1973) de nombreux auteurs ont traité le problème de classification en proposant diverses méthodes de caractérisations locales de la texture, notamment Chu & al. (1990), Dasarathy et Holder (1991) et Gotlieb et Kreyszig (1990). Ces travaux et bien d autres étudient les moyens de caractériser localement l image en décrivant les interactions entre un pixel à classer et un ou plusieurs de ses voisins. Les paramètres extraits de matrices de coocurrence ou les coefficients de corrélation multiples entre groupes voisins de pixels (Smolarz (1997)) ont notamment été utilisés. Pour garantir une bonne qualité d estimation des attributs locaux liés à un voisinage de quelques pixels (3x3 ou 5x5 par exemple), les attributs doivent être estimés sur de grandes régions de l images (souvent 3x3 ou x pixels). L augmentation de la taille des régions améliore 1

généralement l estimation et la classification au détriment de la localisation des frontières entre textures. Cette communication propose une approche différente qui consiste à caractériser la texture à laquelle participe un pixel à l aide d un vecteur aléatoire dont les composantes correspondent aux niveaux de gris d un groupe de pixels voisins. L utilisation des méthodes de décision à noyaux introduites par Vapnik (199) permet d estimer directement une règle de décision performante à partir de cet espace de représentation sans chercher à déduire du voisinage des grandeurs caractéristiques. Les prétraitements sont ainsi supprimés. Cette démarche nous affranchit de la nécessité de garantir la qualité de l estimation des grandeurs caractéristiques et permet d espérer une réduction du nombre de voisins requis pour une performance de classification comparable. Dans cette publication, plutôt que d imposer des contraintes de performance et de chercher à réduire le plus possible la taille du voisinage, nous avons traité le problème dual. La taille du voisinage est figée et l objectif est d optimiser les performances de classification en cherchant, dans le plan de l image, le voisinage le plus discriminant dans le cadre d un problème à deux classes. Cette démarche est développée dans la seconde partie. L étude expérimentale présentée en troisième partie montre que cette approche permet d obtenir de très bons résultats avec un apprentissage réduit (peu d individus représentatifs de chaque classe) et un nombre de voisins faible (ici 9). En revanche, le choix du voisinage revêt une importance capitale. Son optimisation est donc primordiale pour assurer de bonnes performances. Présentation de la méthode Le choix du voisinage est obtenu en sélectionnant, à l issue d une étape d optimisation, le voisinage donnant les meilleures performances de classification estimées par validation croisée. Nous présentons successivement la définition des voisinages, le classifieur et la méthode d optimisation retenus..1 Géométrie des voisinages L ensemble de pixels formant le voisinage du pixel à classer est défini par l ensemble des positions relatives des pixels du groupe par rapport au pixel à classer. Soit V un tel voisinage, dans le cadre de cette étude nous avons imposé 3 contraintes aux voisinages considérés : le pixel à classer fait partie du voisinage, le nombre de pixels formant le voisinage est fixé à 9, les pixels du voisinage doivent tous être connectés entre eux par un coin ou un bord de pixel. Ces contraintes, outre qu elles reprennent des hypothèses implicites dans de nombreuses publications, permettent: de limiter la dimension de l espace des solutions et de réduire la complexité de la recherche d un optimum, de limiter la surface de la région de l image utilisée pour représenter localement la texture et par conséquent d assurer une meilleure localisation de la frontière.

{ } Pour un voisinage donné V, nous définissons un ensemble d apprentissage (x V i, y i) et un { } ensemble de test (zi V, l i) qui servent à l estimation de la règle de décision et à sa validation. x V i et z V i sont les individus à classer et y i et l i représentent leur classe d appartenance (-1 ou 1 dans notre cas).. Classification Le principe des machines à vecteurs supports est d accroître la dimension de l espace de représentation du problème à l aide d une fonction f() pour ensuite chercher le meilleur séparateur linéaire dans le nouvel espace. Lors des développements analytiques, cette fonction peut-être remplacée par une fonction noyau K() qui s applique directement au produit scalaire à condition que cette dernière vérifie le théorème de Mercer. Dans la pratique, la fonction noyau est directement choisie dans la classe des fonctions satisfaisant le théorème de Mercer. La règle de décision s exprime alors comme suit: ( N ) d(x) = sign y i α i K(x i, x) + b i=1 où N est le nombre d individus de l ensemble d apprentissage, α i et b sont les paramètres du séparateur linéaire et x est l individu à classer. Les paramètres doivent vérifier les contraintes : N i=1 y i α i = 0 et 0 α i C. La valeur de C permet de limiter l espace des solutions. Nous l avons choisie constante pour l ensemble de l étude expérimentale. Le noyau choisi est un noyau gaussien de la forme K γ (x i, x) = exp( γ x i x ). Au cours de l étude expérimentale, le paramètre γ est choisi par validation croisée..3 Optimisation du voisinage Nous cherchons à minimiser la probabilité d erreur estimée : P e(γ, V ) = 1 Ntest d γ (zi V )l i < 0 () Ntest où Ntest est le nombre d individus de l ensemble test et d γ la règle de décision élaborée à l aide des noyaux K γ. Ce critère est discret par rapport au voisinage et sans relations d ordres évidentes. Par conséquent, une méthode d optimisation stochastique proposée par Courrieu (1991) permettant de traiter ce type de problèmes difficiles, a été retenue. Cet algorithme consiste à successivement évaluer le critère pour des solutions obtenues par tirage aléatoire dans l espace des solutions. Au cours de l optimisation les meilleurs solutions sont conservées et la densité de probabilité qui régit le tirage aléatoire évolue de sorte que la recherche se concentre dans des régions où le critère optimisé prend de bonnes valeurs. i=1 (1) 3

3 Etude expérimentale 3.1 Base de données Les résultats présentés portent sur des textures obtenues par synthèse et des textures naturelles. Les quatre textures markoviennes utilisées ont été synthétisées à l aide d un modèle autobinomial décrit pour 1 niveau de gris par Cross et Jain (193) et étendu par Smolarz (199) à un nombre quelconque de niveaux de gris (figures 1, et 3). Le procédé de synthèse garantit que les distributions marginales des niveaux de gris sont identiques pour toutes les images obtenues. La dimension des images est 51x51 pixels. Le dernier couple de textures utilisé pour cette étude est constitué des textures d eau et de canevas extraites de la banque d images du GDR ISIS. La dimension de ces images est de 5x5 pixels. Le moment d ordre 1 des niveaux de gris des images a été arbitrairement ramené à 0. Toutes les images sont monochromes, quantifiées sur 5 niveaux de gris. 3. Résultats Les fonctions de décision ont été estimées pour 5 couples de textures (textures (1,), (,3), (,), (3,) et (eau, canevas)). L apprentissage des SVMs a été réalisé à l aide de 50 exemples étiquetés provenant de chaque texture; soit une portion très réduite des images. Les tests ont été menés en utilisant 000 exemples provenant de chaque classe. La table 1 présente les meilleurs, les moins bons résultats, la moyenne et écart-type des résultats obtenus pour un ensemble de 00 voisinages tirés aléatoirement et les résultats obtenus par la méthode de coocurrence sur une distance de pixels dans directions. Les attributs sont estimés sur des fenêtres de x pixels. Les figures 1, et 3 présentent les meilleurs et moins bons voisinages pour chaque couple de textures étudié. Textures Moins bon Meilleur Moyenne Ecart-type coocurrence classées résultat résultat des résultats correspondant x (%) (%) obtenus (%) (%) 1 et 3,5 1,5 3,3,5 7,1 et 3,9 5,03 11, 3,9 37,99 et 1,05 0,5 3,1 1,7 5,7 3 et 3, 1,,77 3,1 11,3 eau et canevas 5,1 7, 1,5 3, 13,7 Table 1: Résultats estimés avec des ensembles de test et d apprentissage indépendants. Les résultats (table 1) montrent d importants gains dus à l optimisation du voisinage. Ces résultats, bien qu imparfaitement comparables à ceux de la littérature, semblent au moins aussi bons que ceux obtenus à l aide de matrices de coocurrences (dernière colonne de la table) ou de coefficients de corrélation multiples estimés avec des voisinages plus importants. La dernière figure (figure ) illustre l effet du choix du voisinage dans le cas de la segmentation d une image coupé en quadrants. La segmentation obtenue à l aide du voisinage optimisé est indiscutablement meilleure que la seconde, obtenue avec un voisinage carré classique.

Détail texture 1 Détail texture 0 0 0 0 0 0 0 0 0 0 0 0 Détail texture Détail texture 3 0 0 0 0 0 0 0 0 0 0 0 0 Figure 1: A gauche : Textures 1 et et meilleur et moins bon voisinages pour ces textures; à droite : Textures et 3 - meilleur et moins bon voisinages pour ces textures. Détail texture Détail texture 3 0 0 0 0 0 0 0 0 0 0 0 0 Détail texture Détail texture 0 0 0 0 0 0 0 0 0 0 0 0 Figure : A gauche : Textures et - meilleur et moins bon voisinages pour ces textures ; à droite : Textures 3 et - meilleur et moins bon voisinages pour ces textures. Détail texture eau 0 0 0 0 0 0 Détail texture canevas 0 0 0 0 0 0 Figure 3: Textures eau et canevas - meilleur et moins bon voisinages pour ces textures. Image a segmenter Segmentation voisinage optimise Segmentation voisinage carre 50 50 50 150 150 150 00 00 00 50 50 50 50 150 00 50 50 150 00 50 50 150 00 50 Figure : Segmentation de deux images contenant les textures eau et canevas avec le voisinage optimisé au centre et un voisinage carré 3x3 à droite. 5

Conclusion Cette communication étudie l influence de l étendue et de la forme du voisinage pris en compte sur la classification de pixels provenant d images texturées. Nous proposons une méthode de recherche d un voisinage optimal pour la classification de pixels. Nous appliquons cette méthode à des problèmes de segmentation à textures. L application de cette méthode à des textures naturelles et de synthèses montre que de très bonnes performances de classification peuvent être atteintes avec de petits voisinages à condition de bien choisir le voisinage. Ce choix est très important. La faible taille du voisinage permet d espérer une meilleure localisation des frontières entre textures (ce que semblent attester les expériences réalisées). L utilisation de classifieurs de type SVM permet notamment d obtenir de très bonnes performances avec des ensembles d apprentissage de petites tailles. La population d apprentissage réduite et la petite taille du voisinage contribuent à limiter drastiquement la région de l image nécessaire pour apprendre. Cette qualité peut devenir importante dans le cadre de l extension de ce travail à des problèmes de classification non supervisée. In fine, le problème traité est analogue à celui de la sélection de variables lors de la conception d un classifieur. Lorsque la règle de décision employée est construite par SVM, le principe de parcimonie de l espace de représentation perd de son importance. Dans le cas présent, ce problème demeure puisque seule la parcimonie de la représentation garantit la localisation des frontières lors de la segmentation. En définitive, ces résultats suggèrent l existence d un compromis localisation-performance de classification analogue au compromis biais-variance. Ce travail se poursuit actuellement par l étude de problèmes de classification et segmentation multi-textures et par l amélioration de la technique d optimisation (optimisation conjointe du nombre de pixels voisins et de la forme du voisinage). Bibliographie [1] Cross G.R., Jain A.K., (193), Markov Random Field Model, IEEE Trans. Pattern Analysis and Machine Intelligence, Vol 5, N 1, 5 39. [] Smolarz A. (1997) Etude qualitative du modèle auto-binomial appliqué à la synthèse de texture, XXIXèmes Journées de statistique, Carcassonne. [3] Chu A., Sehgal C.M., Greenleaf J.F. (1990) Use of gray value distribution of run lengths for texture analysis, Pattern Recognition Letters, Vol 11, 15 0. [] Dasarathy D.V., Holder E.B. (1991) Image characterizations based on joint gray level-run length distributions, Pattern Recognition Letters, Vol 1, 97 50. [5] Gotlieb C.C, Kreyszig H.E. (1990) Texture descriptors based on Co-occurence Matrices Computer graphics and image processing, Vol 51, 70. [] Haralick R.M., Shanmugam K., Dinstein I. (1973) Textural Features for Image Classification IEEE Trans. on Systems Man & Cybernetics, Vol 3, N, 10 1. [7] Vapnik V.N. (199) Statistical learning theory Ed. Wiley Inter-Science, New-York. [] Courrieu P. (1991) A distributed search algorithm for hard optimization, technical report N TA9101, CREPCO URA CNRS 1. [9] Smolarz A. (199) Discrimination de textures à l aide de caractéristiques statistiques locales entre blocs de pixels, XXXèmes journées de Statistique, Rennes.