Optimisation de la géométrie du voisinage pour la segmentation d images texturées Pierre Beauseroy & André Smolarz Institut des Sciences et Technologies de l Information de Troyes (FRE 73) Université de Technologie de troyes 1, rue Marie Curie BP 00, 10 Troyes Cedex pierre.beauseroy@utt.fr ou andre.smolarz@utt.fr Résumé Généralement, lors de la segmentation, chaque pixel d une image texturée est classé à partir d informations provenant de son voisinage. L objectif de ce travail est d étudier l impact de la géométrie du voisinage, choisie pour une taille donnée, sur les performances de classification. Cet article présente une approche utilisant les SVMs pour l étape d apprentissage des textures et de classification des pixels. Les paramètres du classifieur et la géométrie du voisinage sont conjointement optimisés à partir de données étiquetées. L étude expérimentale montre clairement que la géométrie influe considérablement sur la qualité des résultats. L amélioration des performances de classification peut être obtenue par optimisation de la géométrie du voisinage, limitant par voie de conséquence sa taille et permettant une segmentation plus précise. Abstract Usually, when segmenting textured images each pixel is classified according to its neighborhood. This paper is a study of neighborhood s geometry impact for a given number of neighbors on classification results. We propose a new approach using SVMs for learning textures and pixels classification. Parameters of classifier and neighborhood s geometry are jointly optimized based on labelled data. Experiments clearly show that neighborhood s geometry have a great influence on classification results. Better results can be achieved when optimizing neighborhood s geometry. As a consequence, for given performances the number of neighbors can be reduced and the resulting segmentation is improved. Mots clés Image, Segmentation, Texture, SVM, Classification, Apprentissage, Optimisation Keywords Image, Segmentation, Texture, SVM, Classification, Learning, Optimisation 1 Introduction Pour segmenter une image en régions homogènes au sens de la texture, il est nécessaire de classer les pixels de l image. Depuis les travaux de Haralick & al. (1973) de nombreux auteurs ont traité le problème de classification en proposant diverses méthodes de caractérisations locales de la texture, notamment Chu & al. (1990), Dasarathy et Holder (1991) et Gotlieb et Kreyszig (1990). Ces travaux et bien d autres étudient les moyens de caractériser localement l image en décrivant les interactions entre un pixel à classer et un ou plusieurs de ses voisins. Les paramètres extraits de matrices de coocurrence ou les coefficients de corrélation multiples entre groupes voisins de pixels (Smolarz (1997)) ont notamment été utilisés. Pour garantir une bonne qualité d estimation des attributs locaux liés à un voisinage de quelques pixels (3x3 ou 5x5 par exemple), les attributs doivent être estimés sur de grandes régions de l images (souvent 3x3 ou x pixels). L augmentation de la taille des régions améliore 1
généralement l estimation et la classification au détriment de la localisation des frontières entre textures. Cette communication propose une approche différente qui consiste à caractériser la texture à laquelle participe un pixel à l aide d un vecteur aléatoire dont les composantes correspondent aux niveaux de gris d un groupe de pixels voisins. L utilisation des méthodes de décision à noyaux introduites par Vapnik (199) permet d estimer directement une règle de décision performante à partir de cet espace de représentation sans chercher à déduire du voisinage des grandeurs caractéristiques. Les prétraitements sont ainsi supprimés. Cette démarche nous affranchit de la nécessité de garantir la qualité de l estimation des grandeurs caractéristiques et permet d espérer une réduction du nombre de voisins requis pour une performance de classification comparable. Dans cette publication, plutôt que d imposer des contraintes de performance et de chercher à réduire le plus possible la taille du voisinage, nous avons traité le problème dual. La taille du voisinage est figée et l objectif est d optimiser les performances de classification en cherchant, dans le plan de l image, le voisinage le plus discriminant dans le cadre d un problème à deux classes. Cette démarche est développée dans la seconde partie. L étude expérimentale présentée en troisième partie montre que cette approche permet d obtenir de très bons résultats avec un apprentissage réduit (peu d individus représentatifs de chaque classe) et un nombre de voisins faible (ici 9). En revanche, le choix du voisinage revêt une importance capitale. Son optimisation est donc primordiale pour assurer de bonnes performances. Présentation de la méthode Le choix du voisinage est obtenu en sélectionnant, à l issue d une étape d optimisation, le voisinage donnant les meilleures performances de classification estimées par validation croisée. Nous présentons successivement la définition des voisinages, le classifieur et la méthode d optimisation retenus..1 Géométrie des voisinages L ensemble de pixels formant le voisinage du pixel à classer est défini par l ensemble des positions relatives des pixels du groupe par rapport au pixel à classer. Soit V un tel voisinage, dans le cadre de cette étude nous avons imposé 3 contraintes aux voisinages considérés : le pixel à classer fait partie du voisinage, le nombre de pixels formant le voisinage est fixé à 9, les pixels du voisinage doivent tous être connectés entre eux par un coin ou un bord de pixel. Ces contraintes, outre qu elles reprennent des hypothèses implicites dans de nombreuses publications, permettent: de limiter la dimension de l espace des solutions et de réduire la complexité de la recherche d un optimum, de limiter la surface de la région de l image utilisée pour représenter localement la texture et par conséquent d assurer une meilleure localisation de la frontière.
{ } Pour un voisinage donné V, nous définissons un ensemble d apprentissage (x V i, y i) et un { } ensemble de test (zi V, l i) qui servent à l estimation de la règle de décision et à sa validation. x V i et z V i sont les individus à classer et y i et l i représentent leur classe d appartenance (-1 ou 1 dans notre cas).. Classification Le principe des machines à vecteurs supports est d accroître la dimension de l espace de représentation du problème à l aide d une fonction f() pour ensuite chercher le meilleur séparateur linéaire dans le nouvel espace. Lors des développements analytiques, cette fonction peut-être remplacée par une fonction noyau K() qui s applique directement au produit scalaire à condition que cette dernière vérifie le théorème de Mercer. Dans la pratique, la fonction noyau est directement choisie dans la classe des fonctions satisfaisant le théorème de Mercer. La règle de décision s exprime alors comme suit: ( N ) d(x) = sign y i α i K(x i, x) + b i=1 où N est le nombre d individus de l ensemble d apprentissage, α i et b sont les paramètres du séparateur linéaire et x est l individu à classer. Les paramètres doivent vérifier les contraintes : N i=1 y i α i = 0 et 0 α i C. La valeur de C permet de limiter l espace des solutions. Nous l avons choisie constante pour l ensemble de l étude expérimentale. Le noyau choisi est un noyau gaussien de la forme K γ (x i, x) = exp( γ x i x ). Au cours de l étude expérimentale, le paramètre γ est choisi par validation croisée..3 Optimisation du voisinage Nous cherchons à minimiser la probabilité d erreur estimée : P e(γ, V ) = 1 Ntest d γ (zi V )l i < 0 () Ntest où Ntest est le nombre d individus de l ensemble test et d γ la règle de décision élaborée à l aide des noyaux K γ. Ce critère est discret par rapport au voisinage et sans relations d ordres évidentes. Par conséquent, une méthode d optimisation stochastique proposée par Courrieu (1991) permettant de traiter ce type de problèmes difficiles, a été retenue. Cet algorithme consiste à successivement évaluer le critère pour des solutions obtenues par tirage aléatoire dans l espace des solutions. Au cours de l optimisation les meilleurs solutions sont conservées et la densité de probabilité qui régit le tirage aléatoire évolue de sorte que la recherche se concentre dans des régions où le critère optimisé prend de bonnes valeurs. i=1 (1) 3
3 Etude expérimentale 3.1 Base de données Les résultats présentés portent sur des textures obtenues par synthèse et des textures naturelles. Les quatre textures markoviennes utilisées ont été synthétisées à l aide d un modèle autobinomial décrit pour 1 niveau de gris par Cross et Jain (193) et étendu par Smolarz (199) à un nombre quelconque de niveaux de gris (figures 1, et 3). Le procédé de synthèse garantit que les distributions marginales des niveaux de gris sont identiques pour toutes les images obtenues. La dimension des images est 51x51 pixels. Le dernier couple de textures utilisé pour cette étude est constitué des textures d eau et de canevas extraites de la banque d images du GDR ISIS. La dimension de ces images est de 5x5 pixels. Le moment d ordre 1 des niveaux de gris des images a été arbitrairement ramené à 0. Toutes les images sont monochromes, quantifiées sur 5 niveaux de gris. 3. Résultats Les fonctions de décision ont été estimées pour 5 couples de textures (textures (1,), (,3), (,), (3,) et (eau, canevas)). L apprentissage des SVMs a été réalisé à l aide de 50 exemples étiquetés provenant de chaque texture; soit une portion très réduite des images. Les tests ont été menés en utilisant 000 exemples provenant de chaque classe. La table 1 présente les meilleurs, les moins bons résultats, la moyenne et écart-type des résultats obtenus pour un ensemble de 00 voisinages tirés aléatoirement et les résultats obtenus par la méthode de coocurrence sur une distance de pixels dans directions. Les attributs sont estimés sur des fenêtres de x pixels. Les figures 1, et 3 présentent les meilleurs et moins bons voisinages pour chaque couple de textures étudié. Textures Moins bon Meilleur Moyenne Ecart-type coocurrence classées résultat résultat des résultats correspondant x (%) (%) obtenus (%) (%) 1 et 3,5 1,5 3,3,5 7,1 et 3,9 5,03 11, 3,9 37,99 et 1,05 0,5 3,1 1,7 5,7 3 et 3, 1,,77 3,1 11,3 eau et canevas 5,1 7, 1,5 3, 13,7 Table 1: Résultats estimés avec des ensembles de test et d apprentissage indépendants. Les résultats (table 1) montrent d importants gains dus à l optimisation du voisinage. Ces résultats, bien qu imparfaitement comparables à ceux de la littérature, semblent au moins aussi bons que ceux obtenus à l aide de matrices de coocurrences (dernière colonne de la table) ou de coefficients de corrélation multiples estimés avec des voisinages plus importants. La dernière figure (figure ) illustre l effet du choix du voisinage dans le cas de la segmentation d une image coupé en quadrants. La segmentation obtenue à l aide du voisinage optimisé est indiscutablement meilleure que la seconde, obtenue avec un voisinage carré classique.
Détail texture 1 Détail texture 0 0 0 0 0 0 0 0 0 0 0 0 Détail texture Détail texture 3 0 0 0 0 0 0 0 0 0 0 0 0 Figure 1: A gauche : Textures 1 et et meilleur et moins bon voisinages pour ces textures; à droite : Textures et 3 - meilleur et moins bon voisinages pour ces textures. Détail texture Détail texture 3 0 0 0 0 0 0 0 0 0 0 0 0 Détail texture Détail texture 0 0 0 0 0 0 0 0 0 0 0 0 Figure : A gauche : Textures et - meilleur et moins bon voisinages pour ces textures ; à droite : Textures 3 et - meilleur et moins bon voisinages pour ces textures. Détail texture eau 0 0 0 0 0 0 Détail texture canevas 0 0 0 0 0 0 Figure 3: Textures eau et canevas - meilleur et moins bon voisinages pour ces textures. Image a segmenter Segmentation voisinage optimise Segmentation voisinage carre 50 50 50 150 150 150 00 00 00 50 50 50 50 150 00 50 50 150 00 50 50 150 00 50 Figure : Segmentation de deux images contenant les textures eau et canevas avec le voisinage optimisé au centre et un voisinage carré 3x3 à droite. 5
Conclusion Cette communication étudie l influence de l étendue et de la forme du voisinage pris en compte sur la classification de pixels provenant d images texturées. Nous proposons une méthode de recherche d un voisinage optimal pour la classification de pixels. Nous appliquons cette méthode à des problèmes de segmentation à textures. L application de cette méthode à des textures naturelles et de synthèses montre que de très bonnes performances de classification peuvent être atteintes avec de petits voisinages à condition de bien choisir le voisinage. Ce choix est très important. La faible taille du voisinage permet d espérer une meilleure localisation des frontières entre textures (ce que semblent attester les expériences réalisées). L utilisation de classifieurs de type SVM permet notamment d obtenir de très bonnes performances avec des ensembles d apprentissage de petites tailles. La population d apprentissage réduite et la petite taille du voisinage contribuent à limiter drastiquement la région de l image nécessaire pour apprendre. Cette qualité peut devenir importante dans le cadre de l extension de ce travail à des problèmes de classification non supervisée. In fine, le problème traité est analogue à celui de la sélection de variables lors de la conception d un classifieur. Lorsque la règle de décision employée est construite par SVM, le principe de parcimonie de l espace de représentation perd de son importance. Dans le cas présent, ce problème demeure puisque seule la parcimonie de la représentation garantit la localisation des frontières lors de la segmentation. En définitive, ces résultats suggèrent l existence d un compromis localisation-performance de classification analogue au compromis biais-variance. Ce travail se poursuit actuellement par l étude de problèmes de classification et segmentation multi-textures et par l amélioration de la technique d optimisation (optimisation conjointe du nombre de pixels voisins et de la forme du voisinage). Bibliographie [1] Cross G.R., Jain A.K., (193), Markov Random Field Model, IEEE Trans. Pattern Analysis and Machine Intelligence, Vol 5, N 1, 5 39. [] Smolarz A. (1997) Etude qualitative du modèle auto-binomial appliqué à la synthèse de texture, XXIXèmes Journées de statistique, Carcassonne. [3] Chu A., Sehgal C.M., Greenleaf J.F. (1990) Use of gray value distribution of run lengths for texture analysis, Pattern Recognition Letters, Vol 11, 15 0. [] Dasarathy D.V., Holder E.B. (1991) Image characterizations based on joint gray level-run length distributions, Pattern Recognition Letters, Vol 1, 97 50. [5] Gotlieb C.C, Kreyszig H.E. (1990) Texture descriptors based on Co-occurence Matrices Computer graphics and image processing, Vol 51, 70. [] Haralick R.M., Shanmugam K., Dinstein I. (1973) Textural Features for Image Classification IEEE Trans. on Systems Man & Cybernetics, Vol 3, N, 10 1. [7] Vapnik V.N. (199) Statistical learning theory Ed. Wiley Inter-Science, New-York. [] Courrieu P. (1991) A distributed search algorithm for hard optimization, technical report N TA9101, CREPCO URA CNRS 1. [9] Smolarz A. (199) Discrimination de textures à l aide de caractéristiques statistiques locales entre blocs de pixels, XXXèmes journées de Statistique, Rennes.