Segmentaton d mages couleur par analyse d hstogrammes couleur compacts Sé Ouattara, Alan Clément, Bertrand Vgouroux, Julo Rojas Varela Laboratore d Ingénere de Systèmes automatsés UPRES EA 4094 Insttut Unverstare de Technologe, BP 42018, 49016 ANGERS CEDEX, France se_ouat@yahoo.fr ; alan.clement@unv-angers.fr; bertrand.vgourouxt@unv-angers.fr ; julo.rojasvalera@unv-angers.fr Sectons de rattachement : 61, 63 Secteur : Secondare RÉSUMÉ. Nous présentons une méthode de segmentaton non supervsée des mages couleur. Elle est basée sur une analyse hérarchque d hstogrammes couleur compacts. Chaque mode de l hstogramme consttue un noyau de classe, lorsque le nombre de pxels correspondant est supéreur ou égal à un seul arbtrarement fxé. Généralsé à n dmensons, l utlsaton de l hstogramme nd compact sans pertes de données permet de rédure de façon consdérable l espace mémore occupé. Par conséquence, la segmentaton peut être réalsée sans requantfcaton des couleurs de l espace colormétrque consdéré dans la phase de classfcaton. On montre que, pour les mages couleur l utlsaton de l hstogramme 3D compact condut à une melleure segmentaton que celles des hstogrammes 1D ou 2D. MOTS-CLÉS : Segmentaton, classfcaton, mages couleur, hstogramme compact. 1. Introducton La segmentaton est une étape mportante en tratement des mages car elle condtonne leur nterprétaton. Les méthodes de segmentaton basées sur l'analyse d'hstogramme couleur sont confrontées à la dffculté de manpuler une grande quantté de données : pour une mage de résoluton NxM où chaque composante est codée sur 8 bts, un hstogramme couleur classque est représenté par un tableau de 2 24 cellules. Le nombre occupé par chaque cellule pour stocker le nombre de pxels assocés à une couleur réellement présente dans 1
l mage est codé sur log 2 (M.N) bts. Dans le cas où M=N=256, l'hstogramme couleur classque occupe 128 Mo. Il a été proposé l y a quelques années une nouvelle méthode de codage d un hstogramme multdmensonnel appelé hstogramme nd compact (Clément et al., 2001), dans lequel seules les cellules occupées dans l hstogramme classque sont prses en compte. Cec rédut de façon consdérable l espace mémore occupé : typquement un volume de 500 Ko pour une mage de résoluton 256x256 dont chaque composante couleur est codée sur 8 bts, sans perte d nformaton couleur. La classfcaton colormétrque de pxels par analyse d hstogrammes peut être réalsée au moyen de quatre stratéges dfférentes : La premère stratége est basée sur une approche margnale. Chaque composante de l hstogramme est examnée séparément. La méthode est facle à mettre en œuvre, mas elle ne prend pas en compte la corrélaton entre les composantes colormétrques (Jule et al. 2007). Dans la seconde stratége, chaque composante colormétrque est requantfée sur q bts (q<8) afn de rédure la talle de l hstogramme. Cette méthode est effcace mas elle effectue une classfcaton a pror (Xuan et al, 2000). La trosème stratége effectue sot une projecton de l hstogramme sur deux des tros axes colormétrques, sot une réducton à deux composantes en applquant une analyse en composantes prncpales (Kurugollu et al., 2001; Clément et al., 2003). La corrélaton entre les composantes est partellement prse en compte. Les modes détectés peuvent être dfférents de ceux de l hstogramme couleur. Nous contrbuons c à une quatrème stratége totalement vectorelle en utlsant l hstogramme couleur compact. Celu-c faclte la manpulaton des hstogrammes couleur dans un espace mémore rédut. Dans la secton 2 nous présentons la structure de l hstogramme compact. La secton 3 présente l étquetage en composantes connexes de l hstogramme compact. L analyse hérarchque de l hstogramme étqueté permettant la classfcaton des couleurs est détallée à la secton 4. Dans la secton 5, la méthode est applquée à dfférentes mages couleur. Une étude comparatve est réalsée, à la secton 6, entre la méthode de classfcaton proposée et une méthode de classfcaton par analyse d hstogramme b-dmensonnels (Clément et al., 2003) en utlsant des méthodes d évaluaton de segmentaton. 2. Prncpe de l hstogramme nd compact Afn de résoudre le problème de codage et de manpulaton des hstogrammes multdmensonnels, l a été proposé dans (Clément et al., 2001) un algorthme de calcul d un hstogramme multdmensonnel compact. Sachant que la majorté des cellules de l hstogramme classque sont vdes, l hstogramme compact stocke unquement les C cellules réellement occupées. Il est consttué de deux tableaux (fgure 1) : pour une mage à 2
n composantes, un tableau de talle Cxn pour stocker les n-uplets colormétrques dans l ordre lexcographque, et un tableau de talle Cx1 correspondant au nombre de pxels assocés (effectf). Lorsque C est nféreur à MxN, l hstogramme compact occupe mons d espace mémore que l hstogramme classque; dans le cas contrare, l content toutes les couleurs présentes dans l mage. R V B effectf 0 0 5 13 0 0 23 5............ 255 10 0 21 255 251 254 3 Fgure 1. Exemple d hstogramme couleur compact d une mage RVB (8 bts par composante). 3. Etquetage en composantes connexes de l hstogramme nd compact Nous avons récemment développé dans (Ouattara et al. 2007) un algorthme d étquetage en composantes connexes (ECC) de l hstogramme nd compact. Son prncpe consste à effectuer un balayage de tous les n-uplets présents dans l hstogramme compact dans le but de réunr, sous la même étquette, les n-uplets vosns dans l espace colormétrque nd. Comme les n-uplets sont classés dans l ordre lexcographque dans l hstogramme compact, l étquetage d un n-uplet est obtenu en balayant unquement les (3 n -1)/2 n-uplets vosns qu le précèdent. La fgure 2 montre un exemple de quatre couples à balayer pour étqueter le couple (r,v) dans le cas d un hstogramme 2D compact. Axe R Axe V (r-1,v-1) (r-1,v) (r-1,v+1) (r,v-1) (r,v) Fgure 2. Vosns du couple (r,v) à balayer lors de l ECC dans le cas d un hstogramme 2D (axes colorométrques R et V de l espace RVB). 3
4. Classfcaton non supervsée de l hstogramme nd compact La classfcaton des n-uplets colormétrques est effectuée en deux phases: la phase d apprentssage et la phase de décson. La phase d apprentssage consste en une décomposton hérarchque de l hstogramme pour un seul d effectfs fxé S en parcourant l axe des effectfs. Pour chaque nveau d effectfs E j (j de 1 à effectf max), les modes P ( de 1 à m quelconque) sont dentfés au moyen de l ECC présenté à la secton 3. Chaque mode est ensute décomposé tératvement en d autres modes tant que son effectf est supéreur ou égal au seul S (exprmé en pourcentage par rapport à l effectf total de l hstogramme). Le prncpe de décomposton hérarchque est llustré fgure 3 (dessné en une dmenson pour des rasons de clarté. Nous noterons K les noyaux des modes aux feulles entourées sur la fgure 3b. En d autres termes, les noyaux sont les modes sgnfcatfs (fgure 3a) n ayant pas de descendants dans l arbre de décomposton hérarchque. La fgure 3 montre cnq modes sgnfcatfs P ( = 0 à 4) et tros noyaux K ( =2, 3, 4). Le nombre de classes N c est égal au nombre de noyaux (une classe correspondant au noyau K est noté C ). Cependant N c dépend du seul S, c est-à-dre de la précson avec laquelle l analyse de l mage est réalsée. Dans la fgure 3, N c est égal à 3. Dans la phase décson, les centres de gravté μ(k ) de chaque noyau K sont calculés dans l espace colormétrque. Désgnons par β un pont de cordonnées (β 1, β 2,, β n ) dans l espace colormétrque nd. Deux stuatons peuvent se présenter : s le n-uplet appartent à K, la couleur β est attrbuée à la classe C ; dans le cas contrare, nous désgnerons par P k le mode auquel appartent le n-uplet. La couleur β est attrbuée à la classe C correspondant au noyau K lé au mode P k mnmsant d(μ(k ), (β 1, β 2,, β n )). d(a,b) est la dstance eucldenne entre a et b. Fgure 3. Exemple de décomposton hérarchque pour un seul d effectf S fxé. 5. Résultats de segmentaton Afn de comparer pour des mages couleur, la méthode de segmentaton proposée relatvement à une approche de segmentaton par hstogramme 2D (Clément et al., 2003), 4
dont les résultats d évaluaton sont présentés à la secton 6, nous présentons dans cette secton les résultats de segmentaton des deux approches. Les mages à trater sont une mage synthétque (fgure 4a) codée sur 24 bts, de résoluton 256x256, nsprée de l mage Savose (Lambert et al., 2000) ayant 6 classes de couleurs pures - sa constructon et son hstogramme 3D sont llustrés fgure 4 - et tros mages naturelles présentées fgure 5. (a) Image synthétque: Synt_Se (b) Hstogramme 3D Plans Descrpton régons Effectfs R V B Nombre de Pxels Pourcentage Fond (1) 240 20 153 44526 67,9 Pett dsk (2) 240 20 20 1245 1,9 Grand dsk (3) 240 240 20 3768 5,7 Pett Carré (4) 20 240 20 625 1,0 Grand Carré (5) 20 240 154 11000 16,8 Etole (6) 20 20 20 4372 6,7 (c) Constructon de l mage synthétque Fgure 4. Image synthétque Synt_Se dans l espace RVB et sa constructon Les mages sont segmentées au moyen des approches 2D et 3D dont les résultats sont présentés fgure 6. Pour chaque mage, on précse le nombre de classes recherchées. Pour l mage synthétque l obtenton des sx classes n est pas possble par l approche margnale. Pour les mages naturelles segmentées avec l approche 2D, les dfférentes combnasons de plans engendrent des segmentatons dfférentes. Il reste néanmons possble de fusonner les tros segmentatons 2D mas le nombre de classes fnal et la nature des classes dffèrent selon la stratége de fuson utlsée (Kurugollu et al., 2001), (Lezoray et al., 2004). (a) House : 256x256x3 (b) Mandrll : 256x256x3 (c) Peppers : 256x256x3 Fgure 5. Images naturelles codées sur 24 bts ssues de la base de données Unversty of Southern Calforna. 5
Nombre de classes Segmentaton 3D (RVB) Segmentaton 2D (RV) Segmentaton 2D (RB) Segmentaton 2D (VB) Synt_Se (6 classes) mpossble mpossble mpossble House (5 classes) Mandrll (5 classes) Peppers (6 classes) Fgure 6. Résultats de segmentaton en 2D et 3D. 6. Évaluaton des résultats Il exste dans la lttérature dverses méthodes d évaluaton de segmentaton qu peuvent être regroupées en deux catégores : () les méthodes d évaluaton supervsée et () les méthodes d évaluaton non supervsée. La seconde catégore est utlsée dans ce traval avec les crtères de Levne Nazf (Levne et al., 1985), Zeboudj (Zeboudj, 1988) et de Borsott (Borsott et al. 1998) couramment utlsés, leurs expressons mathématques sont données en annexe. Ces crtères se sont avérés performants dans de nombreuses applcatons (Phllpp- Folguet et al. 2006). Les crtères de Levne-Nazf et de Borsott s appuent sur l énerge ntra-classe et prvlégent les segmentatons à régons colorquement homogènes. La dfférence entre ces deux crtères est que le crtère de Borsott accorde un pods mportant aux classes de grands effectfs et pénalse les segmentatons contenant des classes à effectfs égaux. Le crtère de Zeboudj prend quant à lu en compte l énerge ntra-classe et l énerge nter-classes, favorsant les segmentatons à classes homogènes et ben séparées. Les crtères de Levne- 6
Nazf et de Zeboudj accordent le plus grand score à la melleure segmentaton, alors que le crtère de Borsott retourne la plus fable valeur. Conformément à ce qu est pratqué dans la lttérature, les résultats d évaluaton sont donnés avec une précson au 1/10000 dans le tableau c-dessous. Ces résultats montrent que sur l ensemble des tros crtères d évaluaton, la segmentaton vectorelle 3D est en général melleure que les segmentatons margnales. Cependant, pour l mage House et Mandrll, la segmentaton sur les plans VB et RB semblent melleure selon Zeboudj qu en 3D. Cec tradut ben la dffculté qu l y a à évaluer de manère générale la segmentaton et le degré de précson des crtères utlsés reste un pont dscutable. Néanmons, nos résultats montrent que la prse en compte des corrélatons entre les plans colormétrques (segmentaton 3D) aboutt à une melleure segmentaton. Crtère de Levne Crtère de Zeboudj Crtère de Borsott Nombre de classes Segmentaton Segmentaton Segmentaton Segmentaton 3D (RVB) 2D (RV) 2D (RB) 2D (VB) Synt_Se (6 classes) 1 mpossble mpossble mpossble House (5 classes) 0,9680 0,9599 0,9613 0,9650 Mandrll (5 classes) 0,9144 0,8795 0,9127 0,8207 Peppers (6 classes) 0,9314 0,8899 0,8954 0,9124 Nombre de classes Segmentaton Segmentaton Segmentaton Segmentaton 3D (RVB) 2D (RV) 2D (RB) 2D (VB) Synt_Se (6 classes) 0,5091 mpossble mpossble mpossble House (5 classes) 0,65006 0,5851 0,5553 0,7092 Mandrll (5 classes) 0,3680 0,2997 0,3717 0,3177 Peppers (6 classes) 0,5977 0,5578 0,5264 0,5815 Nombre de classes Segmentaton Segmentaton Segmentaton Segmentaton 3D (RVB) 2D (RV) 2D (RB) 2D (VB) Synt_Se (6 classes) 1,25.10-13 mpossble mpossble mpossble House (5 classes) 0,1211 0,1424 0,1570 0,1445 Mandrll (5 classes) 0,4043 0,5464 0,4602 0,7241 Peppers (6 classes) 0,3211 0,3959 0,4215 0,3754 Fgure 7. Résultats d évaluaton de la segmentaton. En gras la segmentaton la plus pertnente 7. Concluson Dans ce traval, nous avons ms en œuvre une méthode de classfcaton vectorelle 3D non supervsée capable de segmenter les mages couleur et plus généralement multcomposantes (nd). L évaluaton de la segmentaton montre que l approche vectorelle est melleure que l approche margnale car elle prend en compte la corrélaton entre les composantes colormétrques. Bblographe Borsott M., Campadell P., Schettn R., Quanttatve evaluaton of color mage segmentaton results, Pattern Recognton Letters, 19:741 747, 1998. Clément A., Vgouroux B., Un hstogramme compact pour l analyse d mages multcomposante, Actes du 18e Colloque GRETSI sur le Tratement du Sgnal et des Images, Toulouse, France, 1, 305-307, 2001. 7
Clément A., Vgouroux B., «Unsupervsed segmentaton of scenes contanng vegetaton (Forsytha) and sol by herarchcal analyss of b-dmensonal hstograms», Pattern Recognton Letters, n 24, 1951-1957, 2003. Jule D., Agnès D., José-Lus L., Ana B. P., A non-parametrc approach for hstogram segmentaton, IEEE Transacton on Image Processng, 16, n 1, 253-261, 2007. Kurugollu F., Sankur B., Harmanc A. E., Color mage segmentaton usng multthresholdng and fuson, Image and Vson Computng, 19, 915-928, 2001. Lambert P., Macare L., Flterng and segmentaton : the specfcty of color mages, Proceedng of 1 st Internatonal Conference on Color n Graphcs and Image Processng, Sant-Etenne, France, 57-71, 2000. Levne M. D., Ahmed M. Nazf. Dynamc measurement of computer generated mage segmentatons, IEEE Transacton on Pattern Analyss and Machne ntellgence, PAMI, 7 n 2, 155-164, march, 1985. Lezoray O., Charrer C., Segmentaton d'mages couleur par coalescence non supervsée d'hstogrammes 2D et fuson de régons selon la théore de Dempster-Shafer, Revue de Tratement du Sgnal, vol. 21, n 6, pp.605-621, 2004. Ouattara S., Clément A. Etquetage d hstogrammes multdmensonnels compacts pour l analyse d mages multcomposantes; Actes du 21 ème Colloque GRETSI sur le tratement d mages, Troyes, France, 11-14 septembre, CD-ROM, 2007. Phlpp-Folguet S., Gugues L., Evaluaton de la segmentaton : état de l artcle, nouveaux ndces et comparason, Revue de Tratement du Sgnal, 23, n 2, 109-125, 2006. Xuan G., Fsher P. Maxmum lkehood clusterng method based on color features, Proceedng of 1 st Internatonal Conference on Color n Graphcs and Image Processng, Sant-Etenne, France, 191-194, 2000. Zeboudj R., Fltrage, Seullage Automatque, Contraste et Contours: du Pré-tratement à l Analyse d mage, PhD thess, Unversté de Sant Etenne, 1988. Annexe L e vn e N a z f 2 σ = 1, avec σ l écart type de la classe et C une constante de c normalsaton B o rso tt = 1 N 2 σ f ( A ) 2. N. ( + ( ) ) 1 0 0 0 0. A 1 1+ lo g ( A ) A, avec A le nombre de pxel = total de l mage, N le nombre de classes, A la talle de la classe et f (A ) le nombre de classes ayant un effectf égal à A N 1 Zeboudj =. A. C ( R ), avec C(R ) le contraste global d une régon R qu dépend du contraste A = 1 ntéreur et extéreur de la régon R, vor (Zeboudj 1988) 8