SETIT 2009 5 th Internatonal Conference: Scences of Electronc, Technologes of Informaton and Telecommuncatons March 22-26, 2009 TUNISIA Applcaton des Systèmes Immuntares Artfcels Pour la Classfcaton Plantare Hba KHELIL * et Abdelkader BENYETTOU * *Laboratore SIMPA -Département d nformatque Unversté des scences et technologe d Oran, Mohammed BOUDIAF - USTOMB ALGERIE hbakhell@yahoo.fr benyettou@smpa-usto.net Résumé: La classfcaton est un problème qu survent dans pluseurs domanes d applcaton, comme la classfcaton des emals, reconnassance de la parole, reconnassance des sgnatures, reconnassance des vsages pour ce but pluseurs méthodes sont applquées de dfférentes approches. Dans cet artcle nous présenterons le système mmuntare artfcel pour la classfcaton plantare, nous avons chos les IRIS comme exemple d applcaton de notre système mmuntare artfcel. Nous présenterons au départ une dée générale sur le mécansme d mmunté naturelle, par la sute nous donnerons les étapes d apprentssage des systèmes mmuntares artfcels et en fn les dfférents résultats obtenu par l applcaton de ces méthodes pour la classfcaton des plantes IRIS. Mots clés: Système mmuntare artfcel (AIRS, antgène, antcorps, cellules B mémore, IRIS. INTRODUCTION La reconnassance des formes est un domane assez vaste en ntellgence artfcelle, dont ont peut trouver la reconnassance des vsages, les emprentes, la parole, l écrture manuscrte le système mmuntare artfcel est une approche bo-nsprée assez récente utlsé pour dfférents problématques, comme la reconnassance des formes [Sec et all, 03][Ln et all, 05][Den et all, 05][Den, 06][Goo et all, 02] [Wat et all, 05 b], détecton d ntrusons [Km et all, 01], robotque [Jun et all, 99], apprentssage machne [Tm, 00] Le présent traval est une applcaton du système mmuntare artfcel (AIRS pour la classfcaton plantare des IRIS. AIRS est une méthode proposé par A. Watkns en 2001 [Wat, 01] dans sa thèse de Master à l unversté de Mssssp, l améloraton de cet algorthme été en 2004 par A. Watkns, J., Tmms et L. Boggess [Wat et all, 04] dont les auteurs optmsent sur le temps d exécuton et le nombre de cellules B mémores générées. Cette méthode été doté par la possblté d apprentssage parallèle prouvé dans le PHD de A. Watkns de l unversté de Kent en 2005 [Wat, 05]. Dans cet artcle nous donnerons une bref défnton sur le système mmuntare naturel, en seconde parte nous représenterons le système mmuntare artfcel par les dfférents algorthmes utlsés dans ce paper, à la fn nous donnerons les résultats de classfcaton des fleurs d IRIS ; des crtques et des conclusons seront après possble pour prouver la valdté et la dfférences entre ces méthodes. 1. Le système mmuntare naturel Le système mmuntare bologque consttue une arme contre les ntrus qu pénètrent le corps, pour cela pluseurs cellules contrbuent pour l élmnaton de cet ntrus nommé «antgène», ces cellules «B et T» partcpent pour ce qu ont appelle «la réponse mmuntare bologque». Nous dstnguons deux types de réponse mmuntare naturelle, une nné «élémentare et lente» et l autre adaptatve «secondare, rapde et ntellgente» [Em, 06]. 2. Le système mmuntare artfcel Pour une bonne smulaton du système mmuntare naturel, l est évdent de ben comprendre son fonctonnement naturel d abord, ce qu n est pas smple, car cette smulaton se base auss sur des concepts mathématques et bo-nsprés à la fos. Pluseurs tentatves ont vu leurs jours par l effort de pluseurs chercheurs. Dans ce traval nous allons présenter quelques algorthmes d mmunté artfcelle pour la reconnassance des formes et vor auss la smulaton des facteurs prncpaux de la réponse mmuntare (antgènes, antcorps et cellules B. - 1 -
3. AIRS : le système mmuntare artfcel pour la reconnassance des formes Dans cette parte nous allons représenter un algorthme d apprentssage du système mmuntare artfcel destné pour la reconnassance des formes (AIRS, cet algorthme est proposé par A. Watkns dans sa thèse de Master de l unversté de Mssssp en 2001, ce derner a connu une évoluton par la proposton de AIRS2 dans sa thèse de PhD en 2005 à l unversté de Kent [Goo et all, 02] [Wat, 01] [Wat et all, 05 a]. Dans cette sesson nous allons présenter les algorthmes d apprentssages plus en détal. 3.1. Les étapes d apprentssage AIRS Dans cette parte nous allons représenter un algorthme d apprentssage du système mmuntare artfcel destné pour la reconnassance des formes (AIRS, cet algorthme est proposé par A. Watkns dans sa thèse de Master de l unversté de Mssssp en 2001 [Wat, 01], ce derner a connu une évoluton par la proposton de AIRS2 dans sa thèse de PhD en 2005 à l unversté de Kent [Wat, 05]. Dans les prochanes sessons nous allons présenter les algorthmes d apprentssage en détal. 3.1.1. Etape d ntalsaton Dans cette parte tout les données d apprentssage (antgènes seront normalsées et auront des valeurs dans l ntervalle [0, 1]. Un seul d affnté est calculé à partr de cet ensemble d antgène, qu représente l affnté moyenne entre tous les exemples d apprentssage selon la formule (1 : seul _ d ' affnté = n n = 1 j = + 1 affnté ( ag, ag n( n 1 2 j (1 Avec : g et g j deux antgènes. Affnté(g,g j retourne la dstance eucldenne normalsée entre g et g j. La dernère étape d ntalsaton consste à ntalser l ensemble des cellules mémores (antcorps et la populaton des ARB (Artfcal Recognton Ball, à partr de l ensemble des antgènes par trage aléatore des exemples. 3.1.2. Etape d dentfcaton des cellules B et génératon des ARBs Cette étape aura leu pour chaque antgène de l ensemble d apprentssage. Une cellule mémore est sélectonnée de l ensemble des cellules B est mc nommée, cette dernère ressemble 1 le plus a l antgène en cours de tment (la plus grande valeur de stmulaton selon la formule (2 1 La ressemblance est calculée par la formule de stmulaton : stmulaton ( ag, mc = 1 affnté ( ag, mc mc = argmax stmulaton ( ag, mc mc MCag. c (2 Une fos que la cellule m a tc h est sélectonnée, elle sera utlsée pour générer des nouveaux ARBs (clonage, cet ensemble sera addtonné a l ensemble total des ARBs généré par l ensemble des antgènes préalablement traté. Le nombre de clone pour cette cellule sera calculé par la formule (3: nombre _ clones = hyper _ clonal _ * clonal _ * stmulaton ( mc, ag en _ cours (3 Par la sute, chaque ARB généré par mc est muté selon l algorthme de mutaton décrt dans la thèse de master de A. Watkns en 2001 [Wat, 01]. 3.1.3. Etape de compétton des ressources et développement des cellules mémore canddates Cette parte est complémentare de la précédente, car elle complète les nformatons des ARBs générés en calculant leurs ressources selon (4 entre chaque antcorps avec l antgène en cours de tment ; ces ressources sont ms à jour durant l apprentssage et chaque ARB n ayant pas de ressources sera supprmé de l ensemble des ARBs [Wat, 01]. ressources = stmulaton( ag, antcorps * clonal _ (4 Les étapes 4.1.2 et 4.1.3 seront exécutées pour un antgène donné jusqu à ce que la condton s S e u l _ d ' a ffn té sot vérfée, avec A B a b. stm j s = j = 1 A B, a b j A B (5 Lorsque la condton d arrêt est valde, l ensemble d ARBs obtenu sera prêt pour ntrodure à l étape fnale d apprentssage. 3.1.4. Etape d ntroducton des cellules mémores Cette étape consste à chosr à partr des ARBs la cellule canddate qu convent le plus à l antgène en terme de smlarté, en tenant compte la cellule m atch déjà sélectonnée dans 4.1.2. La cellule canddate sera addtonnée à l ensemble des cellules mémores seulement s elle retourne une valeur de stmulaton plus élevée que la cellule m a t c h avec l antgène en cours de tment, snon la cellule m atch sera retrée de l ensemble s sa stmulaton entre la cellule canddate dépasse pas un seul [Wat, 01]. Dans cette parte nous avons représenté l algorthme d apprentssage d un système mmuntare artfcel destné pour la reconnassance des formes, autres modfcatons sont porté sur cet algorthme qu seront représenté dans la prochane - 2 -
sesson. 3.2. AIRS2 : L apprentssage d algorthme AIRS améloré Cet algorthme ne dffère pas trop par rapport à l orgnal, seulement au nveau de la mutaton et la compétton des ressources. Car dans la mutaton les auteurs A. Watkns, J., Tmms et L. Boggess ntrodusent la noton de stmulaton entre l antcorps et l antgène dans la formule de mutaton, de même pour la compétton des ressources qu prend en compte seulement des antcorps de même classe que l antgène [Wat et all, 04] [Wat, 05]. 3.3. L apprentssage d algorthme AIRS et AIRS2 par usage de facteur Autres modfcatons sont porté auss sur AIRS et AIRS2, ces modfcatons sont seulement dans la dernère étape d apprentssage (ntroducton des cellules mémores plus précsément sur le crtère d ntroducton de la cellule comme ndqué c dessus : C an ds tm S tm ula to n ( ag, ca nd da te M a tchs tm Stm u la ton ( a g, m a tch C ella ff a ffn ty ( canddate, m atch f ( C andstm > M atchstm f ( C ella ff < A T * A T S M C M C m atch M C M C can dd ate (6 Le code présenté dans (6 représente une parte de la dernère étape d apprentssage d AIRS et AIRS2, les modfcatons portées sur cette étape sont données dans (7 f ( CellAff < AT * ATS + factor (7 Notant que facteur est calculé selon (8: fa c te u r = A T S * d a m p e n e r * lo g ( n p (8 Avec A T S et d a m p e n e r deux paramètres entre 0 et 1 et np est le nombre de classes. Cette modfcaton est surtout pour relaxer la suppresson des cellules mémores, nous allons vor par la sute la dfférence d évoluton des cellules pour chaque méthode. 4. La classfcaton A la fn de l apprentssage, les cellules B générés seront prêt pour la phase de classfcaton, cette dernère dot classer l antgène test dans sa classe assocé en utlsant le prncpe de KMeans entre l antgène et l ensemble des noyaux des cellules mémores de chaque classe. 5. Notons générales sur les IRIS IRIS est une plante vvace à rhzomes ou à bulbes de la famlle des Irdacées (dont fat également parte le crocus. Le genre IRIS content 210 espèces et d'nnombrables varétés hortcoles. On trouve souvent dans les jardns des Irs germanques. La présente base de donnée utlsée est créée par Fsher en 1988, dont chaque fleur IRIS est représentée sur le quadruple :sepal length, sepal wdth, petal length, petal wdth qu désgne la longueur et la largeur des pétales et sépales. Fgure 1. Fleur IRIS 6. Applcaton et mse en œuvre Pour la mse en œuvre de notre applcaton nous avons utlsé la base de donnée d IRIS créée par Fsher en 1988, la dstrbuton des données est présentée dans la table 1: Apprentssage (IRIS Test (bezdekirs Setosa 50 30 Verscolour 50 30 Vrgnca 50 30 TABLE I. Dstrbuton des exemples d IRIS (Apprentssage et Test Pour le déroulement d apprentssage l est oblgatore de fxer les paramètres d apprentssage selon la table dessous : Hyper clonal Clonal Mutaton Sgnfcaton Type Valeurs Taux de clonage Enter 30 Taux moyen de clonage Taux de mutaton Enter 20 Réel [0,1] TABLE II. Paramètres d apprentssage 0.25 L apprentssage est réalsé en langage C++ sous l envronnement LINUX Mandrva 2006 dans une machne dotée d un processeur d une fréquence de 1.7Ghz et d une mémore volatle d un gga de capacté. Prenant en compte les paramètres ndqués dans la table 2, l apprentssage est déroulé sur 50 génératons (tératons pour tout l ensemble d apprentssage et les résultats de classfcaton (KMeans ans que l évoluton des cellules B sont donnés dans la table et les fgures suvantes: - 3 -
Nbr cellules B AIRS + Fact %Tran Nbr cellules %Tran AIRS Nbr cellules B Nbr cellules AIRS2 + Fact. %Tran %Tran 47 100 100 49 100 100 42 94 96.66 47 92 93.33 42 98 96.66 35 100 100 97.33 97.77 97.33 97.77 TABLE III. Taux de classfcaton AIRS2 Setosa 45 100 100 49 100 100 Verscolour 42 92 93.33 47 92 93.33 Vrgnca 42 100 100 35 100 100 97.33 97.77 97.33 97.77 Selon les fgures l évoluton des cellules B est beaucoup plus stable dans b et d que dans a et c, malgré que le taux de reconnassance global sot le même pour les quatre méthodes, ont peut dre que AIRS2 et AIRS2 + facteur sont mons agressves dans la génératon des cellules B mémore. Concernant les taux de classfcaton est dentques pour chaque base de donnée, et cela revent à l étape d ntalsaton car nous avons prs tout l ensemble d apprentssage en enter dans l ensemble cellules B mémore. Dans toutes les expérences les paramètres d apprentssage sont les mêmes pour toutes les expérences, de même pour l ntalsaton des cellules B mémore été équtable pour chaque ensemble. La mesure de dstance utlsée est la dstance eucldenne car elle est la meux adaptée pour des données type réel. Selon les résultats de classfcaton ans que l évoluton de cellules B, l est préférable d utlser AIRS2 ou ben AIRS2 + facteur car elles mnmsent sur le temps d apprentssage, de plus l évoluton des cellules B est de plus en plus stable, c'est-à-dre qu l été possble de s arrêter dans quelque génératons. 7. Concluson Dans cet artcle nous avons présenté la classfcaton des fleurs IRIS à l ade d apprentssage mmuntare artfcel ; nous nous somme ntéressé par mmuno-computng car c est une des plus récente méthode d apprentssage machne et nous avons utlsé dans cet artcle quatre versons d AIRS proposé par A. Watkns (2001-2005 dans le but de la classfcaton plantare. Pour les futurs travaux, nous avons pensé de donner plus d mportance aux valeurs des paramètres et de proposer une nouvelle méthode de recherche des paramètres optmums dans le but d augmenter la performance de la classfcaton mmuntare par usage des algorthmes d optmsaton. Fgure 2. Evoluton des cellules B dans a AIRS, b AIRS2, c AIRS + facteur, d AIRS2 + facteur REFERENCES [Den, 06] Deneche A.: Approches bos nsprees pour la reconnassance de formes, These de Master à l unversté de Mentour, Constantne, Algere (2006 [Den et all, 05] Deneche A., Meshoul S., Batouche M. : Une approche hybrde pour la reconnassance des formes en utlsant un systeme mmuntare artfcel. Graphc computer scence, Bskra, Algere [Em, 06] Emle P.: Organsaton du system mmuntare feln, Thèse de PhD, Ecole Natonale, Lyon, France (2006 [Goo et all, 02] Goodman D., Boggess L., Watkns A.: Artfcal mmune systelassfcaton of multple class problems, Intellgent Engneerng Systems Through Artfcal Neural (2002 [Jun et all, 99] Jun J. H., Lee D. W., Sm K. B.: Realzaton of cooperatve and swarm behavor n dstrbuted autonomous robotc systems usng artfcal mmune - 4 -
system. IEEE nternatonal conference of Man and Cybernetcs, vol. 6, pp. 614--619. New York (1999 [Km et all, 01] Km J., Bently P.: Towards an artfcal mmune system for network ntruson detecton: an nvestgaton of clonal selecton wth a negatve selecton operator. Congress on Evolutonary Computaton, vol. 2, pp. 1244--1252, Korè sud (2001 [Ln et all, 05] Lngjun M., Peter V. D. P., Hayang W., A: Comprehensve benchmark of the artfcal mmune recognton system (AIRS. Advanced data mnng and applcatons ADMA, vol. 3584, pp. 575--582, Chne [Sec et all, 03] Secker A., Fretas A., Tmms J.: AISEC: An artfcal mmune system for e-mal classfcaton. the Congress on Evolutonary Computaton, pp. 131--139, Canberra. Australe (2003 [Tm, 00] Tmms J.: Artfcal mmune systems: a novel data analyss technque nspred by the mmune network theory, Thèse de PhD Wales UK Unversty (2000 [Wat, 01] Watkns A.: AIRS: A resource lmted artfcal mmune classfer, Thèse de Master à l unversté de Msssspp (2001 [Wat et all, 04] Watkns A., Tmms J., Boggess L.: Artfcal mmune recognton system (ars: an mmune nspred supervsed learnng algorthm, vol. 5, pp. 291--317, Genetc Programmng and Evolvable Machnes (2004 [Wat, 05] Watkns A.: Explotng mmunologcal metaphors n the development of seral, parallel, and dstrbuted learnng algorthms, Thèse de PhD à l unversté de Kent [Wat et all, 05a] Watkns A., Tmms J.: Artfcal mmune recognton system (ars: revsons and refnements. Premère conférence Internatonal en Artfcal Immune System ICARIS, pp. 173--181, Unversté de Kent [Wat et all, 05b] Watkns A., Boggess L.: A new classfer based on resources lmted artfcal mmune systems. congress de Evolutonary Computaton, IEEE World Congress on Computatonal Intellgence held n Honolulu, HI, USA, pp. 1546--1551, Unversté de Kent - 5 -