4th Internatonal Conference on Coputer Integrated Manufacturng CIP 2007 03-04 Noveber 2007 Perforances de la classfcaton par les Séparateurs à Vaste Marge (SVM): applcaton au dagnostc vbratore autoatsé R. Zan, A. Felkaou, R. Zegad Laboratore de écanque de précson applquée Départeent d optque et écanque de précson Unversté Ferhat Abbes, Sétf Algére 9000. zan_lpa@yahoo.fr Résué- Cette étude est proposée pour coparer les perforances de la détecton des défauts dans les achnes tournantes en utlsant une récente éthode classfcaton : les Séparateurs à Vaste Marge (SVM) ou en anglas Support Vetcor Machnes. Les sgnaux vbratores ont été tratés pour extrare tros types d ndcateurs qu sont utlsés coe entrée au classfcateur pour l dentfcaton de deux classes (norale, avec défaut). Les SVM sont entranés en utlsant un sous-enseble des données expérentales. Le sous-enseble restant est utlsé pour le test. Les perforances de la classfcaton sont coparées en utlsant tros noyaux dfférents (polynoal,, et sgoïdal). I. INTRODUCTION Le preer rôle de la survellance ndustrelle est d augenter la dsponblté des nstallatons ndustrelles afn de rédure les coûts drects et ndrects de la antenance des équpeents de producton. Une achne en bon état produt un nveau donné de vbratons. L apparton d un défaut ou d une anoale se tradut par une odfcaton caractérstque de cet état de référence. C est pourquo, la plus part des éthodes odernes de antenance sont basées sur le passage vers une antenance prédctve (condtonnelle) susceptble de prévor avec suffsaent de précson, l évoluton de l état d une achne. D'un pont de vue théorque, les problèes du dagnostc des défauts ont un rapport drect avec la reconnassance des fores (RDF) pusque on souhate classer les données en classes prédéfnes. L élaboraton de tel systèe de dagnostc se réalse généraleent en tros phases [] ; La preère est la phase d analyse qu coprend l analyse des données (pré trateent, ), la défnton d un espace de représentaton, la deuxèe est la phase du chox d'une éthode de décson (dscrnaton entre classes), qu dot attrbuer toute nouvelle donnée (ou esure) à un ode de fonctonneent. La dernère est la phase d explotaton où l objectf est d assocer aux nouvelles observatons les odes de fonctonneent. Les séparateurs à vaste arge (SVM) sont des algorthes de classfcaton réceent développés par Vapnk [2]. L dée essentelle des SVM est d utlser des fonctons noyaux et de projeter les données de l espace d entrée (non lnéareent séparables) dans un espace de plus grande denson appelé espace de caractérstques, de façon à ce que les données devennent lnéareent séparables. Ces algorthes tentent de nser les erreurs d apprentssage tout en axsant la arge séparant les données des classes. Le coporteent des SVM est condtonné par le type de noyau utlsé dans la projecton et les valeurs accordées à ses paraètres [2] [3]. Dans cet artcle, nous proposons d applquer les SVM pour l dentfcaton de deux classes ; la preère est de l engrenage san (état noral), la deuxèe est de l engrenage défectueux. Les sgnaux vbratores sont tratés pour extrare tros ensebles d ndcateurs; statstque, coeffcents du odèle autorégressf (AR), et fréquentels. II. LES SEPARATEURS A VASTE MARGE Pour ben décrre la technque de constructon de l'hyperplan optal séparant des données appartenant à deux classes dfférentes, Supposons nous avons les données eprques : ( x, y),...( x, y) R N ± () { } Sot H : w. x + b l'hyperplan qu satsfat les condtons suvantes : w. x + b s y w. x + b s y Ce qu est équvalent à : y( w. x + b) Pour.. (3) La fg. donne une représentaton vsuelle de l'hyperplan optal dans le cas des données lnéareent séparables. Fg.. Un exeple de classfcaton de deux classes par les SVM (2)
4th Internatonal Conference on Coputer Integrated Manufacturng CIP 2007 03-04 Noveber 2007 L hyperplan optal peut être obtenu par la soluton du problèe d optsaton quadratque suvant : 2 n w 2 y ( w. x + b ) L ntroducton des ultplcateurs de Lagrange. donne le lagrangen prare qu s écrt : (5) α >0, X x x d à Φ () x ( Φ( x ),...,( Φ xd),...) T (0) (,..., ) T Généraleent, le vecteur age Φ(x) est de denson supéreure à d, la denson de l espace d orgne. Les données sont projetées va la foncton Φ telle que : Φ (x ).Φ (x) k (x, x), où k est appelée foncton noyau ou (kernel). La fg. 2 ontre que les données non lnéareent séparables dans l espace d entrée X sont à présent séparables dans l espace augenté Φ (x). N T T L( w, b, α) w w α[ y( w x + b) ] (6) 2 Le lagrangen dot être nal par rapport à w et b et axal par rapport à α, Le pont optal est un pont selle qu vérfe : L ( w, b, α ) w L ( w, b, α ) b 0 0 w α y x (7) α y 0 En substtuant w par son expresson (7) dans (6) on peut écrre le la problèe quadratque dual d optsaton sous la fore : l l ax α (. ) α y y x x 2 α j j j j α 0 l α y 0 Par résoluton du problèe dual d optsaton (8) on obtent les coeffcents α nécessare pour l expresson du vecteur w (7) et on peut, donc, établr la foncton de décson suvante : f ( x) α y ( x. x ) + b * * Les ponts x avec α>0 sont appelés vecteurs de supports (VS). Dans le cas où l hyperplan lnéare dans l espace d entrée ne sépare pas ben les données des deux classes, l est possble de créer un hyperplan qu offre une séparaton lnéare dans un espace de redescrpton de grande denson, éventuelleent nfne, l devent donc possble d'envsager d'utlser la éthode des SVM [4]. Notons Φ une transforaton non lnéare de l'espace d'entrée X en un espace de redescrpton Φ (x) : (8) (9) Fg. 2. Illustraton de l effet de changeent d'espace par une foncton noyau. Par les noyaux couraent utlsés pour la classfcaton on peut cter [4], [5]: Polynoal k ( x, x ') ( x. x ' + ) q () 2 x x ' k ( x, x ') e x p ( ) 2 2 σ (2) Sgoïdal k ( x, x ') tanh ( ax. x ' b ) (3) Le problèe d'optsaton (8) se transcrt dans ce cas par : l l l ax α (, ) α y y K x x 2 α α j j j j 0 α C l α y 0 La foncton de décson dans le nouvel espace devent : (4) ( ) * (, ) * (5) f x α y K x x b + * * Où les coeffcents α et b sont obtenus coe précédeent par résoluton de l équaton (4).
4th Internatonal Conference on Coputer Integrated Manufacturng CIP 2007 03-04 Noveber 2007 III. SYSTEME ETUDIE Les vbratons d engrenages sur lesquelles nous avons fat les tests provennent d un réducteur du CETIM (fg.3). (Centre d Etudes Technques des Industres Mécanques, 52 av. Felx Louat, 60300 Senls), fonctonnant 24h/24h. Le densonneent des roues d engrenages céentés trepés, ans que les condtons de fonctonneent (vtesse, couple) sont fxés de façon à obtenr un écallage sur toute la largeur d une dent [6]. Tous les jours après l acquston des sgnaux vbratores, le banc est arrêté, pour expertser l état des dentures des roues.les essas du réducteur s étalent sur 2 jours avec l enregstreent d un sgnal vbratore chaque jour. Le systèe est coposé d un oteur, d un réducteur de bouclage de rapport 40/42 et du réducteur testé, de rapport 20/2. Le réducteur testé a pour vtesse de rotaton 0 tr/n, sot donc une fréquence de rotaton 6,67 Hz. Or, les deux roues coposant ce réducteur ont un nobre de dents quasent dentque. Leurs fréquences de rotaton sont donc très proches l une de l autres. Nous avons en effet : La fréquence d engrèneent des deux roues est f 333.48Hz La fréquence d échantllonnage eng fe 20 khz 20000Hz 5 La pérode d échantllonnage : Δ t / fe 5.0 s Au cours de l expérentaton, l engrenage de test passe de l état de bon fonctonneent à celu d un engrenage détéroré. La seule rearque possble sur les sgnaux teporels de la fg. 4 consste à soulgner l apparton d un otf, lé au défaut avec l apparence d un choc, de anère pérodque. La esure de cette pérode nous donne envron 0.0625s sot une fréquence de 6 Hz. Cette rearque nous peret unqueent de penser qu un défaut apparaît sur l une des roues as sans pouvor toutefos déterner laquelle des deux est attente. A cet effet nous consdérons que les sgnaux de 2 èe au 0 èe jour, forent la preère classe (sans défaut), et que le2 ee et le 3 ee jour appartennent à la deuxèe classe (avec défaut). IV. PRÉPARATION DES OBSERATION Pour avor suffsaent d'ndvdus dans les deux odes de fonctonneent (sans et avec défaut) et pusque nous dsposons d'enregstreents d'une longueur de Ns6060 ponts, chaque sgnal est décoposé en 3 tranches de 892 ponts avec, un recouvreent des tranches de 50%. Pour évter l effet de asque qu entache forteent la sensblté des ndcateurs "larges bandes", le sgnal de chaque tranche, a donc, été centré pus fltré par un fltre passe-bande. Le fltre utlsé est à réponse pulsonnelle fne à phase nale. Pour Chaque jour, nous dsposons de 3 tranches de sgnaux, échantllonnées à 20000 Hz. Par le fltrage c-dessus, nous avons lté notre étude à une fréquence axale de083 Hz. Les tranches des sgnaux sont, donc, suréchantllonnées. Nous proposons de décer ces sgnaux par un facteur 4. Nous obtenons ans des sgnaux de 2048 ponts échantllonnés à une fréquence fe20000/45000 Hz. Nous pouvons rearquer que le théorèe de Shannon ( f e 2. f ax ) est donc ben vérfé. Le vecteur décé est 4 fos plus court. Fg. 3. Schéa de tran d engrenage. Fg. 4. Sgnaux teporels du tran d engrenage. V. EXTRACTION DES INDICATEURS Après les prétrateents précédents, et une analyse prélnare, nous avons chos de calculer les ndcateurs teporels et fréquentels dans dfférentes bandes latérales de largeur 67 Hz autour des fréquences d engrèneent, sot 0 raes latérales (dx fréquences de rotaton) autour des 3 prncpales haronques (.fe333.33 Hz, 2.fe666.66 Hz, et 3.fe999.99 Hz). Les bandes de calcul sont alors les suvantes: [250-47 Hz], [583-750 Hz] et [96-083 Hz]. A. Les ndcateurs teporels Dans chaque tranche nous avons chos de calculer les ndcateurs statstques suvants : la valeur effcace, le facteur de crête, le skewness, le kurtoss, et les oents d ordre (5 à 9). Ces ndcateurs sont calculés dans les tros bandes préctées pour chaque tranche. La atrce des données obtenue est de (56 ndvdus \ 27ndcateurs). B. Les coeffcents du odèle AR L dée générale est de représenter le sgnal teporel par un odèle paraétrque et d extrare des ndcateurs basés sur les
4th Internatonal Conference on Coputer Integrated Manufacturng CIP 2007 03-04 Noveber 2007 paraètres de ce odèle. Ic nous avons chos d utlsé le odèle autorégressf (AR) et d extrare les coeffcents a du odèle représentant chaque tranche. Lors du calcul des coeffcents a du odèle autorégressf le problèe ajor rencontré est coent déterner l ordre p du odèle. Pour résoudre ce problèe nous avons utlsé un algorthe basé sur la éthode de décoposton en valeur sngulère (SVD), proposée dans [7]. Le résultat obtenu par cet algorthe nous donne pour un odèle AR représentant une tranche l ordre 9, donc nous avons esté 9 coeffcents en utlsant la foncton IVAR du MATLAB. Ce qu nous donne pour tous les jours, une atrce de (56 ndvdus \ 9 ndcateurs). C. Les ndcateurs fréquentels Pour extrare les ndcateurs fréquentels, nous avons chos de calculer les énerges autours des fréquences caractérstques dans les bandes [250-47 Hz], [583-750 Hz], [96-083 Hz], [250-47Hz]et dans la bande totale [250-47Hz]. La atrce obtenue est coposée de (56 ndvdus \ 5 ndcateurs). Les tros ensebles de données obtenus, forent, donc, une atrce totale (BDT) de (56ndvdu \ 5 ndcateurs). La fg. 5 représente l évoluton de quelques ndcateurs de chaque enseble. Valeur noralsée 0,5 0,45 0,4 0,35 0,3 0,25 0,2 0,5 0, 0,05 valeur effcace facteur de crète kurtoss Cette fgure ontre l évoluton des ndcateurs pour les douze jours consdérés (56 tranches). On peut constater qu arrvant à l observaton 3, une varaton brusque apparaît pour la ajorté des ndcateurs, car a partr de cette observaton on rentre dans l ntervalle des observaton appartenantes à la deuxèe classe (de 3 jusqu à 56), cette varaton, caractérse ans une dégradaton de l état de l engrenage et l apparton d un ode de fonctonneent avec défaut VI. CONDUITE DES DEFERENTS ETAPES DE CLASSIFICATION L étape d extracton des ndcateurs nous a pert d avor une atrce de données forée par les tros ensebles précédents, et qu est utlsée coe entrée au classfcateur (SVM). Chaque enseble est coposé de 56 ndvdus, dont 84 sont utlsés pour l entraîneent, et les 72 restants pour le test. La classfcaton des données a été réalsée en adaptant à notre problèe une bote à outl MATLAB appelée : Statstcal Pattern Recognton Toolbox for Matlab [7]. L algorthe prncpale utlsé pour l entraîneent des SVM est celu de Platt [4]: Sequental Mnal Optsaton (SMO), pour plus de détal vor [4],[9]. L organgrae de la fg. 6 résue ces dfférentes étapes de classfcaton. Début Trateent du sgnal, constructon de la base de données 0 Tranches a) les ndcateurs teporels Lecture de la Matrce d apprentssage BA, et d étquettes EA, Lecture de la Matrce de test BT, et d étquettes ET Valeur noralsée a2 a4 a6 0,4 0,2 0-0,2 5 29 43 57 7 85 99 3 27 4 55-0,4-0,6-0,8 Tranches Entraîneent des SVM Calcul de la foncton de décson f(x) avec le noyau chos Prédcton des éléents de la atrce test BT par f(x) Energe 0,45 0,4 0,35 0,3 0,25 0,2 0,5 0, 0,05 0 2 b) les coeffcents du odèle AR bande bande2 bande3 bande4 bande5 23 34 45 56 67 78 89 Tranches 22 33 44 55 c) les ndcateurs fréquentels Fg. 5. Evoluton de quelques ndcateurs pour toutes les tranches (2 jours) Pour les dfférents noyaux, récupératon du % d observatons ben classées fn Fg. 6. Organgrae de classfcaton par les SVM http://cp.felk.cvut.cz/cp/software/stprtool/ndex.htl
4th Internatonal Conference on Coputer Integrated Manufacturng CIP 2007 03-04 Noveber 2007 VII. CHOIX DES PARAMETRES Un des grands problèes rencontrés lors de la classfcaton par les SVM est le chox des valeurs des paraètres du noyau perettant une bonne classfcaton, un autre problèe est lé au chox de la valeur de la constante de régularsaton C. Pour résoudre ces deux problèes nous avons utlsé la éthode de valdaton crosée (en anglas «cross valdaton»). Le elleur odèle obtenu (celu qu donne un fable taux d erreur), qu est établ avec les elleures valeurs des paraètres du noyau et de la constante C sera utlsé pour prédre les sortes des observatons de la atrce de test BT. La fg.7 llustre la éthode de valdaton crosée dans le cas de la recherche des elleurs paraètres du noyau et de la constante de régularsaton qu nsent le taux d erreurs TABLEAU. I PERFORMANCES DES SVM POUR LES DEFERENTS NOYAUX Ensebles d ndcateurs Teporels (27) Coeffcents du odèle AR (9) Fréquentels (5) Totale (5) Nbre VS 5 2 5 26 4 6 9 23 0 30 Noyau Polynoal Sgoïdal Polynoal Sgoïdal Polynoal Sgoïdal Polynoal Sgoïdal Perforance en test (%) 95.83 86. 97.22 83.33 98.6 97.22 Où Nbre VS est le nobre des vecteurs de supports Fg. 7. Illustraton de la valdaton crosée pour les données de CETIM Cette fgure ontre l évoluton du taux d erreur de classfcaton des données de CETIM en foncton de paraètre du noyau, et de la constante de régularsaton C. le noyau utlsé est une foncton à base radale (), la valeur optale de la largeur σ est égale à 2, avec une valeur optale de C égale à. Donc le elleur odèle, que nous avons utlsé pour prédre les sortes des observatons de la base de test BT, est celu établ en utlsant les valeurs optales de ces deux paraètres. VIII. PERFORMANCES DES SVM Le tableau représente les perforances des SVM pour les tros ensebles d ndcateurs et pour dfférentes noyaux (kernel) : polynoal,, et sgoïdal. Notons c que les paraètres optaux de chaque noyau ont été choss par la éthode de valdaton crosée. Les résultats du tableau. ontrent que le elleur pourcentage des ben prédts (perforance en test) est obtenu avec les ndcateurs fréquentels (%) pour les noyaux :, polynoal, et sgoïdal, tands que la cobnason des tros ensebles d ndcateurs n a pas aéloré les perforances du classfcateur, cela peut être explqué par l effet de redondance d ndcateurs. Les résultats ontrent auss que le noyau donne la elleure perforance pour les tros types d ndcateurs, cela est favorsé par un bon chox du largeur σ par la éthode de valdaton crosée, car ce paraètre déterne le rayon de l hypersphère qu enfere les données dans l espace ultdensonnel ; s la valeur de σ est trop pette, l espace enferé est auss trop pett, donc on rsque de perdre une parte sgnfcatve des données, auss une grande valeur peut causer un chevaucheent entre les classes L exaen du nobre des vecteurs de supports utlsés dans le dfférents cas étudés, peut donner beaucoup d'nforatons concernant les vecteurs qu sont utlsés réelleent, et auss, l donne une ndcaton sur la coplexté des données dans l'espace augenté par les dfférents noyaux utlsés. Quand l hyperplan est dffcle à déterner, beaucoup de vecteurs de support dovent être utlsés, pendant que peu de vecteurs, ndque que l hyperplan est relatveent facle à dentfer, et par conséquent, la perforance sera relatveent bonne. Les résultats du tableau. ontrent pour la atrce totale que le nobre des vecteurs de supports vare en foncton des noyaux choss. Avec le noyau sgoïdal, la foncton de décson est établ avec 30 vecteurs de supports, et 0 en utlsant un noyau, ce qu explque les perforances obtenues (97.22% pour le noyau sgoïdal et % pour le noyau ). CONCLUSION Dans cet artcle nous avons présenté une éthode de détecton des défauts d engrenage par les séparateurs à vaste arge (SVM), tros types d ndcateurs vbratores sont extrat,
4th Internatonal Conference on Coputer Integrated Manufacturng CIP 2007 03-04 Noveber 2007 le classfcateur entraîné est testé avec tros types de noyaux (polynoal,, et sgoïdale ). Les SVM ont ontré leurs apttudes de classfcaton des données pour les dfférents types d ndcateurs, les elleurs résultats sont obtenus avec les ndcateurs fréquentelles. Les résultats ontrent que Les coeffcents du odèle AR peuvent être utlsés coe ndcateur pour la classfcaton des données avec la nécessté de déternaton de l ordre du odèle avant le calcul des ces coeffcents. Un bon chox de noyau (kernel), et de ces paraètres, est un ssu ajor pour avor une bonne classfcaton des données. REMERCIMENTS Les auteurs reercent Dr. Menad sdahed de CETIM pour la base des données se à notre dsposton et pour les éclarcsseents utles. Nous reercons égaleent Dr. F. Vojtèch de l unversté Technque de Tchèque pour la dsponblté de la bote à outl SPRTool. Et qu est accessble sur le ste Internet : http://cp.felk.cvut.cz/cp/software/stprtool/ndex.htl. REFERENCES [] G. Zwngelsten., Dagnostc des défallances. Théore et pratque pour les systèes ndustrels, Traté des Nouvelles Technologes - Sére Dagnostc et Mantenance. Edtons Herès, Pars, 995. [2] V Vapnk. Statstcal Learnng Theory, wley Interscence publcaton, NewYork, 998. [3] V.Vapnk, The Nature of Statstcal Learnng Theory, 2nd edton. Sprnger, 2000. [4] C. Burge A Tutoral on Support Vector Machnes for Pattern Recognton, Data Mnng and Knowledge Dscovery, vol 2, pp2 67. 998 [5] J.C. Platt. Sequental Mnal Optzaton:A Fast Algorth for Tranng Support Vector Machnes, Techncal Report MSR-TR-98-4 Aprl 2, 998. [4]. [6] A. Raad Contrbutons aux statstques cyclques d ordre supéreur : applcatons au dagnostc des défauts d engrenage, Thèse de doctorat, Unversté Technologe de Copègne, 2003. [7] A. Felkaou, B. Fortas, & A. Apostolouk. Sur la sélecton de l ordre dans l analyse spectrale oderne des processus lnéares, ICSS 94 994. [8] F. Vojtˇech and V Hlav aˇ Statstcal Pattern Recognton Toolbox for Matlab, Czech Techncal Unversty; jun 2004 [9] J.C Platt. Probablstc outputs for support vector achnes and coparsons to Regularzed Lkelhood Method, Advances n Large Margn classfers, MITPress, 999.