Busness Scool W O R K I N G P A P E R S E R I E S Workng Paper 04-38 La régresson logsque PLS : Applcaon à la déecon de défallance d enreprses BEN JABEUR Sam p://.pag.fr/fr/accuel/la-recerce/publcaons-wp.ml IPAG Busness Scool 84, Boulevard San-German 75006 Pars France IPAG orkng papers are crculaed for dscusson and commens only. Tey ave no been peer-reveed and may no be reproduced ou permsson of e auors.
La régresson logsque PLS : Applcaon à la déecon de défallance d enreprses La régresson logsque PLS : Applcaon à la déecon de défallance d enreprses BEN JABEUR Sam IAE Toulon-Var Bâmen Z Unversé du Sud Toulon-Var BP 03 83957 LA GARDE Cedex FRANCE benabeursam@yaoo.fr Résumé. La régresson logsque PLS es une méode relan une varable dépendane qualave à un ensemble de varables explcaves quanaves ou qualaves. En présence de corrélaon la régresson logsque PLS appore une alernave néressane à la régresson logsque classque en permean, enre aure, de enr compe dans la modélsaon du ype de corrélaon exsane. De même en cas de séparaon des données la régresson logsque PLS donne des résulas encourageans. Nous avons valdé cee méode de régresson sur des données fnancères, les résulas obenus semblen êre sasfasans. Inroducon La régresson logsque PLS consse à adaper l algorme de régresson PLS unvarée au cas d une varable d nérê qualave, bnare ou ordnale (ssue de l ulsaon érave du maxmum de vrasemblance. Cee méode de régresson logsque PLS rouve son succès dans dvers domanes, e en parculer le domane de la fnance, où les méodes sasques sandard pour la classfcaon ne son pas rès performanes. Nous essayons de monrer dans ce arcule la performance de la régresson Logsque PLS en classfcaon par rappor à la méode de régresson classque. Rappel sur la régresson logsque La dsrbuon logsque es à l orgne du modèle Log qu adme pour foncon de réparon: exp( β F( β + exp( β e pour densé exp( β f( β [ + exp( β ] en prenan le Log on rerouve un modèle lnéare en. S l on noe p la probablé que Y.
La régresson logsque PLS : Applcaon à la déecon de défallance d enreprses On a alors la représenaon suvane : p Y Log( β p e on cerce à esmer les composanes du veceur β. Dans le cas de modèle dcoomque unvaré, pluseurs méodes d esmaon son envsageables. La méode la plus ulsée lorsque la lo des perurbaons es connue celle du maxmum de vrasemblance. 3 La régresson logsque PLS La régresson PLS unvarée es un modèle non lnéare relan une varable dépendane Y à un ensemble de varables ndépendanes quanaves ou qualaves. Elle peu êre obenue par une sue de régressons smples e mulples (Wold, 984. Cee méode es ule lorsque la régresson mulple fonconne mal. Or on peu renconrer des problèmes analogues en régresson logsque. La régresson logsque PLS consse à adaper l algorme de régresson PLS au cas d une varable d nérê qualave, bnare ou ordnale. Il es ule de rappeler que la régresson logsque PLS es unvarée e ne s applque donc qu a la modélsaon d une seule varable d nérê Y que l on cerce à modélser à l ade des varables,, P, canddaes à l explcaon. Nous allons ans décrre l algorme de régresson logsque PLS. -Recerce de la premère composane: -Eape : on calcule les coeffcens de régresson smple de Y sur caque varable. dans la régresson logsque -Eape : La composane PLS s écr alors : Pus on effecue une régresson logsque de Y sur : log Yˆ c + Y c Y Où es le coeffcen de régresson, le veceur des résdus e es la probablé de survenue de l événemen. D ou une premère équaon de régresson :
La régresson logsque PLS : Applcaon à la déecon de défallance d enreprses Yˆ c x +... + c k xk + Y avec Don les coeffcens son faclemen nerpréables. La probablé de survenue de l événemen pour l ndvdu es : exp( c + exp( c K K -Recerce de la deuxème composane : -Eape : oue fos s l on esme que le pouvor explcaf de ce modèle es fable on cerce une deuxème composane, combnason lnéare de, non corrélée à Y e explquan ben le résdu du. Cee composane es combnason lnéare des résdus x des régressons des varables sur la composane : ou p + x p es le coeffcen de régresson de caque sur. -Eape : pour caque valeur de, on calcule le coeffcen de régresson x dans la régresson logsque mulple de Y sur les varables e x. de -Eape 3 : la composane PLS s écr alors : x x où es le résdu de la régresson de sur la premère composane. 3
La régresson logsque PLS : Applcaon à la déecon de défallance d enreprses On peu auss réécrre la composane en foncon des varables nales : p ( On procède ensue à une régresson logsque de Y sur e : log Yˆ c + c + Y c c où e les coeffcens de régresson logsque de Y sur, : Pour la deuxème composane la probablé de survenue de l événemen es : exp( c + c + exp( c s écr en foncon des varables explcaves en remplaçan les composanes, en foncon de : -Recerce de la -ème composane : exp( c + c + exp( c + c -Eape : on calcule le résdu...,, x x, x de la régresson de sur les premères composanes.on noera la -ème colonne de la marce : p +... + p + x -Eape : pour caque valeur de, on calcule le coeffcen de régresson de x,. 4
La régresson logsque PLS : Applcaon à la déecon de défallance d enreprses -Eape 3 : la composane PLS s écr alors : Pour caque composane composanes,..., calculée, on procède à la régresson logsque de Y sur les.l équaon de régresson logsque PLS es obenue en exprman cee équaon en foncon des varables d orgne : log Yˆ c +... + c cx +... + c α où α c +... + c l c l l La probablé de survenue de l événemen de la composane : exp( c +... + c + exp( c + c exp( α + exp( α Nguyen e Rocke (004 on monré que les composanes PLS son des combnasons lnéares des varables d orgne, e que les coeffcens de la combnason lnéare s exprmen à l ade du coeffcen de régresson lnéare de la varable de réponse sur cacun des regresseurs. Ils proposen donc de mner la défnon e de remplacer la régresson lnéare par une régresson logsque. L algorme de régresson logsque PLS se présene comme su : -Eape : calcul des composanes PLS -Eape- : obenr composanes PLS, T (,,, en ulsan l algorme PLS ou Smpls. -Eape : classfcaon Une fos on a calculé les composanes de l éape, on procède à une régresson logsque de Y sur les composanes reenu par valdaon crosée (Umer, 996: 5
La régresson logsque PLS : Applcaon à la déecon de défallance d enreprses log Yˆ c... c p ˆ + + e la probablé de survenue de l événemen s écr alors : exp( c +... + c ˆ p + exp( c +... + c 3 Applcaon Le problème raé es la déecon précoce des défallances d enreprses à parr de raos économques e fnancers sur des données ndvduelles d enreprses un an e deux ans avan la défallance. Nous essayons de comparer les résulas de la régresson logsque e les résulas de la régresson logsque PLS sur un écanllon de 60 enreprses défallane e 60 enreprses sanes, nous esons les deux méodes sur un écanllon d apprenssage (40 sanes e 40 défallanes e un écanllon es (0 sanes e 0 défallanes. Nore varable explcave es dcoomque codée comme su (Y s l enreprse es défallane, Y0 s l enreprse es sane, nous allons explquer cee varable en foncon de 7 raos fnancers qu on le plus for pouvor de dscrmnaon enre les enreprses, nous allons applqué l algorme présené précédemmen. Les résulas de classfcaon de deux méodes son résumés comme su. Ecanllon d apprenssage Logsque PLS Log 95% 93,75% Ecanllon es 96% 9,5% TAB. Taux de bon classemen un an avan la défallance Ecanllon d apprenssage Logsque PLS Log 96,5% 95% Ecanllon es 85% 80% TAB. Taux de bon classemen deux ans avan la défallance 6
La régresson logsque PLS : Applcaon à la déecon de défallance d enreprses Nous pouvons consaer que la régresson logsque PLS donne des résulas melleurs que la régresson logsque smple comme l a monré Basren e Esposo e e (005. La plupar des ravaux raan la probablé de défallance des enreprses abandonnen les raos e les grandeurs compables les plus corrélés ben qu ls semblen avor une fore conrbuon dans l analyse, la régresson PLS perme de reméder ce problème. Parfos l applcaon de la régresson logsque pose un problème. Ce problème nommé problème de séparaon (message affcée par le logcel SAS, l peu ouefos arrver que l on observe des dffculés dans la progresson de l algorme vers la soluon : la foncon du log vrasemblance es maxmale e l esmaeur du maxmum de vrasemblance n exse pas. Généralemen, ces dffculés condusen à l affcage de valeurs anormalemen grandes, en valeur absolue, pour un ou pluseurs paramères de modèle. Cec correspond au cas de la classfcaon parfae dans lequel une ou pluseurs combnasons de varables explcaves permeen de prévor parfaemen la survenue ou le non survenu de l événemen consdéré. Pour résoudre ce problème Nguyen e Rocke (004 proposen une exenson de la régresson PLS à la régresson logsque que perme de résoudre ce problème de séparaon des données. 4 Concluson Les résulas obenus de la régresson logsque PLS son sasfasans. En régresson logsque classque l y a abondance des varables explcaves du modèle dés que la corrélaon exse enre les predceurs. La méode PLS es en quelque sore une réponse au regre qu éprouve l ulsaeur d une régresson pas à pas de devor cosr une seule varable explcave par bloc des varables explcaves. En régresson pas à pas l y a excluson de varables évenuellemen mporanes ; en régresson PLS oues les varables mporanes son conservées e les varables sans mporance son so exclues, so parcpan au modèle, mas avec un pods fable. La plupar des ravaux raan la probablé de défallance des enreprses abandonnen les raos e les grandeurs compables les plus corrélés ands qu ls on une fore conrbuon dans l analyse, de même en ermes de classfcaon la régresson logsque PLS donne des résulas melleurs que la régresson logsque. Dans le cas de séparaon (non convergence de l algorme du maxmum de vrasemblance la régresson logsque PLS donne des résulas assez encourageans. Références Basen, P., V. Esposo, e M. Tenenaus (005: PLS generalsed lnear regresson. Compuaonal Sascs & Daa Analyss, 48:7-46. For, G., e S.L. Lamber (005: Classfcaon usng Paral Leas Squares Penalzed Logsc Regresson. Bonformacs, :04-. Nguyen, D., e D. Rocke (004: On paral leas squares dmenson reducon for mcroarraybased classfcaon: a smulaon sudy. Compuaonal Sascs & Daa Analyss, 46:407-45. Nguyen, D.,e D. Rocke (00a: Mul-class cancer classfcaon va Paral Leas Squares gene expresson profles. Bonformacs, 8:6-6. 7
La régresson logsque PLS : Applcaon à la déecon de défallance d enreprses Nguyen, D.,e D. Rocke (00b:Tumor classfcaon by Paral Leas Squares usng mcroarray gene expresson daa. Bonformacs, 8:39-50. Tenenaus, M., J. Gauc, e C. Menardo (995. Régresson PLS e Applcaons. Revue de Sasques Applquée, 43 :7-63. Summary PLS Logsc regresson s a meod connecng a qualave varable dependen o a un on quanave or qualave explanaory varables. In e presence of correlaon PLS logsc regresson brngs an neresng alernave o e radonal logsc regresson le makng possble, amongs oer ngs, o old accoun n e modelng of e ype of exsng correlaon. In e same ay n e even of separaon of e daa PLS logsc regresson gves encouragng resuls. We valdaed s meod of regresson on fnancal daa; e resuls obaned seem o be sasfacory. 8