a) La technique de l analyse discriminante linéaire : une brève présentation. Nous nous limiterons ici à l'analyse discriminante linéaire et à deux groupes : - linéaire, la variante utilisée par ALTMAN dans ses travaux et par la plupart des auteurs ayant adopté cette méthode de classification. - à 2 groupes, l'enjeu pour un utilisateur potentiel étant de prévoir suffisamment de temps à l'avance si une entreprise, candidate à un prêt bancaire, appartiendra au groupe des entreprises saines (1er groupe) ou au groupe des entreprises défaillantes (2e groupe), l'ensemble des situations particulières des entreprises concernées se ramenant à l'un de ces 2 groupes, et seulement à l'un de ces 2 groupes. 3 étapes de la méthode doivent être distinguées : - la première étape correspond à la constitution de la banque de données, c'est à dire, en l'occurence, la constitution de deux échantillons de base, l'un regroupant un ensemble d'entreprises ayant au cours d'une période donnée été confrontées à un dépot de bilan, l'autre regroupant un ensemble d'entreprises présumées saines n'ayant pas au cours de la même période été confrontées au même problème. Dans l'un et l'autre cas, il appartiendra à l'observateur de collectionner pour chaque entreprise les données comptables et financières des n exercices antérieurs à l'année du dépot de bilan, et d'en tirer une base de X ratios jugés significatifs de la situation financière de l'entreprise de l'année concernée. - la seconde étape correspond à la phase d'analyse proprement dite, consistant à étudier, via l'usage de la technique d'analyse discriminante, le potentiel prédictif de chacun des ratios retenus, et la détermination de la fonction discriminante la plus efficace, telle que le nombre d'erreurs de classement de la fonction discriminante appliquée à l'échantillon de départ soit minimisé. A supposer que dans une première étape l'on ne s'intéresse qu'à 2 ratios, l'un représentatif de la rentabilité des entreprises concernées (X1) et l'autre représentatif de leur niveau d'endettement (X2) et qu'après représentation graphique dans un système d'axes (X1, X2) des caractéristiques financières des entreprises des 2 échantillons de base (les entreprises connues pour avoir déposé leur bilan au cours de la période étant représentées par un x, les entreprises saines par un o.) l'on obtienne le graphique suivant :
Les Etapes de l'analyse discriminante linéaire multiple appliquée à la décision bancaire en matière d'octroi de crédit.. identifier les caractéristiques financières X1, X2, Xn... susceptibles d'aboutir à une fonction Z Z = a0 + b1 x1 + b2 X2 + b3 X3 +... + bn Xn Phase I telle que : Z1 et Z2 soient les plus éloignées possible la zone de recouvrement soit la plus faible possible le nombre de bons classements soit le plus élevé possible dans l'échantillon de référence et l'échantillon de validation.. évaluer le Zc, Z limite, en deçà duquel le banquier aurait intérêt à apporter une réponse négative à la demande de crédit, compte tenu a) des résultats statistiques obtenus à partir de la Fonction score b) du coût associé à une éventuelle erreur de classement du demandeur de crédit. q1. C1 Phase II Zc = Log ---------- q2. C2 avec Zc = Z limite optimal q1 = probabilité a priori de non remboursement du Crédit q2 = probabilité a priori de remboursement du crédit C1 = coût de l'erreur de classement 1 (défaillante qualifiée de saine) C2 = coût de l'erreur de classement 2 (saine qualifiée de défaillante)
La méthode d'analyse discriminante linéaire consiste à identifier la droite qui, traversant le double nuage des points représentatif des 2 catégories d'entreprises,aura le meilleur pouvoir séparateur ( discriminant) des 2 populations d'entreprises, c'est à dire tel que. la distance Z1 et Z2 soit maximisée. la zone de recouvrement des 2 distributions des Z calculés pour les entreprises appartenant aux 2 groupes soit la plus faible possible,. le nombre de bons clasements (entreprise défaillante classée comme défaillante par le modèle, entreprise saine classée comme saine par le modèle) soit le plus élevé possible tant dans l'échantillon de référence que dans l'échantillon de validation. Se situant dans un plan X1 O X2, la droite discriminante (fonction score) peut être définie par une fonction de X1 et X2, f (X1, X2),et peut être représentée par : Z = a0 + b1 X1 + b2 X2 X1 et X2 étant les mesures des ratios retenus dans la fonction score résultante b1 et b2 étant les valeurs des coefficients discriminants associés à chacun de ces ratios a0 étant une constante 1, représentative de l'ensemble des ratios jouant un rôle dans le phénomène observé (l'échec de l'entreprise) mais non pris en considération dans la fonction résultante. Z étant le score de l'entreprise pour un couple (X1, X2) la fonction score la meilleure étant obtenue au terme d'une procédure pas-à-pas, consistant à intégrer à la fonction Z les ratios, dans l'ordre de leur contribution discriminante 2 f (X1) f (X1, X2) f (X1, X2, X3) f (X1, X2, X3, X4)... f (X1, X2, X3, X4,...,Xn) tant que le pouvoir discriminant de la Fonction score progresse avec l'introduction d'un ratio supplémentaire, la fonction score retenue étant celle pour laquelle le % de bons classements x1 + y2 N des N entreprises de l'échantillon de base est maximisé (avec n variables). 1 cette dernière pouvant être éventuellement égale à 0, si l'on adopte une variante particulière de la méthode d'analyse discriminante, très largement employée, consistant à contraindre la constante a0 à prendre la valeur zéro (constante forcée à l'origine). 2 bi σi ou bi (x i1 - x i2 ) selon les cas, la première ayant été notamment utilisée par ALTMAN (1968), la seconde proposée par JOY et TOLLEFSON (1975).
groupes d'appartenance réelle Défaillantes Saines groupes des entreprises déclarées Défaillantes Saines x1 x2 y1 y2 x = x1 + x2 = effectifs dans l'échantillon de base des entreprises défaillantes y = y1 + y2 = effectifs dans l'échantillon de base des entreprises saines N = x+ y = effectifs totaux de l'échantillon de base bons classements = x1 + y2 mauvais classements = y1 + x2 = erreurs de type 2 + erreurs de type 1 Au terme de la procédure, l'analyste dispose d'une fonction discriminante de forme générale Z = a0 + a1 X1 + a2 X2 + a3 X3 + a4 X4 +...+ an Xn Z, le score, correspondant à la valeur d'une moyenne pondérée où les Xi sont les ratios qui permettent de prévoir le mieux la réalité, et les i les a poids qu'il convient d'affecter à chacun d'eux; ce Z apparaît donc comme une note synthétique unique, comme dans les exemples étudiés précédemment, mais qui a toutefois l'avantage par rapport à ces exemples antérieurs, d'être moins subjective dans la mesure où tant le choix des ratios de la fonction Z que les poids accordés à chacun d'eux ne sont pas laissés au libre-choix de l'utilisateur, mais résultent directement de l'objectif recherché à travers l'usage de la technique d'analyse discriminante, à savoir l'identification la plus précise possible de l'identité des entreprises qui feront l'objet d'une procédure judiciaire. Dans ce cadre de référence, l'entreprise aura d'autant moins de chances de faire faillite que le Z calculé à partir de ses caractéristiques financières sera plus élevé. - la troisième étapecorrespond à la phase de validation des résultats trouvés : pour pouvoir utiliser la fonction score à des fins prévisionnelles, encore convient-il de vérifier sa pertinence à partir d'un autre échantillon que celui à partir duquel elle a été calculée. Seuls les résultats obtenus (% de bons classements) à partir d'un autre échantillonque l échantillon initial (l'échantillon de validation) permettront de juger du caractère prédictif de la fonction obtenue, celle-ci étant d'autant meilleure que le taux de bons classements, pour chacune des années précédant l'année du dépot de bilan, sera plus proche de 100 %. La fonction score obtenue sera en outre d'autant meilleure qu'elle fournira longtemps de bons résultats dans le cadre de son exploitation bancaire courante, tout affaiblissement constaté de son pouvoir discriminant nécessitant une refonte de cette fonction discriminante sur les bases qui ont été développées précédemment. - Règle de décision bancaire et analyse discriminante : le score-limite Zc Lors de la présentation précédente, nous avons fait référence à la notion de score, plus ou moins élevé selon la qualité du demandeur de crédit. Dès lors, une règle de décision possible en matière d'octroi de crédit, pourrait être de s'appuyer sur le score obtenu, calculé à partir de la fonction discriminante obtenue, pour un demandeur de crédit. A titre d'exemple, à un score Z calculé inférieur à 0 serait associée un refus de crédit, à un score Z
calculé supérieur à 0 serait associé un accord de crédit. Z = 0 jouerait ici le rôle d'un scorelimite, élément essentiel de la décision. Ce choix du niveau Zc = 0 est toutefois ici tout à fait arbitraire. Il nous reste à préciser le mode de détermination de Zc, après prise en considération des facteurs censés influencer le choix d'un tel niveau de Zc. Un premier élément d'appréciation est l'observation des limites de la zone de recouvrement (cf; graphique précédent) Zl Zm, correspondant à l'étendue de variation du Z calculé pour laquelle on ne saurait dire si un Z calculé appartenant à cette zone doit être associé à une entreprise saine ou à une entreprise défaillante. A cette zone de recouvrement correspond une zone d'incertitude dans l'utilisation des résultats du modèle, à l'inverse des autres zones pour lesquelles le modèle fournit une réponse non ambigüe (sociétés défaillantes si Z < Zl, sociétés saines si Z > Zm). Face à cette situation, une première solution pourrait être de limiter l'utilisation du modèle aux 2 catégories extrêmes, l'abandonnant pour le traitement de la partie centrale, au risque d'éliminer du diagnostic bon nombre de dossiers intermédiaires. Une seconde solution pourrait être, au terme de cette première étape, de mettre l'accent sur les cas à problème et d'envisager une seconde analyse discriminante sur l'échantillon réduit des dossiers incertains, et de mettre à jour une fonction discriminante complémentaire susceptible d'opérer le tri entre entreprises défaillantes et entreprises saines, les premières seules posant problème. Une troisième solution, plus simple, consiste à déterminer par le calcul un score limite Zc, se situant entre Zl et Zm, qui, unique, départagera le domaine de variation de Z en 2 zones et non trois comme dans la 1ère solution, et sur la base duquel sera prise la décision d'affecter telle ou telle entreprise à telle ou telle classe. C'est la troisième solution qui a été la plus fréquemment retenue par les divers utilisateurs de l'analyse discriminante linéaire multiple appliquée à la décision d'octroi de crédit. 3 Cette troisième solution consiste à calculer un seuil qualifié de seuil-critique ou de score-limite Zc, d'expression générale : q1.c1 Zc = Log --------- q2.c2 avec Zc = seuil-critique ou score -limite q1 = probabilité a priori de faillite de l'entreprise q2 = probabilité a priori de non faillite de l'entreprise C1 = coût de l'éventuelle erreur de classement de type 1 (consistant à déclarer saine, au terme de l'utilisation du modèle une entreprise qui déposera ultérieurement son bilan. Dans ce cas de figure, le coût de l'erreur correspond à la perte sèche de la partie du 3 la seconde ayant été notamment retenue dans l'application 1984 de la fonction score Banque de France que nous analyserons plus loin avant d'être abandonnée quelques annéesplus tard lors de sa reformulation et extension.
capital non encore remboursée à la date du dépot de bilan,qui ne pourra pas être recouvrée par celle-ci. C2 = coût de l'éventuelle erreur de classement de type 2 (consistant à déclarer défaillante, au terme de l'utilisation du modèle, une entreprise qui finalement échappera au dépot de bilan.. Le fait pour la banque de l'avoir considérée comme défaillante potentielle, et de lui avoir refusé le crédit qu'elle demandait, aura pour la banque un coût, le coût d'opportunité associé au produit net bancaire perdu du fait de ne pas avoir réalisé cette opération de prêt ou,si le client à la suite de ce refus cesse toute relation d affaires avec elle,le coût d opportunité associé à la perte de la totalité du Produit net bancaire global qu aurait assurée l entreprise à l établissement bancaire au cours des années ultérieures. A titre d'exemple, dans le cas d'une situation où q1 et q2 seraient estimés identiques (q1 = q2 = 0.50) et où C1 et C2 seraient également estimés identiques, la formulation précédente conduirait à un Zc égal à Zc = Log 1 = 0 le niveau 0 constituant alors le score-limite en deçà duquel toute entreprise sera considérée comme potentiellement défaillante, au delà duquel toute entreprise sera considérée comme saine. Il convient toutefois de considérer que les probabilités a priori de dépot de bilan dans une économie donnée sont différentes de la probabilité associée à l'échantillon de référence. Ansi, dans l'économie française estime t-on actuellement à 3,3 % environ le taux annuel de défaillance d'une société industrielle estimé sur la base de la comparaison entre dépots les de bilan constatés et les effectifs de sociétés en activité. q1 et q2 peuvent donc être estimés respectivement,sur un horizon de 3 ans,à 10 % et 90%. Il convient également de considérer que les coûts C1 et C2,les coûts des erreurs de classement potentielles ne sont pas non plus de même ampleur. A supposer que l'on estime C1 cinq fois plus coûteuse que C2 Zc, devient alors : 0.10x 5 Zc = Log --------------- = Log (0.555) = - 0.59 0.90x 1 la règle de décision bancaire étant désormais ce nouveau seuil, traduisant une plus grande disposition du système bancaire à prêter, compte tenu du rapport retenu des coûts des erreurs de classement éventuelles, et d'une estimation plus faible du taux de faillite potentielle des entreprises concernées à l'échelon national.