Modélisation et diagnostic des systèmes non linéaires par Multi-ACP Mohamed-Faouzi Harkat * Yvon Tharrault ** Gilles Mourot ** José Ragot ** * Université Badji Mokhtar Annaba Faculté des Sciences de l ingénieur, Département d électronique BP. 2, Annaba, 23, Algerie mharkat@univ-annaba.org ** Centre de Recherche en Automatique de Nancy. UMR 739 Nancy-Université, CNRS 2, avenue de la Forêt de Haye. 5456 Vandoeuvre-Lès-Nancy Cedex {yvon.tharraut, gilles.mourot, jose.ragot}@ensem.inpl-nancy.fr RÉSUMÉ. Il a été montré que la combinaison d un ensemble de modèles locaux valides dans une zone de l espace de fonctionnement du système peut donner une meilleure approche pour modéliser des systèmes non linéaires. Nous présentons dans ce papier une nouvelle variante de l analyse en composantes principales non linéaires (ACPNL) pour la modélisation et le diagnostic des systèmes non linéaires. Le modèle ACPNL proposé est représenté par des multimodèles ACP linéaires. Ainsi, une extention du principe de reconstruction, utilisé habituellement dans le cas linéaire, est exploitée à la fois pour la localisation de défauts et la proposition de valeurs de remplacement pour les mesures en défauts. Un exemple de simulation est donné pour montrer les performances de l approche proposée. ABSTRACT. It has been shown that a combination of several models can provide a suitable approach to model nonlinear processes. In the present study, we developed a multiple principal component analysis (PCA) model for fault detection and identification of nonlinear systems. An extension of the reconsruction approach, used with linear PCA model, based on a Non Linear Principal Component Analysis (NLPCA) model is used for fault isolation and for outlier measurement replacement. A simulation example is given to show the performances of the proposed approach. MOTS-CLÉS : Détection de défauts, reconstruction, ACP non linéaire, multi-modèles KEYWORDS: Fault detection, reconstruction, nonlinear PCA, multi-models. 4ème Colloque Interdisciplinaire en Instrumentation, pages à 8
2 4ème Colloque Interdisciplinaire en Instrumentation. Introduction L analyse en composantes principales, si elle a été initialement destinée à la compression de données, est également un outil intéressant pour détecter et localiser des erreurs de mesure et des dysfonctionnements de procédés (Dunia, 996), (Gertler, 997). Cependant, l analyse en composantes principales est une méthode linéaire, alors que la plupart des systèmes physiques ont des comportements non linéaires. Ceci a motivé un certain nombre de travaux pour étendre la portée de l analyse dans un cadre non linéaire (Dong, 994), (Webb, 996) : courbes principales, réseaux de neurones auto-associatifs, analyse en composantes principales non linéaire (NLPCA), réseaux de fonctions de bases radiales (RBF). Cependant, l algorithme des courbes principales donne un modèle non paramétrique, non exploitable pour le diagnostic en temps réel. Tandis que les approches neuronales de l ACPNL posent certains problèmes tels que le problème d itialisation des poids et le problème de convergence des algorithmes d apprentissage. Ainsi, nous proposons, dans ce travail, un modèle ACP non linéaire en combinant plusieurs modèles ACP linéaires. L idée de cette approche est d appréhender le comportement non linéaire d un système par un ensemble de modèles locaux (ACP linéaires) caractérisant le fonctionnement du système dans différentes zones de fonctionnement. Dans le cas de ce modèle, en plus de l identification des modèles locaux, il faut déterminer le nombre de ces modèles ainsi que le nombre de composantes principales à retenir dans chaque modèle. Dans ce travail on ne s intéresse qu à l identification des modèles locaux et à la détermination du nombre de composantes de chaque modèle en supposant que le nombre de modèles est connu. Ainsi, le modèle non linéaire obtenu peut exploiter toutes les approches de détection et d identification de défauts utilisées habituellement dans le cas de l ACP linéaire. En particulier, nous pouvons calculer un indice de détection avec un seuil adaptatif et exploiter le principe de reconstruction, qui dans la version linéaire de l ACP essaye de reconstruire une variable en fonction de toutes les autres variables et du modèle ACP, pour l analyse de valeurs aberrantes et de défauts de fonctionnement. Cet article est organisé comme suit. La deuxième section présentera le principe de modélisation utilisant l ACP non linéaire. La section 3 décrira le principe de détection et de localisation de défaut en utilisant le modèle ACPNL obtenu. La section 4 présentera, dans le cadre de la détection de mesures aberrantes, un exemple d illustration et finalement des conclusions constitueront la dernière section. 2. Modèle ACP Non Linéaire L ACP non linéaire est une extension de l ACP linéaire. Tandis que l ACP cherche à identifier les relations linéaires entre les variables du processus, l objectif de l ACP non linéaire est d extraire à la fois les relations linéaires et non linéaires.
Modélisation et diagnostic des systèmes non linéaires par Multi-ACP 3 2.. ACP linéaire Dans cette partie, nous allons rappeler le principe de l analyse en composantes principales. Soit x(k) = [x (k) x 2 (k)... x m (k)] T le vecteur contenant les m variables observées du système (mesures ou commandes) à l instant k. Considérons la matrice de données X = [x() x(2)... x(n)] T R N m comprenant N observations x(k)(k =,..., N) recueillies sur ce processus en fonctionnement normal. L ACP détermine une transformation optimale (vis-à-vis d un critère de variance) de la matrice de données X : T = XP et X = T P T [] avec T = [t t 2... t m ] R N m, où les t i sont les composantes principales et la matrice P = [p p 2... p m ] R m m, où les vecteurs orthogonaux p i sont les vecteurs propres correspondant aux valeurs propres λ i de la décomposition en valeurs et vecteurs propres de la matrice de covariance (ou de corrélation) Σ de X : Σ = P ΛP T avec P P T = P T P = I m [2] avec Λ = diag(λ... λ m ) une matrice diagonale où les termes diagonaux sont ordonnés dans l ordre décroissant. L équation [] s écrit alors : X = ˆT l ˆP T l + T m l P T m l = ˆX + E [3] avec : et ˆX = XĈl [4] E = X C m l [5] où l indice l représente le nombre de composantes à retenir dans modèle ACP, Ĉ l = T ˆP l ˆP l et Cm l = I m Ĉl constituent le modèle ACP du système. Les matrices ˆX et E représentent, respectivement, les variations modélisées et les variations non modélisées de X à partir de l composantes (l < m). Les l premiers vecteurs propres ˆP l R m l constituent l espace de représentation alors que les (m l) derniers vecteurs propres P m l R m m l constituent l espace résiduel. 2.2. Modélisation par un multi-acp La notion de multi-modèle introduit la définition de zone de fonctionnement dont les limites sont définies par la fonction de validité associée. Pour la détermination des zones d activation des différents modèles locaux on utilise des algorithmes de classification floue.
4 4ème Colloque Interdisciplinaire en Instrumentation 2.2.. Algorithme de classification Fuzzy Gustafson-Kessel (FGK) L algorithme FGK est un algorithme de classification floue fondé sur l optimisation d un critère quadratique de classification où chaque classe est représentée par son centre de gravité et sa matrice de covariance (Gustafson, 979). L algorithme nécessite de connaître le nombre de classes au préalable et génère les classes par un processus itératif en minimisant une fonction objectif. Ainsi, il permet d obtenir une partition floue des données en donnant à chaque échantillon un degré d appartenance à une région donnée. L algorithme utilise l ensemble des mesures X et le nombre de classes ou de région c. Les valeurs des degrés d appartenance sont regroupées dans une matrice U = [µ ik ], avec k N, i c. où µ ik désigne le degré d appartenance de la mesure k à la classe i. L algorithme FGK fait évoluer la partition ( Matrice U ) en minimisant la fonction objectif suivante : J m (U, c) = k i µm ikd 2 ik [6] où m > est un paramètre contrôlant le degré de flou et d 2 ik est une distance qui dépend des données ainsi que de l inverse de la matrice de covariance de chaque groupe. [ d 2 ik = (x k v i ) N F i = k= µ m ik x k v i 2 N k= µ m ik (ρ i det(f i )) /n F i ] (x k v i ) T [7] où F i est la matrice de covariance du ième groupe, v i son centre et ρ i est un paramètre permettant de contrôler son volume. 2.2.2. Multi-ACP Après la phase de classification permettant de déterminer les zones linéaires, ie. matrices de covariance locales et les poids des fonctions d activarions des modèles locaux, des modèles ACP linéaires locaux sont calculés à partir des matrices de covariance locales F i. Le modèle global du système est une combinaison des modèles locaux. Ainsi, l estimation du vecteur de mesure x est lui aussi une combinaison des estimations locales et qui est donnée par l expression suivante : c ˆx(k) = µ ik Ĉ i x(k) [8] i=
Modélisation et diagnostic des systèmes non linéaires par Multi-ACP 5 où µ ik est le poids du ième modèle, Ĉ i est le ième modèle ACP linéaire et c est le nombre des modèles linéaires. La fonction de pondération µ i détermine le degré d activation du modèle local associé. Selon la zone où évolue le sysème, cette fonction indique la contribution plus au moins importante du modèle local (ACP linéaire) correspondant dans le modèle global (ACPNL). 3. Détection et localisation de défauts par ACPNL 3.. Détection L erreur d estimation est donnée par : e(k) = x(k) ˆx(k) [9] Ainsi, un défaut est détecté si : SP E(k) > δ 2 α [] où SP E est l erreur quadratique d estimation (SP E = e T e) et δ 2 α est le seuil de détection qui est lui aussi une combinaison des seuils locaux : δ 2 α = c µ ik δα,(i) 2 [] i= où δα,(i) 2 est le seuil théorique calculer pour le ième modèle ACP linéaire (Box, 954). Il faut noter que cette formulation permet d obtenir un seuil adaptatif en fonction du point de fonctionnement. 3.2. Principe de reconstrcution de variables Dans un premier temps nous allons rappeler le principe de reconstruction dans le cas linéaire. Nous allons montrer l expression du résidu en présence d un défaut d quelconque sur la j eme variable du processus à surveiller après reconstruction. Notons par x (k) le vecteur des mesures à l instant k en absence de défaut et ξ j la direction du défaut. Ainsi on peut écrire que : x(k) = x (k) + ξ j d(k) [2] Le vecteur de mesures reconstruit peut être utilisé pour définir un ensemble de résidus. Pour obtenir ces différents résidus, Dunia et al. (Dunia, 996) ont défini la matrice G j : G T j = [ ξ ξ 2... g j... ξ m ] [3]
6 4ème Colloque Interdisciplinaire en Instrumentation où gj T = c jj [ c T j ct +j ] et les indices j et +j désignent, respectivement, les vecteurs formés par les (j ) premiers et les (m j) derniers éléments du vecteur c j. Où c j est la jème ligne de la matrice Ĉ. G j permet de calculer le vecteur de mesures reconstruit x j en utilisant le vecteur d entrée x : x j (k) = G j x(k) = [ x (k)... z j (k)... x m (k) ] T [4] où z j (k) est la valeur reconstruite de la jème variable. Ainsi, on peut définir l erreur d estimation après reconstruction : ( ) ( ) e r (k) = I Ĉ G j x(k) = I Ĉ G j (x (k) + ξ i d(k)) [5] A partir de l expression du résidus e r (k) on peut montrer que si la variable en défaut (la ième) est la variable reconstruite (i = j), le défaut est éliminé et aucun résidu n est affecté. Ainsi, on peut écrire : e r,i (k) = { si i = j si i j [6] où e r,i (k) est la ième composante du vecetur d erreur e r (k) De la même façon, nous pouvons reconstruire les différentes variables en exploitant la formule classique de reconstruction dans le cas linéaire. Dans ce cas, la reconstruction avec le modèle ACPNL est une combinaison des reconstructions locales (reconstruction obtenue par le modèle local associé). On obtient dans le cas non linéaire (multi-acp) : z j (k) = M µ ik z j,(i) (k) [7] i= où z j,(i) (k) est la reconstruction de la jème variable en utilisant le ième modèle ACP linéaire. La reconstruction dans ce cas peut être utilisée, comme dans le cas linéaire, pour la localisation de défauts. Cette méthode consiste à éliminer l influence du défaut sur l indicateur de détection lorsque la variable en défaut est reconstruite. La recontruction de la variable supposée en défaut est effectuée en se basant sur le modèle déjà calculé et les mesures des autres variables. L analyse de l indice de détection SP E avant et après reconstruction permet de localiser la variable incriminée. 4. Exemple Pour illustrer cette approche, nous allons présenter un exemple non linéaire simple. L exemple choisi est décrit par les équations suivantes :
Modélisation et diagnostic des systèmes non linéaires par Multi-ACP 7 x = u 2 +.3 sin(2πu) + ε x 2 = u + ε 2 x 3 = u 3 + u + + ε 3 [8] où u [, ] est une variable aléatoire uniforme et ε i un bruit aléatoire uniformément distribué dans l intervalle [.,.]. Le multi-acp utilisé est constitué de cinq modèles locaux. La figure présente l évolution des cinq fonctions d activation des différents modèles. L estimation de la courbe de l exemple traité avec Multi-ACP, est illustrée sur la figure 2. La figure 3 présente l évolution de l indice de détection SP E en absence puis en présence d un défauts affectant la première variable x à partir de l instant 3 avec un seuil de détection adaptatif. Une fois le défaut détecté, nous cherchons à localiser la variable en défaut. Pour cela, nous appliquons la procédure de localisation basée sur le principe de reconstruction. La figure 4 présente l évolution des indices SP E, SP E 2 et SP E 3 calculés, respectivement, après reconstruction de x, x 2 et de x 3. Comme on peut le constater, l indice qui ne présente pas de dépassement de son seuil de détection est bien SP E. Ce qui indice que x est la variable incriminée. Enfin, nous proposons des valeurs de remplacement pour les mesures en défaut et la figure 5 présente l évolution de la variable x, en absence de défaut, avec défaut et après reconstrcution. Il est claire que la reconstruction est une estimation très satisfaisante de la variable en absence de défaut. Fonctions d activation des modèles locaux.5 µ.5 5 5 2 25 3 35 4 µ 2 4 3 Mesures Estimations 5 5 2 25 3 35 4 2.5 µ 3 x 3 5 5 2 25 3 35 4.5.5 µ 4 5 5 2 25 3 35 4 µ 5 5 5 2 25 3 35 4 2.5.5 x 2.5.5.5.5 x.5 Figure. Evolution des fonctions d activation des modèles locaux Figure 2. Evolution des mesures et leurs estimations 5. Conclusion Dans ce papier nous avons présenté une nouvelle variante de l analyse en composantes principale non linéaire. Cette variante utilise le principe du multi-acp, qui est une combinaison d un ensemble de modèles ACP locaux valides dans une zone de l espace de fonctionnement du système. Les résidus sont générés pour la détection
8 4ème Colloque Interdisciplinaire en Instrumentation SPE en absence de défauts..5 Seuil de détection.5 SPE. 5 5 2 25 3 35 4 5 5 2 25 3 35 4 SPE 2.4.3.2.4. SPE avec défauts.3.2. Seuil de détection SPE 3.3.2. 5 5 2 25 3 35 4 5 5 2 25 3 35 4 5 5 2 25 3 35 4 Figure 3. Evolution des SPE en absence et en présence d un défaut affectant la première variable Figure 4. Localisation de la variable en défaut par reconstruction.4.2 Mesures sans défaut Mesures avec défaut Mesures reconstruites.8 Variable x.6.4.2.2.4 2 22 24 26 28 3 32 34 36 38 4 Figure 5. Reconstruction de la variable incriminée et proposition de valeurs de remplacement des mesures aberrantes de défauts avec un seuil adaptatif. En exploitant le principe de reconstruction dans le cas linéaire, nous proposons pour la première fois une expression analytique pour la recosntcruction dans le cas non linéaire. Une extention de ce même principe pour la localisation de défauts est également proposée et illustrée sur un exemple de simulation. Dans nos futurs travaux nous envisageons d étendre le principe de reconstruction pour la recherche des paramètres structurels du modèle. Remerciement Ce travail a été réalisé avec le soutien du programme TASSILI n 7 MDU 74.
Modélisation et diagnostic des systèmes non linéaires par Multi-ACP 9 6. Bibliographie [GUS 79] GUSTAFSON D. AND W. KESSEL, «Fuzzy clustering with a fuzzy covariance matrix», In Proc. IEEE CDC, San Diego, CA, USA, 979. [BOX 54] BOX G. E. P., «Some theorems on quadratic forms applied in the study of analysis of variance problems : Effect of inequality of variance in one-way classification», The Annals of Mathematical Statistics,, vol. 25, 954, p. 29-32. [DUN 96] DUNIA R., QIN S. J., EDGAR T. F., «Identification of faulty sensors using principal component analysis», AIChE Journal, vol. 42, n o, 996, p. 2797-282. [GER 97] GERTLER J., MCAVOY T. J., «Principal component analysis and parity relations - A strong duality», IFAC Conference SAFEPROCESS, Hull, UK 997, p. 837-842. [WEB 96] WEBB A. R., «An approach to nonlinear principal component analysis using radially symmetric kernel functions», Statist. Comput., vol. 6, 996, p. 59-68. [WIS 96] WISE B. M. AND GALLAGHER N. B., «The process chemometrics approach to process monitoring and fault detection», Journal of Process Control vol. 6, 996, p. 329-348.