Modélisation et diagnostic des systèmes non linéaires par Multi-ACP



Documents pareils
Principe de symétrisation pour la construction d un test adaptatif

Filtrage stochastique non linéaire par la théorie de représentation des martingales

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

Echantillonnage Non uniforme

1 Complément sur la projection du nuage des individus

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

Exercice : la frontière des portefeuilles optimaux sans actif certain

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Classification Automatique de messages : une approche hybride

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Exemple PLS avec SAS

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Économetrie non paramétrique I. Estimation d une densité

La classification automatique de données quantitatives

Introduction à l approche bootstrap

Évaluation de la régression bornée

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Quantification Scalaire et Prédictive

Programmation linéaire

Transmission d informations sur le réseau électrique

3 Approximation de solutions d équations

NON-LINEARITE ET RESEAUX NEURONAUX

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN

CONFERENCE PALISADE. Optimisation robuste d un plan d expériences par simulation Monte-Carlo Concepts de «Design Space» et de «Quality by Design»

La Recherche du Point Optimum de Fonctionnement d un Générateur Photovoltaïque en Utilisant les Réseaux NEURO-FLOUS

Big Data et Graphes : Quelques pistes de recherche

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Big Data et Graphes : Quelques pistes de recherche

Laboratoire 4 Développement d un système intelligent

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

Chapitre 2 Le problème de l unicité des solutions

FIMA, 7 juillet 2005

A METHOD FOR THE DESIGN OF NEURO-FUZZY CONTROLLERS; AN APPLICATION IN ROBOT LEARNING

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

Régulation directe adaptative et prédictive sur plusieurs pas de temps pour processus à plusieurs entrées et plusieurs sorties.

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Laboratoire d Automatique et Productique Université de Batna, Algérie

Commun à tous les candidats

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Gestion obligataire passive

Simulation de variables aléatoires

Résolution d équations non linéaires

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Cours 02 : Problème général de la programmation linéaire

Analyse fonctionnelle Théorie des représentations du groupe quantique compact libre O(n) Teodor Banica Résumé - On trouve, pour chaque n 2, la classe

Soutenance de stage Laboratoire des Signaux et Systèmes

INF6304 Interfaces Intelligentes

Analyse en Composantes Principales

Modélisation géostatistique des débits le long des cours d eau.

Optimisation et programmation mathématique. Professeur Michel de Mathelin. Cours intégré : 20 h

OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT)

CURRICULUM VITAE. Informations Personnelles

BIG Data et R: opportunités et perspectives

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Résolution de systèmes linéaires par des méthodes directes

Représentation des Nombres

Apprentissage Automatique

Forthcoming Database

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Application de l AMDEC à un satellite en phase active

Contrôle par commande prédictive d un procédé de cuisson sous infrarouge de peintures en poudre.

Le théorème des deux fonds et la gestion indicielle

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

Détection et suivi d'objets dans une séquence d'images par contours actifs

Monitoring elderly People by Means of Cameras

Théorèmes de Point Fixe et Applications 1

Apprentissage non paramétrique en régression

Équation de Langevin avec petites perturbations browniennes ou

Prédiction et Big data

Cours d analyse numérique SMI-S4

Préparée au Laboratoire d'analyse et d'architecture des Systèmes du CNRS. Spécialité : Systèmes Automatiques. Par CLAUDIA VICTORIA ISAZA NARVAEZ

Revision of hen1317-5: Technical improvements

Introduction au Data-Mining

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

Texte Agrégation limitée par diffusion interne

Commande Prédictive. J. P. Corriou. LSGC-ENSIC-CNRS, Nancy. corriou@ensic.inpl-nancy.fr

Interception des signaux issus de communications MIMO

LA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE

CHAPITRE I. Modélisation de processus et estimation des paramètres d un modèle

Programmation linéaire et Optimisation. Didier Smets

PROBABILITES ET STATISTIQUE I&II

PROJET MODELE DE TAUX

Une méthode d apprentissage pour la composition de services web

Coup de Projecteur sur les Réseaux de Neurones

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

TABLE DES MATIERES. C Exercices complémentaires 42


Etude des propriétés empiriques du lasso par simulations

L utilisation d un réseau de neurones pour optimiser la gestion d un firewall

Transcription:

Modélisation et diagnostic des systèmes non linéaires par Multi-ACP Mohamed-Faouzi Harkat * Yvon Tharrault ** Gilles Mourot ** José Ragot ** * Université Badji Mokhtar Annaba Faculté des Sciences de l ingénieur, Département d électronique BP. 2, Annaba, 23, Algerie mharkat@univ-annaba.org ** Centre de Recherche en Automatique de Nancy. UMR 739 Nancy-Université, CNRS 2, avenue de la Forêt de Haye. 5456 Vandoeuvre-Lès-Nancy Cedex {yvon.tharraut, gilles.mourot, jose.ragot}@ensem.inpl-nancy.fr RÉSUMÉ. Il a été montré que la combinaison d un ensemble de modèles locaux valides dans une zone de l espace de fonctionnement du système peut donner une meilleure approche pour modéliser des systèmes non linéaires. Nous présentons dans ce papier une nouvelle variante de l analyse en composantes principales non linéaires (ACPNL) pour la modélisation et le diagnostic des systèmes non linéaires. Le modèle ACPNL proposé est représenté par des multimodèles ACP linéaires. Ainsi, une extention du principe de reconstruction, utilisé habituellement dans le cas linéaire, est exploitée à la fois pour la localisation de défauts et la proposition de valeurs de remplacement pour les mesures en défauts. Un exemple de simulation est donné pour montrer les performances de l approche proposée. ABSTRACT. It has been shown that a combination of several models can provide a suitable approach to model nonlinear processes. In the present study, we developed a multiple principal component analysis (PCA) model for fault detection and identification of nonlinear systems. An extension of the reconsruction approach, used with linear PCA model, based on a Non Linear Principal Component Analysis (NLPCA) model is used for fault isolation and for outlier measurement replacement. A simulation example is given to show the performances of the proposed approach. MOTS-CLÉS : Détection de défauts, reconstruction, ACP non linéaire, multi-modèles KEYWORDS: Fault detection, reconstruction, nonlinear PCA, multi-models. 4ème Colloque Interdisciplinaire en Instrumentation, pages à 8

2 4ème Colloque Interdisciplinaire en Instrumentation. Introduction L analyse en composantes principales, si elle a été initialement destinée à la compression de données, est également un outil intéressant pour détecter et localiser des erreurs de mesure et des dysfonctionnements de procédés (Dunia, 996), (Gertler, 997). Cependant, l analyse en composantes principales est une méthode linéaire, alors que la plupart des systèmes physiques ont des comportements non linéaires. Ceci a motivé un certain nombre de travaux pour étendre la portée de l analyse dans un cadre non linéaire (Dong, 994), (Webb, 996) : courbes principales, réseaux de neurones auto-associatifs, analyse en composantes principales non linéaire (NLPCA), réseaux de fonctions de bases radiales (RBF). Cependant, l algorithme des courbes principales donne un modèle non paramétrique, non exploitable pour le diagnostic en temps réel. Tandis que les approches neuronales de l ACPNL posent certains problèmes tels que le problème d itialisation des poids et le problème de convergence des algorithmes d apprentissage. Ainsi, nous proposons, dans ce travail, un modèle ACP non linéaire en combinant plusieurs modèles ACP linéaires. L idée de cette approche est d appréhender le comportement non linéaire d un système par un ensemble de modèles locaux (ACP linéaires) caractérisant le fonctionnement du système dans différentes zones de fonctionnement. Dans le cas de ce modèle, en plus de l identification des modèles locaux, il faut déterminer le nombre de ces modèles ainsi que le nombre de composantes principales à retenir dans chaque modèle. Dans ce travail on ne s intéresse qu à l identification des modèles locaux et à la détermination du nombre de composantes de chaque modèle en supposant que le nombre de modèles est connu. Ainsi, le modèle non linéaire obtenu peut exploiter toutes les approches de détection et d identification de défauts utilisées habituellement dans le cas de l ACP linéaire. En particulier, nous pouvons calculer un indice de détection avec un seuil adaptatif et exploiter le principe de reconstruction, qui dans la version linéaire de l ACP essaye de reconstruire une variable en fonction de toutes les autres variables et du modèle ACP, pour l analyse de valeurs aberrantes et de défauts de fonctionnement. Cet article est organisé comme suit. La deuxième section présentera le principe de modélisation utilisant l ACP non linéaire. La section 3 décrira le principe de détection et de localisation de défaut en utilisant le modèle ACPNL obtenu. La section 4 présentera, dans le cadre de la détection de mesures aberrantes, un exemple d illustration et finalement des conclusions constitueront la dernière section. 2. Modèle ACP Non Linéaire L ACP non linéaire est une extension de l ACP linéaire. Tandis que l ACP cherche à identifier les relations linéaires entre les variables du processus, l objectif de l ACP non linéaire est d extraire à la fois les relations linéaires et non linéaires.

Modélisation et diagnostic des systèmes non linéaires par Multi-ACP 3 2.. ACP linéaire Dans cette partie, nous allons rappeler le principe de l analyse en composantes principales. Soit x(k) = [x (k) x 2 (k)... x m (k)] T le vecteur contenant les m variables observées du système (mesures ou commandes) à l instant k. Considérons la matrice de données X = [x() x(2)... x(n)] T R N m comprenant N observations x(k)(k =,..., N) recueillies sur ce processus en fonctionnement normal. L ACP détermine une transformation optimale (vis-à-vis d un critère de variance) de la matrice de données X : T = XP et X = T P T [] avec T = [t t 2... t m ] R N m, où les t i sont les composantes principales et la matrice P = [p p 2... p m ] R m m, où les vecteurs orthogonaux p i sont les vecteurs propres correspondant aux valeurs propres λ i de la décomposition en valeurs et vecteurs propres de la matrice de covariance (ou de corrélation) Σ de X : Σ = P ΛP T avec P P T = P T P = I m [2] avec Λ = diag(λ... λ m ) une matrice diagonale où les termes diagonaux sont ordonnés dans l ordre décroissant. L équation [] s écrit alors : X = ˆT l ˆP T l + T m l P T m l = ˆX + E [3] avec : et ˆX = XĈl [4] E = X C m l [5] où l indice l représente le nombre de composantes à retenir dans modèle ACP, Ĉ l = T ˆP l ˆP l et Cm l = I m Ĉl constituent le modèle ACP du système. Les matrices ˆX et E représentent, respectivement, les variations modélisées et les variations non modélisées de X à partir de l composantes (l < m). Les l premiers vecteurs propres ˆP l R m l constituent l espace de représentation alors que les (m l) derniers vecteurs propres P m l R m m l constituent l espace résiduel. 2.2. Modélisation par un multi-acp La notion de multi-modèle introduit la définition de zone de fonctionnement dont les limites sont définies par la fonction de validité associée. Pour la détermination des zones d activation des différents modèles locaux on utilise des algorithmes de classification floue.

4 4ème Colloque Interdisciplinaire en Instrumentation 2.2.. Algorithme de classification Fuzzy Gustafson-Kessel (FGK) L algorithme FGK est un algorithme de classification floue fondé sur l optimisation d un critère quadratique de classification où chaque classe est représentée par son centre de gravité et sa matrice de covariance (Gustafson, 979). L algorithme nécessite de connaître le nombre de classes au préalable et génère les classes par un processus itératif en minimisant une fonction objectif. Ainsi, il permet d obtenir une partition floue des données en donnant à chaque échantillon un degré d appartenance à une région donnée. L algorithme utilise l ensemble des mesures X et le nombre de classes ou de région c. Les valeurs des degrés d appartenance sont regroupées dans une matrice U = [µ ik ], avec k N, i c. où µ ik désigne le degré d appartenance de la mesure k à la classe i. L algorithme FGK fait évoluer la partition ( Matrice U ) en minimisant la fonction objectif suivante : J m (U, c) = k i µm ikd 2 ik [6] où m > est un paramètre contrôlant le degré de flou et d 2 ik est une distance qui dépend des données ainsi que de l inverse de la matrice de covariance de chaque groupe. [ d 2 ik = (x k v i ) N F i = k= µ m ik x k v i 2 N k= µ m ik (ρ i det(f i )) /n F i ] (x k v i ) T [7] où F i est la matrice de covariance du ième groupe, v i son centre et ρ i est un paramètre permettant de contrôler son volume. 2.2.2. Multi-ACP Après la phase de classification permettant de déterminer les zones linéaires, ie. matrices de covariance locales et les poids des fonctions d activarions des modèles locaux, des modèles ACP linéaires locaux sont calculés à partir des matrices de covariance locales F i. Le modèle global du système est une combinaison des modèles locaux. Ainsi, l estimation du vecteur de mesure x est lui aussi une combinaison des estimations locales et qui est donnée par l expression suivante : c ˆx(k) = µ ik Ĉ i x(k) [8] i=

Modélisation et diagnostic des systèmes non linéaires par Multi-ACP 5 où µ ik est le poids du ième modèle, Ĉ i est le ième modèle ACP linéaire et c est le nombre des modèles linéaires. La fonction de pondération µ i détermine le degré d activation du modèle local associé. Selon la zone où évolue le sysème, cette fonction indique la contribution plus au moins importante du modèle local (ACP linéaire) correspondant dans le modèle global (ACPNL). 3. Détection et localisation de défauts par ACPNL 3.. Détection L erreur d estimation est donnée par : e(k) = x(k) ˆx(k) [9] Ainsi, un défaut est détecté si : SP E(k) > δ 2 α [] où SP E est l erreur quadratique d estimation (SP E = e T e) et δ 2 α est le seuil de détection qui est lui aussi une combinaison des seuils locaux : δ 2 α = c µ ik δα,(i) 2 [] i= où δα,(i) 2 est le seuil théorique calculer pour le ième modèle ACP linéaire (Box, 954). Il faut noter que cette formulation permet d obtenir un seuil adaptatif en fonction du point de fonctionnement. 3.2. Principe de reconstrcution de variables Dans un premier temps nous allons rappeler le principe de reconstruction dans le cas linéaire. Nous allons montrer l expression du résidu en présence d un défaut d quelconque sur la j eme variable du processus à surveiller après reconstruction. Notons par x (k) le vecteur des mesures à l instant k en absence de défaut et ξ j la direction du défaut. Ainsi on peut écrire que : x(k) = x (k) + ξ j d(k) [2] Le vecteur de mesures reconstruit peut être utilisé pour définir un ensemble de résidus. Pour obtenir ces différents résidus, Dunia et al. (Dunia, 996) ont défini la matrice G j : G T j = [ ξ ξ 2... g j... ξ m ] [3]

6 4ème Colloque Interdisciplinaire en Instrumentation où gj T = c jj [ c T j ct +j ] et les indices j et +j désignent, respectivement, les vecteurs formés par les (j ) premiers et les (m j) derniers éléments du vecteur c j. Où c j est la jème ligne de la matrice Ĉ. G j permet de calculer le vecteur de mesures reconstruit x j en utilisant le vecteur d entrée x : x j (k) = G j x(k) = [ x (k)... z j (k)... x m (k) ] T [4] où z j (k) est la valeur reconstruite de la jème variable. Ainsi, on peut définir l erreur d estimation après reconstruction : ( ) ( ) e r (k) = I Ĉ G j x(k) = I Ĉ G j (x (k) + ξ i d(k)) [5] A partir de l expression du résidus e r (k) on peut montrer que si la variable en défaut (la ième) est la variable reconstruite (i = j), le défaut est éliminé et aucun résidu n est affecté. Ainsi, on peut écrire : e r,i (k) = { si i = j si i j [6] où e r,i (k) est la ième composante du vecetur d erreur e r (k) De la même façon, nous pouvons reconstruire les différentes variables en exploitant la formule classique de reconstruction dans le cas linéaire. Dans ce cas, la reconstruction avec le modèle ACPNL est une combinaison des reconstructions locales (reconstruction obtenue par le modèle local associé). On obtient dans le cas non linéaire (multi-acp) : z j (k) = M µ ik z j,(i) (k) [7] i= où z j,(i) (k) est la reconstruction de la jème variable en utilisant le ième modèle ACP linéaire. La reconstruction dans ce cas peut être utilisée, comme dans le cas linéaire, pour la localisation de défauts. Cette méthode consiste à éliminer l influence du défaut sur l indicateur de détection lorsque la variable en défaut est reconstruite. La recontruction de la variable supposée en défaut est effectuée en se basant sur le modèle déjà calculé et les mesures des autres variables. L analyse de l indice de détection SP E avant et après reconstruction permet de localiser la variable incriminée. 4. Exemple Pour illustrer cette approche, nous allons présenter un exemple non linéaire simple. L exemple choisi est décrit par les équations suivantes :

Modélisation et diagnostic des systèmes non linéaires par Multi-ACP 7 x = u 2 +.3 sin(2πu) + ε x 2 = u + ε 2 x 3 = u 3 + u + + ε 3 [8] où u [, ] est une variable aléatoire uniforme et ε i un bruit aléatoire uniformément distribué dans l intervalle [.,.]. Le multi-acp utilisé est constitué de cinq modèles locaux. La figure présente l évolution des cinq fonctions d activation des différents modèles. L estimation de la courbe de l exemple traité avec Multi-ACP, est illustrée sur la figure 2. La figure 3 présente l évolution de l indice de détection SP E en absence puis en présence d un défauts affectant la première variable x à partir de l instant 3 avec un seuil de détection adaptatif. Une fois le défaut détecté, nous cherchons à localiser la variable en défaut. Pour cela, nous appliquons la procédure de localisation basée sur le principe de reconstruction. La figure 4 présente l évolution des indices SP E, SP E 2 et SP E 3 calculés, respectivement, après reconstruction de x, x 2 et de x 3. Comme on peut le constater, l indice qui ne présente pas de dépassement de son seuil de détection est bien SP E. Ce qui indice que x est la variable incriminée. Enfin, nous proposons des valeurs de remplacement pour les mesures en défaut et la figure 5 présente l évolution de la variable x, en absence de défaut, avec défaut et après reconstrcution. Il est claire que la reconstruction est une estimation très satisfaisante de la variable en absence de défaut. Fonctions d activation des modèles locaux.5 µ.5 5 5 2 25 3 35 4 µ 2 4 3 Mesures Estimations 5 5 2 25 3 35 4 2.5 µ 3 x 3 5 5 2 25 3 35 4.5.5 µ 4 5 5 2 25 3 35 4 µ 5 5 5 2 25 3 35 4 2.5.5 x 2.5.5.5.5 x.5 Figure. Evolution des fonctions d activation des modèles locaux Figure 2. Evolution des mesures et leurs estimations 5. Conclusion Dans ce papier nous avons présenté une nouvelle variante de l analyse en composantes principale non linéaire. Cette variante utilise le principe du multi-acp, qui est une combinaison d un ensemble de modèles ACP locaux valides dans une zone de l espace de fonctionnement du système. Les résidus sont générés pour la détection

8 4ème Colloque Interdisciplinaire en Instrumentation SPE en absence de défauts..5 Seuil de détection.5 SPE. 5 5 2 25 3 35 4 5 5 2 25 3 35 4 SPE 2.4.3.2.4. SPE avec défauts.3.2. Seuil de détection SPE 3.3.2. 5 5 2 25 3 35 4 5 5 2 25 3 35 4 5 5 2 25 3 35 4 Figure 3. Evolution des SPE en absence et en présence d un défaut affectant la première variable Figure 4. Localisation de la variable en défaut par reconstruction.4.2 Mesures sans défaut Mesures avec défaut Mesures reconstruites.8 Variable x.6.4.2.2.4 2 22 24 26 28 3 32 34 36 38 4 Figure 5. Reconstruction de la variable incriminée et proposition de valeurs de remplacement des mesures aberrantes de défauts avec un seuil adaptatif. En exploitant le principe de reconstruction dans le cas linéaire, nous proposons pour la première fois une expression analytique pour la recosntcruction dans le cas non linéaire. Une extention de ce même principe pour la localisation de défauts est également proposée et illustrée sur un exemple de simulation. Dans nos futurs travaux nous envisageons d étendre le principe de reconstruction pour la recherche des paramètres structurels du modèle. Remerciement Ce travail a été réalisé avec le soutien du programme TASSILI n 7 MDU 74.

Modélisation et diagnostic des systèmes non linéaires par Multi-ACP 9 6. Bibliographie [GUS 79] GUSTAFSON D. AND W. KESSEL, «Fuzzy clustering with a fuzzy covariance matrix», In Proc. IEEE CDC, San Diego, CA, USA, 979. [BOX 54] BOX G. E. P., «Some theorems on quadratic forms applied in the study of analysis of variance problems : Effect of inequality of variance in one-way classification», The Annals of Mathematical Statistics,, vol. 25, 954, p. 29-32. [DUN 96] DUNIA R., QIN S. J., EDGAR T. F., «Identification of faulty sensors using principal component analysis», AIChE Journal, vol. 42, n o, 996, p. 2797-282. [GER 97] GERTLER J., MCAVOY T. J., «Principal component analysis and parity relations - A strong duality», IFAC Conference SAFEPROCESS, Hull, UK 997, p. 837-842. [WEB 96] WEBB A. R., «An approach to nonlinear principal component analysis using radially symmetric kernel functions», Statist. Comput., vol. 6, 996, p. 59-68. [WIS 96] WISE B. M. AND GALLAGHER N. B., «The process chemometrics approach to process monitoring and fault detection», Journal of Process Control vol. 6, 996, p. 329-348.