Identication paramétrique : la méthode des moindres carrés. Benjamin Bradu

Identication paramétrique : la méthode des moindres carrés Benjamin Bradu 24 novembre 2006

Chapitre 1 Prérequis 1.1 Principes L'identication consiste à appliquer des signaux de perturbation à l'entrée d'un système (ceux-ci peuvent être de type binaire aléatoire ou pseudo-aléatoire, galois, sinus à fréquences multiples... et en analyser la sortie dans le but d'obtenir un modèle purement mathématique. Les diérents paramètres du modèle ne correspondent à aucune réalité physique dans ce cas. L'identication peut se faire soit dans le temps (espace temporel ou en fréquence (espace de Laplace. Eviter les modèles purement théoriques à partir des équations physiques (en général des équations diérentielles, qui sont longs à obtenir et souvent trop complexes pour le temps de développement donné, est donc possible avec cette technique. 1.2 Protocole Pour obtenir un modèle consistant, il est important d'exciter le processus avec toutes les fréquences de sa plage de fonctionnement. Le signal d'entré appliqué doit donc être riche en fréquences (posséder un large spectre. En général on applique un signal périodique pseudo-aléatoire (PRBS. Lorsque le système possède plusieurs entrées/plusieurs sorties il est important d'appliquer des signaux décorrélés pour ne pas introduire de biais d'identication. Une idée commune consistant à exciter l'une après l'autre les entrées est une mauvaise méthode car elle introduit un biais d'identication et ne rend pas compte du fonctionnement normal du système. Il est important de respecter une procédure rigoureuse pour identier un procédé : Détermination d'un protocole de mesure : propriétés statistiques des signaux d'entrée pour balayer toutes les fréquences interessantes, le ratio signal/bruit doit être susemment important et le nombre de points de mesures doit être signicatif pour le test (>1000. Détermination de la structure du modèle : type de modèle, ordre et retard. Identication : choix d'un algorithme pour trouver le modèle en minimisant les erreurs entre les mesures et le modèle, en général algorithme basé sur la Méthode des moindres carrés (LS,RLS,RELS. Validation du modèle : Réalisation de plusieurs tests de vérication. Il est nécessaire pour cette étape d'utiliser des mesures diérentes de celles utilisées lors de l'identication. Fig. 1.1 Procédure d'identication 1

CHAPITRE 1. PRÉREQUIS 2 1.3 Modèle Le principe d'une identication paramétrique est d'extraire un modèle mathématique à partir d'observations. Le modèle doit permettre de calculer la sortie du procédé y p à n'importe quel instant t si les conditions initiales du système sont connues. Pour cela on peut se servir des valeurs des entrées aux instants présents et précédents (u(t, u(t 1,... et des valeurs précédentes de la sortie (y(t 1, y(t 2,... dans le cas d'un modèle régressif. Il est tout de même important d'avoir des connaissances basiques du système pour choisir un type de modèle adapté : Modèle possédant une entrée/une sortie (SISO ou plusieurs entrées et plusieurs sorties (MIMO Modèle linéaire ou non-linéaire (dans ce cas, qu'est-ce qui est non-linéaire en fonction de quoi Modèle continu ou discret Modèle régressif ou indépendant : pour un modèle régressif, la sortie à un instant t, y(t, dépend des instants précédents (y(t i. Modèle stochastique ou déterministe En général, le modèle est représentaté sous forme de fonction de transfert utilisant la Transformée en Z. L'identication nécessite une structure de modèle connu à priori pour venir identier dans cette structure diérents paramètres. Voici les 3 structures de modèle les plus utilisés : 1.3.1 Le modèle ARX Le modèle ARX (Auto Regressive model with external inputs est un modèle auto régressif qui inclus des entrées u(t et un bruit blanc ζ(t de moyenne nulle. De plus, le modèle inclus un retard pur de k coups d'horloge. Si le système est échantilloné à une période d'échantillonage T, alors le retard sera de k T. Sous forme échantillonée : y(k = B [u(t k, u(t 1 k,...] T A [y(k 1, y(k 2,...] T + A [ζ(k, ζ(k 1,...] (1.1 sous forme de fonction de transfert utilisant l'opérateur retard q 1 : On rappel que q k x(t = x(t k 1.3.2 Le modèle ARMAX y(t = q k B(q 1 A(q 1 u(k + ζ(k (1.2 Le modèle ARMAX(Auto Regressive Moving Average with external inputs reprend les attributs du modèle ARX mais inclus une fonction de transfert avec une moyenne ajustable sur le bruit blanc. En général le bruit blanc permet de modéliser des perturbations non-mesurables dans le modèle. Or, ces perturbations non-mesurables (uctuations thermiques, vibrations du sol... sont rarement de moyenne nulle et peuvent aussi répondrent à un modèle. 1.3.3 Le modèle ARIMAX ou CARIMA y(t = q k B(q 1 A(q 1 u(t + T (q 1 A(q 1 ζ(t (1.3 Dans le modèle ARIMAX(Auto Regressive Integrated Moving Average with external inputs le modèle du bruit est directement intégré. y(t = q k B(q 1 A(q 1 u(t + T (q 1 A(q 1 ζ(t (1.4 correspond à l'opérateur diérentiel. Le polynome T (q 1 est souvent égal à 1 mais il doit en général répondre à un modèle de bruit pour être pertinent (c'est à dire que l'on doit avoir une idée du bruit.

Chapitre 2 Identication paramétrique 2.0.4 Mise en équation du problème Pour réaliser l'identication d'un modèle contenant p paramètres, sachant que le système possède n sorties y i, m entrées u i sur un ensemble de N mesures, on introduit 3 matrices distinctes : La matrice de sortie Y p = y 1 (k y n (k. y 1 (k + N y n (k + N de dimension N n La matrice d'observation φ = [ϕ T 1, ϕ T 2,..., ϕ T N ]T de dimension N p a 11 a 1n La matrice de paramètres ˆθ =. de dimension n p a m1 a mn Signication : Y p représente les n sorties du procédé à chaque mesure. φ contient toutes les données mesurables du problème à l'instant k. ϕ k est l'observation faite à l'instant k : ϕ k = [y 1 (k 1, y 1 (k 2,...y 2 (k 1, y 2 (k 2..., u 1 (k 1, u 1 (k 2,...u 2 (k 1, u 2 (k 2...] T de dimension p. La matrice de paramètres contient tous les paramètres à identier. C'est elle qui est l'inconnue du problème. On peut alors représenter une série de N mesures par la relations matricielle suivante : Y p = φ θ (2.1 Y p et φ sont les données mesurées et θ représentent tous les paramètres à identier. Il ne faut pas confondre θ qui représente les paramètres réels du système et ˆθ qui contient les approximations de ces paramètres. Le résultats de l'identication est la matrice ˆθ qui doit être la plus proche possible de θ. Malheureusement le θ réel n'est jamais connu dans la réalité. 2.1 Algorithme des moindres carrés (LS L'algorithme des moindres carrés (ou LS pour Least Squares algorithm a pour objectif de minimiser la somme les erreurs quadratiques ε 2 entre le modèle et les mesures. Il faut donc minimiser la fonction V qui est telle que : V = 1 N ε 2 = 1 N (Y p (k Y m (k 2 = 1 N (Y p (k φ θ 2 (2.2 Le système à identier a pour modèle Y m = φ ˆθ (il n'y a pas de bruit ou de perturbation ici, le ˆθ optimal peut être calculé en utilisant la pseudo-inverse de φ : ˆθ = [φ T φ] 1 φ T y (2.3 Attention, [φ T φ] doit être inversible. Si le modèle est de type ARX (voir équation (1.2, l'algorithme LS fournit une identication pertinente sans aucun biais si les signaux d'entré sont bien décorrélés, l'erreur commise sur les paramètres (θ ˆθ est ainsi minime. En 3

CHAPITRE 2. IDENTIFICATION PARAMÉTRIQUE 4 revanche, si le modèle est de type ARMAX ou ARIMAX (voir équations ( 1.3 et (1.4, la solution trouvée sera biaisée à cause du terme T (q 1 A(q 1 ζ(t qui n'a pas une moyenne nulle. Pour identier de tels modèles, il est nécessaire de procéder à une identication utilisant l'algorithme des moindres carrés récursif étendu (RELS pour supprimer ce biais. Cependant, si le bruit est très faible, l'algorithme LS classique peut fournir de bons résultats. L'avantage de cette méthode est qu'elle est directe grâce à la relation (2.3 et donc très rapide. Elle peut permettre de mettre en place un système d'identication temps réel. 2.2 Algorithme des moindres carrés récursif (RLS L'Algorithme des moindres carrés récursif (ou RLS pour Recursive Least Squares algorithm est la version récursive de l'algorithme LS. Les ressources calculatoires sont donc plus importantes et cet algorithme est mal adapté pour une identication temps réel mais demeure néanmoins plus ecace que l'algorithme LS pour une identication hors ligne. L'algorithme est le suivant pour chaque itération k : ˆθ k = ˆθ k 1 + K k ε k ε k = (yk ˆθ k 1 T ϕ k P K k = k 1 ϕ k (2.4 1+ϕ T k P k 1 ϕ k P k = P k 1 P k 1 ϕ k ϕ T k P k 1 1+ϕ T k P k 1 ϕ k ˆθ k contient les paramètres a identier,ε k représente l'erreur entre la sortie réelle et l'estimation, K k est la matrice de gain d'adaptation qui évolue pendant le déroulement de l'algorithme et si il y a convergence, alors K k 0. Il existe d'autres versions de l'algorithme RLS, particulièrement une version permettant d'intégrer un facteur d'oubli λ pour ne [ plus prendre en compte les premières itérations qui sont souvent peu signicatives. Dans ce cas, la matrice P k = 1 λ P k 1 P k 1 ϕ k ϕ T k P k 1 avec 0 < λ 1. Si λ = 1 on retrouve l'algorithme classique et si λ 1, les erreurs 1+ϕ T k P k 1 ϕ k ] sont pondérées par un coecient λ k t. 2.3 Algorithme des moindres carrés récursif étendu (RELS L'Algorithme des moindres carrés récursif étendu (ou RELS pour Recursive Extended Least Squares algorithm est aussi appelé méthode d'erreur de prédiction (ou PEM. Cet algorithme permet de fournir une identication pertinente sans aucun biais pour les modèles ARMAX et ARIMAX ( equations (1.3 et (1.4. Le principe de cette méthode est d'inclure le polynome T (q 1 dans la matrice θ = [â i, ˆb i, ˆt i ]. On obtient alors une matrice d'observation augmentée contenant les termes passés du bruit ζ : ϕ = [y(t 1 y(t n, u(t 1 u(t m, ζ(t 1 ζ(t r] T (2.5 Bien sûr, le bruit ne peut pas être mesuré, en revanche on peut faire une bonne estimation de ˆζ(t en utilisant le modèle du process avec une expression récurssive (c'est comme un prédicteur : ˆζ(t = y(t + n m â i y(t i ˆbi u(t k i r ˆt i ˆζ(t i (2.6 L'algorithme est le même que le RLS mais en utilisant des matrices d'observation et de paramètres augmentées. De plus le prédicteur ˆζ(t = ε(t.