THESE. Présentée à L UNIVERSITE PARIS XII VAL DE MARNE CRETEIL



Documents pareils
Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Coup de Projecteur sur les Réseaux de Neurones

L apprentissage automatique

Chapitre 6 Apprentissage des réseaux de neurones et régularisation

Pourquoi l apprentissage?

CHAPITRE I. Modélisation de processus et estimation des paramètres d un modèle

4.2 Unités d enseignement du M1

Introduction au Data-Mining

LA QUALITE DU LOGICIEL

Systèmes de transport public guidés urbains de personnes

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Optimisation de la compression fractale D images basée sur les réseaux de neurones

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

Utilisation des médicaments au niveau des soins primaires dans les pays en développement et en transition

Date de diffusion : Rédigé par : Version : Mars 2008 APEM 1.4. Sig-Artisanat : Guide de l'utilisateur 2 / 24

Chapitre 1 : Introduction aux bases de données

NORME INTERNATIONALE D AUDIT 260 COMMUNICATION DES QUESTIONS SOULEVÉES À L OCCASION DE L AUDIT AUX PERSONNES CONSTITUANT LE GOUVERNEMENT D'ENTREPRISE

Conditions Générales de Vente et d'utilisation

Algorithmes d'apprentissage

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

LE PROBLEME DU PLUS COURT CHEMIN

modélisation solide et dessin technique

Mention : En débat

INTELLIGENCE ECONOMIQUE : ENJEUX ET RETOUR D EXPERIENCE PILOTE DANS SEPT PMI DE BOURGOGNE

Applicable sur le site à compter du 1 Février 2015

a) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées :

Les types et niveaux de maintenance

Transmission d informations sur le réseau électrique

L utilisation d un réseau de neurones pour optimiser la gestion d un firewall

La classification automatique de données quantitatives

Travaux pratiques avec RapidMiner

Réorganisation du processus de transfusion sanguine au Liban

Business Intelligence avec SQL Server 2012

Programmation Objet - Cours II

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

BACCALAURÉAT PROFESSIONNEL M R I M : MICRO INFORMATIQUE ET RESEAUX : INSTALLATION ET MAINTENANCE

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Introduction au Data-Mining

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

Mastère spécialisé. «Ingénierie de l innovation et du produit nouveau De l idée à la mise en marché»

NOTICE DE EOBD-Facile Pour Android

Préparée au Laboratoire d'analyse et d'architecture des Systèmes du CNRS. Spécialité : Systèmes Automatiques. Par CLAUDIA VICTORIA ISAZA NARVAEZ

Introduction au datamining

C ) Détail volets A, B, C, D et E. Hypothèses (facteurs externes au projet) Sources de vérification. Actions Objectifs Méthode, résultats

Principe et règles d audit

La conversion de données : Convertisseur Analogique Numérique (CAN) Convertisseur Numérique Analogique (CNA)

MINISTÈRE DE LA DÉFENSE SECRÉTARIAT GÉNÉRAL POUR L'ADMINISTRATION CHARTE DE L'AUDIT INTERNE DU SECRÉTARIAT GÉNÉRAL POUR L'ADMINISTRATION

APPLICATION DU SCN A L'EVALUATION DES REVENUS NON DECLARES DES MENAGES

POLITIQUE DE BIOSÉCURITÉ

Annexe : La Programmation Informatique

Principes de liberté d'expression et de respect de la vie privée

L IMPACT DES N.T.I.C. DANS LA FORMATION PROFESSIONNELLE DES CADRES DE L INSTITUTION MILITAIRE

DÉVELOPPEMENT INFONUAGIQUE - meilleures pratiques

CAPTEURS - CHAINES DE MESURES

Utiliser Access ou Excel pour gérer vos données

Qlik Sense Cloud. Qlik Sense Copyright QlikTech International AB. Tous droits réservés.

L'EPS à l'école primaire aucune modification des programmes

NOTIONS DE PROBABILITÉS

ETI/Domo. Français. ETI-Domo Config FR

Les principes de la sécurité

LA PROCEDURE D'EVALUATION A.NA.PSY.p.e. EST LE RESULTAT D'UNE RECHERCHE

Formation des formateurs en entreprise

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Classification Automatique de messages : une approche hybride

Etude du cas ASSURAL. Mise en conformité du système d'information avec la norme ISO 17799

Mastère spécialisé MS : «Ingénierie de l innovation et du produit nouveau

La fonction d audit interne garantit la correcte application des procédures en vigueur et la fiabilité des informations remontées par les filiales.

Thème 5. Proposition d'une activité d'exploration élève : Micro-trottoir «Qu'est-ce qu'une entreprise?»

Lignes directrices relatives à la relation d affaires et au client occasionnel

Réseau : Interconnexion de réseaux, routage et application de règles de filtrage.

Evaluation de la variabilité d'un système de mesure

Sécurité. Tendance technologique

Mentions Légales. Webmaster. Propriété intellectuelle

FICHE DE POSTE. Date de rédaction : 20/02/15. Argumentaire général

Prédiction de couverture de champ radioélectrique pour les réseaux radiomobiles : L apport du Système d Information Géographique ArcInfo 8

Chapitre 2 : Systèmes radio mobiles et concepts cellulaires

MASTER 2 SCIENCES HUMAINES ET SOCIALES Mention Psychologie. Spécialité : Recherches en psychologie

Observation des modalités et performances d'accès à Internet

COMMENT MAITRISER LA GESTION DES APPROVISIONNEMENTS ET DES STOCKS DE MEDICAMENTS

Lecture critique et pratique de la médecine

Contenus détaillés des habiletés du Profil TIC des étudiants du collégial

Formation projet informatique. Expression de besoins, définir un besoin informatique

RÉSOLUTION DE SYSTÈMES À DEUX INCONNUES

Anticiper pour avoir une innovation d'avance : le leitmotiv de Pierre Jouniaux, entrepreneur du big data!

TASCAM MX Utilisation du SCSI

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

MODE D'EMPLOI DE LA CALCULATRICE POUR LES COURTS SÉJOURS DANS L'ESPACE SCHENGEN

Nom-Projet MODELE PLAN DE MANAGEMENT DE PROJET

CEP-CICAT 5 Février Lieutenant Jean-marc BRUCKERT - Service Prévention

Application 1- VBA : Test de comportements d'investissements

Figure 1 Différents éléments influençant les mesures de seuil réalisées en champ visuel

Conditions : stage indemnisé, aide au logement possible, transport CEA en Ile-de-France gratuit.

Jexcel. V1.1.4 Manuel d'utilisation. modifié le 16 nov. 2004

Efficacité énergétique pour les particuliers : une solution pour le monitoring énergétique

Apprentissage Automatique

1. Introduction Création d'une requête...2

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Copropriété: 31, rue des Abondances Boulogne-Billancourt

Calcul de développements de Puiseux et application au calcul du groupe de monodromie d'une courbe algébrique plane

Formation «Système de gestion des documents d activité (SGDA)»

Transcription:

Année 2003 THESE Présentée à L UNIVERSITE PARIS XII VAL DE MARNE CRETEIL En vue de l obtention du titre de Docteur de l Université Spécialité Génie Informatique, Automatique et Traitement du Signal par Anne-Sophie BELLANGER-DUJARDIN CONTRIBUTION A L ETUDE DE STRUCTURES NEURONALES POUR LA CLASSIFICATION DE SIGNATURES : APPLICATION AU DIAGNOSTIC DE PANNES DES SYSTEMES INDUSTRIELS ET A L AIDE AU DIAGNOSTIC MEDICAL Soutenue le?? devant la Commission d Examen : Mme V. AMARGER M. G. BLOCH M. H. COUSILLAS M. H. MAAREF M. K. MADANI M. G. ZWINGELSTEIN MCF Professeur MCF Professeur Professeur Professeur Associé/EDF Examinatrice Rapporteur Rapporteur Rapporteur Examinateur Examinateur

!"#$ % & ' % ( )*+, - (, $../0$, +.123 22 4-1$ ) 56 7 )/8/7 29 12%222%:& ' ( ; $.<.7 1 1((( 4& ' %42 2 ( %$ #1.$.)/- 1 " & 2 4 (1 2 ( & ' $ $ # /-(2) / 1 (1-1 : 22 ( 2& ' %42 %$ < 7-8 "0 & % 0 -/ -' " -.-) - - 7-0 = - < 1- > (- % 12 2 ) / 1(1 8 "0 & (( -: 2 %?: & 2 2 : 2 7 1%22% & '2 2-22-22@- A - (> / (-%! 1 (1 (( -%- -1 &

REMERCIEMENTS....2 SOMMAIRE.. 3 INTRODUCTION.6 CHAPITRE I. DIAGNOSTIC ET RESEAUX DE NEURONES ARTIFICIELS...12 I.1. Introduction...13 I.2. Les Réseaux de Neurones Artificiels...16 I.2.1. Réseaux de neurones artificiels et diagnostic...16 I.2.2. Le perceptron...18 I.2.3. Le réseau Learning Vector Quantization...22 I.2.4. Le réseau Radial Basis Function...26 I.3. Approche neuronale hybride...31 I.3.1. Généralités...31 I.3.2. Informations d'entrée et étape de prétraitement...31 I.3.3. Les agents neuronaux...35 I.3.4. L'étape de décision...35 I.4. Conclusion...36 CHAPITRE II. APPROCHES NEURONALES SIMPLES POUR L AIDE AU DIAGNOSTIC ET LEUR EVALUATION EXPERIMENTALE...39 II.1. Introduction...40 II.2. Volet Biomédical : Les Potentiels Evoqués Auditifs...41 II.2.1. Présentation...41 II.2.2. Mise en œuvre clinique et construction de la base de données...44 II.2.3. Résultats...47 II.2.3.1. Application d'une technique conventionnelle : Modélisation AR des signaux PEA...47 II.2.3.1.1. Première approche...48 II.2.3.1.2. Seconde Approche...50 II.2.3.2. Aide au diagnostic par techniques neuronales...51 II.2.3.2.1. Réseau Learning Vector Quantization...52 II.2.3.2.2. Réseau Radial Basis Function...54

II.3. Volet Industriel : Diagnostic de défaillances d un moteur asynchrone...57 II.3.1. Introduction...57 II.3.2. Construction de la base de données...58 II.3.3. Aide au diagnostic par techniques neuronales...62 II.3.3.1. Exploitation de la base de données 1...62 II.3.3.1.1. Réseau Learning Vector Quantization...62 II.3.3.1.2. Réseau Radial Basis Function...63 II.3.3.2. Exploitation de la base de données 2 Réseau RBF...65 II.3.3.2.1. Optimisation de la structure du réseau...65 II.3.3.2.2. Résultats obtenus...66 II.3.3.3. Exploitation de la base de données 3...67 II.3.3.3.1. Réseau Learning Vector Quantization...67 II.3.3.3.2. Réseau Radial Basis Function...68 II.3.3.4. Détection de l'apparition d'un défaut de roulement progressif...70 II.3.3.4.1. Réseau Learning Vector Quantization...71 II.3.3.4.2. Réseau Radial Basis Function...71 II.4. Conclusion...73 CHAPITRE III. VERS DES TECHNIQUES NEURONALES HYBRIDES...76 III.1. Introduction...77 III.2. Validation de la structure neuronale hybride proposée : Application au problème d'aide au diagnostic biomédical...78 III.2.1. Structures n'impliquant qu'un seul agent neuronal...79 III.2.1.1. Structures hybrides RNA/Seuillage...79 III.2.1.1.1. Structure hybride LVQ/Seuillage...80 III.2.1.1.2. Structure hybride RBF/Seuillage...81 III.2.1.2. Structures hybrides RNA/Module de décision neuronal...83 III.2.1.2.1. Structure hybride RBF/(LVQ+Seuillage)...83 III.2.1.2.2. Structure hybride RBF/(BP+Seuillage)...88 III.2.2. Structure hybride impliquant 2 agents neuronaux...93 III.3. Validation de la structure neuronale hybride proposée :Application au problème d'aide au diagnostic industriel...98 III.3.1. Structure Hybride RBF/LVQ...97 III.3.1.1. Application de la structure hybride RBF/LVQ : exploitation de la base de données 2...98 III.3.1.2. Application de la structure hybride RBF/LVQ : exploitation de la base de données 3...99 III.3.1.3. Application de la structure hybride RBF/LVQ : Détection de l'apparition d'un défaut progressif...101

III.3.2. Structure Hybride RBF/BP...102 III.3.2.1. Application de la structure hybride RBF/BP : exploitation de la base de données 2...103 III.3.2.2. Application de la structure hybride RBF/BP : exploitation de la base de données 3...104 III.3.2.3. Application de la structure hybride RBF/LVQ : Détection de l'apparition d'un défaut progressif...105 III.4. Conclusion...107 CONCLUSION..112 BIBLIOGRAPHIE 118 ANNEXE 1 : Les fondements biologiques des réseaux de neurones artificiels...123 ANNEXE 2 : Ecoulements diphasiques : Problème du Taux de Vide.132 ANNEXE 3 : L'appareil auditif... 145

Le problème du diagnostic se rencontre dans de nombreux domaines, notamment dans le domaine médical et le domaine industriel. Pour le diagnostic médical, l'objectif est de déterminer une maladie à partir de symptômes, et de résultats d'examens. Le diagnostic industriel, quant à lui, consiste à trouver la cause d'une défaillance. Dans l'un et l'autre des cas, l'objectif est de parvenir à une solution destinée à assurer le bon fonctionnement du système surveillé être humain dans le cas médical et système de production dans le cas industriel. Dans le domaine industriel, la production est caractérisée par une complexité croissante qui s'explique par la considération de contraintes à respecter. D'un point de vue économique, par exemple, ces contraintes concernent l'obligation de rendement et surtout de diminution des coûts en raison du contexte de plus en plus concurrentiel dans lequel les entreprises évoluent. D'un point de vue technique, les contraintes portent sur le développement des technologies, de l'informatisation et de l'automatisation. Enfin, il ne faut pas oublier la nécessité d'assurer la sécurité des hommes qui assurent cette production. Cette complexité se traduit par la présence inévitable d'aléas de fonctionnement, qu'il sera alors nécessaire de détecter et corriger le plus rapidement possible. Ces aléas se traduisent par la présence d'écarts entre production réelle et production prévue. Ces aléas sont indéniablement néfastes. Le diagnostic doit alors permettre de préserver la sécurité des hommes, et d'éviter la détérioration des matériels. Mais, il doit aussi permettre de réduire les coûts financiers qui pourraient immanquablement découler d'une avarie sur le système de production, et ainsi de maintenir la compétitivité de l'industrie sur son marché. Pour cela, il est nécessaire de mettre en place un dispositif de surveillance permettant d'avoir une représentation de l'état de l'outil de fonctionnement. Un certain nombre de capteurs donneront alors les informations nécessaires (données, images, signal) pour caractériser l'état du système. La surveillance des 7

systèmes se décompose en trois fonctions : la détection d une défaillance, qui consiste à reconnaître une déviation par rapport au fonctionnement attendu, la localisation d une faute, qui consiste à déterminer la région physique du système dans lequel la défaillance s est produite et enfin, le diagnostic qui permet de déterminer précisément l origine de la défaillance détectée. Concernant le domaine médical, l'enjeu est un peu différent, puisque ici, le système considéré est l'être humain, dont la complexité est immense. L'objectif du diagnostic est ici, de déterminer une maladie à partir de symptômes et de résultats d'examens complémentaires, afin de proposer le traitement adéquat mais aussi, dans certains cas tels que les problèmes psychologiques ou psychiatriques, de trouver les causes des troubles. La contrainte majeure est de préserver la santé physique et morale du patient. Pour cela, les médecins disposent, à l'heure actuelle, de techniques à la pointe de l'évolution technologique qui leur permettent d'obtenir des données, des images, des signaux pour établir leur diagnostic. Le médecin visualise alors les résultats de ces divers examens pour établir son diagnostic. En effet, les médecins ne disposent pas d'outils permettant une aide au diagnostic. Mais, ne pourrait-on pas développer des techniques d'analyse de ces informations pour réaliser un outil d'aide au diagnostic? Les systèmes de production dans le milieu industriel sont de plus en plus automatisés, c'est-à-dire que l'homme est remplacé dans ses tâches répétitives par des systèmes automatiques. La première conséquence de cette automatisation est donc de déplacer progressivement le niveau d'intervention de l'homme dans le sens d'une réduction de l'activité physique directe au profit d'une activité mentale de commande et de coordination. Cependant, ces systèmes automatisés ne sont pas sans faiblesse, et leur fragilité et leur susceptibilité aux dysfonctionnement font que l'intervention humaine est souvent nécessaire. Dans le milieu médical, le rôle du médecin est aussi primordial. C'est en lui que le patient place sa confiance. Le caractère indispensable de l'acteur humain dans le contexte du diagnostic médical relève entre autre d'un aspect "psychologique". De plus, par ses capacités de juger et de décider, d'analyser, de synthétiser et d'interpréter les symptômes, le praticien joue un rôle primordial. C'est lui qui détient "l'expertise" et la "connaissance". Ainsi, tant dans un contexte de surveillance et de maintenance des systèmes industriels que dans le contexte du diagnostic 8

médical, il n'est pas envisageable de mettre en place des outils de surveillance sans considérer le rôle indispensable de l'homme. Il s'agit donc de développer, non pas des outils de diagnostic, mais plutôt d'aide au diagnostic. L'homme est un acteur incontournable dans le processus de diagnostic. Il possède en effet les capacités indispensables à la résolution de problèmes liés à cette activité. Celles-ci sont dues aux caractéristiques du cerveau humain qui lui confère les capacités de perception, de mémorisation, d'apprentissage, d'adaptation et de raisonnement. Le problème d'aide au diagnostic a donc tout naturellement fait l'objet de travaux en ce sens, en tentant de reproduire ces performances à l'aide d'un système artificiel. En effet, au cours des vingt cinq dernières années, le domaine de l'intelligence Artificielle (IA) a connu un essor important, avec, en particulier, le développement des réseaux de neurones artificiels. Ces derniers tentent de reproduire, par simulation, certains des principes organisationnels et fonctionnels du cerveau humain. Ils permettent d'élaborer un nombre important de techniques originales, couvrant un large domaine d'applications. Parmi leurs propriétés les plus attractives, on peut citer leurs capacités d'apprentissage et de généralisation et, pour certain d'entre eux, leur capacité de classification et d'identification. Ils ont ainsi été appliqués, par exemple, avec succès à des problèmes de reconnaissance des formes. Toutes ces propriétés font des réseaux de neurones un outil permettant de développer de nouvelles techniques pour l'aide au diagnostic, et nos travaux portent sur l'application de ces techniques au diagnostic, tant dans le domaine industriel que dans le domaine médical. Dans de nombreux cas, la grande difficulté inhérente au problème du diagnostic repose sur la similitude des caractéristiques à partir desquelles est effectué un diagnostic. On dispose souvent d'une connaissance empirique du système, et de ce fait, d'un modèle incomplet du système, nécessitant le recours à un "expert". La difficulté du diagnostic dans le domaine médical en est un exemple significatif : plusieurs diagnostics contradictoires pourraient être formulés à partir d'un même examen clinique. On peut aussi établir le même type de constat concernant la faible efficacité des systèmes de supervision et de détection de pannes utilisés dans l'industrie. 9

Les travaux effectués au cours de cette thèse visent à apporter des éléments de réponse au problème d'intégration des connaissances "d'expert" dans un processus conduisant à la détection et au diagnostic d'un dysfonctionnement. La classe des problèmes étudiés relève de celles d'identification et de catégorisation des dysfonctionnements. Pour tenter de les résoudre, nous avons mis en œuvre des techniques basées sur le connexionnisme (structures à base de réseaux de neurones), et nous proposons alors une structure permettant de "catégoriser" des informations (signaux, données ), issues de différents capteurs, par des techniques neuronales. Ce mémoire est organisé en trois chapitres. Le premier chapitre concerne la présentation du diagnostic par réseaux de neurones artificiels. Nous y présentons différents modèles neuromimétiques utilisés dans le cadre du présent travail. Leur structure, leur algorithme d'apprentissage et leurs caractéristiques sont alors abordés. Nous y présentons aussi la structure hybride neuronale que nous proposons pour tenter de résoudre le problème d'aide au diagnostic, quel que soit le domaine d'étude considéré. Le chapitre suivant concerne la mise en œuvre de techniques neuronales simples pour la résolution de problèmes liés à l'aide au diagnostic. Nous y présentons les deux problématiques sur lesquelles portent nos travaux, et qui concernent les deux domaines déjà cités : le domaine médical et le domaine industriel. Dans le domaine médical, nos travaux concernent l'aide au diagnostic à partir de résultats d'un examen permettant de déceler des troubles auditifs. Les informations principales utilisées dans ce cas sont les Potentiels Evoqués Auditifs. Dans le domaine industriel, nous nous sommes intéressés au problème du diagnostic de défaillances d'un moteur asynchrone. Enfin, les résultats obtenus lors de la mise en œuvre des techniques neuronales exposées dans le premier chapitre sont présentés. Ceux-ci permettront de montrer les limites des techniques neuronales simples dans la résolution de problèmes d'aide au diagnostic de systèmes complexes. Les limites montrées au chapitre II nous ont amenés à mettre en oeuvre une technique plus complexe pour tenter de répondre au problème d'aide au diagnostic. Le dernier chapitre est donc consacré à la présentation des résultats obtenus grâce à cette technique neuronale hybride pour les deux problématiques considérées. 10

Puis, dans la conclusion, nous rappelons brièvement les différents résultats obtenus au cours de ce travail, et présentons les perspectives qui découlent de cette thèse. Enfin, et compte tenu du volet biomédical, pouvant sensibiliser les lecteurs liés à ce domaine, il nous a paru important d'inclure une rapide présentation des fondements biologiques des réseaux de neurones (même si ces considérations peuvent présenter moins d'intérêt pour un lecteur initié au domaine des réseaux de neurones). Ces aspects constituent donc le contenu de la première annexe au présent document. D'autre part, des travaux liés à l'estimation quantitative de données ont été initiés au cours de cette thèse. Ils visaient l'évaluation de la faisabilité de l'estimation de paramètres d'un système à surveiller. Cette faisabilité a été validée sur un système expérimental de mélange diphasique et a concerné plus particulièrement l'estimation du taux de vide dans de tels écoulements. Toutefois, ces travaux n'ont pas donné lieu à une intégration aux structures neuronales hybrides proposées dans cette thèse. C'est pourquoi nous avons préféré rapporter ces travaux sous la forme d'une seconde annexe au présent document. Enfin, compte tenu de l'utilisation de signaux biomédicaux relatifs à l'audition, il nous a semblé intéressant d'inclure une présentation sommaire de l'appareil auditif. Celle-ci constitue donc la troisième annexe. 11

Dans la vie courante, il existe de nombreuses situations dans lesquelles l'être humain se trouve, en tant qu'utilisateur, face à des systèmes qui ne fonctionnent pas de manière attendue. Qui ne s'est pas trouvé au volant d'une voiture qui refuse de démarrer? Qui n'a jamais été confronté à un ascenseur en panne? Afin de résoudre ces problèmes divers que pose ce genre de situation, l'intervention humaine et un outillage approprié sont indispensables. La complexité des systèmes actuels rend ces interventions d'un niveau élevé. Il est donc nécessaire de fournir à l'intervenant des outils d'aide au diagnostic de la panne rencontrée. L ouvrage de G. Zwingelstein, «Diagnostic des Défaillances» [ZWIN 95], constitue une source précieuse de connaissances dans le domaine du diagnostic industriel. Le diagnostic des fautes requiert généralement l'élaboration d'un modèle du système à surveiller. Généralement, un modèle est une représentation formelle (avec un sens plutôt mathématique) de ce système. Lorsqu un modèle est disponible, les techniques de diagnostic utilisables sont appelées techniques internes. Ces méthodes de diagnostic internes sont dérivées des techniques utilisées par les automaticiens. Elles impliquent une connaissance approfondie du système à surveiller sous la forme d une représentation formelle (au sens mathématique) : le modèle. Leur principe est le suivant : il s'agit, à partir des observations des entrées et des sorties de remonter aux paramètres ou au vecteur d'état interne. La détection d'un état anormal se fait alors par comparaison entre les paramètres mesurés ou calculés à l'instant considéré et ceux associés à un fonctionnement normal. Les paramètres de l'état 13

courant du système s'obtiennent grâce aux méthodes d'identification de paramètres et/ou aux méthodes d'estimation du vecteur d'état. Ces méthodes de diagnostic par identification de paramètres et d'estimation du vecteur d'état ont été les premières à avoir été employées dans l'industrie. Initiées par les automaticiens qui recherchaient les modèles des procédés devant faire l objet d une automatisation poussée, ces méthodes de diagnostic internes s appuient sur l existence d un modèle mathématique très précis du système à surveiller. Dans le cas contraire, les résultats d'estimation et d'identification sont à prendre avec beaucoup de précaution. Ces techniques sont très utilisées dans le domaine de l aéronautique et de l aérospatiale où les modèles de la dynamique du vol sont parfaitement connus ainsi que dans l industrie électronique et électrique, lorsque l'on dispose d'un modèle parfaitement connu du système étudié. Elles sont aussi appliquées dans l'industrie nucléaire [ZWIN 95]. Cependant, il existe certaines limites à l'application de ces méthodes de diagnostic. Ces techniques ne sont, en effet, applicables que lorsqu'un modèle précis et exhaustif du système à surveiller est disponible. Ainsi, elles ne pourront pas être utilisées dans un grand nombre d'applications médicales, car il est quasiment impossible d'obtenir un modèle de toutes les fonctions du corps humain. De même, dans le cas des circuits électroniques non linéaires, la modélisation est une tâche ardue qui limite l'utilisation de telles techniques. Les applications qui vont nous intéresser dans cette thèse concernent, soit, des systèmes pour lesquels aucune représentation formelle n'est disponible (le cas biomédical, où il s agit de l être humain), soit, des systèmes pour lesquels une telle représentation est difficile à obtenir (le cas de la plupart des systèmes industriels réels). Ces techniques internes ne sont alors pas applicables et il faut donc envisager la mise en œ uvre d autres techniques. D'autres méthodes, applicables dans le cas où aucun modèle n est disponible, et appelées méthodes externes, ont donc été proposées. Dans cette catégorie, on trouve les techniques de reconnaissance des formes, les techniques à base de systèmes experts, ainsi que les techniques neuronales. Les techniques de reconnaissance des formes permettent de déterminer l appartenance d un objet à une classe en déterminant de quelle forme un objet observé se rapproche le plus. Ces méthodes constituent des outils privilégiés pour la classification de signatures associées aux modes de fonctionnements normaux et défaillants. Le diagnostic par reconnaissance des formes consiste donc à classer les états du système. L ouvrage de B. Dubuisson, «Diagnostic et reconnaissance des formes», développe tout particulièrement ces techniques de diagnostic [DUBU 90]. Grâce à leur capacité à discriminer des signatures caractéristiques des fonctionnements normaux et anormaux de systèmes, les méthodes de reconnaissance des 14

formes sont des techniques à envisager lorsqu on souhaite procéder à une automatisation du diagnostic. Par exemple, certains de ces algorithmes sont utilisés pour la surveillance vibratoire de machines tournantes [GROS 92]. Elles sont applicables lorsqu on dispose d une connaissance a priori des états de fonctionnement du système à surveiller. Elles sont également utilisables pour le diagnostic de systèmes nouveaux et on pourra alors mettre en œ uvre des algorithmes ayant la capacité de prendre en compte des états de fonctionnement inconnus a priori. Dans ce cas, il faudra appliquer des algorithmes capables de rejeter ou de détecter une ambiguïté dans les nouvelles formes rencontrées. De la même manière, dans le cas de systèmes vieillissants, i.e. présentant une dérive lente des caractéristiques de fonctionnement, il est utile d appliquer le même genre de techniques. Il faut toutefois noter que les performances de ce type de techniques sont fortement liées au degré de compréhension du système : la présence d un expert est donc quasi indispensable. Les systèmes experts ont, quant à eux, pour fonction d assister l utilisateur nonspécialiste pour la résolution d un problème en utilisant les connaissances d un expert. Comme toute les nouvelles technologies, ils ont connus une sur-médiatisation qui les rendait capables de résoudre tout type de problèmes. Avec le recul, la mise en œ uvre des systèmes experts a trouvé un équilibre. Les systèmes experts sont une des applications de l Intelligence Artificielle qui ont quitté les laboratoires pour être utilisés dans le monde de l entreprise. De nombreux systèmes ont été implantés avec succès pour résoudre des problèmes concrets notamment en médecine [SHOR 76], pour établir des diagnostics, dans le domaine financier, les assurances, la réparation d'équipement. Dans le domaine de l aide au diagnostic, ils permettent de réaliser aisément le diagnostic des petits systèmes [ZWIN 95]. En revanche, pour les systèmes industriels plus complexes, la percée de ces techniques est moins rapide, compte tenu des coûts importants de développement et de maintenance de tels systèmes. Cependant, les grandes difficultés que l on rencontre lorsqu on cherche à extraire des experts leur connaissance, puis, quand on tente de formaliser ces connaissances dégagées, sont peut-être signes d une faiblesse intrinsèque des systèmes experts. En effet, la conception de tels systèmes repose sur une hypothèse : la structuration de nos aptitudes en règles symboliques parfaitement identifiables. Cette hypothèse, très répandue chez les psychologues et les chercheurs en Intelligence Artificielle dans les années 70, est aujourd hui en recul et on envisage désormais des modèles qui n y ont plus recours, comme les réseaux de neurones artificiels. 15

L'objet de cette thèse concerne la mise en œ uvre de ces dernières techniques pour la construction d'outils d'aide au diagnostic quelque soit le domaine considéré. Ce chapitre est consacré à l'étude de la mise en œ uvre de réseaux de neurones pour l'aide au diagnostic. Dans un premier temps, nous aborderons les réseaux de neurones artificiels, et plus particulièrement les trois modèles que nous avons utilisés. Dans un second temps, nous présenterons une approche neuronale hybride pour tenter de proposer une solution d aide au diagnostic. L une des tâches principales à effectuer en diagnostic est la reconnaissance et la classification de signatures. Cette tâche est souvent effectuée de façon visuelle par les spécialistes de maintenance. De la même manière, lors du fonctionnement d un système complexe, comme une centrale nucléaire, les informations visuelles délivrées par les indicateurs présents dans la salle de commande constituent des formes visuelles que les opérateurs utilisent pour identifier les modes de fonctionnement. Quand une anomalie de fonctionnement apparaît, les informations se modifient et les opérateurs doivent alors identifier la situation de fonctionnement. Ainsi, les opérateurs, de façon consciente ou non, mettent en oeuvre la reconnaissance visuelle des formes. Les réseaux de neurones sont des outils bien adaptés pour aider les spécialistes dans cette activité de reconnaissance et de classification. Ils sont en effet particulièrement performants pour effectuer des tâches de reconnaissance des formes et de classification automatique de signatures. Dans le domaine industriel, ils sont presque exclusivement utilisés pour la classification automatique de formes à partir de données bruitées et incomplètes [ZWIN 95]. Lorsqu ils sont utilisés pour le diagnostic par reconnaissance des formes, l approche consiste à apprendre aux réseaux un certain nombre de situations de fonctionnement normal et anormal du système. A l issu de cet apprentissage, le réseau est ensuite mis en place et il peut être confronté à des situations, ou plutôt des formes, qu il n a jamais rencontrées. C est la capacité de généralisation des réseaux qui est alors sollicité afin qu il effectue une 16

classification correcte de la forme présentée. De nombreux exemples d une telle utilisation des réseaux neuronaux pour le diagnostic industriel sont présents dans la littérature : classification de signaux pour le contrôle non destructif de tubes métalliques [ZWIN 91,92], classification de signaux électriques pour le diagnostic de circuits analogiques [AMAR 96][BENG 97b], reconnaissance pannes à partir d'observations sur le système pour la surveillance des procédés de raffinage [VENK 89]. Ils sont aussi utilisés et donnent de bons résultats pour la classification d'informations médicales : classification de données pour la reconnaissance de cellules cervicales [BAZO 94], classification de signaux médicaux (potentiels évoqués auditifs) [ALPS 94]. Une autre application des réseaux de neurones artificiels dans le domaine du diagnostic concerne les problèmes d identification et de modélisation. Il s agit alors, après avoir appris au réseau différentes valeurs pour certains paramètres du système à surveiller, d obtenir, lors de la phase de généralisation, la ou les valeurs des paramètres à surveiller. En comparant ensuite les valeurs obtenues à celles correspondant à un fonctionnement normal, on peut alors détecter un fonctionnement anormal. [BENG 97a]. L application des réseaux de neurones au problème du diagnostic peut donc se faire suivant deux démarches. La première démarche considère le diagnostic comme un problème de reconnaissance de formes où il s agit de déterminer la classe à laquelle appartient la forme en présence. La seconde approche permet d identifier les paramètres du système à surveiller. Puis, en comparant les valeurs obtenues avec celles des paramètres correspondant à un fonctionnement normal du système, on peut aboutir à un diagnostic. Quelle que soit la démarche considérée, la capacité de généralisation et le temps de réponse court des réseaux de neurones s avèrent très utiles au problème du diagnostic. Cependant, la paramétrisation de tels outils est une étape délicate, car il n existe pas de règles permettant de fixer les paramètres caractéristiques des réseaux (nombre de couches, nombre de neurones par couches ). Ces choix devront se faire empiriquement pour obtenir les résultats recherchés [ZWIN 95]. Les réseaux neuronaux présentent des avantages majeurs pour la résolution de problèmes complexes qui peuvent se heurter aux limites rencontrées en informatique classique grâce à leurs propriétés liées à leur capacité d'apprentissage. Ils peuvent en effet apprendre des règles à partir d'exemples. Puis, sur la base de règles apprises, ils sont capables 17

de généraliser et ainsi, d'étendre ces règles à de nouveaux exemples non appris, même si les formes présentées sont entachées de bruit ou ont des informations manquantes. Les opérations effectuées par des opérateurs neuronaux peuvent être diverses, et nous ne retiendrons que les tâches de classification 1. La suite de cette partie est consacrée à la présentation des modèles neuronaux. Nous présenterons ainsi les modèles utilisés pour la construction d'un outil d'aide au diagnostic : le Perceptron multi-couches à une couche cachée, le réseau Learning Vector Quantization (LVQ) et le réseau Radial Basis Function (RBF). Les fondements biologiques des réseaux de neurones artificiels, ainsi que les premières représentations mathématiques des modèles neuromimétiques, dont le neurone formel proposé par Mc Cullogh et Pitts en 1943 sont rappelés en annexe (Annexe 1). Les Perceptrons multi-couches à une couche cachée sont des réseaux dont l'algorithme d'apprentissage est celui de la rétropropagation du gradient mis au point dans les années 1980 [RUME 86]. Cet algorithme est dérivé de la règle de Widrow-Hoff. Cet algorithme d'apprentissage par rétropropagation du gradient a contribué à la relance d'intérêt pour les systèmes neuronaux. Structure du réseau : Le perceptron multicouche à une couche cachée est, comme son nom l indique un réseau multi-couches. Il est composé d'une couche d'entrée, d'une ou plusieurs couches cachées et d'une couche de sortie. La figure I.1 représente un réseau à trois couches (une seule couche cachée). Le nombre d'unités d'entrée et de sortie dépend du problème à traiter. En revanche, le choix du nombre de couches cachées et du nombre de neurones par couche cachée doit faire l'objet d'un compromis entre performance et vitesse d'apprentissage. 1 Un exemple d'application des réseaux de neurones artificiels pour la quantification est présenté en Annexe 2. 18

Perceptron multicouche à une couche cachée W' ij W'' ij s 1 s m Couche d entrée Couche cachée Couche de sortie Figure I. 1 - Perceptron multi-couche à une couche cachée Apprentissage : La procédure d'apprentissage repose sur l'idée de propager vers les couches internes l'erreur commise en sortie pour modifier les poids synaptiques. C'est un apprentissage supervisé. Pour cela, on dispose d'un ensemble d'exemples (base d'apprentissage), constituée de couples (entrée, sortie désirée). Lors de l'apprentissage, on présente les exemples au réseau qui calcule les sorties correspondantes. Ces calculs s'effectuent de proche en proche depuis la couche d'entrée vers la couche de sortie (phase de relaxation ou de propagation avant). L'erreur entre la sortie réelle et la sortie désirée est calculée (somme quadratique des erreurs sur chaque neurone de sortie). Cette erreur est ensuite rétropropagée à travers le réseau donnant lieu à une modification des poids synaptiques. Ce processus est réitéré pour chaque exemple de la base d'apprentissage. Si, pour tous les exemples, l'erreur commise est inférieure à un seuil choisi, on dit alors que le réseau a convergé. L'apprentissage consiste donc à minimiser l'erreur quadratique commise sur l'ensemble des exemples, par ajustement des poids en diminuant le gradient. Pour formaliser, de façon très sommaire, ce principe, prenons un réseau à n neurones d'entrée et m neurones de sortie. On note X={X 1, X 2,, X p } un ensemble de p vecteurs d'entrée, S d ={S d1, S d2,, S dp }, l'ensemble des p sorties désirées et S={S 1, S 2,, S p }, l'ensemble des sorties obtenues effectivement à l'issue de la propagation avant des vecteurs de l'ensemble X. Le couple (X, Sd) constitue la base d'apprentissage du réseau. Considérons le 19

k ième élément X k de l'ensemble X, on note X k = (x k1, x k2,, x kn ), les composantes de ce vecteurs. De la même manière, on note S dk = (s dk1, s dk2,, s dkm ), les composantes du k ième élément de l'ensemble S d et S k = (s k1, s k2,, s km ) les composantes du k ième élément de l'ensemble S. On note aussi : la fonction d'activation d'un neurone (et ', sa dérivée) y j, la sortie du neurone j d'une couche cachée. On a alors : y j = ϕ wijei θ j (Eq. I.1) i où w ij, sont les poids de la connexion entre le neurone j et le neurone i de la couche précédente e i est l'entrée n i du neurone j j est un biais éventuel. Après la présentation du k ième exemple, on veut minimiser l'erreur quadratique observée, qui est définie par : E 1 (Eq.I.2) = m 2 sdki ski 2 i= 1 Cette erreur sera alors minimisée par la méthode du gradient, c'est-à-dire en faisant évoluer les poids dans la direction indiquée par le gradient de E. La règle de modification des poids de la connexion reliant un neurone j à un neurone i pour l'itération k est donnée par : w k ij = w k 1 ij αδ y i j (Eq.I.3) où est le taux d'apprentissage. i est le signal d'erreur de l'unité i, i.e. la contribution de l'entrée de l'unité i à l'erreur quadratique constatée en sortie. Le calcul de ce signal d'erreur se fait par le principe de rétropropagation. Considérons la couche de sortie, c'est-à-dire que l'indice i caractérise la couche de sortie. On obtient alors : δ = i ( si sdi i ) ϕ (' e ) (Eq.I.4) 20

Le calcul des poids de la dernière couche dépend des éléments des couches précédentes. Considérons maintenant le cas où i est l'indice d'un neurone caché. Considérons la couche de neurones suivant immédiatement l'unité i et notons j l'indice des neurones de cette couche. L'erreur quadratique E relative à la présentation d'un exemple dépend fonctionnellement de l'ensemble des y c et toutes les sorties y c dépendent de y i. Dans ce cas, le signal d'erreur i est donné par : δ = ϕ (' e ) i i c δ w c ij (Eq.I.5) La figure I.2 schématise les différentes étapes de l'algorithme de rétropropagation. j w ij Entrée e i Etat y i i (a) '('e i ) Signal d'erreur e i -s i (b) wki k i '('e i ) (c) Figure I. 2 - Apprentissage par rétropropagation : Propagation avant du signal d'entrée Calcul du signal d'erreur i relatif à un neurone de sortie Calcul par rétropropagation du signal d'erreur d'un neurone caché Les réseaux multicouches à rétropropagation du gradient sont des outils performants pour la classification non-linéaire, la compression de données, l'approximation de fonction Cependant, ces réseaux présentent certains inconvénients. En effet, le temps d'apprentissage peut être long (de quelques minutes à plusieurs heures suivant la complexité du problème traité). De plus, il n'existe pas de méthodologie formelle pour la conception et la construction 21

de ce type de réseau. Les choix des paramètres caractéristiques du réseau (nombre de couches, nombre de neurones par couches, pas d'apprentissage, fonction d'activation) se font alors par tâtonnement pour obtenir les performances recherchées. Malgré ces difficultés, ils possèdent des capacités remarquables d'apprentissage et de reconnaissance des formes. Pour cela, ils sont particulièrement bien adaptés à la résolution de problèmes de diagnostic industriel et médical, comme le montrent les exemples d'utilisation pour la classification de signaux en médecine [ALPS 95] (classification de Potentiels Evoqués Auditifs), et pour le diagnostic des machines tournantes. En effet, Yang et son équipe anglaise ont mis en œ uvre un réseau à rétropropagation du gradient pour le diagnostic de 4 catégories de défaut d'un roulement à billes [YANG 03]. Les signatures utilisées pour caractériser le fonctionnement du moteur sont des signatures vibratoires et quatre approches basées sur les analyses bi-spectrales et par ondelettes du signal vibratoire sont proposées. Le but est l'évaluation en continu du fonctionnement du moteur. Les résultats de ces analyses constituent les entrées des réseaux de neurones à rétropropagation entrainés pour reconnaître les défauts de roulement. Les résultats obtenus et présentés dans [YANG 03] montrent que le réseau peut alors distinguer les quatre différentes conditions de fonctionnement avec des taux de classification correcte très élevés (atteignant même les 100% dans le cas d'une des analyses bispectrales). Il faut toutefois noter que, pour cette étude, les défauts créés artificiellement sont assez marqués, et qu'une machine présentant ce type de défauts seraient alors déjà dans un état très défaillant. Cette étude récente sur des travaux similaires à ceux menés au cours de cette thèse montre cependant l'intérêt donné aux réseaux de neurones artificiels dans le domaine du diagnostic. La structure de "Learning Vector Quantization" (LVQ) a été proposée à la fin des années 80 par Teuvo Kohonen [KOHO 88], [KOHO 89]. Elle fait partie des techniques de compétition les plus simples. Toutefois, malgré sa simplicité, elle est très efficace et présente donc un intérêt pratique non négligeable. L'objectif de ce type de méthodes est de déterminer des vecteurs (appelés aussi vecteurs prototypes) qui sont représentatifs des données à traiter et servent ensuite à la classification et à la compression de données. Les vecteurs prototypes sont codés par les poids du réseau. L'apprentissage permet de retrouver les valeurs caractéristiques de ces vecteurs prototypes. Cet apprentissage est de type supervisé. L'algorithme d apprentissage, proposé par 22

Teuvo Kohonen, est un algorithme basé sur la technique de compétition entre les neurones. Un tel comportement est appelé "tout au vainqueur" ("Winner Take All"). Les neurones sont donc en concurrence les uns avec les autres. On appelle ce type d apprentissage apprentissage concurrentiel. Structure du réseau Le réseau LVQ est un réseau multi-couches, dont la structure est schématisée par la figure I.3. Il se compose de trois couches : une couche d'entrée, une couche cachée, encore appelée couche de compétition et une couche de sortie. W 1 W 2 e 1 s 1 e S s m Couche d entrée (S neurones) Couche cachée, dite de compétition (S 1 neurones) où W 1 est une matrice de dimension S 1 xs W 2 est une matrice de dimension S 2 xs 1 Figure I. 3 - Structure d'un réseau LVQ Couche de sortie (S 2 neurones) Le fonctionnement d un tel réseau est alors le suivant : lorsqu un vecteur e est présenté au réseau, ce dernier calcule la distance euclidienne entre le vecteur d entrée e et les vecteursligne composant la matrice des poids W 1. On obtient alors un vecteur de dimension S 1 qui est présenté à la couche de compétition. Le neurone qui possède alors la plus petite entrée (c està-dire celui dont le vecteur des poids est le plus proche du vecteur d entrée e) est alors désigné comme vainqueur et sa position dans la couche de compétition est donnée par l équation Eq. I.6. C= arg min k j 2 ( e(j)-w 1(k, j) ) où C est la réponse donnée par le C ième neurone de la couche de compétition, (Eq. I.6) 23

e(j) est la j ième composante du vecteur d'entrée e W 1 (k,j) est la j ième composante de la k ième ligne de la matrice des poids W 1 La réponse donnée par le C ième neurone de la couche de compétition est alors égale à 1 et les sorties des autres neurones cachés seront égales à 0. La couche de compétition classe les vecteurs d entrée en S 1 sous-classes. La couche de sortie, dont la fonction de transfert est une fonction linéaire, va alors transformer la réponse donnée par la couche de compétition afin de déterminer l appartenance du vecteur d entrée e à l une des classes définies par l utilisateur. Si, par exemple, les neurones 1, 2 et 3 de la couche de compétition apprennent tous des sous-classes de l espace d entrée qui font partie de la classe 2, alors, les poids des connexions reliant les neurones compétitifs 1, 2 et 3 au neurone de sortie 2 prendront la valeur 1, tous les autres poids synaptiques des liaisons entre ces neurones compétitifs et les autres neurones de sortie étant alors nuls. Ainsi, ce neurone de sortie répondra 1 si n importe lequel des trois neurones compétitifs gagne la compétition. Le nombre de neurones S de la couche d'entrée et S 2 de la couche de sortie dépend du problème à traiter. La couche d'entrée comprend autant de neurones que de composantes des vecteurs de la base de données. Pour la couche de sortie, le nombre de neurones est égal au nombre de classes désirées. Ces derniers possèdent deux états d'activation : 0 ou 1. Par exemple, si on présente au réseau un vecteur appartenant à la classe n 1, le neurone n 1 de la couche de sortie sera actif (état 1), alors que les autres neurones de sortie seront inactifs (état 0). Le choix du nombre de neurones S 1 de la couche cachée est un problème plus délicat. Il doit obéir à un compromis optimisant l'apprentissage et la capacité du réseau à généraliser. Cependant, la couche de compétition classant les vecteurs d entrée au sein de S 1 sous-classes, il sera nécessaire de choisir S 1 supérieur à S 2. Initialisation Avant d entraîner un réseau LVQ, il faut initialiser les matrices des poids W1 et W2. On initialise ces poids à partir des vecteurs de la base d apprentissage et des classes désirées pour ces vecteurs d apprentissage. La matrice des poids W1 est initialisée de la manière suivante : chacun des poids W1(i,j) associés à l entrée i prend la valeur correspondant au centre de l intervalle au sein duquel sont comprises toutes les valeurs que peut prendre l entrée i. 24

La seconde phase de l initialisation consiste à assigner les neurones de la couche de compétition à chacune des classes. Pour cela, l algorithme d initialisation recherche la distribution des sorties désirées. Ainsi, si 35% des vecteurs de la base d apprentissage appartiennent à la classe 2, 35% des neurones de la couche de compétition seront dédiés à la reconnaissance de sous-classes formant la classe 2. Alors, comme nous l avons vu précédemment, si les neurones 1, 2 et 3 de la couche de compétition sont désignés pour former des sous-classes de la classe 2, les poids W 2 (2,1), W 2 (2,2) et W 2 (2,3) prendront la valeur 1, tous les autres poids synaptiques W 2 (2,j), où j [4,S 1 ] seront alors égaux à 0. Apprentissage : Une fois le réseau initialisé, l apprentissage peut commencer. On recherche tout d abord le vecteur des sorties désirées S dc pour la couche de compétition, en utilisant la matrice W 2 des poids de la couche de sortie et le vecteur S d des sorties désirées fixé par l utilisateur de la manière suivante. S W * = 2 (Eq I.7) dc Sd Cette expression transforme le vecteur S d des sorties désirées, contenant un 1 à la position de la classe désirée, en un vecteur S dc de sorties désirées pour la couche de compétition contenant des 1 aux positions correspondant à tous les neurones formant les sousclasses de la classe désirée. Un vecteur e de la base d apprentissage est ensuite présenté au réseau. D après ce qui précède, le neurone de la couche de compétition dont le vecteur des poids est le plus proche (au sens de la distance Euclidienne) du vecteur d entrée gagne la compétition (répond la valeur 1). Seul le vecteur des poids correspondant à ce neurone vainqueur sera alors modifié. Si la sortie de ce neurone de la couche de compétition correspond à la valeur attendue, les poids sont alors ajustés de la manière suivante : [ 1 S] W1( C, j) = lr ( e( j) W 1( C, j)) j ; (Eq. I.8) où l r est le pas d apprentissage, fixé par l utilisateur. Sinon, si la sortie désirée du neurone vainqueur est 0 (c est-à-dire si ce neurone correspond à une sous-classe n appartenant pas à la classe désirée), la règle de Kohonen est appliquée, mais avec un signe opposé. 25

[ 1 S] W1( C, j) = lr ( e( j) W 1( C, j)) j ; (Eq. I.9) On répète ensuite cette procédure avec les autres couples vecteur/classe désirée de la base d apprentissage. Le nombre de fois où cette procédure est répétée est fixé par l utilisateur. Dans le cadre de cette technique, il n existe aucun critère d arrêt pour l apprentissage, contrairement à d autres méthodes comme la rétropropagation du gradient dans le cas du Perceptron multicouches. Ainsi, d après Jodouin, cette technique d apprentissage peut conduire à des phénomènes de surapprentissage [JODO 94]. En effet, si l apprentissage LVQ est prolongé outre mesure, le réseau finit par consacrer une proportion considérable de ses vecteurs prototypes à suivre le détail des frontières entre les classes. Le réseau obtient alors de moins bonnes performances sur le problème en général, car, s il a appris correctement, ses performances en généralisation sont dégradées. Cependant, elles sont rapides et donnent de bons résultats dans le cadre de la classification. Dans [VUCK 02], on trouve une application de ce type de modèle pour la classification de signaux électroencéphalographiques (EEG) en deux catégories. Le but de leur étude est de pouvoir détecter les états de somnolence et de vigilance d'un être humain en bonne santé à partir de son EEG. Pour cela, ils ont utilisé deux modèles de réseaux de neurones artificiels : le perceptron multi-couche et le réseau Learning Vector Quantization. Leurs résultats montrent alors de meilleures performances pour le réseau LVQ par rapport au perceptron employé. Cette étude récente montre l'intérêt d'un tel modèle pour la classification de signaux.! Les modèles à fonction de base radiale (RBF 2 ) sont des modèles dans lesquels la modélisation s'effectue par des fonctions locales, appelées aussi fonctions noyaux. Ils reposent sur une cartographie de l espace des entrées par des exemples qui ont une influence locale. Ce sont des réseaux à couches avec comme origine, une technique d interpolation nommée méthode d interpolation RBF ( RBF interpolation ) ou méthode des noyaux. Cette méthode est bien connue en statistique pour l approximation à partir de données empiriques de densités de probabilités. Elle a été proposée par Powell [POWE 85] et améliorée par 2 Radial Basis Function en anglais. 26

Niranjan et Fallside [NIRA 88]. Employée pour la première fois dans le contexte des réseaux de neurones par Broomhead et Lowe [BROO 88], cette technique s avère être à la fois rapide et efficace, en particulier dans le cadre de la classification. Les réseaux à fonction de base radiale font partie des réseaux à base de distance. Les neurones sur lesquels sont basés ces réseaux sont appelés neurones à base radiale et sont basés sur la distance entre le vecteur d entrée X et le vecteur centre (vecteur de la base d apprentissage, aussi appelé vecteur prototype) du neurone C. La sortie de ce type de neurone est définie de la manière suivante : où n y = G( X C ) = G n n X(i) C(i) (Eq I.10) i X est la norme n du vecteur X. La fonction G(z) est généralement une fonction non n linéaire, symétrique, monotone pour z>0. Les bornes supérieures et inférieures de cette fonction sont respectivement notées G max et G min. Dans la plupart des cas, G(z) est une fonction exponentielle généralisée : ( G G ) m z σ G( z) G + e (Eq. I.11) = min max min où les deux paramètres m et σ sont respectivement l ordre et l écart type de la fonction. Les frontières de décision (zone d influence) D(γ), qui correspondent à l'ensemble des points de l'espace d'entrée pour lesquels le réseau donne une réponse en sortie égale à γ R, sont alors 1 données par X C = G ( γ ). n Le cas le plus fréquemment utilisé est le cas particulier où n=2, G min =0 et m=2. Dans ce cas, la distance calculée entre le vecteur X et le vecteur centre C est la distance euclidienne et la fonction G(z) est une fonction gaussienne. Les paramètres décrivant alors un tel neurone à base radiale sont la position des centres et l écart type de la gaussienne. De plus, dans ce cas, la frontière de décision D(γ) définie précédemment est sphérique. 27

Structure du réseau : Le réseau RBF est un réseau à trois couches 3 : une couche d entrée, une couche cachée composée des neurones à base radiale présentés précédemment et une couche de sortie de neurones dont la fonction d activation est linéaire. La figure I.4 illustre l architecture d un réseau RBF. Le nombre de neurones des couches d entrée et de sortie est choisi en fonction du problème à traiter. En ce qui concerne la couche cachée, la technique RBF prévoit une fonction noyau, c est-à-dire un neurone, par point de donnée apprise. En d autres termes, le nombre de neurones de la couche cachée est égal au nombre d exemples présentés au réseau lors de la phase d apprentissage. Dans ce cas, cela assure un comportement sans erreur pour les données connues. Toutefois, en pratique, les données peuvent être nombreuses et redondantes. Certains algorithmes d apprentissage peuvent alors conduire à un nombre plus restreint de neurones (par exemple [BROO 88]). e 1 W 1 W 2 e 2 s 1 e 3 s S2 e S Couche d entrée S neurones Couche cachée composée de fonctions-noyaux S 1 neurones Figure I. 4 - Structure d'un réseau RBF Couche de sortie S 2 neurones Apprentissage : On peut distinguer deux étapes distinctes dans la phase d apprentissage des réseaux RBF : la paramétrisation des fonctions à base radiale et l apprentissage des poids de la couche de sortie [MOOD 89]. La première étape peut se décomposer en deux sous-étapes : la détermination du nombre et de la position des centres C i et le choix de la taille σ i des champs 3 Pour certains auteurs, les réseaux RBF sont des réseaux à deux couches, car les entrées ne sont pas considérées comme définissant une couche. 28

récepteurs. La position du centre C i d un neurone de la couche cachée est codée par les poids W 1 (i,j) d entrée du neurone et la dimension σ i, par un paramètre interne L algorithme d apprentissage de base du réseau à fonction de base radiale est le suivant : on associe à chacun des vecteurs de la base d apprentissage un neurone à base radiale. Ces vecteurs sont alors codés dans les poids d entrée et constituent les centres C i de ces neurones. Puis, on procède à l ajustement des poids de la couche de sortie. Pour ce calcul, des auteurs préconisent des techniques d apprentissage linéaires [JODO 94]. Le rôle de la couche cachée est de recoder son entrée de manière à ce que les différentes classes puissent être reconnues par des séparateurs linéaires. Dans le cadre des réseaux RBF, ce recodage se fait de façon naturelle : chaque neurone à base radiale vient décrire par son champ récepteur un nuage de données appartenant toutes à la même classe. La couche de sortie choisit alors, parmi les neurones actifs de la couche cachée, la classe la mieux représentée. La réponse s i du i ème neurone de sortie est alors donnée par la relation suivante : =W ( i j) y( j) s i 2, (Eq. I.12) j où y(j) représente la sortie du j ème neurone à base radiale (neurone de la couche cachée). Il existe plusieurs variantes de cet algorithme, car, en pratique, les données peuvent être nombreuses et redondantes, ce qui conduirait à un réseau surdimensionné. On peut alors citer : les algorithmes incrémentaux, où on construit une architecture de réseau adaptée au problème en augmentant la complexité de la structure du réseau par un ajout de neurones, les algorithmes décrémentaux, dont le principe est de simplifier une architecture complexe de réseau en supprimant les paramètres (connexions ou neurones) qui ne sont pas nécessaires à une application spécifique [MUST 92]. Les réseaux RBF effectuent une cartographie de l espace d entrée en associant un ensemble de catégories à un ensemble de zones de l espace d entrée. Ils sont capables de calculs très puissants. De plus, leur apprentissage est rapide et simple. Ces qualités font de ces réseaux des outils de choix pour de multiples applications, dont la classification et la quantification. 29

Par exemple, F. Schwenker et al. [SCHW 02] mettent en œ uvre ce réseau pour classer des séries temporelles acoustiques. Leur base de données contient les chants de crickets de 35 espèces enregistrés en Thaïlande et en Equateur. Des caractéristiques locales 3 au total - sont alors extraites des enregistrements et classées par des classifieurs neuronaux de type RBF suivant 35 catégories. La mise en œ uvre de ces réseaux leur permet alors d'atteindre un taux d'erreur de 34,65% pour la classification de l'une des caractéristiques. Ces réseaux, grâce à leurs perfomances en matière de classification, sont des outils privilégiés pour l aide au diagnostic, ce qui justifie leur exploitation dans le cadre de mes travaux. Cependant et nous le montrerons au chapitre II - les approches neuronales simples, c'est-à-dire celles n'impliquant qu'un seul réseau de neurones artificiels, ne sont en général pas suffisantes pour construire un outil performant pour l'aide au diagnostic [DUJA 99a,b,c]. En effet, si, depuis les deux dernières décennies, des études ont montré que les techniques à base de réseaux de neurones présentent des avantages certains pour résoudre des problèmes pour lesquelles les méthodes conventionnelles sont limitées, d'autres ont aussi montré que le comportement complexe et les performances («comportement intelligent») des systèmes biologiques (vivants) ne peuvent se résumer dans la simplicité actuelle de telles structures [CHEB 97]. Partant de ce constat, inversement, il paraît invraisemblable que des approches n impliquant qu un seul réseau neuronal soient les plus appropriées pour approcher les performances du traitement d information des systèmes vivants. Nous nous sommes alors orientés vers des structures plus complexes, pouvant impliquer plusieurs réseaux de neurones. Dans le paragraphe suivant, nous proposons une approche neuronale hybride. 30

" "#$ % Informations d'entrée Etape de Pré-traitement Agent Agent Neuronal Agent Agent Etape de décision Figure I. 5 - Structure hybride Neuronale L'approche que nous proposons pour l'élaboration d'un outil d'aide au diagnostic concerne une association de différentes techniques, conventionnelles et neuronales. La stratégie que nous envisageons de mettre en œ uvre est présentée figure I.5. Dans de nombreux cas, afin d'établir un diagnostic, une seule mesure ne suffit pas à obtenir suffisamment d'informations pertinentes pour pouvoir établir un diagnostic. En effet, le médecin, par exemple, prendra en compte les résultats de différents examens, les symptômes du patient, avant de donner son diagnostic. De la même manière, pour un processus industriel, les informations relatives au fonctionnement de ce dernier peuvent être délivrés par différents indicateurs que l'opérateur doit analyser. Il semble alors légitime de prendre en compte différentes informations relatives au système (industriel ou biomédical) et de combiner ces données. L'architecture, qui permettra ensuite de traiter l'ensemble des informations délivrées par les capteurs, comprend trois niveaux de traitement : Une étape de prétraitement Un ensemble d'agents neuronaux Une étape finale de décision où on réaliserait la fusion des informations de chacun des agents neuronaux spécialisés afin de parvenir à un élément de diagnostic &'& Les informations d'entrée et l'étape de prétraitement sont deux éléments quasiindissociables de la structure hybride proposée. Dans le domaine industriel, le diagnostic 31

d'une défaillance ou d'une dégradation fait le plus souvent appel à l'utilisation de signatures élaborées à partir des signaux ou des informations. Dans le domaine médical, on trouve aussi fréquemment une chaîne de traitement des informations issues des sondes ou des examens médicaux (par exemple, pour l'obtention de la surface de la Dynamique Temporel du Tronc Cérébral). En effet, les informations brutes que fournissent les capteurs ont souvent besoin d'un traitement afin d'extraire des caractéristiques pertinentes pour la surveillance du système considéré et d en faciliter le traitement par les structures neuronales suivantes, par des opérations de filtrage, de normalisation Les principales signatures utilisées pour résoudre le problème du diagnostic dans le domaine industriel et le domaine médical sont énumérées dans la suite de cette partie. Le traitement du signal joue un rôle très important dans l'établissement des signatures associées aux fonctionnements normaux et anormaux. Une autre opération peut être aussi envisagée dans cette étape de prétraitement : il s agit de diviser le problème en sous-problèmes plus simples à partir des mesures effectuées. Le principe de cette opération peut se résumer ainsi :"Divide to Simplify" 4. (DTS). Chacun des sous-problèmes ainsi obtenus pourrait alors être traité par une structure neuronale adéquate, spécialisée pour chacun des sous-problèmes. La technique DTS est exposée dans [CHEB 97] ( && & & Une signature est une information élaborée à partir des signaux ou des données recueillies et doit contenir les informations jugées pertinentes par les spécialistes pour la détection d une défaillance ou d une dégradation. La complexité d une signature dépend de la nature du système à surveiller et varie suivant l anomalie recherchée : défaillance ou dégradation. Parmi les principales signatures utilisées, on peut citer : 4 Diviser pour simplifier 32

Les signatures vibratoires Elles sont adaptées à la surveillance d ensembles mécaniques dont les différents éléments sont soumis à des efforts mécaniques dynamiques qui se traduisent par des vibrations. Elles sont principalement utilisées pour le diagnostic des machines tournantes. Les signatures acoustiques Elles sont principalement utilisées pour la détection de fuites qui peuvent survenir dans des matériels sous pression comme les tuyauteries, les raccords, les réservoirs et les dispositifs d arrêt de fluide comme les robinets ou les vannes. Cependant, elles ne permettent pas de quantifier le débit de la fuite, en raison de l importance des bruits de fond qui existent dans les installations industrielles. Leur interprétation est souvent délicate. Les signatures ultrasonores Elles sont principalement utilisées pour détecter des défauts dans les matériaux avec lesquels sont réalisés les équipements industriels. Mais elles peuvent aussi permettre la détection d impuretés dans un liquide. L utilisation de capteurs ultrasonores permet un contrôle non destructif. Cette méthode est aujourd hui très utilisée pour la détection de fissures dans différents éléments des matériels tels que les tuyauteries, les enceintes sous pression, les soudures, les boulons [ZWIN 95]. Les signatures thermiques Elles peuvent s'obtenir de deux manières : soit par mesure de température par contact (utilisation de thermocouples et de sondes à résistance), soit sans contact (détection du flux infrarouge émis par le matériel à surveiller, par thermographie infrarouge, par exemple). Ces signatures permettent la surveillance thermique des machines ou des points chauds dans les installations électriques. Les signatures radiographiques, gammagraphiques et neutrographiques Elles sont très utilisées pour la détection de défauts volumiques dans de grosses pièces métalliques ou dans des soudures. Ces techniques permettent l'obtention d'une image (cliché bidimensionnel) contenant l'information pertinente. 33

Les signatures par analyse des lubrifiants Elles sont utilisées pour déterminer les caractéristiques physico-chimiques du lubrifiant et d'identifier une usure des éléments mécaniques. Elles peuvent être de nature différente : spectrogramme, images, critères quantitatifs. Elles permettent une détection précoce de mécanisme d'usure sur des machines tournantes. Il faut cependant être très attentif à la qualité de la prise des échantillons du lubrifiant car de là dépend la fiabilité des conclusions. ( '& ") && Pour le problème du diagnostic médical, les informations sont tout d'abord des données factuelles. Le patient décrit ses symptômes au médecin (intensité et localisation d'une douleur, apparition de troubles, sensations.). Ce dernier va ensuite, après auscultation, déterminer la cause des symptômes décrits ou observés ou, si besoin est, orienter le patient vers des examens complémentaires. Les capteurs susceptibles d être alors utilisés correspondent à ceux mis en œ uvre pour réaliser les différents examens que les médecins ont à leur disposition. Suivant le trouble dont il s'agit de trouver la cause, les examens et donc les capteurs mis en jeu sont différents. Il peut alors s agir d appareils d imagerie (radio, scanner, IRM ), mais aussi d électrodes pour le recueil de signaux tels que les électrocardiogrammes, électro-encéphalogramme, ou potentiels évoqués (réponse électrique provoquée par la stimulation brève d'un organe sensoriel). Les potentiels évoqués les plus connus sont les somesthésiques, les visuels et les auditifs, dont nous parlerons plus en détail dans la suite de ce mémoire. Les données factuelles, dont nous parlions précédemment, pourraient faire aussi l'objet d'une formalisation afin de traiter ces informations par les agents neuronaux mis en œ uvre dans l'étage suivant de l'approche proposée. Les informations permettant de caractériser le fonctionnement du système surveillé sont maintenant recueillies par les capteurs et traitées de façon à extraire l'information pertinente contenues dans ces données ou signaux bruts. Il s'agit maintenant de fournir des éléments de diagnostic. 34

Nous proposons ensuite de mettre en œ uvre un ensemble d'agents neuronaux pour apporter un élément de réponse au problème du diagnostic du système surveillé. Ces agents peuvent être des modèles neuronaux similaires (architecture homogène) ou différents (architectures hétérogènes). Une présentation générale des réseaux de neurones artificiels, ainsi que celle des structures utilisées dans cette thèse, ont été faites au paragraphe I.2.2. ' La phase de décision, quant à elle, doit permettre de donner un élément de diagnostic à partir des informations fournies par l ensemble des agents neuronaux spécialisés. Pour cela, plusieurs solutions semblent être acceptables. On peut ainsi envisager la mise en œ uvre d un certain nombre de techniques : théorie de la décision, systèmes experts, systèmes neuronaux. On peut aussi envisager de prendre en compte des informations non traitées par les agents neuronaux. Ainsi, par exemple, les données factuelles comme les symptômes des patients dans le domaine médical, pourrait être introduites à ce niveau de notre approche. Par exemple, dans le cadre du problème biomédical, la prise en compte du seuil auditif interviendra, dans cette structure, au niveau de cette étape de décision. De plus, l'objectif étant l'étude d'un outil d'aide au diagnostic le but n'étant pas de se substituer au spécialiste, notamment dans le domaine médical, où le médecin doit rester maître de sa décision -, il paraît alors intéressant de pouvoir obtenir un indicateur de confiance du résultat fourni par la structure hybride proposée. Différentes structures ont ainsi été mises en œ uvre au cours de cette thèse. Elles seront présentées au chapitre III. Les travaux de F. Schwenker [SCHW 02] peuvent constituer une application de cette structure hybride. Rappelons que leur but est la classification de signaux bio-acoustiques. La première étape consiste en l'extraction de trois caractéristiques locales des signaux enregistrés (étape de pré-traitement). Puis, chacune de ces caractéristiques est traitée par un classifieur 35

neuronal, un réseau RBF. Les résultats de classification sont ensuite fusionnés suivant 3 différentes techniques. La mise en œ uvre de telles techniques leur permet alors d'atteindre un taux de classification correcte de 93,78%, malgré des résultats de classifcation insuffisants issus des réseaux de neurones utilisés seuls (9,06% de classification correcte pour la caractéristique 1, 65,35% pour la caractéristique2 et 7,87% pour la caractéristique 3). Ces travaux récents montrent donc une nette amélioration des performances, et ainsi, justifient l'emploi d'une telle structure. * Qu il s agisse d "identifier la cause probable de la (ou des) défaillance(s) à l aide d'un raisonnement logique fondé sur un ensemble d'informations provenant d'une inspection, d'un contrôle ou d'un test" 5 dans le cas du diagnostic industriel, ou de "déterminer une maladie d'après ses symptômes" 6 dans le cas du diagnostic médical, le problème du diagnostic est un problème complexe. Le choix d'une technique d'aide au diagnostic dépend donc fortement des connaissances dont on dispose sur le système, mais pas uniquement. Il faut en effet aussi tenir compte de la façon dont les connaissances peuvent être formalisées, mais aussi des critères de fonctionnement. Ainsi, il est important de savoir si ces connaissances caractérisent un fonctionnement normal ou anormal du système. Leur accessibilité et leur fiabilité sont aussi des aspects dont il faut tenir compte. Enfin, concernant la formalisation des connaissances, le problème porte sur le type dont il s'agit (système d'équation, graphe ). Parmi les critères de fonctionnement, on peut citer la rapidité du temps de réponse, la robustesse au bruit, aux erreurs de modélisation, la capacité de prédiction Enfin, il n'est pas envisageable de penser la mise en place d'un système de diagnostic en dehors de toute présence humaine. L'homme est un acteur incontournable dans la procédure de diagnostic. Il possède en effet les capacités de juger et de décider en cas d'incertitude, d'anticiper un dérèglement à partir d'indices avant son effet sur le système, d évaluer, de synthétiser, d'interpréter, et de raisonner rapidement en fonction des cas les plus 5 définition retenue par les instances nationales et internationales de normalisation (AFNOR, CEI) 6 définition étymologique du dictionnaire ROBERT faisant référence à la racine grecque du mot (dia : par, gnosis : connaissance) 36

probables. Cependant, ces interventions comportent une contrainte temporelle : afin d'éviter toute situation grave, tant dans le domaine industriel que dans le domaine médical, il est indispensable de réagir vite. Compte tenu de la complexité des problèmes généralement rencontrés dans le domaine de l'aide au diagnostic et plus particulièrement dans les domaines auxquels nous nous sommes intéressés l'utilisation des techniques conventionnelles devient vite inefficace. C'est pourquoi nous avons consacré ce travail de thèse à l'étude de l'aide au diagnostic par réseaux de neurones artificiels. Dans ce chapitre, nous avons passé en revue trois modèles neuronaux : le réseau à rétropropagation du gradient, le réseau Learning Vector Quantization et le réseau Radial Basis Function. Le réseau à rétropropagation du gradient est un outil performant pour la classification non-linéaire, la compression de données, l'approximation de fonction Le réseau Learning Vector Quantization, quant à lui, est un réseau classifieur. Enfin, le réseau Radial Basis Function est utilisé lui aussi à des fins de classification. Il donne aussi de bons résultats dans l'approximation de fonction, et l'identification. Enfin, nous proposons une structure hybride neuronale multi-modèle pour l'aide au diagnostic. Partant de l'hypothèse que les approches neuronales simples, c'est-à-dire celles n'impliquant qu'un seul réseau de neurones artificiels, ne sont en général pas suffisantes pour construire un outil suffisamment performant pour l'aide au diagnostic, nous avons donc construit une structure plus complexe, pouvant s'adapter à une plus large variété de domaines d'application. Bien que certains travaux aient été effectués sur le mélange d'experts neuronaux [JORD 95][SRID99][CHEN 99], ceux-ci n'en sont encore qu'à un stade théorique, et ne sont donc pas encore exploitables. De plus, l'idée de base de ces travaux repose essentiellement sur des techniques issues des méthodes statistiques, qui supposent un nombre suffisant et important de données. Dans les cas réels (et aussi dans les applications traitées), cette dernière condition n'est pas forcément réalisable. Notre choix s'est porté sur une architecture de traitement des informations comprenant trois niveaux : un niveau de prétraitement, un autre constitué d'agent neuronaux et enfin, un niveau de décision. La phase de prétraitement des informations doit permettre d'extraire des caractéristiques pertinentes pour la surveillance du système considéré et d en faciliter le traitement par les structures neuronales suivantes. Il peut alors s'agir d'opérations de filtrage, de normalisation Ces informations ainsi traitées sont ensuite présentées à un ensemble d'agents neuronaux. Ce niveau de traitement peut être homogène (les agents neuronaux sont du même type) ou hétérogène (on utilise des modèles différents). Dans les applications présentées et traitées dans cette thèse, ce niveau de 37

traitement permet de réaliser une classification préliminaire des informations d'entrée. En effet, dans le domaine du diagnostic, la classification ou, plus exactement, la catégorisation de signaux issus du système à surveiller en fonctionnement, c'est à dire l'affectation de la catégorie de défauts à ces signaux - tient une place importante. Enfin, une phase de décision donnera un élément de diagnostic. Ce dernier niveau de traitement peut mettre en jeu diverses techniques, comme des opérations de seuillage, des réseaux de neurones artificiels, ou même des systèmes experts. Pour mettre en œ uvre une telle stratégie, et ce, quel que soit le domaine d'application, il est tout d'abord nécessaire de disposer d'une base exhaustive d'informations relatives au fonctionnement du système à surveiller, afin de pouvoir mettre en œ uvre les structures neuronales (apprentissage des cas normaux et des cas de fonctionnement anormal). Concernant les agents neuronaux, nous avons choisi de mettre en œ uvre des modèles particulièrement adaptés à la classification : les réseaux Learning Vector Quantization et Radial Basis Function. Une étude doit ensuite permettre de choisir la structure (nombre de neurones, réglage de paramètres) la plus adéquate pour le traitement du problème posé. Enfin, le choix du module de décision devra répondre aux attentes des médecins dans le cas d'une application médicale (obtention d'un diagnostic, avec ou sans indice de confiance, par exemple), ou du cahier des charges imposé par une entreprise dans le cas d'une application industrielle (obtention d'un seuil d'alerte pour une maintenance préventive, localisation d'un défaut ). Le chapitre suivant est destiné à montrer les limites d'une approche neuronale à réseau de neurones unique dans la résolution d'un problème d'aide au diagnostic. Deux problèmatiques ont ainsi été étudiées. L'une concerne le domaine biomédical, et l'autre, le domaine industriel. 38

Chapitre I....13 Diagnostic et Réseaux de Neurones Artificiels...13 I.1. Introduction...13 I.2. Les Réseaux de Neurones Artificiels...16 I.2.1. Réseaux de neurones artificiels et diagnostic...16 I.2.2. Le perceptron...18 I.2.3. Le réseau Learning Vector Quantization...22 I.2.4. Le réseau Radial Basis Function...26 I.3. Approche neuronale hybride...31 I.3.1. Généralités...31 I.3.2. Informations d'entrée et étape de prétraitement...31 ( && & &...32 ( '& ") &&...34 I.3.3. Les agents neuronaux...35 I.3.4. L'étape de décision...35 I.4. Conclusion...36 39

Comme nous l avons souligné précédemment, le problème du diagnostic est un problème complexe. De nombreuses techniques ont été développées et constituent une aide précieuse. Les travaux présentés dans cette thèse ne prétendent pas résoudre le problème du diagnostic, mais apporter une aide pour le diagnostic dans les domaines industriel ou médical. Ils concernent les méthodes de diagnostic externes, c est-à-dire celles qui ne nécessitent pas de modèle pour être mises en œ uvre. La seule connaissance du système à surveiller repose alors sur l'expertise humaine confortée par un solide retour d'expérience. Dans cette catégorie, on trouve les techniques de reconnaissance de formes, mais aussi les techniques basées sur l'intelligence artificielle, qui constituent des outils privilégiés pour la catégorisation d'informations issues du système à surveiller en fonctionnement, c'est à dire l'affectation de la catégorie de défauts à ces signaux. Dans le domaine du diagnostic qu'il soit industriel ou médical cette tâche tient une place importante 1. Ce chapitre a pour objet l'étude de la mise en œ uvre de réseaux de neurones pour l'aide au diagnostic dans deux domaines, l'un biomédical, l'autre industriel. La première partie de ce chapitre est consacrée au problème biomédical. Après avoir présenté la problématique ainsi que la mise en œ uvre d'une technique conventionnelle, nous aborderons l'application de techniques neuronales à réseaux de neurones unique. Deux modèles neuronaux ont été mis en 1 Remarque : pour des raisons liées aux différentes significations que peut prendre le terme «classification» selon le domaine, dans la suite de cette thèse, nous allons utiliser ce terme dans le sens de la «catégorisation». Notre choix d usage de ce terme dans le sens précité est motivé par l utilisation du terme «classification» dans ce sens dans la littérature scientifique anglophone : le terme «catégorisation» étant plutôt courant parmi les biologistes (neurosciences). 40

œ uvre pour la classification des informations : le réseau Learning Vector Quantization et le réseau Radial Basis Function. Nous présentons ensuite les résultats obtenus. Enfin, nous aborderons la problématique industrielle et présenterons de la même manière les résultats des techniques neuronales simples qui lui sont associés. L'objet de cette étude est le développement d un outil d aide au diagnostic pour les médecins ORL. L exploration fonctionnelle otoneurologique possède aujourd hui une technique permettant l étude objective de la conduction nerveuse le long des voies auditives : les Potentiels Evoqués Auditifs (PEA), qui sont des signaux électriques. La classification des PEA est une première étape dans le développement d un outil d aide au diagnostic. La difficulté principale de cette classification réside dans la ressemblance de signaux correspondant à des pathologies différentes, mais aussi dans la disparité des signaux au sein d'une même classe. Les résultats du test médical peuvent, par exemple, être différents pour deux mesures différentes pour le même patient. Lorsqu on stimule un organe sensoriel, il engendre une série de processus neurologiques, d une grande complexité. Les processus nerveux, quelle qu en soit leur origine, mettent en jeu de minuscules décharges électriques que l on nomme potentiel d action et qui se propagent le long des voies nerveuses. Lorsqu'un grand nombre de potentiels d action est émis en même temps, il apparaît par sommation un potentiel électrique. Les potentiels évoqués sont des réponses électriques provoquées par la stimulation brève d un système sensoriel. Ce stimulus provoque le départ d une volée de potentiels d action qui peuvent être enregistrés sur le trajet des nerfs, ou plus à distance des structures activées. Les électrodes exploratrices enregistrent la réponse évoquée sous l aspect de variations de potentiel successivement positives et négatives. 41

Figure II. 1 - Principe de génération des PEA Le processus de génération d un Potentiel Evoqué Auditif (PEA) consiste à stimuler l oreille avec un écouteur attaqué par un clic électrique. Sous l effet de cette stimulation, les fibres nerveuses sont excitées et génèrent un potentiel d action. La somme de ces potentiels d action, synchrones de la stimulation, est recueillie à distance et constitue le PEA. La figure II.1 est un schéma de principe qui résume la génération des PEA. Les potentiels évoqués auditifs sont des signaux d amplitude très faible, quelques centaines de nanovolts, noyés dans un bruit de fond d amplitude très supérieure, de plusieurs centaines de millivolts. Ce bruit de fond est constitué de l activité électro-encéphalographique (EEG), à laquelle se rajoute l activité électro-myographique due au fait que l on recueille ces potentiels à distance de leur lieu d émission, à travers les espaces méningés, la boîte crânienne, les muscles d insertion céphalique et cervicale et le cuir chevelu. C est en raison de cette difficulté d extraction que de nombreuses techniques de traitement du signal ont été mises en œ uvre. Ces potentiels reflètent l activité de l oreille interne, du nerf auditif et d une partie du tronc cérébral. Ils sont composés essentiellement de cinq ondes, désignées de I à V. Le temps d apparition d une onde par rapport à l émission du clic est appelé latence de cette onde. La figure II.2 représente un PEA parfait. L origine de ces ondes a longtemps été sujette à discussion. On s accorde généralement pour admettre que les ondes I reflète l activité du nerf auditif, l onde II, celle des noyaux cochléaires, l onde III, de l olive supérieure, l onde IV du lemnisque latéral et l onde V, celle du colliculus inférieur 2. C est du moins le schéma qui prévaut en clinique courante. Toutefois, il ne s agit que d une approximation puisqu il est 2 Une présentation de l'appareil auditif est donnée en Annexe 3. 42

probable qu à une onde ne correspond pas un générateur unique mais un ensemble de générateurs qui déchargent simultanément. Figure II. 2 - PEA Parfait Les PEAs nous renseignent donc sur l'activité des voies auditives, depuis l'oreille interne jusqu'au tronc cérébral. De ce fait, ils ont deux domaines d'applications : la détermination objective du seuil auditif et le diagnostic des pathologies du nerf auditif ou des voies centrales : les PEA permettent de situer objectivement le seuil auditif sur la zone des aigus, de 2 000 à 4 000 Hz, par le repérage de l'onde V que l'on suit jusqu'à 10 à 20 db du seuil auditif. Ceci est utile chaque fois que l'audiométrie tonale n'est pas réalisable (très jeunes enfants, personnes souffrant de retard mental ou simulant une surdité...) une altération du fonctionnement du nerf auditif ou du tronc cérébral va modifier les PEA. C'est ainsi qu'ils aident au diagnostic des tumeurs du nerf auditif (neurinome), des atteintes vasculaires ou tumorales du tronc cérébral ou encore dégénératives telles que la sclérose en plaque, par exemple. L'examen des PEA a longtemps été celui qui permettait le diagnostic précoce du neurinome de l'acoustique, tumeur bénigne développée à partir de la gaine de Schwann du nerf cochléo-vestibulaire. Les PEA sont entrés dans la pratique clinique quotidienne du diagnostic étiologique d'une surdité à partir des années 70. A cette époque, ils se montraient même supérieurs au scanner. Avec le développement de l'imagerie par résonance magnétique (IRM), dont le pouvoir de résolution théorique est de 2 mm, ils ont perdu leur suprématie dans ce domaine. 43

Toutefois, maintenant que l'on peut faire un diagnostic par imagerie d'un tout petit neurinome, que l'on sait être une tumeur bénigne à évolution lente, savoir si elle entraîne ou non un retentissement sur la fonction de l'oreille est un élément important à considérer dans la prescription chirurgicale. Si la décision de ne pas opérer immédiatement est prise, les PEA sont un élément important du suivi du patient, par exemple. L'extraction et le recueil de ces signaux sont représentés figure II.3. On installe des électrodes sur la tête du patient en des points précis qui dépendent des buts recherchés. Dans notre cas, on utilise quatre électrodes (3 autocollantes et une aiguille) que l on place de la manière suivante : une électrode autocollante sur le front (masse) deux électrodes autocollantes derrière les oreilles, sur les mastoïdes, une électrode aiguille au sommet du crâne (vertex) pour le recueil de l EEG. La stimulation du système auditif est réalisée à l aide d un son bref, proche d'un clic acoustique, délivré par un casque que porte le patient. Figure II. 3 - Extraction et Recueil des PEA Une technique d'extraction, proposée par J-F. Motsch [MOTS 87] et M. Ohresser, permet, suite à 800 acquisitions de signaux, la visualisation de l'estimation des PEA sur des moyennes de 16 acquisitions. Ainsi, une surface, composée de 50 estimations de PEA, et appelée Dynamique Temporelle du Tronc Cérébral (DTC), peut-être visualisée. Le logiciel 44

développé pour l'acquisition et le traitement du signal PEA s'appelle ELAUDY 3. Celui-ci permet l'obtention du signal moyenné, appelé PEM, qui correspond à la moyenne des 800 acquisitions, et de la surface DTC. La figure II.4 (tirée de [MOTS 87]) montre deux surfaces typiques, l'une obtenue avec un patient normo-entendant (II.11-A), l'autre, avec un patient souffrant de troubles auditifs (II.11-B). Cette dernière figure (II.11-B) montre qu'il existe une grande variété de signaux PEA pour un même patient. De plus, ce logiciel détermine automatiquement, à partir du PEM, les cinq ondes significatives et donne les latences de ces ondes. Il permet aussi l'enregistrement, pour chaque patient, d'un fichier contenant les informations administratives (nom, âge ), les résultats des tests auditifs et les conclusions du médecin ORL (pathologie, causes, indice de confiance sur la pathologie diagnostiquée). Figure II. 4 - Surfaces DTC (A Patient Normo-entendant B Patient souffrant d'un trouble Auditif Pour l'élaboration de notre base de données, nous disposions du logiciel ELAUDY et d'un CD-ROM contenant un ensemble de dossiers de patients (11 185 dossiers). Ces dossiers proviennent du CREFON 4. Chaque dossier contient la fiche patient (informations administratives), la fiche surface DTC. L'extraction d'une base de données utile pour notre travail peut se décomposer en deux tâches : 3 Extraction et Lecture AUtomatique de la DYnamique temporelle du tronc cérébral 4 Centre de Recherche et d'exploration Fonctionnelle Oto-Neurologique 45

une sélection des patients intéressants pour l'étude suivant différents critères (âge, pathologie...), l'extraction des données pour chaque patient sélectionné (latences, signal PEM...). A partir des renseignements mentionnés par le médecin, nous avons sélectionné les sujets à inclure dans notre base de données. Grâce à un programme en langage C, nous avons ensuite extrait les informations utiles pour chaque patient ainsi sélectionné. sont : Nous avons choisi 3 catégories de patients selon le type de leur trouble. Ces catégories normal : ces patients ont une audition normale (classe normale) endocochléaire : ces patients sont atteints de troubles qui touchent la partie de l oreille située au niveau de la cochlée (classe endocochléaire) rétrocochléaire : ces patients sont atteints de troubles qui touchent la partie de l oreille située après la cochlée. (classe rétrocochléaire) En effet, les PEA ont longtemps été le moyen le plus fiable de diagnostic précoce du neurinome. Par exemple, M.Don et al. montrent l'importance de définir un système qui permet de classer les signaux caractérisant les sujets rétrocochléaires par rapport aux autres [DON 97]. De plus, il existe de nombreux travaux étudiant les différences entre les pathologies rétrocochléaires et endocochléaires. Nous avons donc choisi de commencer notre étude en ne retenant que ces deux classes pathologiques auxquelles nous avons adjoint la détection des patients normo-entendants. Nous avons ainsi sélectionné 213 vecteurs. 92 d entre eux appartiennent à la classe normale, 83, à la classe endocochléaire et 38, à la classe rétrocochléaire. Plusieurs approches peuvent alors être envisagées : une approche "signal", où les informations relatives à chaque vecteur sélectionné sont sous la forme d'un signal temporel (ex : le potentiel moyenné) une approche "données", où les informations constituant la base de données des techniques neuronales seraient les informations accessibles du logiciel ELAUDY 46

une approche "image", où les informations pour chaque cas sélectionné seraient disponibles sous la forme d'une image, qui caractériserait, par exemple, la surface DTC présentée précédemment. (Rq : cette étude a été amorcée il y a peu au sein du laboratoire) Nous avons décidé, dans un premier temps, de travailler à l'aide du potentiel moyenné (approche signal). En effet, nous savons que le praticien détermine la pathologie en observant les latences - lesquelles sont directement extraites du PEM - et l'aspect de la surface (synchronisation des différentes ondes). En travaillant directement sur le PEM, nous faisons abstraction de la détermination des ondes et des latences et nous nous intéressons directement au signal source. Pour construire notre base d apprentissage, nous avons choisi des signaux correspondant à des pathologies indiquées comme étant certaines par le médecin. Tous les signaux PEA proviennent du même système expérimental. La base d apprentissage contient 24 signaux, dont 11 correspondant à la classe rétrocochléaire, 6, à la classe endocochléaire et 7, à la classe normale. Il y a aussi d'autres paramètres dont le médecin tient compte pour l'élaboration de son diagnostic et dont la prise en compte s'est révélée indispensable pour l'obtention d'une classification correcte. Ainsi, l'examen du seuil auditif est une étape nécessaire au médecin pour permettre de distinguer les patients de la classe normale des patients souffrant d'une atteinte de type endocochléaire. Nous avons donc décidé d'inclure ce paramètre dans notre étude. Les premiers résultats obtenus dans ce travail ont en effet montré la difficulté de séparer les classes endocochléaire et normale. La prise en compte du seuil auditif permet alors d'améliorer de façon conséquente les résultats obtenus.! "! ## $ % " & ' Dans un premier temps, nous avons tenté d'évaluer la pertinence de l'utilisation de techniques conventionnelles. Pour cela, nous nous sommes penchés sur la modélisation 47

autorégressive des signaux PEM. Réaliser la modélisation autorégressive à l'ordre m d'un signal s revient à rechercher les m coefficients a i tels que : s( n) m = i= 1 ai s( n i) n + [ m 1; M ] (Eq.II.1) où M est la taille du signal s à modéliser. Nous avons alors modélisé certains signaux, qui constitueront alors une base connue 5, puis, par recherche de la corrélation entre les coefficients obtenus pour des signaux "inconnus" et ceux obtenus pour la constitution de notre base initiale, classer ces signaux suivant les trois pathologies.! (##% Pour cette première approche, nous avons tout d'abord recherché un Potentiel Evoqué Moyenné Moyen pour chacune des trois classes. Pour cela, nous avons pris au hasard un certain nombre de signaux dont la pathologie était indiquée comme étant certaine par le médecin et nous avons calculé le signal moyen. Pour chacun des trois signaux obtenus, nous avons recherché les coefficients AR. Une étude de la corrélation du signal réel avec le signal reconstitué ou moyen de l'équation Eq.II.1, nous a permis de constater qu'un ordre 45 était nécessaire pour permettre de reconstituer fidèlement le signal à l'aide des coefficients AR (Figure II.5). Ces trois séries de 45 coefficients AR vont donc constituer notre base de référence pour la classification des signaux de notre base de données. Pour chacun des 213 signaux, nous avons donc recherché les 45 coefficients AR. Puis, nous avons calculé la corrélation de ces coefficients avec chacune des trois séries de coefficients de notre base de référence. La corrélation maximale nous donne alors la classe du signal considéré. Les résultats sont présentés dans le Tableau II.1. 5 Par analogie avec la mise en œ uvre des réseaux de neurones artificiels, on pourrait appeler cette base, base d'apprentissage pour la classification. 48

Figure II. 5 Modélisation AR à l'ordre 45 des signaux Moyens Classe Réelle Rétrocochléaire Endocochléaire Normal Classe obtenue Par l approche conventionnelle Rétrocochléaire 13 36 42 Endocochléaire 15 29 28 Normal 10 18 22 Tableau II. 1 Résultats de classification par modélisationar (première approche) Le taux de classification correcte obtenu grâce à cette structure est donc de 30% pour la globalité de la base de données avec un taux de classification correcte de : 34,2% pour la classe rétrocochléaire, 34,9% pour la classe endocochléaire, 24% pour la classe normale. De plus, on a pu remarquer que les vecteurs qui nous ont permis de calculer les signaux moyens ne sont pas bien reconnus par cette technique, puisque seuls 50% de ces 49

vecteurs sont correctement classés. Le Potentiel Evoqué Moyenné Moyen n'est donc pas une représentation correcte. De ce fait, nous avons envisagé une autre stratégie pour la classification des PEAs à l'aide d'un modèle AR.! ) ##% Pour cette seconde approche, nous avons repris les vecteurs correspondant aux pathologies certaines qui nous avaient permis d'obtenir les signaux moyens mentionnés cidessus. Pour chacun de ces signaux, nous avons recherché les coefficients AR. Comme précédemment, un ordre 45 est nécessaire pour restituer fidèlement les signaux considérés. Nous obtenons donc une base de référence de 24 séries de 45 coefficients AR. Puis, nous procédons de la même manière : pour chacun des 213 signaux de notre base de données, nous recherchons les coefficients AR à l'ordre 45. Puis, nous comparons les coefficients obtenus à ceux de notre base de référence en recherchant la corrélation entre les séries de coefficients. La corrélation maximale permet alors de déterminer la classe à laquelle appartient le signal considéré. Les résultats sont présentés dans le Tableau II.2. Classe Réelle Rétrocochléaire Endocochléaire Normal Classe donnée Par l approche conventionnelle Rétrocochléaire 26 38 45 Endocochléaire 4 25 19 Normal 8 20 28 Tableau II. 2 Résultats de classification par modélisation AR (Deuxième approche) Le taux de classification correcte obtenu grâce à cette structure est donc de 37% pour l'ensemble de la base de données (y compris la base de référence) avec un taux de classification correcte de : 68,4% pour la classe rétrocochléaire, 30% pour la classe endocochléaire, 30,4% pour la classe normale. 50

On peut ainsi noter que les résultats obtenus sont globalement très insuffisants 6, et que, par conséquent, la classification par modélisation AR n'est pas une solution acceptable, car les taux de classification correcte sont très faibles. En effet, les signaux sur lesquels nous travaillons peuvent être très différents au sein d'une même classe et présenter des similitudes d'une classe à l'autre. C'est pourquoi nous avons choisi de mettre en œ uvre des techniques neuronales.! &#% L'objet de l étude biomédicale est l obtention d un élément de diagnostic à partir de signaux médicaux, les Potentiels Evoqués Auditifs (PEA) présentés précédemment. La classification des PEA est l une des étapes dans le développement d un outil d aide au diagnostic. Rappelons que la difficulté principale de cette classification réside dans la ressemblance des signaux correspondant à des pathologies différentes, mais aussi dans la disparité des signaux au sein d'une même classe. Deux traitements ont été appliqués sur les signaux PEM extraits de la base de données du CREFON. Le premier consiste en une normalisation des signaux. En effet, deux signaux moyennés issus de l'examen peuvent avoir des amplitudes très différentes. De plus, il s'avère que, selon Motsch [MOTS 87], le praticien ne tient pas compte de l'amplitude des signaux pour établir son diagnostic. Ce sont ces considérations qui nous ont amenés à normaliser entre 0 et 1 les signaux d'entrée du réseau. Chaque PEM a été normalisé indépendamment des autres. On obtient ainsi un signal dont les valeurs maximales et minimales sont respectivement 1 et 0. On fait ainsi abstraction des amplitudes relatives des signaux définissant notre base de données. Le deuxième traitement appliqué au signal PEM est une troncature. On sait, en effet, que l'onde I se situe après les 20 premiers points et que l'onde V apparaît avant les 20 derniers points de ce signal. De plus, les premiers points contiennent l'artefact de stimulation. Il n'existe donc pas d'information utile dans ces portions de signal. C'est pourquoi, nous avons travaillé sur des signaux tronqués. Nous avons alors supprimé les 20 premiers et les 20 derniers points de chaque signal. 6 Sauf, toutefois pour la classification des vecteurs rétrocochléaires. 51

! " & * +, - # Comme nous l'avons vu précédemment, le réseau LVQ est un réseau classifieur. C'est un réseau multi-couche à une couche cachée. Le nombre de neurones de la couche d'entrée correspond au nombre de composantes des vecteurs d'entrée, soit 88 neurones. Le nombre de sortie correspond quant à lui au nombre de classes que l'on souhaite obtenir. On souhaite classer les vecteurs d'entrée dans 3 catégories. Ainsi, le réseau LVQ comprendra 3 neurones de sortie. Le nombre de neurones dans la couche cachée est un des paramètres à ajuster pour ce modèle. Comme mentionné précédemment, le choix du nombre de neurones cachés est un problème délicat. Nous avons donc mené une étude en faisant varier le nombre de neurones dans la couche cachée du réseau LVQ de 2 à 100. Les résultats de l'évolution du nombre d'erreurs en phase de généralisation en fonction du nombre de neurones sont représentés par la figure II.6. Figure II. 6 - Evolution du nombre d'erreurs en fonction du nombre de neurones dans la couche cachée du réseau LVQ pour la classification des signaux PEA 52

On peut remarquer qu'on obtient les meilleures performances soit, un taux de classification correcte de 56,8% - pour un nombre de neurones dans la couche cachée égal à 12 et 20. On peut alors remarquer que la répartition des erreurs n'est alors pas la même suivant le nombre de neurones cachés., " A partir des résultats précédents, nous avons donc mis en œ uvre les réseaux LVQ ainsi optimisés. Nous avons pu observer que la couche cachée peut ainsi contenir 12 ou 20 neurones cachés. Les résultats obtenus sont présentés dans le tableau II.3. Classe Réelle Rétrocochléaire Endocochléaire Normal Classe donnée par le LVQ 12 n 20 n 12 n 20 n 12 n 20 n Rétrocochléaire 25 26 9 9 7 10 Endocochléaire 5 5 50 46 39 33 Normal 8 7 24 28 46 49 Tableau II. 3 - Résultats de classification des PEA par les réseaux LVQ On peut noter que, pour ces deux configurations (12 et 20 neurones cachés), la base d apprentissage a été correctement apprise. Tous les vecteurs appris sont correctement classés lors de la phase de généralisation. Ainsi, le taux de classification correcte obtenu grâce à ces structures est de 56,8% pour la globalité de la base de données avec un taux de classification : de 65,8% (12 neurones cachés) et de 68,4% (20 neurones cachés) pour la classe rétrocochléaire, de 60,2% (12 neurones cachés) et de 55,4% (20 neurones cachés) pour la classe endocochléaire, de 50% (12 neurones cachés) et de 53,3% (20 neurones cachés) pour la classe normale. Les résultats obtenus par cette technique neuronale simple sont meilleurs que ceux des techniques conventionnelles précédentes. Cependant, le taux de classification correcte global de tels réseaux est nettement insuffisant pour prétendre en faire un outil d'aide au diagnostic, puisque, pour seulement un peu plus d'un vecteur sur deux, la classe correcte est désignée par le réseau LVQ. 53

! " "., - # Comme nous l'avons vu au chapitre I, le réseau Radial Basis Function est aussi un réseau multi-couche, dont la particularité est le caractère évolutif de son architecture. En effet, la couche cachée de ce réseau est construite durant l'apprentissage et la structure finale, à savoir le nombre de neurones dans la couche cachée, n'est connu que lorsque cette première phase de mise en œ uvre du réseau est terminée. Tout comme le réseau LVQ, les nombres de neurones des couches d'entrée et de sortie sont déterminés par le problème à traiter. Ainsi, le réseau comprendra autant de neurones en entrée que de composantes des vecteurs d'entrée (80 dans le cas des PEM). Pour le nombre de neurones de sortie, on peut envisager le problème de deux manières différentes, suivant la manière dont on code les classes. En effet, on peut coder les classes de la même manière que pour le LVQ, c est-à-dire de manière disjonctive. Ainsi, le vecteur (1,0,0) t représentera la classe 1, (0,1,0) t représentera la classe 2 et (0,0,1) t représentera la classe 3. Le réseau RBF comprendra dans ce cas 3 neurones de sortie. La réponse du réseau sera alors un vecteur comprenant 3 composantes. Chacune des composantes contient la distance du vecteur appliqué en entrée aux différentes classes. Plus la distance n i est proche de 1, plus le vecteur est proche de la classe i. Si, par exemple, la sortie du réseau pour un vecteur d'entrée donné est : 0,0800 0,6890 0,2310 le vecteur est alors classé dans la classe 2. On peut aussi choisir de coder la classe de la manière suivante : * 1, pour la classe 1, * 2, pour la classe 2, * 3, pour la classe 3. Dans ce cas, le réseau RBF ne comprendra qu'un seul neurone de sortie. Compte tenu du fonctionnement du réseau (le réseau RBF fournit une distance), on interprétera la réponse 54

de la façon suivante : si, pour un vecteur d'entrée donné, la réponse est proche de 1 (resp. 2 ou 3), le vecteur sera considéré comme appartenant à la classe 1 (resp. 2 ou 3). Nous avons choisi de coder les classes comme pour le LVQ. Le réseau RBF comprend donc 3 neurones en sortie. Comme nous l'avons déjà mentionné, contrairement au LVQ, le nombre de neurones de la couche cachée du RBF est déterminé par apprentissage. Les neurones de la couche cachée sont utilisés pour mémoriser un exemple et une fonction d activation. Chacun a une activité locale dans l espace d entrée. Ainsi, les fonctions noyaux ne donnent des réponses utiles que dans le cas d un domaine restreint, leur champ récepteur. Ce champ récepteur, encore appelé zone d'influence, est l'un des paramètres caractéristiques du réseau RBF. Pour le modèle que nous utilisons, le rayon de cette zone est fixe et nous pouvons le faire varier grâce à un paramètre, noté sc. Nous avons étudié, dans chacun des cas, l'impact de la taille de la zone d'influence des neurones. Pour cela, nous avons fait varier le paramètre sc de 0,1 à 10 avec un pas de 0,1 pour la classification des PEA. L'apprentissage s'arrête quand le nombre de neurones cachés atteint le nombre de vecteurs de la base d'apprentissage ou que l'erreur commise atteint un seuil fixé par l'utilisateur. Les résultats obtenus en phase de généralisation sont présentés à la figure II.7. On peut remarquer alors un minimum de 87 erreurs pour une valeur de sc de 7,5. Il est cependant intéressant de s'intéresser à l'évolution de l'erreur dans chacune des classes. En effet, il peut être utile de choisir une valeur du paramètre sc permettant d'optimiser la classification d'une des classes, par exemple, pour l'utilisation d'un RBF dans une structure plus complexe. Ainsi, on pourra privilégier la reconnaissance d'une classe par rapport à une autre et dédier ainsi le réseau en question à la reconnaissance d'une des catégories de pathologie. Les résultats obtenus ne sont valables que pour les bases d'apprentissage définies. Ils montrent cependant la pertinence de ce paramètre dans la construction d'un réseau adéquat. Il est important de rappeler que les critères d'arrêt d'apprentissage utilisés, mentionnés ci dessus, restent restrictifs du fait que le rayon d'influence a été supposé identique pour tous les neurones de la couche cachée. 55

Figure II. 7 - Evolution de l'erreur commise en fonction du paramètre sc pour la classification des PEA, " A partir des résultats précédents, nous avons donc mis en œ uvre le réseau RBF ainsi optimisé. La valeur du paramètre sc choisie est donc de 7,5. Les résultats obtenus sont présentés dans le tableau II.4. Classe Réelle Rétrocochléaire Endocochléaire Normal Classe donnée Par le RBF Rétrocochléaire 24 5 7 Endocochléaire 8 45 28 Normal 6 33 57 Tableau II. 4 - Résultats de classification des PEA par le réseau RBF Le taux de classification correcte obtenu grâce à cette structure est de 59,1% pour la globalité de la base de données avec un taux de classification correcte de : 56

63,1% pour la classe rétrocochléaire, 54,2% pour la classe endocochléaire, 62% pour la classe normale. Si les résultats de classification correcte globaux sont proches pour les deux techniques neuronales appliquées, on peut cependant noter que les 2 réseaux LVQ permet une meilleure reconnaissance des classes rétrocochléaire et endocochléaire, alors que le réseau RBF obtient de meilleurs résultats pour la classification des vecteurs de type "Normal". Cependant, dans les deux cas, les taux de classification correcte sont trop insuffisants pour pouvoir implanter en l'état un réseau LVQ ou un réseau RBF seul comme outil d'aide au diagnostic.! / & 0 1%! L'objet de cette étude concerne le développement d'un outil d'aide au diagnostic de la machine asynchrone, devenue de plus en plus présente dans les applications industrielles. En effet, ce type de moteur est très robuste, son coût est faible et il peut atteindre de hautes performances grâce au développement de composants électroniques permettant la mise en place de loi de commandes sophistiquées. Néanmoins, en cas de défaillance du moteur, ces algorithmes peuvent devenir complètement inefficaces, voire dangereux pour l installation. C est pourquoi, il est important de contrôler à tout instant l état de la machine et de mettre en place des systèmes de maintenance préventive pour vérifier son bon fonctionnement. Le problème de la surveillance de ces machines fait l objet de nombreuses recherches [COMB 02][THOM 99]. L un des axes principaux est la recherche de modèles principalement des modèles du fonctionnement défaillant de la machine asynchrone, de manière à pouvoir non seulement détecter une défaillance, mais aussi l identifier et la localiser de manière à pouvoir appliquer les techniques internes de diagnostic [CHAN 02]. 57

Cependant, la diversité des conditions réelles de fonctionnement et la dérive des modèles internes par rapport à ces conditions rendent ces techniques souvent difficilement applicables. Nous avons décidé de faire abstraction de l obtention de ce modèle et de mettre alors en œ uvre des techniques de diagnostic externes à base de réseaux de neurones. Pour cette étude, nous avons travaillé en collaboration avec le laboratoire CERTES (Centre d Etudes et de Recherche en Thermique, Environnement et Systèmes). C est cette équipe, experte en mécanique, qui a constitué la base de données, à partir d un moteur asynchrone présent sur un banc d essai pour l étude des vibrations. Les travaux menés par cette équipe concernent le développement d outils pour la maintenance préventive de ce type de machine, mais d un point de vue traitement du signal. Il n est cependant pas exclu que nos travaux convergent [BARR 03] pour mettre en œ uvre la technique hybride présentée au chapitre I.3, et dont les premiers résultats de mise en œ uvre seront présentés au chapitre suivant.! 2 Le CERTES dispose d un banc d essai permettant de simuler un certain nombre de dysfonctionnements mécaniques (figure II.8) Figure II. 8 - Banc d'essai 58

Ce banc est composé des éléments suivants : Un moteur asynchrone d une puissance de 1,5kW Un réducteur à engrenages Une pompe centrifuge (non représentée sur la photo) Un roulement à billes relié au moteur par accouplement élastique Le banc d essai est alimenté par un variateur de courant qui permet de faire varier la vitesse de 0 à 1500Tr/min (0 à 25Hz). Sur ce banc d essai sont placés différents capteurs qui permettent d obtenir différentes informations sur le fonctionnement du moteur. On trouve ainsi : Un accéléromètre qui permet de mesurer l accélération du rotor du moteur Une sonde de courant pour mesurer l intensité de l alimentation du moteur Un capteur de position qui permet de savoir quand le moteur a effectué un tour. A chaque tour du rotor à l entrée du moteur, un réflecteur de lumière passera devant un capteur qui signalera un tour du rotor. Nous l appellerons par la suite Top Tour Plusieurs dispositifs permettent de simuler des défauts fréquemment rencontrés en milieu industriel, tels que : Ecaillage de la bague extérieure d un roulement Balourd (déséquilibre dynamique) Défaut d alignement du moteur Cavitation dans la pompe Tous ces défauts possèdent des signatures vibratoires qu on peut identifier séparément si toutes les caractéristiques des différents éléments sont parfaitement connues (fréquences de défauts de roulement, vitesses de rotation). Toutefois, les effets des défauts se cumulent le plus souvent et les vibrations peuvent exciter les fréquences propres des éléments du banc. Nous nous sommes focalisés sur la recherche et la détection de deux types de défauts : les défauts de roulement et les balourds. Les roulements à billes sont, sans doute, les organes les plus sensibles sur une machine. D après une étude menée par la société SKS, 27% des défauts de roulement ont pour origine des maladresses de montage. On imagine donc aisément l intérêt d avoir à remplacer le moins souvent possible et donc, d éviter les 59

démontages systématiques en optant pour une stratégie de surveillance appropriée. Dans la plupart des cas, la dégradation se traduit par un écaillage d une des pistes d un élément du roulement, provoquant un choc à chaque passage. Dans le cadre de notre simulation, le défaut de roulement est provoqué en serrant une vis. La bague extérieure sera donc enfoncée localement et, à chaque passage d une bille sur ce défaut, un choc apparaîtra. Chaque élément d'un ensemble tournant peut comprendre une différence de répartition de masse. La conjugaison des différences de masse crée un balourd résultant de l'ensemble tournant. Pour simuler l apparition d un balourd sur le banc d essai dont nous disposons, nous pouvons placer sur le rotor, une petite masse de poids variable de façon à pouvoir simuler plusieurs niveaux de balourd. Comme mentionné précédemment, plusieurs informations sont disponibles. Les signaux que nous avons choisi d exploiter sont ceux issus de l accéléromètre. Les informations provenant du Top Tour ont aussi été considérées pour la construction de la base de données. Nous avons décidé de travailler, dans un premier temps, à fréquence de rotation fixe du moteur. Nous nous sommes tout d abord focalisés sur la détection de défauts d un niveau donné (serrage constant de la vis dans le cas de la simulation d'un défaut de balourd, et masse de poids constant placée sur le rotor pour la simulation du balourd). Plusieurs bases de données ont été élaborées pour la mise en œ uvre des techniques neuronales pour la détection de défaillance d un moteur. Les signaux fournis par le laboratoire CERTES comprennent plusieurs périodes (plusieurs tours de rotation du moteur) pour un mode de fonctionnement donné. Nous avons décidé de travailler sur une période (i.e. un tour de moteur). Les signaux ainsi définis ont alors été obtenus de différentes manières : soit on se calle sur le signal du Top Tour, c est-à-dire que l origine de tous les signaux de la base de données correspond à la même position du moteur, et on prend ensuite le nombre d échantillons nécessaires pour que le signal obtenu corresponde à une période (992 dans notre cas), soit, on travaille avec une fenêtre glissante. Dans ce dernier cas, la base de données est ainsi construite : le premier signal extrait du fichier comprend les 992 premiers points du fichier. Puis, on décale l origine de 100 échantillons, et on construit le second signal en prenant les 992 points suivants, ainsi de suite jusqu à épuisement du fichier. Le tableau II.5 récapitule les différentes bases de données élaborées, pour trois catégories : balourd, défaut de roulement et fonctionnement normal. 60

Base de données 1 Base de données 2 Base de données 3 Base d apprentissage Signaux calés sur le Top Tour (64 vecteurs par classe, soit 192 vecteurs au total) Signaux calés sur le Top Tour (60 vecteurs par classe, soit 180 vecteurs au total) Signaux «Fenêtre glissante» (22 vecteurs par classe, soit 66 vecteurs au total) Base de généralisation Signaux calés sur le Top Tour (128 vecteurs par classe, soit 384 vecteurs au total) Signaux «Fenêtre glissante» (318 vecteurs par classe soit 954 vecteurs au total) Signaux «Fenêtre glissante» (318 vecteurs par classe, soit 954 vecteurs au total) Tableau II. 5 - Récapitulatif des différentes bases de données Nous nous sommes aussi intéressés à la détection de l apparition progressive d un défaut de roulement. Pour cette étude, la base de données a été construite de la manière suivante : Base d apprentissage : nous disposons d'un ensemble de fichiers correspondant à quatre différents niveaux de défauts (serrage de la vis sur le roulement plus ou moins fort) ainsi qu'à un fonctionnement normal. Nous avons extrait de ces fichiers les signaux qui constituent alors notre base d apprentissage Base de généralisation : nous disposons d'une mesure simulant un fonctionnement avec apparition progressive d un défaut de roulement. Ce signal nous permet d'effectuer la phase de généralisation. Comme dans le cas de l approche bio-médicale, les différentes bases de données ont été utilisées pour la mise en œ uvre de deux réseaux de neurones artificiels : le réseau LVQ et le réseau RBF. L optimisation de ces réseaux ainsi que les résultats obtenus sont présentés dans la partie suivante. 61

!! &#%!! '#!! " & * +, - # Le nombre de neurones de la couche d'entrée correspond au nombre de composantes des vecteurs d'entrée, soit 992 neurones. Le nombre de sorties correspond quant à lui au nombre de classes que l'on souhaite obtenir. On souhaite classer les vecteurs d'entrée dans 3 catégories. Ainsi, le réseau LVQ comprendra 3 neurones de sortie. Le nombre de neurones dans la couche cachée est un des paramètres à ajuster pour ce modèle. Comme mentionné précédemment, le choix du nombre de neurones cachés est un problème délicat. 80 Erreurs commises Réseau LVQ - Base de données 1 70 Classe "Balourd" Classe "Défaut de Roulement" Classe Normale Résultats Globaux 60 Nombre d'erreurs commises 50 40 30 20 10 0 5 15 25 35 45 55 65 75 85 95 100 Nombre de Neurones dans la couche cachée Figure II. 9 - Evolution du nombre d'erreurs en fonction du nombre de neurones dans la couche cachée du réseau LVQ pour la base de données 1 Nous avons donc mené une étude en faisant varier le nombre de neurones dans la couche cachée du réseau LVQ de 6 à 100. Les résultats de l'évolution du nombre d'erreurs en 62

phase de généralisation en fonction du nombre de neurones sont représentés par la figure II.9. On peut remarquer qu'on obtient les meilleures performances soit, un taux de classification correcte de 95,4% - pour un nombre de neurones dans la couche cachée égal à 9., " A partir des résultats précédents, nous avons donc mis en œ uvre le réseau LVQ ainsi optimisé. Le nombre de neurones cachés s élève alors à 9 neurones. Les résultats obtenus sont présentés dans le tableau II.6. On peut noter que la base d apprentissage a été correctement apprise. Tous les vecteurs appris sont correctement classés lors de la phase de généralisation. Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 95,4% pour la globalité de la base de données avec un taux de classification correcte de : 95,2% pour la classe normale, 97,5% pour la classe Balourd, 93,5% pour la classe Défaut de Roulement. Classe Réelle Classe donnée Normal Balourd Défaut de Roulement Par le RBF Normal 118 0 6 Balourd 4 117 2 Défaut de Roulement 2 3 116 Tableau II. 6 - Résultats de classification par le réseau LVQ (Base de Données 1)!! " ". Tout comme le réseau LVQ, les nombres de neurones des couches d'entrée et de sortie sont déterminés par le problème à traiter. Ainsi, le réseau comprendra autant de neurones en entrée que de composantes des vecteurs d'entrée (992 dans notre cas). Nous avons choisi de coder les classes comme pour le LVQ (manière disjonctive : 1 neurone par classe désirée). Le réseau RBF comprend donc 3 neurones en sortie. 63

Comme nous l'avons déjà mentionné, contrairement au LVQ, le nombre de neurones de la couche cachée du RBF est déterminé par apprentissage. Pour le modèle que nous utilisons, le rayon de la zone d'influence est fixe. Nous avons étudié, dans chacun des cas, l'impact de la taille de la zone d'influence des neurones. Pour cela, nous avons fait varier le paramètre sc de 1 à 100 avec un pas de 1 pour la classification des signaux issus de l accéléromètre. L'apprentissage s'arrête quand le nombre de neurones cachés atteint le nombre de vecteurs de la base d'apprentissage ou que l'erreur commise atteint un seuil fixé par l'utilisateur. Les résultats obtenus en phase de généralisation sont présentés à la figure II.10. 9 8 Nombre d'erreurs Commises Réseau RBF - Base de données 1 Classe"Balourd" Classe "Défaut de Roulement Classe Normale Résultats Globaux 7 Nombre d'erreurs commises 6 5 4 3 2 1 0 0 10 20 30 40 50 60 70 80 90 100 Valeur du Rayon de la zone d'influence (Paramètre Sc) Figure II. 10 - Evolution de l'erreur commise en fonction du paramètre sc (base de données 1) On peut remarquer alors que, si le paramètre sc est égal à 5, 6 ou 7, le réseau ne commet aucune erreur. Le taux de classification atteint donc les 100% pour chacune des classes Compte tenu des taux de classification particulièrement élevés, nous avons décidé de faire abstraction du Top Tour, au moins dans un premier temps pour la base de généralisation. Le but de cette deuxième simulation est de permettre à un utilisateur final de ne pas se soucier 64

de la position du rotor lors de l acquisition des signaux de test de la machine. De plus, considérant les résultats obtenus précédemment, seul le réseau RBF a été mis en œ uvre pour la base de données 2. Nous avons donc mis en œ uvre ce réseau, en lui apprenant les mêmes signaux que précédemment, mais en utilisant, pour la généralisation, des signaux non calés sur le Top Tour.!! '# 3" ".!! - # La démarche est la même que celle décrite précédemment. Les résultats obtenus sont présentés figure II.11. 600 500 Nombre d'erreurs commises Réseau RBF - Base de données 2 Classe Normale Classe "Balourd" Classe" Défaut de roulement Résultats Globaux Nombre d'erreurs commises 400 300 200 100 0 0 5 10 15 20 25 30 35 40 45 50 Valeur du rayon de la zone d'influence (Paramètre Sc) Figure II. 11 - Evolution de l'erreur commise en fonction du paramètre sc (base de données 2) On peut remarquer alors un minimum de 352 erreurs pour une valeur de sc de 21. Il est cependant intéressant de s'intéresser à l'évolution de l'erreur dans chacune des classes. En effet, il peut être utile de choisir une valeur du paramètre sc permettant d'optimiser la classification d'une des classes, par exemple, pour l'utilisation d'un RBF dans une structure plus complexe. Ainsi, on pourra privilégier la reconnaissance d'une classe par rapport à une 65

autre et dédier ainsi le réseau en question à la reconnaissance d'une des catégories de défaillance.!! " A partir des résultats précédents, nous avons mis en œ uvre le réseau RBF ainsi optimisé. La valeur du paramètre sc choisie est donc de 21. Les résultats obtenus sont présentés dans le tableau II.7. Classe Réelle Classe donnée Normal Balourd Défaut de Roulement Par le RBF Normal 181 24 0 Balourd 137 270 167 Défaut de Roulement 0 24 151 Tableau II. 7 - Résultats de classification par le réseau RBF (base de données 2) Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 63,1% pour la globalité de la base de données avec un taux de classification correcte de : 57,9% pour la classe normale, 84,9% pour la classe Balourd, 47,5% pour la classe Défaut de Roulement. On peut remarquer que les performances du réseau sont les plus élevées concernant la reconnaissance de balourds. De plus, quand le réseau se trompe sur l une des deux autres classes, le vecteur mal classé est systématiquement catalogué comme étant un signal caractérisant un balourd. On peut noter que les performances se dégradent nettement. Ceci est tout à fait compréhensible puisque les signaux de la base d apprentissage sont callés sur le Top Tour alors que les signaux de la base de généralisation ne le sont pas. Nous avons donc décidé d apprendre aux réseaux des informations similaires en leur apprenant des signaux construits sur le principe de la fenêtre glissante. 66

!!! '#!!!! " & * +, - # La démarche est la même que celle décrite précédemment. Les résultats obtenus sont présentés figure II.12. On peut remarquer alors un minimum de 327 erreurs pour un nombre de neurones dans la couche cachée égal à 9. 600 Erreurs Commises Réseau LVQ - Base de Données 3 500 Nombre d'erreurs commises 400 300 200 Classe Normale Classe "Balourd" Classe "Défaut de Roulement" Erreur Globale 100 0 10 20 30 40 50 60 70 80 90 100 Nombre de Neurones dans le Couche Cachée Figure II. 12 - Evolution de l'erreur commise en fonction du nombre de neurones cachés du LVQ (base de données 3), " A partir des résultats précédents, nous avons donc mis en œ uvre le réseau LVQ ainsi optimisé. Le nombre de neurones cachés s élève alors à 9 neurones. Les résultats obtenus sont présentés dans le tableau II.8. 67

Classe Réelle Classe donnée Normal Balourd Défaut de Roulement Par le RBF Normal 202 82 42 Balourd 51 198 49 Défaut de Roulement 65 38 227 Tableau II. 8 - Résultats de classification par le réseau LVQ (Base de Données 3) On peut noter que la base d apprentissage a été correctement apprise. Tous les vecteurs appris sont correctement classés lors de la phase de généralisation. Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 65,7% pour la globalité de la base de données avec un taux de classification correcte de : 63,5% pour la classe normale, 62,3% pour la classe Balourd, 71,4% pour la classe Défaut de Roulement.!!! " "., - # La démarche est la même que celle décrite précédemment (variation du paramètre sc de 1 à 100). Les résultats obtenus sont présentés figure II.13. On peut remarquer alors un minimum de 131 erreurs pour une valeur de sc de 2. 68

400 Nombre d'erreurs commises Réseau RBF - Base de données 3 350 Nombre d'erreurs commises 300 250 200 150 Classe "Défaut de Roulement Classe Normale Erreur Globale Classe "Balourd" 100 50 0 0 10 20 30 40 50 60 70 80 90 100 Valeur du rayon de la zone d'influence Figure II. 13 - Evolution de l'erreur commise en fonction du paramètre sc (base de données 3), " A partir des résultats précédents, nous avons donc mis en œ uvre le réseau RBF ainsi optimisé. La valeur du paramètre sc choisie est donc de 2. Les résultats obtenus sont présentés dans le tableau II.9. Classe Réelle Classe donnée Normal Balourd Défaut de Roulement Par le RBF Normal 269 30 0 Balourd 49 251 15 Défaut de Roulement 0 37 303 Tableau II. 9 - Résultats de classification par le réseau RBF (base de données 3) 69

Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 86,3% pour la globalité de la base de données avec un taux de classification correcte de : 84,6% pour la classe normale, 78,9% pour la classe Balourd, 95,3% pour la classe Défaut de Roulement. Compte tenu des résultats obtenus pour la détection d un niveau de défaut avec les réseaux LVQ et RBF seuls, nous nous sommes alors intéressés à la détection de l apparition d un défaut sur une machine tournante, en utilisant ces techniques à réseau de neurones unique.!!4 / $##$ #& Le principe de cette série de simulations est le suivant : après avoir appris au réseau considéré (LVQ ou RBF) un ensemble de signaux correspondants soit à un fonctionnement normal, soit à un fonctionnement défaillant, avec plusieurs niveaux de défauts, on généralise sur un ensemble de signaux extraits d'une mesure en continue de l'accélération du moteur, tout en faisant apparaître progressivement un effort sur le roulement à billes (afin de générer un défaut de roulement de plus en plus important). Puis, il s'agit de rechercher le moment où le réseau commence à détecter un défaut de roulement. Chaque réseau comprend 992 neurones d'entrée (correspondant au nombre d'échantillons des signaux) et 2 neurones de sortie (un par classe). La base d'apprentissage utilisée comprend 718 signaux : 318 correspondent à un fonctionnement normal et 400, à un fonctionnement défaillant de niveau fixe (4 niveaux différents). La généralisation s'opère sur 19389 signaux. Les résultats obtenus pour le réseau LVQ seul et le réseau RBF seul ne sont globalement pas satisfaisants, puisque les réseaux ne parviennent pas à détecter correctement l'apparition du défaut. Afin de permettre une représentation des résultats, nous les avons analysés de la manière suivante : nous connaissons le moment où le défaut commence à apparaître. Les signaux correspondant aux instants précédant ce moment sont donc des signaux de fonctionnement normal (classe normale). Ceux correspondant aux instants suivant l'apparition du défaut caractérisent donc un fonctionnement défaillant (classe "défaut de Roulement"). Partant de ce principe, nous avons 70

donc analysé les résultats obtenus comme des résultats de classification. Ceux-ci sont présentés ci-après.!!4 " & * + Nous avons procédé comme précédemment, en faisant varier le nombre de neurones de la couche cachée de 6 à 100. Les résultats sont présentés figure II.14. 100 90 Pourcentage de Classification Correcte réseau LVQ Classe Normale Classe "Défaut de Roulement" Résultats globaux Pourcentage de classification correcte 80 70 60 50 40 30 20 10 0 20 40 60 80 100 120 Nombre de Neurones Cachés Figure II. 14 Evolution du pourcentage de classifcation correcte en fonction du nombre de neurones cachés L'étude de cette courbe montre que, si le réseau reconnaît correctement un fonctionnement normal, en revanche, alors même que le défaut est installé, il ne le détecte pas.!!4 " ". Nous avons procédé en faisant varier le paramètre sc du réseau RBF de 1 à 50. Les résultats sont présentés figure II.15. 71

100 90 Pourcentage de classification correcte Réseau RBF Classe Normal (sans défaut) Classe "Défaut de Roulement) Résultats globaux Pourcentage de classificartion correcte 80 70 60 50 40 30 20 10 0 0 5 10 15 20 25 30 35 40 45 50 Valeur du rayon de la zone d'influence (Paramètre sc) Figure II. 15 -Evolution du pourcentage de classifcation correcte en fonction du paramètre sc Comme précédemment, on peut noter que la reconnaissance du défaut de roulement n'est pas du tout satisfaisante par un réseau RBF seul. De plus, si l'augmentation du rayon de la zone d'influence permet une amélioration du taux de classification globale, le comportement général du réseau demeure décevant (reconnaissance en moyenne de près d'un vecteur sur deux : comportement quasi aléatoire). En effet, les deux classes à discriminer sont trop proches pour être dissociées correctement par le mappage réalisé par un réseau RBF dont le paramètre sc est grand. On assiste alors à un recouvrement des zones d'influence des neurones cachés qui explique ce comportement aléatoire. Dans ce cas, il faudrait sans doute envisager un apprentissage avec zone d'influence variable selon le type de vecteur appris (normal ou défaillance). 72

4 2 Dans ce chapitre, nous avons présenté la mise en œ uvre de techniques neuronales à réseau de neurones unique dans le cadre de deux applications, l'une biomédicale, l'autre industrielle. L'application biomédicale concerne les Potentiels Evoqués Auditifs (PEA). L'étude industrielle aborde le problème de diagnostic de défaillances d'un moteur asynchrone. Dans ce dernier cas, nous avons travaillé sur les données issues d'un point de mesure du moteur : l'accélération. Notre première étude a porté sur la catégorisation des signaux PEA. La principale difficulté de cette catégorisation est liée à la catégorisation de vecteurs très similaires correspondant à des classes différentes et à la grande variété de vecteurs au sein d une même classe. Nous avons dans un premier temps appliqué une technique conventionnelle (modélisation autorégressive). Les résultats alors obtenus étant très insuffisants (seuls 37% des vecteurs sont correctement classés grâce à cette approche), nous avons alors choisi de mettre en œ uvre les réseaux LVQ et RBF. La première phase de cette étude concerne l'étude du comportement des réseaux de neurones LVQ et RBF pour la classification de ces signaux. Concernant le réseau LVQ, nos efforts se sont concentrés sur la recherche du nombre de neurones cachés. Nous avons donc fait varier le nombre de neurones cachés de 2 à 100 afin de rechercher la structure permettant d'obtenir les meilleurs taux de classification. Dans le cadre de l'application biomédicale, nous avons ainsi pu observer un taux de classification correcte "optimal" de 56,8% pour un nombre de neurones cachés égal à 12 et à 20. Pour ces deux structures, la répartition des erreurs au sein des trois classes est quasiment la même. De la même manière, nous avons étudié le comportement du réseau RBF. Un tel réseau faisant partie des modèles à architecture évolutive, le nombre de neurones de la couche cachée est fixé par l'apprentissage. Nous nous sommes donc penchés sur l'influence du rayon de la zone d'influence de ce réseau. Nous avons donc fait varier le paramètre sc, rayon de la zone d'influence, et étudié l'évolution du nombre d'erreurs commises par le réseau en phase de généralisation en fonction de ce paramètre. Dans le cadre de l'application biomédicale, les meilleurs résultats sont obtenus pour sc égal à 7,5. On atteint alors 59,1% de classification correcte sur l'ensemble de la base de données. Concernant l'application industrielle, les mêmes réseaux ont été employés et les mêmes recherches de structures adéquates ont été réalisées pour les réseaux LVQ et RBF, et 73

ce, pour trois bases de données. La construction de ces différentes bases de données a été motivée par un souci de s'adapter aux conditions de mesures dans l'industrie. Si les deux premières bases nécessitent les mesures issues de deux capteurs différents (accéléromètre et capteur de position pour le signal Top Tour), la troisième, quant à elle, doit permettre d'obtenir un diagnostic à partir de la seule information issue de l'accéléromètre, quelque soit l'instant de la prise de mesure. De plus, nous avons tenté de détecter l'apparition d'un défaut progressif au moyen de ces mêmes structures. Concernant la base de données 1, où les signaux d'apprentissage et de généralisation sont tous callés sur le Top Tour, les résultats obtenus sont satisfaisants, puisque nous atteignons un taux de classification correcte de 95,4% pour un réseau LVQ comprenant 9 neurones cachés et même 100% pour un réseau RBF dont le paramètre sc est égal à 5, 6 ou7. Compte tenu de ces résultats, nous avons décidé d'évaluer les performances du réseau RBF en phase de généralisation avec des signaux dont l'origine ne dépend plus de l'information délivrée par le Top Tour (Base de Données 2). Les résultats obtenus montrent qu'on obtient un taux de classification de 63,1% pour un réseau RBF dont le paramètre sc vaut 21. Les performances de ces réseaux ont ensuite été évaluées sur une troisième base de données. L'apprentissage et la généralisation des réseaux neuronaux sont alors réalisés en utilisant des signaux dont l'origine n'est plus une même position de l'axe de rotation du moteur. On atteint alors des taux de classification de 65,7% pour un réseau LVQ comprenant 9 neurones cachés et 86,3% pour un réseau RBF dont le paramètre sc est égal à 2. En revanche, concernant la détection de l'apparition d'un défaut de roulement, les résultats obtenus par un réseau de neurones seul sont très insatisfaisants, puisque l'un et l'autre des réseaux ne permettent même pas la reconnaissance d'un défaut installé. La mise en œ uvre des structures neuronales à réseau de neurones unique est nettement insuffisante pour la résolution de ce problème de classification et l'élaboration d'un outil d'aide au diagnostic pour les deux cas, biomédical et industriel, étudiés. Les résultats biomédicaux permettent d'obtenir seulement 56,2% de classification correcte dans le cas du LVQ et 59,1% dans le cas du RBF. De la même manière, dans l'étude de cas industriel, même si le réseau RBF permet d'obtenir des résultats satisfaisants (100% de classification correcte pour la base de données1 et 86,3% pour la base de données 3), seuls 63,1% de signaux sont correctement classés par le réseau RBF pour la base de données 2. Quant au réseau LVQ, il ne permet pas d'obtenir de meilleurs résultats pour les différentes bases de données. Par ailleurs; 74

les performances de ces structures dans le cadre de la reconnaissance de l'apparition d'un défaut de roulement sont très insuffisantes. Compte tenu de ces différents résultats, et des insuffisances des différents réseaux employés seuls, nous avons imaginé une structure hybride (présentée au chapitre I) pour le traitement des informations dans un but d'aide au diagnostic. Le chapitre suivant est consacré à l'étude et la mise en œ uvre de cette structure. 75

Chapitre II...40 Approches Neuronales Simples pour l Aide au Diagnostic et leur Evaluation Expérimentale...40 II.1. Introduction...40 II.2. Volet Biomédical : Les Potentiels Evoqués Auditifs...41 II.2.1. Présentation...41 II.2.2. Mise en œ uvre clinique et construction de la base de données...44 II.2.3. Résultats...47 II.2.3.1. Application d'une technique conventionnelle : Modélisation AR des signaux PEA 47 II.2.3.1.1. Première approche...48 II.2.3.1.2. Seconde Approche...50 II.2.3.2. Aide au diagnostic par techniques neuronales...51 II.2.3.2.1. Réseau Learning Vector Quantization...52 II.2.3.2.2. Réseau Radial Basis Function...54 II.3. Volet Industriel : Diagnostic de défaillances d un moteur asynchrone...57 II.3.1. Introduction...57 II.3.2. Construction de la base de données...58 II.3.3. Aide au diagnostic par techniques neuronales...62 II.3.3.1. Exploitation de la base de données 1...62 II.3.3.1.1. Réseau Learning Vector Quantization...62 II.3.3.1.2. Réseau Radial Basis Function...63 II.3.3.2. Exploitation de la base de données 2 Réseau RBF...65 II.3.3.2.1. Optimisation de la structure du réseau...65 II.3.3.2.2. Résultats obtenus...66 II.3.3.3. Exploitation de la base de données 3...67 II.3.3.3.1. Réseau Learning Vector Quantization...67 II.3.3.3.2. Réseau Radial Basis Function...68 II.3.3.4. Détection de l'apparition d'un défaut de roulement progressif...70 II.3.3.4.1. Réseau Learning Vector Quantization...71 II.3.3.4.2. Réseau Radial Basis Function...71 II.4. Conclusion...73 76

Nous avons montré au chapitre précédent que les approches neuronales simples c'est-à-dire celles n'impliquant qu'un seul réseau de neurones artificiels ne sont en général pas suffisantes pour construire un outil performant pour l'aide au diagnostic de systèmes complexes tels que ceux traités dans cette thèse. Nous nous sommes alors orientés vers des structures plus complexes, pouvant impliquer plusieurs réseaux de neurones. Dans ce chapitre, nous proposons d'appliquer l'approche neuronale hybride déjà présentée au chapitre I (I.3). Cette approche pour l'aide au diagnostic concerne une association de différentes techniques, conventionnelles et neuronales. La stratégie que nous envisageons de mettre en œ uvre est présentée figure III.1. Informations d'entrée Etape de Pré-traitement Agent Agent Neuronal Agent Agent Etape de décision Figure III.1 - Structure hybride Neuronale Dans de nombreux cas, afin d'établir un diagnostic, une seule mesure ne suffit pas à obtenir suffisamment d'informations pertinentes pour pouvoir établir un diagnostic. En effet, le médecin, par exemple, prendra en compte les résultats de différents examens, les symptômes du patient, avant de donner son diagnostic. De la même manière, pour un 77

processus industriel, les informations relatives au fonctionnement de ce dernier peuvent être délivrés par différents indicateurs que l'opérateur doit analyser. Il semble alors légitime de prendre en compte différentes informations relatives au système (industriel ou biomédical) et de combiner ces données. L'architecture, qui permettra ensuite de traiter l'ensemble des informations délivrées par les capteurs, comprend trois niveaux de traitement : Une étape de prétraitement Un ensemble d'agents neuronaux Une étape finale de décision où on réaliserait la fusion des informations de chacun des agents neuronaux spécialisés afin de parvenir à un élément de diagnostic. Nous avons mis en oeuvre plusieurs variantes de cette structure dans le cadre des deux problématiques présentées au chapitre précédent. Les résultats de validation sont présentés dans la suite de ce mémoire. Dans la suite du texte, nous désignerons les structures hybrides de la manière suivante : Structure Hybride [Agents Neuronaux]/[Structure de Décision]. Compte tenu des résultats présentés au chapitre II, nous avons appliqué notre approche hybride neuronale au problème de classification des PEA. Dans ce cas, l'information d'entrée provient du dispositif médical mis en œ uvre pour l'acquisition des signaux, présenté à la figure II.15. L'étape de prétraitement, quant à elle, se compose des deux traitements préliminaires effectués sur les signaux PEM, à savoir, une normalisation et une troncature. Ces deux prétraitements ont été présentés au II.4. Plusieurs approches ont été envisagées, mettant en jeu différents agents neuronaux et structures de décision. Pour l étape de décision nous avons pris en compte un paramètre supplémentaire : le seuil auditif. Ce paramètre est en effet un paramètre pertinent pris en compte par le médecin pour décider si un patient fait partie de la classe normale ou 78

endocochléaire 1. Afin d'obtenir les données relatives au seuil auditif, nous nous sommes intéressés à l'audiogramme des patients ainsi qu'à un paramètre présent dans leur dossier : la perte auditive. Ces deux informations (audiogramme et perte auditive) nous ont permis de construire une base de données constituée des valeurs 0 et 1, permettant de caractériser le seuil auditif. La valeur 0 a été attribuée aux patients souffrant d'une déficience auditive supérieure à 20dB et la valeur 1, aux patients dont l'audition est dite normale. Cette information (seuil auditif) ainsi que la valeur normalisée 2 de la perte ont été prises en compte au niveau des structures de décision. Les différentes architectures mises en œ uvre sont présentées ci-après.! " La première structure hybride proposée est présentée par la figure III.2. Cette structure n'implique qu'un seul agent neuronal, un réseau LVQ ou un réseau RBF, dont le rôle est de classer les signaux PEA traités en trois catégories. Le résultat de classification, ainsi que le seuil auditif sont présentés au module de décision (ici, un ensemble de règles logiques qui permet lorsque la classe désignée par le réseau est la classe 2 ou la classe 3 de prendre en compte le seuil auditif. Si le seuil auditif est correct, la classe désignée sera la classe 3, sinon, le vecteur sera classé en classe 2) Les bases de données (apprentissage et généralisation) sont celles utilisées dans le chapitre précédent (II.2.3) Pour la phase de généralisation, nous avons utilisé la base de données globale, qui comprend les vecteurs de la base d apprentissage, mais aussi les vecteurs non appris. Lorqu'on présente un signal au système, la classe correspondante doit être désignée. 1 A partir des résultats présentés au chapitre II, nous avons en effet pu constater que lorsqu'une erreur est commise sur un vecteur de type endocochléaire, il a une nette tendance à être classé comme étant un vecteur de type normal plutôt qu'un vecteur de type rétrocochléaire. De la même manière, un vecteur de type normal mal classé sera étiqueté comme un vecteur de type endocochléaire. 2 Pour la normalisation, on procède de la même manière que pour le PEM afin de conserver la dynamique de l'information "perte auditive" (cf. Chapitre II.4) 79

PEM Seuil Auditif Etape De Prétraitement RNA Etape de Décision (Seuillage) Figure III. 2 - Structure hybride RNA/Seuillage # $ " Pour mettre en œ uvre la structure hybride LVQ/Seuillage, nous avons procédé de la même manière qu'au paragraphe II.4.1.1 pour rechercher la structure adéquate du réseau LVQ dans cette configuration (structure hybride). Les résultats obtenus pour cette dernière sont présentés figure III.3. Figure III. 3 - Evolution du nombre d'erreurs commises en généralisation pour la structure hybride LVQ/Seuillage On peut remarquer qu'on obtient les meilleures performances soit, un taux de classification correcte de 80,7% - pour un nombre de neurones dans la couche cachée égal à 80

77. Dans ce cas, les résultats obtenus pour chacune des classes sont présentés dans le tableau III.1. Classe Réelle Rétrocochléaire Endocochléaire Normal Classe donnée Par la structure proposée Rétrocochléaire 27 7 3 Endocochléaire 11 57 1 Normal 0 19 88 Tableau III. 1 - Résultats relatifs à la structure hybride LVQ/Seuillage Le taux de classification correcte obtenu grâce à cette structure est donc de 80,7% pour la globalité de la base de données avec un taux de classification correcte de : 71% pour la classe rétrocochléaire, 68,7% pour la classe endocochléaire, 95,6% pour la classe normale. %&" Pour la mise en œ uvre de notre structure hybride RBF/Seuillage, nous avons procédé de la même manière qu'au paragraphe II.2.3.2.2.a. pour rechercher la structure adéquate du réseau RBF dans cette structure. Les résultats obtenus pour cette dernière sont présentés figure III.3. On peut remarquer qu'on obtient les meilleures performances soit, un taux de classification correcte de 77,5% - pour sc égal à 6,6 et compris entre 7,7 et 7,9. Dans ces cas, les résultats obtenus pour chacune des classes sont présentés dans le tableau III.4. Concernant le réseau, on peut noter que la base d apprentissage a été correctement apprise. Le taux de classification correcte obtenu grâce à cette structure est donc de 77,5% pour la globalité de la base de données avec un taux de classification correcte de : 71% pour sc = 6,6 et 68,4% pour sc compris entre 7,7 et 7,9 pour la classe rétrocochléaire, 67,5% pour sc = 6,6 et 68,7% pour sc compris entre 7,7 et 7,9 pour la classe endocochléaire, 89% pour la classe normale. 81

180 160 140 Erreur globale Nombre d'erreurs commises sur la classe 1 Nombre d'erreurs commises sur la classe 2 Nombre d'erreurs commises sur la classe 3 Nombre d'erreurs 120 100 80 60 40 20 0 0 1 2 3 4 5 6 7 8 9 10 Valeur du paramètre sc Figure III. 4 - Evolution du nombre d'erreurs commises en généralisation pour la structure hybride RBF/Seuillage Classe Réelle Rétrocochléaire Endocochléaire Normal Classe donnée Parla structure proposée Rétrocochléaire 27 26 6 6 1 1 Endocochléaire 11 12 56 57 9 9 Normal 0 0 21 20 82 82 Valeur du paramètre sc 6,6 [7,7;7,9] 6,6 [7,7;7,9] 6,6 [7,7;7,9] Tableau III. 2 - Résultats relatifs à la structure hybride RBF/Seuillage 82

! "' La seconde structure hybride proposée est présentée par la figure III.5. Cette structure comme la précédente n'implique qu'un seul agent neuronal, un réseau RBF. Le module de décision est, quant à lui, composé d'un réseau de neurones artificiels et du même programme Matlab que précédemment (programme permettant de prendre en considération le seuil auditif). Module de décision PEM Etape de Prétraitement RBF RNA Règles Logiques Seuil Auditif Figure III. 5 - Structure hybride RBF/LVQ+Seuillage %&"(#$ ) * L'objectif visé ici est le suivant : dans un premier temps, nous voulons obtenir une "mesure de ressemblance" du signal considéré par rapport aux différentes classes définies. Puis, dans un second temps, un module de décision doit permettre de déterminer l'appartenance de ce signal à une des classes. Le réseau RBF a pour but de fournir la "mesure de ressemblance". Le réseau LVQ, quant à lui, compose un étage de décision-classification. Dans la structure proposée, les sorties du réseau RBF constituent les entrées du réseau LVQ. La phase d'apprentissage, nécessaire à la mise en œ uvre d'une telle structure, est effectuée de la manière suivante : on entraine tout d'abord le réseau RBF en lui apprenant une série d'exemples. Une fois le réseau entraîné, les exemples de la base d'apprentissage sont présentés au réseau et les sorties ainsi obtenues forment les exemples de la base d'apprentissage du réseau LVQ. Puis, nous procédons à l'apprentissage de ce second réseau. Comme nous l'avons déjà vu, le réseau RBF effectue une cartographie de l espace d entrée en associant un ensemble de catégories à un ensemble de zones de l espace d entrée. Les techniques de "Learning Vector Quantization", quant à elles, font partie des techniques de compétition. Rappelons que l'objectif de ces méthodes est de déterminer la valeur optimale de vecteurs prototypes. Ceux-ci sont représentatifs des données à traiter et 83

sont codés dans les poids du réseau. L'apprentissage permet de retrouver les valeurs caractéristiques des vecteurs prototypes. Même si ce modèle est principalement utilisé pour la classification, la nature compétitive de sa stratégie d apprentissage (basée sur le principe du tout au vainqueur ( Winner takes all )) rend son utilisation en tant qu opérateur de décisionclassification possible.. Figure III. 6 - Evolution de l'erreur commise en phase de généralisation en fonction du nombre de neurones du réseau LVQ pour la structure hybride RBF/LVQ Pour choisir la structure du réseau RBF, nous nous sommes appuyés sur les résultats précédents. Nous avons donc choisi sc = 7,7. Le réseau LVQ ayant désormais un rôle de décision, nous avons donc entrepris de rechercher le nombre de neurones pour obtenir la structure adéquate. Comme précédemment, nous avons fait varier le nombre de neurones cachés de 2 à 100 et les résultats obtenus en sortie du réseau LVQ sont présentés figure III.6. 84

On atteint un nombre minimal d'erreurs (86 erreurs) pour un réseau comportant 5 neurones cachés 3. La répartition de ces erreurs au sein des trois classes est donnée par le tableau III.3. Classe Réelle Rétrocochléaire Endocochléaire Normal Classe donnée Parla structure proposée Rétrocochléaire 22 2 9 Endocochléaire 12 49 27 Normal 4 32 56 Tableau III. 3 - Résultats de classification des PEA par la structure hybride RBF/LVQ En tenant compte maintenant du seuil auditif pour les vecteurs classés endocochléaires ou normaux, on obtient les résultats suivants (Tableau III.4). Classe Réelle Rétrocochléaire Endocochléaire Normal Classe donnée Parla structure proposée Rétrocochléaire 22 2 9 Endocochléaire 12 76 4 Normal 4 5 79 Tableau III. 4 - Résultats de classification des PEA par la structure hybride RBF/LVQ+Seuillage Concernant les réseaux, on peut noter que la base d apprentissage a été correctement apprise. Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 83,1% pour la globalité de la base de données avec un taux de classification correcte de : 57,9% pour la classe rétrocochléaire, 91,6% pour la classe endocochléaire, 85,9% pour la classe normale. 3 On peut remarquer que, pour un nombre plus important de neurones cachés, le nombre d'erreurs commises en phase de généralisation varie peu (89 à 90 erreurs commises). En effet, le nombre de neurones cachés du LVQ peut être vu comme le nombre de sous-classes qu'on peut dénombrer au sein du problème [MATL]. L'augmentation du nombre de neurones cachés, et donc de sous-classes, ne modifie donc pas, ou peu le comportement du réseau. 85

Nous avons ensuite mis en œ uvre la même structure, mais en injectant la perte auditive au niveau du décideur LVQ. Ce dernier comprend maintenant 4 neurones d'entrée (3 neurones prenant en compte la sortie du réseau RBF + 1 pour la perte auditive normalisée). L'architecture de la structure mise en œ uvre est présentée figure III.7. Module de décision PEM Perte Auditive Etape de Prétraitement RBF LVQ Règles Logiques Seuil Auditif Perte Auditive Normalisée Figure III. 7 Structure hybride RBF/LVQ+Seuillage prenant en compte la perte auditive Pour choisir la structure du réseau RBF, nous nous sommes appuyés sur les résultats précédents. Nous avons donc choisi sc = 7,7. Le réseau LVQ ayant désormais un rôle de décision et prenant en compte des informations différentes, nous avons donc entrepris de rechercher le nombre de neurones pour obtenir la structure adéquate. Comme précédemment, nous avons fait varier le nombre de neurones cachés de 2 à 100 et les résultats obtenus en sortie du réseau LVQ sont présentés figure III.8. On atteint un nombre minimal d'erreurs (81 erreurs) pour un réseau comportant 18 neurones cachés 4. La répartition de ces erreurs au sein des trois classes est donnée par le tableau III.5. 4 Pour un nombre de neurones plus important, le nombre d'erreurs varie peu. En effet, le nombre de neurones cachés du LVQ peut être vu comme le nombre de sous-classes qu'on peut dénombrer au sein du problème [MATL]. L'augmentation du nombre de neurones cachés, et donc de sous-classes, ne modifie donc pas, ou peu le comportement du réseau. 86

Figure III. 8 - Evolution de l'erreur commise en phase de généralisation en fonction du nombre de neurones du réseau LVQ pour la structure hybride RBF/LVQ prenant en compte la perte auditive Classe Réelle Rétrocochléaire Endocochléaire Normal Classe donnée Parla structure proposée Rétrocochléaire 22 2 8 Endocochléaire 12 50 24 Normal 4 31 60 Tableau III. 5 - Résultats de classification des PEA par la structure hybride RBF/LVQ prenant en compte la perte auditive Classe Réelle Rétrocochléaire Endocochléaire Normal Classe donnée Parla structure proposée Rétrocochléaire 22 1 7 Endocochléaire 13 76 4 Normal 3 6 81 Tableau III. 6 - Résultats de classification des PEA par la structure hybride RBF/LVQ+Seuillage prenant en compte la perte auditive 87

En tenant compte maintenant du seuil auditif pour les vecteurs classés endocochléaires ou normaux, on obtient un taux de classification optimal (34 erreurs commises) pour un nombre de neurones égal à 49 5. La répartition des erreurs au sein des trois classes est donnée dans le tableau suivant (Tableau III.6). Concernant les réseaux, on peut noter que la base d apprentissage a été correctement apprise. Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 84% pour la globalité de la base de données avec un taux de classification correcte de : 57,9% pour la classe rétrocochléaire, 91,6% pour la classe endocochléaire, 88% pour la classe normale. On peut remarquer que la prise en compte de l'information "perte auditive" n'améliore que très peu les performances de la structure proposée. %&"(%+) * Nous avons ensuite repris la même structure en remplaçant le réseau LVQ par un réseau de type Back-Propagation, présenté au Chapitre II.2.2.4. Comme précédemment, le réseau RBF effectue une cartographie de l espace d entrée en associant un ensemble de catégories à un ensemble de zones de l espace d entrée. Le réseau BP va quant à lui, jouer le rôle d'un expert. La structure proposée est représentée figure III.9. Module de décision PEM Etape de Prétraitement RBF BP Règles Logiques Seuil Auditif Figure III. 9 - Structure hybride RBF/BP+Seuillage Comme précédemment, pour choisir la structure du réseau RBF, nous nous sommes appuyés sur les résultats précédents. Nous avons donc choisi sc = 7,7. Concernant le réseau 5 Cette différence s'explique par la répartition différente des erreurs au sein des trois classes pour les deux réseaux LVQ. En effet, même si le nombre d'erreurs commises par un réseau LVQ à 49 neurones cachés est le même que celui obtenu avec une réseau à 18 neurones cachés, la répartition des erreurs au sein des classes 2 (endocochléaire) et 3 (Normale) va permettre au module de seuillage par le seuil auditif de "corriger" un plus grand nombre d'erreurs que dans le cas du LVQ à 18 neurones cachés. 88

BP, nous avons choisi un réseau à une seule couche cachée et nous avons entrepris de rechercher le nombre de neurones de cette couche pour obtenir la structure adéquate. Comme précédemment, nous avons fait varier le nombre de neurones cachés de 2 à 100. Le seuil de l'erreur est fixé à 0,02 et le pas d'apprentissage à 0,005. Les résultats obtenus en sortie du réseau BP sont présentés figure III.10. Figure III. 10 - Evolution de l'erreur commise en phase de généralisation en fonction du nombre de neurones du réseau BP pour la structure hybride RBF/BP On atteint un nombre minimal d'erreurs (84 erreurs) pour un réseau comportant 19 neurones cachés. La répartition de ces erreurs au sein des trois classes est donnée par le tableau III.7. Classe Réelle Rétrocochléaire Endocochléaire Normal Classe donnée Parla structure proposée Rétrocochléaire 21 5 5 Endocochléaire 10 40 19 Normal 7 38 68 Tableau III. 7 - Résultats de classification des PEA par la structure hybride RBF/BP 89

En tenant compte maintenant du seuil auditif pour les vecteurs classés endocochléaires ou normaux, on obtient un taux de classification optimal (35 erreurs commises) pour un nombre de neurones égal à 15 6. La répartition des erreurs au sein des trois classes est donnée dans le tableau suivant (Tableau III.8). Classe Réelle Rétrocochléaire Endocochléaire Normal Classe donnée Parla structure proposée Rétrocochléaire 22 2 7 Endocochléaire 14 75 4 Normal 2 6 81 Tableau III. 8 - Résultats de classification des PEA par la structure hybride RBF/BP+Seuillage Concernant les réseaux, on peut noter que la base d apprentissage a été correctement apprise. Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 83,6% pour la globalité de la base de données avec un taux de classification correcte de : 57,9% pour la classe rétrocochléaire, 90,4% pour la classe endocochléaire, 88% pour la classe normale. Nous avons ensuite mis en œ uvre la même structure, mais en injectant la perte auditive au niveau du décideur BP. Ce dernier comprend maintenant 4 neurones d'entrée (3 neurones prenant en compte la sortie du réseau RBF + 1 pour la perte auditive normalisée). L'architecture de la structure mise en œ uvre est présentée figure III.11. 6 Cette différence s'explique par la répartition différente des erreurs au sein des trois classes pour les deux réseaux BP. En effet, si le nombre d'erreurs global est peu important pour un réseau BP à 15 neurones cachés (83 erreurs commises, soit 11 erreurs de plus que le BP à 19 neurones cachés), la répartition des erreurs au sein des classes 2 (endocochléaire) et 3 (Normale) va permettre au module de seuillage par le seuil auditif de "corriger" un plus grand nombre d'erreurs que dans le cas du BP à 19 neurones cachés. 90

Module de décision PEA Perte Auditive Etape de Prétraitement RBF BP Règles Logiques Seuil Auditif Perte Auditive Normalisée Figure III. 11 - Structure hybride RBF/BP+Seuillage prenant en compte la perte auditive Pour choisir la structure du réseau RBF, nous nous sommes appuyés sur les résultats précédents. Nous avons donc choisi sc = 7,7. Le réseau BP prenant désormais en compte des informations différentes, nous avons donc entrepris de rechercher le nombre de neurones pour obtenir la structure adéquate. Concernant le réseau BP, nous avons choisi un réseau à une seule couche cachée et nous avons entrepris de rechercher le nombre de neurones de cette couche pour obtenir la structure adéquate. Comme précédemment, nous avons fait varier le nombre de neurones cachés de 2 à 100. Le seuil de l'erreur est fixé à 0,02 et le pas d'apprentissage à 0,005. Les résultats obtenus en sortie du réseau BP sont présentés figure III.12. On atteint un nombre minimal d'erreurs (72 erreurs) pour un réseau comportant 59 neurones cachés. On peut remarquer que la prise en compte de ce paramètre supplémentaire améliore les performances du réseau décideur BP, contrairement au réseau LVQ. La répartition de ces erreurs au sein des trois classes est donnée par le tableau III.9. 91

Figure III. 12 - Evolution de l'erreur commise en phase de généralisation en fonction du nombre de neurones du réseau BP pour la structure hybride RBF/BP tenant compte de la perte auditive Classe Réelle Rétrocochléaire Endocochléaire Normal Classe donnée Parla structure proposée Rétrocochléaire 28 12 8 Endocochléaire 6 48 19 Normal 4 23 65 Tableau III. 9 - Résultats de classification des PEA par la structure hybride RBF/BP prenant en compte la perte auditive En tenant compte maintenant du seuil auditif pour les vecteurs classés endocochléaires ou normaux, on obtient un taux de classification optimal (33 erreurs commises) pour un nombre de neurones égal à 15 7. La répartition des erreurs au sein des trois classes est donnée dans le tableau suivant (Tableau III.10). 7 Cette différence s'explique par la répartition différente des erreurs au sein des trois classes pour les deux réseaux BP. En effet, si le nombre d'erreurs global est plus important pour un réseau BP à 15 neurones cachés (83 erreurs commises, soit 11 erreurs de plus que le BP à 59 neurones cachés), la répartition des erreurs au sein des classes 2 (endocochléaire) et 3 (Normale) va permettre au module de seuillage par le seuil auditif de "corriger" un plus grand nombre d'erreurs que dans le cas du BP à 59 neurones cachés. En revanche, les performances concernant la classe 1 sont détériorées. 92

Classe Réelle Rétrocochléaire Endocochléaire Normal Classe donnée Parla structure proposée Rétrocochléaire 23 4 6 Endocochléaire 12 75 4 Normal 3 4 82 Tableau III. 10 - Résultats de classification des PEA par la structure hybride RBF/BP+Seuillage prenant en compte la perte auditive Concernant les réseaux, on peut noter que la base d apprentissage a été correctement apprise. Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 84,5% pour la globalité de la base de données avec un taux de classification correcte de : 60,5% pour la classe rétrocochléaire, 90,4% pour la classe endocochléaire, 89,1% pour la classe normale., RBF Module de décision PEM Etape de Prétraitement LVQ BP Règles Logiques Seuil Auditif Figure III. 13 - Structure hybride RBF+LVQ/BP+Seuillage La structure hybride proposée ici est présentée par la figure III.13. Cette structure implique deux agents neuronaux, un réseau RBF et un réseau LVQ. Le module de décision est, quant à lui, composé d'un réseau à rétropropagation du gradient et du même programme Matlab que précédemment (programme permettant de prendre en considération le seuil auditif). Les bases de données utilisées sont celles déjà présentées au paragraphe II.2.3. Pour la phase d'apprentissage de cette structure, nous avons procédé de la manière suivante : nous avons entraîné les deux réseaux RBF et LVQ indépendament l'un de l'autre avec la même 93

base d'apprentissage. Puis, nous avons présenté les exemples de cette base aux deux réseaux entraînés. Les sorties ainsi obtenues forment alors la base d'apprentissage du réseau BP et on peut donc procéder à l'apprentissage de ce dernier. Dans cette structure, les deux réseaux RBF et LVQ jouent le rôle de classifieurs. Cependant, la nature des informations données par chacun des réseaux est différente. En effet, le réseau RBF va donner, en sortie, une distance entre le vecteur d'entrée et les classes préalablement apprises. Le réseau LVQ, quant à lui, du fait de sa nature compétitive (stratégie "Winner Takes All" 8 ), va assigner au vecteur d'entrée une classe. Comme précédemment, le réseau BP va quant à lui, jouer le rôle d'un expert. En prenant en compte les deux informations données par les deux réseaux RBF et LVQ, il va pouvoir ainsi désigner la classe. La structure proposée peut alors être vue comme une architecture associant un opérateur décisionnel à deux classifieurs neuronaux donnant deux informations différentes sur la classe d'un vecteur d'entrée. Comme précédemment, pour choisir les structures des réseaux RBF et LVQ, nous nous sommes appuyés sur les résultats précédents. Nous avons donc choisi sc = 7,7 et un nombre de neurones cachés égal à 77 pour le réseau LVQ. Concernant le réseau BP, nous avons choisi un réseau à une seule couche cachée et nous avons entrepris de rechercher le nombre de neurones de cette couche pour obtenir la structure adéquate. Comme précédemment, nous avons fait varier le nombre de neurones cachés de 2 à 100. Le seuil de l'erreur est fixé à 0,02 et le pas d'apprentissage à 0,01. Le programme s'arrête lorsque l'erreur commise lors de l'apprentissage converge. Les résultats obtenus en sortie du réseau BP sont présentés figure III.14. 8 Tout au Vainqueur 94

Figure III. 14 - Evolution de l'erreur commise en phase de généralisation en fonction du nombre de neurones du réseau BP pour la structure hybride RBF+LVQ/BP On atteint un nombre minimal d'erreurs (87 erreurs) pour un réseau BP comportant 7 neurones cachés. La répartition de ces erreurs au sein des trois classes est donnée par le tableau III.11. Classe Réelle Classe donnée Rétrocochléaire Endocochléaire Normal Par la structure proposée Rétrocochléaire 26 10 12 Endocochléaire 8 37 17 Normal 4 36 63 Tableau III. 11 - Résultats de classification des PEA par la structure hybride RBF+LVQ/BP En tenant compte maintenant du seuil auditif pour les vecteurs classés endocochléaires ou normaux, on obtient un taux de classification optimal (41 erreurs commises) pour un nombre de neurones égal à 16 (on pourra se référer à la note n 4 pour la justification de la 95

différence observée avec les résultats précédents). La répartition des erreurs au sein des trois classes est donnée dans le tableau suivant (Tableau III.12). Classe Réelle Classe donnée Rétrocochléaire Endocochléaire Normal Par la structure proposée Rétrocochléaire 27 12 9 Endocochléaire 7 65 3 Normal 4 6 80 Tableau III. 12 - Résultats de classification des PEA par la structure hybride RBF+LVQ/BP+Seuillage Concernant les réseaux, on peut noter que la base d apprentissage a été correctement apprise. Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 80,7% pour la globalité de la base de données avec un taux de classification correcte de : 71% pour la classe rétrocochléaire, 78,3% pour la classe endocochléaire, 87% pour la classe normale. - Compte tenu des résultats présentés au chapitre II, nous avons appliqué notre approche hybride neuronale au problème de diagnostic des défaillances d un moteur asynchrone. Dans ce cas, le capteur est l accéléromètre mis en œ uvre pour l'acquisition des signaux. Dans l approche que nous proposons, les signaux dont on fait l acquisition sont directement traités par les structures neuronales, sans traitement préalable. Plusieurs approches ont été envisagées, mettant en jeu différents agents neuronaux et structures de décision. Celles-ci sont présentées ci-après ainsi que les résultats obtenus pour 96

les bases de données 2, 3 ainsi que celle concernant l apparition du défaut progressif de roulement. Les structures hybrides que nous avons mises en œ uvre sont des structures du type : RNA/Module de décision neuronal 9, dont le principe est rappelé figure III.15. Accélération Etape de Prétraitement RNA Module de Décision Neuronal Figure III. 15 Structure Hybride RNA/Module de décision neuronal Deux modules de décision ont été exploités : l un impliquant un réseau LVQ, l autre un réseau à rétropropagation du gradient. Dans les deux cas, un seul agent neuronal est utilisé : un réseau RBF. Ce choix tient compte des résultats de classification obtenus et présentés au chapitre II. -. %&"#$ La première structure hybride proposée pour le problème du diagnostic de défaillance d'un moteur asynchrone est présentée par la figure III.16. Cette structure n'implique donc qu'un seul agent neuronal, un réseau RBF. Le module de décision est, quant à lui, composé d'un réseau LVQ. Module de décision Accélération Etape de Prétraitement RBF LVQ Figure III. 16 - Structure hybride RBF/LVQ 9 Rappel : Les structures hybrides sont désignées de la manière suivante : Structure Hybride [Agents Neuronaux]/[Structure de Décision]. 97

Comme dans le cas de l application bio-médicale, l'objectif visé ici est le suivant : dans un premier temps, nous voulons obtenir une "mesure de ressemblance" du signal considéré par rapport aux différentes classes définies. Puis, dans un second temps, un module de décision doit permettre de déterminer l'appartenance de ce signal à une des classes. Le réseau RBF a pour but de fournir la "mesure de ressemblance". Le réseau LVQ, quant à lui, compose un étage de décision-classification. - %&"# $, Comme précédemment, nous avons cherché à optimiser la structure proposée. Nous avons ici fait varier à la fois le rayon de la zone d influence (paramètre sc) de 1 à 50 avec un pas de 1 pour le réseau RBF et le nombre de neurones de la couche cachée de 6 à 100 pour le réseau LVQ du module de décision. Les résultats obtenus sont présentés figure III.17. Nombre d'erreurs commises Réseau RBF-LVQ - Base de données 2 600 Classe Normal Classe "Balourd" Classe "Défaut de Roulement" Résultats Globaux 500 400 300 200 100 0 50 40 Valeur du rayon de la zone d'influence (Paramètre Sc) 30 20 10 0 5 15 25 35 45 75 65 55 Nombre de neurones dans la couche cachée (LVQ) 85 95 100 Figure III. 17 - Evolution de l'erreur commise en phase de généralisation en fonction de la valeur du paramètre sc et du nombre de neurones cachés du réseau LVQ pour la structure hybride RBF/LVQ (base de données 2) 98

On peut remarquer qu on obtient les meilleures performances soit un taux de classification correcte de 63,4% - pour une valeur du paramètre sc égale à 3 pour le réseau RBF et un nombre de neurones dans la couche cachée du réseau LVQ égal à 13. Dans ce cas, les résultats obtenus pour chacune des classes sont présentés dans le tableau III.13. Classe Réelle Classe donnée Normal Balourd Défaut de Roulement Par la structure RBF/LVQ Normal 168 26 0 Balourd 150 285 167 Défaut de Roulement 0 7 151 Tableau III. 13 - Résultats relatifs à la structure RBF/LVQ (Base de données 2) Le taux de classification correcte obtenu grâce à cette structure est donc de 63,4%, avec un taux de classification correcte de : 52,8% pour la classe normale 89,6% pour la classe Balourd 47,5% pour la classe Défaut de Roulement On ne peut ainsi remarquer, en comparant ces résultats à ceux obtenus avec un réseau RBF seul, aucune amélioration des performances globales (seuls 63,1% des signaux étaient correctement classés par un RBF seul). On peut aussi noter que la variation du nombre de neurones dans la couche cachée du LVQ a peu d'influence sur le comportement global de la structure, pour un réseau RBF donné. - %&"# $, - Nous avons procédé de la même manière que précédemment et recherché la structure optimale RBF/LVQ, mais avec notre base de données 3, en faisant varier le paramètre sc du réseau RBF et le nombre de neurones de la couche cachée du réseau LVQ. Les résultats obtenus sont présentés figure III.18. 99

Nombre d'erreurs Commises Réseau RBF-LVQ - Base de données 3 Classe "Balourd" Classe "Roulement" Classe Normale Résultats Globaux 400 350 Nombre d'erreurs commises 300 250 200 150 100 50 0 50 45 40 Valeur du Rayon de la zone d'influence (Paramètre Sc) 35 30 25 20 15 10 5 0 0 20 40 60 80 100 Nombre de Neurones dans la couche cachée (LVQ) Figure III. 18 - Evolution de l'erreur commise en phase de généralisation en fonction de la valeur du paramètre sc et du nombre de neurones cachés du réseau LVQ pour la structure hybride RBF/LVQ (base de données 3) On peut remarquer qu on obtient les meilleures performances soit un taux de classification correcte de 86,7% - pour une valeur du paramètre sc égale à 2 pour le réseau RBF et un nombre de neurones dans la couche cachée du réseau LVQ égal à 84. Dans ce cas, les résultats obtenus pour chacune des classes sont présentés dans le tableau III.14. Classe Réelle Classe donnée Normal Balourd Défaut de Roulement Par la structure RBF/LVQ Normal 268 26 0 Balourd 50 257 16 Défaut de Roulement 0 35 302 Tableau III. 14 - Résultats relatifs à la structure RBF/LVQ (Base de données 3) 100

Le taux de classification correcte obtenu grâce à cette structure est donc de 86,7%, avec un taux de classification correcte de : 84,3% pour la classe normale 80,8% pour la classe Balourd 95% pour la classe Défaut de Roulement On peut ainsi remarquer, en comparant ces résultats à ceux obtenus avec un réseau RBF seul, qu'aucune amélioration des performances globales n'est observable (86,3% des signaux étaient correctement classés par un RBF seul). -- %&"# $ / 0 0 Comme dans les cas précédents, nous avons mis en oeuvre la structure hybride RBF/LVQ pour la détection d'un défaut de roulement progressif. Compte tenu des résultats précédents obtenus avec un réseau de neurones unique, qui, rappelons-le, étaient très insuffisants, nous avons effectué une première étude de faisabilité. Pour cela, nous avons choisi un réseau RBF dont le paramètre sc est fixé à 16 et nous avons fait varier le nombre de neurones cachés du réseau LVQ de 6 à 100. Les résultats obtenus sont présentés figure III.19. On peut alors remarquer que, quelle que soit la structure du réseau LVQ employé, le pourcentage de classification correcte reste stable autour de 31%. Les résultats obtenus précédemment par l'utilisation du même réseau RBF mais utilisé seul étaient alors de 34%. L'utilisation du réseau LVQ comme module de décision ne permet donc pas d'améliorer les résultats du réseau RBF seul, dans le cadre de ce problème complexe 101

Figure III. 19 Evolution du pourcentage de classification correcte en fonction du nombre de neurones cachés du LVQ (Structure RBF/LVQ avec sc = 16) -. %&"%+ Module de décision Accélération Etape de Prétraitement RBF BP Figure III. 20 - Structure hybride RBF/BP La seconde structure hybride proposée pour le problème du diagnostic de défaillance d'un moteur asynchrone est présentée par la figure III.20. Comme précédemment, cette structure n'implique qu'un seul agent neuronal, un réseau RBF, qui va effectuer une cartographie de l espace d entrée en associant un ensemble de catégories à un ensemble de 102

zones de l espace d entrée. Le module de décision est, quant à lui, composé d'un réseau BP qui jouera le rôle d'un expert. - %&"%+, Comme précédemment, nous avons cherché à optimiser la structure proposée. Nous avons ici fait varier à la fois le rayon de la zone d influence (paramètre sc) de 1 à 30 avec un pas de 1 pour le réseau RBF et le nombre de neurones de la couche cachée de 1 à 100 pour le réseau BP du module de décision. On obtient les meilleures performances soit un taux de classification correcte de 81,1% - pour une valeur du paramètre sc égale à 10 pour le réseau RBF et un nombre de neurones dans la couche cachée du réseau BP égal à 35. Dans ce cas, les résultats obtenus pour chacune des classes sont présentés dans le tableau III.15. Classe Réelle Classe donnée Normal Balourd Défaut de Roulement Par la structure RBF/LVQ Normal 268 37 0 Balourd 50 241 53 Défaut de Roulement 0 40 265 Tableau III. 15 - Résultats relatifs à la structure RBF/BP (Base de données 2) Le taux de classification correcte obtenu grâce à cette structure est donc de 81,1%, avec un taux de classification correcte de : 84,3% pour la classe normale 75,8% pour la classe Balourd 81,3% pour la classe Défaut de Roulement On peut ainsi remarquer, en comparant ces résultats à ceux obtenus avec un réseau RBF seul, une amélioration des performances globales (seuls 63,1% des signaux étaient correctement classés par un RBF seul). A l'inverse des résultats observés pour la structure RBF/LVQ, on peut noter que l'utilisation du réseau à rétropropagation du gradient comme 103

décideur permet d'améliorer la reconnaissance des classes "Normale" et "Défaut de Roulement", alors que la reconnaissance des défauts de type "Balourd" se dégrade. - %&"% +, - Nous avons procédé de la même manière que précédemment et recherché la structure optimale RBF/BP, mais avec notre base de données 3, en faisant varier le paramètre sc du réseau RBF et le nombre de neurones de la couche cachée du réseau BP. On obtient dans ce cas les meilleures performances soit un taux de classification correcte de 98,5% - pour une valeur du paramètre sc égale à 3 pour le réseau RBF et un nombre de neurones dans la couche cachée du réseau BP égal à 15 neurones. Dans ce cas, les résultats obtenus pour chacune des classes sont présentés dans le tableau III.16. Classe Réelle Classe donnée Normal Balourd Défaut de Roulement Par la structure RBF/LVQ Normal 314 4 0 Balourd 4 309 1 Défaut de Roulement 0 5 317 Tableau III. 16 - Résultats relatifs à la structure RBF/BP (Base de données 3) Le taux de classification correcte obtenu grâce à cette structure est donc de 98,5%, avec un taux de classification correcte de : 98,7% pour la classe normale 97,2% pour la classe Balourd 99,7% pour la classe Défaut de Roulement On peut ainsi remarquer, en comparant ces résultats à ceux obtenus avec un réseau RBF seul, une nette amélioration des performances (86,3% des signaux étaient correctement classés par un RBF seul). 104

-- %&"% + / 0 0 Comme précédemment, nous avons appliqué cette structure RBF/BP au problème de détection de l'apparition d'un défaut de roulement progressif. En s'appuyant sur les résultats obtenus par la mise en œ uvre d'un réseau RBF seul (II.3.3.4.2), nous avons décidé de faire varier le paramètre sc entre 6 et 15, le comportement du réseau RBF devenant quasi-aléatoire au-delà. Concernant le réseau BP, le nombre de neurones dans la couche cachée varie de 2 à10. Les résultats obtenus sont présentés figure III.21. 100 Roulement progressif - Pourcentage de Classification correcte RBF (Sc=6) / BP 100 Roulement progressif - Pourcentage de Classification correcte RBF (Sc=7) / BP Pourcentage de classification correcte 90 80 70 60 50 40 30 20 Classe Normal Classe "Défaut de Roulement" Résultats Globaux Résultats RBF seul Pourcentage de classification correcte 90 80 70 60 50 40 30 20 10 Classe Normal Classe "Défaut de Roulement" Résultats Globaux Résultats RBF seul 10 100 0 1 2 3 4 5 6 7 8 9 Nombre de Neurones dans le couche cachée du BP Roulement progressif - Pourcentage de Classification correcte RBF (Sc=8) / BP 100 90 0 1 2 3 4 5 6 7 8 9 Nombre de Neurones dans le couche cachée du BP Roulement progressif - Pourcentage de Classification correcte RBF (Sc=9) / BP Pourcentage de classification correcte 90 80 70 60 50 40 30 20 Classe Normal Classe "Défaut de Roulement" Résultats Globaux Résultats RBF seul Pourcentage de classification correcte 80 70 60 50 40 30 20 10 Classe Normal Classe "Défaut de Roulement" Résultats Globaux Résultats RBF seul 10 90 0 1 2 3 4 5 6 7 8 9 Nombre de Neurones dans le couche cachée du BP Roulement progressif - Pourcentage de Classification correcte RBF (Sc=10) / BP 100 90 0 1 2 3 4 5 6 7 8 9 Nombre de Neurones dans le couche cachée du BP Roulement progressif - Pourcentage de Classification correcte RBF (Sc=11) / BP Pourcentage de classification correcte 80 70 60 50 40 30 20 Classe Normal Classe "Défaut de Roulement" Résultats Globaux Résultats RBF seul Pourcentage de classification correcte 80 70 60 50 40 30 20 10 Classe Normal Classe "Défaut de Roulement" Résultats Globaux Résultats RBF seul 10 1 2 3 4 5 6 7 8 9 Nombre de Neurones dans le couche cachée du BP 0 1 2 3 4 5 6 7 8 9 Nombre de Neurones dans le couche cachée du BP 105

100 Roulement progressif - Pourcentage de Classification correcte RBF (Sc=12) / BP 100 Roulement progressif - Pourcentage de Classification correcte RBF (Sc=13) / BP 90 90 Pourcentage de classification correcte 80 70 60 50 40 30 20 Classe Normal Classe "Défaut de Roulement" Résultats Globaux Résultats RBF seul Pourcentage de classification correcte 80 70 60 50 40 30 20 Classe Normal Classe "Défaut de Roulement" Résultats Globaux Résultats RBF seul 10 10 100 0 1 2 3 4 5 6 7 8 9 Nombre de Neurones dans le couche cachée du BP Roulement progressif - Pourcentage de Classification correcte RBF (Sc=14) / BP 100 0 1 2 3 4 5 6 7 8 9 Nombre de Neurones dans le couche cachée du BP Roulement progressif - Pourcentage de Classification correcte RBF (Sc=15) / BP 90 90 Pourcentage de classification correcte 80 70 60 50 40 30 20 Classe Normal Classe "Défaut de Roulement" Résultats Globaux Résultats RBF seul Pourcentage de classification correcte 80 70 60 50 40 30 Classe Normal Classe "Défaut de Roulement" Résultats Globaux Résultats RBF seul 10 20 0 1 2 3 4 5 6 7 8 9 Nombre de Neurones dans le couche cachée du BP 10 1 2 3 4 5 6 7 8 9 Nombre de Neurones dans le couche cachée du BP Figure III. 21 Evolution du pourcentage de classification correcte en fonction du nombre de neurones dans la couche cachée du réseau BP pour différentes valeurs du paramètre sc du réseau RBF (Structure hybride RBF/BP). Sur ces différentes courbes, nous avons aussi tracé les résultats globaux obtenus par le réseau RBF seul. On peut ainsi remarquer qu'à nouveau, la structure hybride ne permet pas d'obtenir les améliorations escomptées. De plus, lorsqu'on peut observer une amélioration du pourcentage global de classification correcte (par exemple, pour sc égal à 11), on note une inversion dans la reconnaissance des classes. Cette tendance est probablement lié au comportement quasi-aléatoire du réseau RBF déjà observé au chapitre précédent. Compte tenu des résultats obtenus par l'une et l'autre des structures hybrides RNA/module de décision neuronale dans le cadre de la détection d'un défaut progressif, il apparaît clairement que la configuration employée (une seule signature, pas de prétraitement) ne permet pas de résoudre ce problème complexe. On peut alors envisager plusieurs perspectives pour améliorer ces performances : tout d'abord, compte tenu de la complexité du problème, on peut imaginer que l'utilisation de l'accélération comme seule signature n'est pas suffisante pour caractériser le fonctionnement de la machine tournante. Une solution pourrait alors être l'utilisation d'autres informations, voire, une extraction d'informations pertinentes du signal d'accélération par d'autres techniques, comme le traitement par ondelettes. 106

Concernant le comportement des réseaux de neurones artificiels, nous avons déjà pu noter, au chapitre II, un fonctionnement quasi-aléatoire du réseau RBF, et envisager un apprentissage avec zone d'influence variable. Une des perspectives de travail serait alors la mise en œ uvre d'une structure hybride RNAs/Module de décision neuronale présentée figure III.22. RBF (Classe Normale) RBF (Défaut Niveau1) Accélération Etape de Prétraitement RBF (Défaut Niveau2) BP RBF (Défaut Niveau3) RBF (Défaut Niveau4) Figure III. 22 - Perspectives : Structure Hybride de type RNAs/Module de décision neuronal pour la détection de défaut progressif Dans une telle structure, chacun des réseaux RBF serait dédié à la reconnaissance d'un niveau de défaut. Lors de la présentation d'un vecteur, chacun des réseaux va donner en sortie une probabilité d'appartenance à la classe pour laquelle il est spécialisé. Le réseau décideur (un réseau BP par exemple) devra ensuite, à partir de toutes les informations délivrées par les réseaux spécialistes, désigner la classe correspondante. 1 2 Dans ce chapitre, nous avons appliqué la structure neuronale hybride multi-modèle pour l'aide au diagnostic présentée au chapitre I. Partant en effet du constat que les structures neuronales simples ne permettaient pas d'obtenir des performances suffisantes pour la 107

réalisation d'un outil d'aide au diagnostic (cf. résultats su chapitre II), nous avons alors construit une structure plus complexe, pouvant s'adapter à une plus large variété de domaines d'application. Nous avons appliqué cette stratégie aux problématiques exposées dans le chapitre II. Concernant le problème biomédical, plusieurs variantes ont ainsi été mises en œ uvre. Leur philosophie reste cependant la même : plusieurs informations sont utilisées: le PEM, obtenu grâce au dispositif médical présenté Figure II.15, la perte auditive, extraite du dossier du patient et le seuil auditif, estimé grâce à l'audiogramme et à l'information "perte auditive". Le PEM est ensuite prétraité (troncature+normalisation) et est présenté à un agent neuronal (réseau RBF et/ou réseau LVQ) dont le rôle est de classer ces signaux. Les réponses des agents neuronaux sont ensuite présentées au module de décision. Différents modules de décision ont alors été mis en œ uvre : si tous comportent une étape de seuillage pour la prise en compte du seuil auditif, l'implication ou non d'un autre réseau de neurones et la prise en compte ou non de la perte auditive font leur différence. Lorsque le module de décision fait intervenir un réseau de neurones, nous avons choisi d'utiliser les réseaux LVQ et BP. En effet, même si le réseau LVQ est un réseau dédié à la classification, la nature compétitive de sa stratégie autorise son utilisation en tant qu'opérateur de 'décision-classification'. Son utilisation dans la structure hybride RBF/LVQ+Seuillage doit permettre, à partir de la mesure de ressemblance à chacune des classes fournie par le RBF, et, éventuellement de la perte auditive, de désigner la classe correspondante. Concernant le réseau BP, ce dernier va, à partir des informations de classification fournies par le ou les agents neuronaux (RBF dans le cas de la structure hybride RBF/BP+Seuillage, RBF et LVQ dans le cas de la structure hybride RBF+LVQ/BP+Seuillage) et, éventuellement, la perte auditive, jouer le rôle d'un expert. On peut alors noter une amélioration conséquente des performances par rapport aux structures simples. Alors qu'un réseau LVQ seul permettait de classer correctement 56,8% des vecteurs de notre base de données, la mise en œ uvre de notre structure LVQ/Seuillage permet d'atteindre 80,7% de classification. De la même manière, si un réseau RBF seul ne permettait de classer correctement que 59,1% des vecteurs de notre base de données, on atteint des taux de classification correcte de: 77,5% dans le cas de la structure hybride RBF/Seuillage, 83,1% dans le cas de la structure hybride RBF/LVQ+Seuillage et 84% avec prise en compte de la perte auditive 83,6% dans le cas de la structure hybride RBF/BP+Seuillage et 84,5% avec prise en compte de la perte auditive. 108

Enfin, la mise en œ uvre de la structure hybride RBF+LVQ/BP+Seuillage permet d'obtenir un taux de classification correcte de 80,7%, avec un taux de reconnaissance équilibré pour chacune des trois classes. On peut donc constater que : la prise en compte du seuil auditif dans le module de décision permet une amélioration notable des résultats, en reclassant les vecteurs de type endocochléaire et de type normal, la prise en compte de la perte auditive au niveau du réseau de neurones dans le cadre d'un module de décision hybride (RNA+Seuillage) permet la prise en compte de ce paramètre utilisé par les médecins pour la catégorisation des patients souffrant d'une atteinte endocochléaire et ayant une audition normale et ainsi, d'améliorer les résultats de classification concernant ces deux classes. En revanche, la prise en compte de ce paramètre ne permet pas d'obtenir une meilleure reconnaissance de la classe 1 (patients souffrant d'une atteinte de type rétrocochléaire). La préférence d'une structure par rapport à une autre n'est donc pas simple à obtenir. Il faut savoir s'il est primordial d'obtenir un taux de classification optimal dans ce cas, le choix se porterait sur la structure hybride RBF/BP+Seuillage - ou si on préfère avoir une reconnaissance correcte et "équilibrée" pour chacune des classes dans ce cas, le choix se porterait sur la structure hybride RBF+LVQ/BP+Seuillage. L'ajout d'un indice de confiance sur le résultat pourrait alors permettre de trancher. Le médecin saurait alors quel crédit accorder à la réponse donnée par l'outil d'aide au diagnostic. Concernant le volet industriel rappelons qu'il s'agit de détecter des défaillances d'un moteur asynchrone la mise en œ uvre des structures hybrides proposées permet dans de nombreux cas, d'observer une amélioration des résultats de classification par rapport aux techniques neuronales simples. Deux structures, du type RNA/Décision neuronale ont ainsi été proposées. Toutes les deux ne comprennent qu'un seul agent neuronal, le réseau RBF. Le module de décision neuronal est constitué, quant à lui, d'un réseau LVQ dans un cas, et d'un réseau à rétropropagation du gradient dans l'autre cas. Ces deux structures ont été mises en œ uvre pour les bases de données 2 et 3 10 présentées au chapitre II.3.2 ainsi que pour essayer 10 Base de données 2 : Base d'apprentissage : Signaux callés sur le Top Tour Base de généralisation : Signaux "Fenêtre Glissante" Base de données 3 : Signaux "Fenêtre Glissante" (base d'apprentissage et de généralisation). 109

de détecter l'apparition d'un défaut progressif survenant sur un roulement à billes. Dans le cas d'un module de décision neuronal de type LVQ, les améliorations observées sont peu significatives. En revanche, on observe une nette amélioration des performances par rapport aux résultats obtenus avec un réseau RBF seul dans le cas d'un module de décision de type BP. Ainsi, lors de l'exploitation de la base de données 2, si le réseau RBF seul permettait d'obtenir 63,1% de classification correcte, l'utilisation des structures hybrides permet d'atteindre : 63,4% de classification correcte pour la structure RBF/LVQ 81,1% de classification correcte pour la structure RBF/BP Dans le cadre de l'exploitation de la base de données 3, si le réseau RBF seul permettait d'atteindre 86,3% de classification correcte, on atteint des taux de classification correcte de : 86,7% pour la structure RBF/LVQ 98,5% pour la structure RBF/BP En revanche, lorsqu'il s'agit de détecter l'apparition progressive d'un défaut, les résultats donnés par les structures RNA/Module de décision neuronal restent très insuffisants. Dans le cas de ce problème complexe, l'architecture proposée ne permet pas une discrimination correcte des classes. Rappelons que le réseau utilisé pour la classification est un réseau RBF pour lequel le rayon des zones d'influence des neurones cachés est fixe. Il semble judicieux alors d'envisager un rayon différent pour chacune des classes. Une architecture à envisager pour améliorer les performances de la structure hybride RNAs/Module de décision neuronale (figure III.22) où chacun des réseaux RBF utilisés serait dédié à la reconnaissance d'une et une seule classe (normale, défaut de roulement niveau 1, défaut de roulement niveau 2.). Le module de décision neuronal devra alors, à partir des informations données par chacun des réseaux RBF spécialisés (rappelons que le RBF donne une distance à une classe) désigner la classe correspondante. De plus, compte tenu de la complexité du problème abordé, il est aussi envisageable que l'utilisation de l'accélération comme seule signature caractérisant le fonctionnement du système ne soit pas suffisante. Il convient alors d'envisager l'utilisation d'informations provenant d'autres capteurs et/ou le prétraitement de ces signatures par d'autres techniques afin d'extraire des caractéristiques pertinentes à présenter aux agents neuronaux constituant la structure hybride. 110

Cependant, la structure neuronale hybride que nous proposons permet une amélioration des résultats par rapport aux techniques neuronales simples dans la majorité des cas présentés. De plus, elle est adaptée aux problèmes d'aide au diagnostic, et ce, quelque soit le domaine abordé, qu'il soit industriel ou médical. 111

Chapitre III....77 Vers des techniques neuronales hybrides...77 III.1. Introduction...77 III.2. Validation de la structure neuronale hybride proposée : Application au problème d'aide au diagnostic biomédical...78 III.2.1. Structures n'impliquant qu'un seul agent neuronal...79 III.2.1.1. Structures hybrides RNA/Seuillage...79 III.2.1.1.1. Structure hybride LVQ/Seuillage...80 III.2.1.1.2. Structure hybride RBF/Seuillage...81 III.2.1.2. Structures hybrides RNA/Module de décision neuronal...83 III.2.1.2.1. Structure hybride RBF/(LVQ+Seuillage)...83 III.2.1.2.2. Structure hybride RBF/(BP+Seuillage)...88 III.2.2. Structure hybride impliquant 2 agents neuronaux...93 III.3. Validation de la structure neuronale hybride proposée :Application au problème d'aide au diagnostic industriel...96 III.3.1. Structure Hybride RBF/LVQ...97 III.3.1.1. Application de la structure hybride RBF/LVQ : exploitation de la base de données 2 98 III.3.1.2. Application de la structure hybride RBF/LVQ : exploitation de la base de données 3 99 III.3.1.3. Application de la structure hybride RBF/LVQ : Détection de l'apparition d'un défaut progressif...101 III.3.2. Structure Hybride RBF/BP...102 III.3.2.1. Application de la structure hybride RBF/BP : exploitation de la base de données 2 103 III.3.2.2. Application de la structure hybride RBF/BP : exploitation de la base de données 3 104 III.3.2.3. Application de la structure hybride RBF/LVQ : Détection de l'apparition d'un défaut progressif...105 III.4. Conclusion...107 112

L'objet de l'étude que nous venons de présenter concerne le domaine de l'aide au diagnostic, qu'il soit industriel ou médical. Partant du constat que l'homme est un acteur incontournable dans l'activité de diagnostic, nous nous sommes penchés sur le développement de techniques d'aide au diagnostic. L'objectif des travaux présentés dans cette thèse est de proposer des éléments de réponse au problème d'intégration des connaissances d'experts dans un processus permettant de détecter et de faire le diagnostic d'un dysfonctionnement. Les problèmes étudiés relèvent de l'identification et de la catégorisation des dysfonctionnements. Pour tenter de les résoudre, nous avons mis en œ uvre des techniques impliquant des structures neuronales. Deux problématiques ont ainsi été abordées : l'une relevant du domaine médical et l'autre du domaine industriel. Les différentes techniques employées pour le diagnostic s'appuient sur l'existence ou non d'un modèle du système à surveiller. Lorsqu'un modèle peut être obtenu, les méthodes de diagnostic, encore appelées méthodes internes, ont pour principe de comparer l'état théorique du système fournit par le modèle avec son état réel courant donné par les observations. Si on ne peut pas obtenir de modèle, les techniques mises en œ uvre sont appelées techniques externes. Parmi celles-ci, on trouve les techniques de reconnaissance des formes, ainsi que les techniques de l'intelligence artificielle (systèmes experts et techniques neuromimétiques). Nous nous sommes intéressés au diagnostic des systèmes pour lesquels on ne dispose pas de modèle. Dans ce cas, la seule connaissance du système repose alors sur l'expertise humaine confortée par un solide retour d'expériences. Une des tâches principales est alors la catégorisation des informations issues du système à surveiller, c'est-à-dire l'affectation de la catégorie de défauts à ces informations. Si les techniques de reconnaissance des formes sont adaptées à ce genre de problème, dans de nombreux cas, cette catégorisation présente de nombreuses difficultés. Ces difficultés peuvent être dues de la grande ressemblance des 113

informations de classes différentes d'une part, et, d'autre part, elles peuvent reposer sur la grande disparité de ces informations au sein d'une même classe. Durant les dernières décennies, des études ont montré que lorsqu'une approche de diagnostic par reconnaissance des formes est adoptée, les réseaux de neurones artificiels sont des outils performants pour réaliser cette catégorisation. Nos efforts se sont donc focalisés sur la mise en œ uvre de techniques neuronales. Le premier chapitre a été consacré au diagnostic par des techniques basées sur les réseaux de neurones artificiels. Nous avons présenté trois modèles neuronaux 1 fréquemment utilisés pour le problème du diagnostic : le réseau à rétropropagation du gradient (ou BackPropagation), le réseau Learning Vector Quantization et le réseau Radial Basis Function. Puis, nous avons proposé et présenté la mise en œ uvre d'une strucutre neuronale hybride pour le diagnostic des systèmes complexes tels que ceux que nous avons étudiés dans cette thèse. Cette structure comprend trois niveaux de traitement : tout d'abord une phase de prétraitement des informations qui permet d'extraire les informations pertinentes des données brutes et d'en faciliter le traitement par les structures neuronales suivantes. Puis, un ensemble d agents neuronaux, pouvant être d'un même type (architecture homogène) ou de types différents (architecture hétérogène), permet la réalisation d'une classification préliminaire des informations prétraitées. Enfin, le dernier niveau de traitement est constitué d'un module de décision qui fournira un élément de diagnostic. La réalisation de celui-ci peut faire appel à diverses techniques, telles que des opérations de seuillage, des réseaux de neurones artificiels, ou des systèmes experts, par exemple. Dans un deuxième chapitre, nous avons présenté les résultats obtenus par la mise en œ uvre des réseaux LVQ et RBF pour deux domaines, l'un biomédical, et l'autre, industriel. Le volet biomédical concerne l'aide au diagnostic de pathologies auditives en utilisant des signaux caractéristiques : les Potentiels Evoqués Auditifs (PEA). Pour réaliser l'outil d'aide au diagnostic, nous disposions ici d'une base de données mise à notre disposition par un centre médical, le CREFON 2. Le volet industriel aborde le problème du diagnostic de défaillances 1 Il est important de noter que ces modèles ne doivent pas être considérés comme des solutions concurrentes, mais comme des systèmes ayant des caractéristiques différentes. 2 Centre de Recherche et d'exploration Fonctionnelle Oto-Neurologique 114

d'un moteur asynchrone. La base de données a été réalisée au sein du laboratoire CERTES 3 et nous nous sommes focalisés sur la signature vibratoire donnée par l'accélération du moteur. L'étude a concerné la catégorisation de signaux PEM dans le cas biomédical et vibratoires dans le cas industriel. Nous nous sommes focalisés sur la mise en œ uvre des réseaux LVQ et RBF et la recherche des structures adéquates pour le traitement de ces informations en faisant varier un paramètre caractéristique pour chacun des réseaux : le nombre de neurones cachés pour le réseau LVQ et la valeur d'un paramètre caractéristique du rayon de la zone d'influence (sc) pour le réseau RBF. Concernant l'application biomédicale, les résultats obtenus ont été assez insuffisants puisqu'on atteint des taux de classification correcte de 56,2% pour un réseau LVQ comprenant 12 ou 20 neurones cachés et 59,1% pour un réseau RBF où le paramètre sc vaut 7,5. Ces résultats ont été cependant meilleurs que ceux obtenus dans le cadre de la mise en œ uvre d'une approche conventionnelle (modélisation autorégressive) puisque, dans ce cas, seuls 37% des vecteurs de notre base de données étaient correctement classés. Concernant l'application industrielle, plusieurs bases de données ont été construites pour la mise en œ uvre de ces techniques neuronales simples. Les différences entre les trois premières bases utilisées concernaient l'origine des signaux des bases d'apprentissage et de généralisation (origine prise au moment du "Top Tour" ou non). La quatrième base employée devait permettre la détection de l'apparition d'un défaut progressif apparaissant sur un des organes du moteur asynchrone (roulement à billes). Concernant la première base de données, les signaux des bases d'apprentissage et de généralisation étaient calés sur le Top Tour. On a alors obtenu d'excellents résultats, avec des taux de classification correcte de 95,4% pour un réseau LVQ comprenant 9 neurones cachés et de 100% pour un réseau RBF où le paramètre sc est compris entre 5 et 7. Nous avons décidé d'étendre notre étude en construisant une deuxième base de données pour laquelle l'origine des signaux de la base de généralisation n'était pas forcément en phase avec le Top Tour. Dans ce cas, compte tenu des résultats précédents, seul le réseau RBF a été mis en oeuvre. Les résultats obtenus étaient alors assez insuffisants puisqu'on a atteint un taux de classification correcte de 63,1% pour un réseau RBF où le paramètre sc valait 21. La troisième base de données comprenait quant à elle, des signaux dont l'origine ne dépendait pas de l'information délivrée par le Top Tour, et ce, tant pour la base d'apprentissage que pour la base de généralisation. On a alors obtenu des taux de classification correcte de 65,7% pour un réseau LVQ comprenant 9 neurones cachés et de 86,3% pour un réseau RBF où le paramètre sc est égal à 2. Si le réseau LVQ n'a pas 3 Centre d Etudes et de Recherche en Thermique, Environnement et Systèmes 115

permis d'obtenir des résultats satisfaisants, la mise en œ uvre d'un réseau RBF pour la classification de ces signaux a semblé adaptée. Compte tenu de ces résultats prometteurs, nous avons décidé de détecter l'apparition progressive d'un défaut de roulement sur la machine tournante. Les résultats ont alors été très insuffisants: le réseau LVQ n'est pas parvenu à détecter ce défaut, même quand celui-ci est installé sur la machine. Le même constat a pu être fait pour le réseau RBF. Les résultats obtenus ont montré que globalement, des structures neuronales simples ne sont pas suffisantes pour réaliser un outil d'aide au diagnostic fiable [DUJA 01b], nous nous sommes alors tournés vers la structure plus complexe, présentée au chapitre I. Le chapitre III a été consacré à la mise en œ uvre de la structure neuronale hybride proposée et à son application aux deux problématiques précédentes. Concernant le volet biomédical, si plusieurs variantes ont été mises en œ uvre, leur principe reste le même : plusieurs informations sont présentées à la structure : le PEM, le seuil auditif et la perte auditive dans certains cas. Après prétraitement (normalisation+troncature), le PEM est présenté aux agents neuronaux (RBF et/ou LVQ) dont le rôle sera de réaliser une première classification. Les résultats obtenus sont ensuite traités par le module de décision. Différents modules de décision ont été mis en œ uvre, comportant tous une étape finale de seuillage. Leur différence repose sur l'implication ou non d'un réseau de neurones et de la prise en compte, ou non de l'information liée à la perte auditive. Lorsque le module de décision fait intervenir un réseau de neurones, nous avons choisi d'utiliser les réseaux LVQ et BP, qui, de par leur nature peuvent jouer le rôle de décideur. Les résultats que nous avons alors obtenus sont meilleurs par rapport aux structures simples, puisque les taux de classification correcte varient de 77,5% pour la structure hybride RBF/Seuillage à 84,5%pour la structure RBF/BP+Seuillage avec prise en compte de la perte auditive. De la même manière, concernant le volet industriel, le principe des structures hybrides mises en œ uvre est le même Dans tous les cas, le module de décision mis en œ uvre est un réseau de neurones artificiels. Les réseaux LVQ et BP comme précédemment, ont joué le rôle des décideurs. Si les résultats obtenus grâce à la structure RBF/LVQ ne présentent pas d'amélioration significative dans le cas des bases de données 2 et 3 par rapport aux résultats obtenus par le RBF seul, la mise en œ uvre du réseau BP comme module de décision a permis d'améliorer de façon notable les résultats (81,1% des signaux de la base de données 2 sont correctement reconnus, alors que seuls 63,1% l'étaient par le RBF seul, et 98,5% des signaux de la base de données 3 le sont, alors que seuls 86,3% l'étaient par le RBF seul). En revanche, 116

dans le cadre plus complexe de la détection de défaut progressif, la structure hybride ne permet pas d'améliorer les résultats obtenus par un réseau RBF utilisé seul. Cette structure neuronale hybride est adaptée aux problèmes d'aide au diagnostic, qu'ils soit biomedical ou industriel. Nous avons pu aussi remarquer que plusieurs structures pouvaient être pertinentes pour l'aide au diagnostic. Dans le cas de l'application biomédicale, par exemple, la préférence d'une structure par rapport à une autre n'est pas simple à obtenir. Il faut savoir s'il est primordial d'obtenir un taux de classification optimal dans ce cas, le choix se porterait sur la architecture hybride RBF/BP+Seuillage - ou si on préfère avoir une reconnaissance correcte et "équilibrée" pour chacune des classes dans ce cas, le choix se porterait sur l'architecture hybride RBF+LVQ/BP+Seuillage. On pourrait alors imaginer l'ajout d'un indice de confiance sur le résultat qui pourrait alors permettre au médecin de savoir quel degré de crédibilité accorder à la réponse fournie par le système et, ainsi de trancher. Cet indice de confiance aurait aussi tout à fait sa place dans un système d'aide au diagnostic industriel. A plus long terme, concernant l'étude biomédicale, il sera intéressant de poursuivre l'approche basée sur l'analyse de le traitement d'images, amorcée il y a peu. Enfin, dans le cadre de la problématique industrielle, et compte tenu des faibles performances obtenues pour la détection préventive de défaut, plusieurs perspectives sont envisageables. La mise en œ uvre d'une structure hybride mettant en jeu un ensemble d'agents neuronaux où chacun serait spécialisé dans la reconnaissance d'une catégorie de fonctionnement est une piste à explorer. Cette structure a été présentée au chapitre III. De plus, et compte tenu des remarques précédentes, on peut aussi penser que l'utilisation d'une seule signature pour caractériser le fonctionnement d'une machine tournante ne soit pas suffisante. On peut alors imaginer d'adjoindre à cette information d'autres signatures, comme le courant d'alimentation, pour améliorer les résultats. Rappelons aussi que les signatures utilisées dans ce cas n'avaient pas subi de prétraitement visant à extraire des caractéristiques pertinentes de ces signaux. Utiliser une autre représentation de ces signatures, obtenue, par exemple, grâce à la transformée en ondelettes, est aussi une perspective à ne pas ignorer. 117

"It is not absolutely necessary to believe that neural network model have anything to do with the nervous system, but it helps. Because, if they do, we are able to use a large body of ideas, experiments, and facts from cognitive science and neuroscience to design, construct and test networks. Otherwise, we would have to suggest functions and mechanism for intelligent behaviour without any examples of successful operation." 1 [ANDE 95] Le cerveau humain possède une fantastique puissance de traitement de l'information si l'on considère ses capacités à prendre en charge certaines tâches nécessaires pour obtenir un comportement intelligent. A la base de ce formidable outil, on trouve les neurones. Ce sont les éléments fonctionnels de base des systèmes nerveux. S'il existe une grande variété de neurones (entre 100 et 1 000 pour le cerveau humain) et s'ils différent beaucoup d'une espèce animale à l'autre, ils possèdent néanmoins le même comportement global. Les neurones L'accomplissement de tâches par le cerveau est lié à l'activité électrochimique des cellules nerveuses. Un neurone est une cellule assurant cinq fonctions spécialisées : 1 "Il n'est pas absolument nécessaire de croire que les réseaux de neurones artificiels ont un rapport avec le système nerveux, mais cela aide. Dans ce cas, nous sommes capables d'utiliser beaucoup d'idées, d'expériences et de concepts des sciences cognitives et des neurosciences pour modéliser, construire et tester des réseaux. Dans le cas contraire, il nous faut inventer des fonctions et des mécanismes de comportement intelligent sans aucun exemple." 124

recevoir des signaux en provenance des neurones voisins, intégrer ces signaux, engendrer un influx nerveux, le conduire, le transmettre à un autre neurone capable de le recevoir. Il est constitué principalement de trois parties qui, vis-à-vis des transferts d'information, ont un rôle fonctionnel bien précis : un réseau d'entrée, les dendrites, qui capte les signaux des autres neurones ou de l'extérieur dans le cas des neurones sensoriels, un élément de traitement de l'information, le corps cellulaire, ou soma, un réseau de sortie, l'axone qui achemine l'impulsion nerveuse vers les autres neurones. La connexion des ramifications d'un axone aux dendrites ou au soma d'un autre neurone est appelée synapse. L'arborisation dendritique des cellules nerveuses, comme la ramification des axones, varie beaucoup suivant le type de cellule. La longueur des axones chez l'être humain peut ainsi aller de quelques dixièmes de millimètre jusqu'à plus d'un mètre. Pour simplifier, nous considérerons que le signal support de l'information nerveuse est de nature électrique : l'influx nerveux est une impulsion électrique et les signaux dendritiques et somatiques sont des variations de potentiel électrique. Au niveau de la synapse, c'est-à-dire, entre deux cellules nerveuses, la transmission se fait le plus souvent par l'intermédiaire d'un médiateur chimique. Selon les neurobiologistes, le principe de fonctionnement classique simplifié est le suivant : le soma recueille l'ensemble des informations collectées par les dendrites, en effectue une sommation et compare le résultat obtenu à un seuil. Si ce potentiel somatique dépasse ce seuil, il y a émission d'un potentiel d'action ou spike. Ce signal, très bref (1 ms), est alors transmis sans atténuation le long de l'axone et réparti sur les synapses des neurones cibles. L'information mémorisée est contenue dans les liens synaptiques. Chaque neurone comporte donc sa propre unité de décision et le seul lien qui unit les neurones entre eux sert à transmettre des informations. Contrairement à un ensemble d'ordinateurs connectés en réseau, il n'existe aucun signal de synchronisation ou de contrôle. 125

Figure A1. 1 - Neurone Biologique Les réseaux de neurones biologiques Afin d'avoir une idée de la complexité du système nerveux, il faut savoir qu'on estime à environ 100 à 1 000 milliards le nombre de neurones du système nerveux humain et qu'on compte en moyenne 1 000 à 100 000 synapses par neurone. La notion de réseaux de neurones s'applique aux réseaux dans lesquels les neurones sont considérés comme les nœ uds d'un graphe et les synapses comme les arrêtes de celui-ci. Un réseau de neurones peut se représenter sous la forme d'une "boîte noire" munie d'entrées et de sorties. Le rôle de cette boîte noire est de percevoir, de réagir et de se souvenir. L'entrée de ce réseau est constituée d'un ensemble de capteurs sensoriels spécialisés qui réagissent aux stimuli du monde extérieur (image, son, odeur...). La mission de ces récepteurs est de prévenir le cerveau de toute modification survenue dans son environnement et d'enrichir le contenu cérébral, d'une part en informations à mémoriser, d'autre part, en stimulant l'organisation des structures et des connexions nerveuses. En sortie du réseau, on trouve d'autres cellules spécialisées, les motoneurones, qui permettent de commander des contractions musculaires 2. A l'intérieur de cette boîte noire, les schémas de connexions du système nerveux sont très variables d'une région à l'autre du cerveau. Et même si ces architectures sont assez bien connues, parfois depuis fort longtemps, leurs propriétés fonctionnelles demeurent encore souvent difficiles à comprendre. La théorie de la localisation cérébrale des fonctions mentales 2 A l exception des systèmes endocriniens et exocriniens. 126

date du début du XIXème siècle, mais des études plus récentes ont montré que ces découpages n'étaient pas aussi nets que l'on pensait. Les travaux de Cajal [CAJA 52] ont permis de montrer que le cortex est organisé en couches. De plus, de nombreuses observations prouvent que les cellules sont organisées en unités fonctionnelles et anatomiques, appelées colonnes corticales en raison du caractère ascendant et descendant de la transmission des signaux à l'intérieur de ces cellules. Si les systèmes nerveux simples tels que l'arc réflexe monosynaptique dans lequel seules trois cellules interviennent sont bien connus, il subsiste bien des questions concernant les systèmes plus complexes dans lesquels plusieurs capteurs sensoriels interviennent. Le fait de reconnaître une personne que l'on ne connaît pas bien n'est pas lié uniquement à une de ses caractéristiques (visage, voix, façon de marcher...). Il existe une coopération complexe entre les cellules fonctionnelles. Par exemple, après un accident vasculaire cérébral, qui entraîne souvent une hémiplégie, une hémiparésie ou une aphasie, on a pu observer une récupération partielle ou totale grâce à une réorganisation opérée au sein du cortex cérébral. La plasticité neuronale La plasticité neuronale, propriété particulièrement remarquable du système nerveux, recouvre la faculté d'évolution des cellules nerveuses et de leurs interconnexions. Les notions d'apprentissage et de mémoire sont étroitement liées à cette propriété. Si le système nerveux d'un nouveau-né est caractérisé par une architecture complexe due à un "précâblage" redondant, un enfant de quatre ans possède déjà un système mature. En effet, les circuits neuronaux se spécialisent pendant cette période par sélection, élimination ou renforcement des connexions, grâce aux stimuli extérieurs. L'apprentissage, ou adaptation des réseaux neuronaux à court terme, consiste en une modification des liens synaptiques. Un bon exemple de cette plasticité neuronale est celui évoqué plus haut concernant les accidents vasculaires cérébraux. Des études récentes utilisant la tomographie par émission de photons par exemple ont permis de mettre en évidence une récupération importante, parfois même totale des fonctions perdues, suite à une lésion partielle du cerveau, soit par restauration des circuits endommagés, soit par transfert de la fonction de la région lésée sur une région voisine saine. Pour comprendre ce phénomène d'apprentissage, de nombreuses études ont été réalisées sur l'aplysia Californica, un mollusque marin dont le système nerveux ne comporte qu'environ 20 000 cellules nerveuses de très grosse taille (elles atteignent 1 mm de diamètre). Par exemple, on provoque une habituation des ouïes au toucher. C'est un réflexe 127

monosynaptique. Si ce stimulus est suffisamment répété, il se produit un phénomène d'habituation, c'est-à-dire que la réponse diminue et reste affaiblie durant un certain temps. L'effet physiologique associé à ce phénomène est une décroissance de l'émission présynaptique du neurotransmetteur aux synapses. Alors, l'arrivée d'un potentiel d'action provoque une dépolarisation moindre et l'efficacité synaptique diminue. On peut, de façon analogue, provoquer un accroissement de l'efficacité synaptique. C'est à Hebb qu'on doit, en 1949, le premier énoncé d'une règle qualitative régissant la plasticité synaptique : "When an axon of cell A is near enough to excite cell B and repeatedly or persistently takes part in firing it, some growth process or metabolic change takes place in one or both cells such that A's efficiency, as one of the cells firing B, is increased." 3 [HEBB 49]. Le neurone formel C'est en 1943 que McCulloch & Pitts ont modélisé une cellule nerveuse par un automate à seuil, appelé neurone formel. Un neurone formel est une modélisation très simplifiée du neurone biologique. Il en reprend les caractéristiques de fonctionnement principales. Sa fonction est d'intégrer les entrées et d'en calculer une transformation nonlinéaire. La modélisation d'un tel neurone est représentée figure A1.2. 3 "Quand une cellule A excite par son axone une cellule B et que, de manière répétée et persistante, elle participe à la genèse d'une impulsion dans B, un processus de croissance ou un changement métabolique a lieu dans l'une ou dans les deux cellules, de telle sorte que l'efficacité de A à déclencher une impulsion dans B est, parmi les autres cellules qui ont cet effet, accrue." 128

Synapse Corps cellulaire x i w ij Dendrites o = w. x x j = ϕ( o j ) j ij i i Axone x j Neurone j Figure A1. 2 - Schéma fonctionnel d'un neurone (o i ) (o i ) o i Linéaire : ϕ(o i )= o i seuil : ϕ( ) 0 o i = 1 o i si o si o i i θ θ (o i ) (o i ) 1 1 semi-linéaire : sigmoïde : 0 o θ 1 θ θ si o < θ i 1 ϕ( o ) = si θ o θ ϕ( o ) i 1 2 2 1 si o i i 1 o i 1 i > θ 2 2 i = o i oi θ exp T oi θ 1 + exp T Figure A1.1 - Les fonctions d'activation usuelles. 129

Le potentiel o j de sortie du neurone j, auquel sont connectés les neurones i en entrée, se calcule à l'aide de la relation suivante : j = i o w. x (Eq. A1.1) ij i dans laquelle x i représente l'état du neurone i et w ij, le poids de la synapse reliant le neurone i au neurone j. La sortie, ou état, du neurone j est alors : x ( ) = ϕ (Eq. A1.2) j o j où ϕ est la fonction d'activation du neurone. Les fonctions d'activation généralement utilisées sont les fonctions linéaires, les fonctions seuils, les fonctions semi-linéaires et les sigmoïdes (tangentielles et exponentielles) et sont représentées figure A1.3. Les réseaux de neurones artificiels et leur mise en oeuvre Par analogie avec le système nerveux, un réseau de neurones artificiels est équivalent à un graphe dont les nœ uds sont des neurones et dont les arêtes orientées et pondérées sont les connexions (ou synapses). La mise en œ uvre d un tel réseau peut être comparée à la formation d un étudiant. En effet, un étudiant qui assiste à un cours apprend, grâce à un professeur, les notions essentielles dans des matières précises. Il est entraîné grâce à des exemples caractéristiques et évalué sur des choses connues. Quand il entre dans la vie active, il doit généraliser les connaissances acquises de façon à résoudre les problèmes réels qui lui sont posés. De la même manière, la mise en œ uvre d un réseau de neurones artificiels passe par les mêmes étapes. La phase d apprentissage consiste à la modification des paramètres du réseau afin de faire converger le comportement du réseau vers un comportement de référence. L algorithme d apprentissage dépend du modèle du réseau utilisé. Pour cette phase d'apprentissage, il est nécessaire d'employer un corpus de données, appelé base d'apprentissage, la validation de cet apprentissage est faite sur un autre ensemble de données, la base de test. L'ensemble formé par la base d'apprentissage, la base de test et, éventuellement de leurs sorties correspondantes, est appelée base de données du système neuronal. Le choix de la base de données, ainsi que le choix de la représentation des données associées constituent des éléments essentiels dans la réussite d'une application à base de réseaux de neurones. 130

Le réseau, ainsi entraîné, peut alors être utilisé comme outil pour effectuer une tâche précise qui lui a été apprise. Il est alors capable de répondre très rapidement ce qui rend leur utilisation possible pour des traitements en temps réel. 131

Les travaux présentés dans cette annexe concernent l'estimation quantitative de paramètres d'un système à surveiller. Le problème sur lequel se sont focalisés nos efforts concerne l'estimation du taux de vide dans un écoulement diphasique [DUJA 01a]. Il ne s'agit que d'une étude de faisabilité et la structure neuronale hybride présentée précédemment n'a pas été mise en œ uvre. Les résultats obtenus pour un système expérimental sont présentés ici. La présence d'impuretés (gaz, corps étranger) dans un liquide peut avoir des répercussions sur le bon fonctionnement d'un système. Le phénomène complexe des écoulements diphasiques (mélange de deux substances dans deux phases thermodynamiques différentes), est étudié depuis 1910 par de nombreux travaux de recherche. Les problèmes liés à ce phénomène se rencontrent dans de nombreux processus industriels. Un exemple fréquemment observé dans l'industrie est celui des écoulements à bulles, où l'une des substances est présente sous forme liquide et l'autre sous forme gazeuse. Parmi les industries concernées par ce problème, on peut ainsi citer les industries chimiques, métallurgique, pétrolières (production et transport), nucléaires Le problème principal, encore à l'étude aujourd'hui, est la mesure du taux de vide, rapport entre volume de gaz et volume de liquide, dans un contexte dynamique. En effet, si la mesure du volume de liquide est en général aisée, celle du volume de gaz présent dans le liquide est plus délicate et constitue encore aujourd hui un problème ouvert. C est pourquoi, 133

dans un écoulement à bulles, l intérêt principal réside dans les bulles et il semble donc judicieux de s intéresser aux caractéristiques de celles-ci (taille, vitesse ). De nombreuses études ont été menées pour tenter de résoudre ce problème [LEUT 98], et de nombreuses techniques ont été proposées parmi lesquelles : la photographie, le laser [DURS 75], des techniques mettant en œ uvre des capteurs capacitifs Cependant, les limitations de ces méthodes sont grandes et sont dues, d'une part, à la nécessité de connaître un modèle très fin de l'écoulement à bulles (qui est un problème très difficile et encore non résolu à ce jour), et d'autre part, aux difficultés liées aux conditions expérimentales et de mesure. Quelques auteurs proposent aussi des techniques ultrasonores [BONN 87][LEMO 98]. Compte tenu des difficultés d'une telle mesure (taux de vide) notamment à cause du contexte dynamique dans lequel elle intervient, nous pensons qu'il sera nécessaire d'associer les mesures obtenues par plusieurs capteurs différents afin de parvenir à une estimation de ce taux de vide. La technique à développer doit être non invasive et non destructive, car elle doit pouvoir s'adapter, par exemple, sur des tuyauteries existantes, comme par exemple des pipelines. Nous avons choisi de travailler dans un premier temps avec des techniques ultrasonores. Nous nous sommes alors focalisés sur la mesure fournie par un capteur ultrasonore, dans un contexte statique. Dans un premier temps, nous nous sommes intéressés à la classification des signaux fournis par ce capteur, afin d obtenir une information qualitative. Puis, nous nous sommes penchés sur l'estimation du taux de vide présent entre les deux capteurs ultrasonores. La partie suivante concerne le dispositif mis en œ uvre pour l'acquisition des signaux et la construction des bases de données pour les deux problématiques soulevées. Puis, nous présentons les résultats obtenus lors de la mise en œ uvre des techniques neuronales simples (cf. Chapitre I&II) Les ultrasons sont des ondes acoustiques dont la fréquence varie de 20khz à 200Mhz. Ces ondes ne peuvent se propager que dans un milieu matériel et leur propagation dépend du milieu dans lequel elles se propagent. L'intensité de ces ondes a aussi son importance, puisque, dans le cas d'ultrasons dit de puissance, des bulles dites de cavitations peuvent apparaître. 134

L'analyse par ultrasons repose sur l'analyse des échos observés après émission d'un faisceau d'ondes ultrasonores. Un capteur envoie un train d'ondes ultrasonores qui se propagent dans le milieu à contrôler où elles font l'objet de phénomènes de diffraction et de réflexion. L'analyse de l'écho obtenu au moyen, soit d'un autre capteur placé en regard de l'émetteur, soit par l'émetteur lui-même qui peut recevoir l'onde réfléchie, peut alors permettre de détecter un défaut. Cette méthode de contrôle non destructif et non invasif est en général utilisée pour la détection de fissure dans différents matériaux. Dans ce cas, une analyse spectrale des échos peut être suffisante. En revanche, dans le cas de la détection d'impuretés dans un liquide, une analyse classique des signaux ne permet pas de conclure. Le dispositif expérimental, représenté figure A2.1 nous a permis de construire une base de données. Le protocole d'acquisition des signaux, est le suivant : on dispose d'un récipient rempli d'eau, dans lequel on crée artificiellement un flot de bulles d'air, symbolisant les impuretés. Les bulles d'air sont générées en continu au moyen d'une pompe. Un robinet permet de régler le débit et ainsi le volume d'air présent entre les deux capteurs à un moment précis. Ondes émises Emetteur Ultrasonore Pompe à air Valve Figure A2.1 - Dispositif expérimental On dispose de deux capteurs à ultrasons, un émetteur et un récepteur, qui sont placés face à face de part et d'autre du récipient. Ceux-ci sont directement au contact de 135

l'eau, ceci afin de s'affranchir de la propagation de l'onde ultrasonore à travers le plastique. Les capteurs sont pilotés par un logiciel qui gère à la fois l'émission et la réception des ondes. Celles-ci se font en continu ce qui permet la visualisation en temps réel de l'évolution des signaux en fonction de la quantité d'air émise par la pompe. L'acquisition, quant à elle, se fait au moment choisi par l'expérimentateur. Le mode expérimental permettant de faire varier le débit de la pompe, nous avons, dans un premier temps, choisi de définir trois classes de signaux, en fonction du volume d'air émis. Nous avons alors procédé à l'acquisition de 61 signaux répartis de la manière suivante : 20 signaux pour la classe 1, correspondant à de l'eau seule, 20 signaux pour la classe 2, correspondant à un faible débit d'air, 21 signaux pour la classe 3, correspondant à un fort débit d'air. Un exemple de signal correspondant à chacune des classes est présenté figure A2.2. Amplitude Numéro de composante Figure A2.2 - Signaux ultrasonores --- Classe 1 -+- Classe 2 -*- Classe 3 La base d'apprentissage, que nous avons constituée pour la mise en œ uvre des structures neuronales, comprend 14 signaux, dont quatre correspondant à la classe 1, cinq, à la classe 2 et cinq, à la classe 3. Pour la phase de généralisation, nous avons utilisé la base de données globale, qui comprend les vecteurs de la base d apprentissage, mais aussi les vecteurs non appris. 136

Cette première base de données nous permet d obtenir des renseignements qualitatifs concernant la quantité d air présent dans l eau. Le but de cette première étude est la classification des signaux ultrasonores relevés suivant 3 catégories. Il est cependant nécessaire, dans certains cas, d'avoir une estimation quantitative de ce taux de vide. Pour évaluer la faisabilité d'une telle estimation par l'association du capteur ultrasonore et des réseaux de neurones artificiels, nous avons donc mis en place une seconde expérimentation afin de construire une seconde base de données. Le protocole d'acquisition des signaux diffère un peu du précédent. Comme précédemment, nous disposons du même récipient et des deux capteurs ultrasonores placés en regard l'un de l'autre. En revanche, nous ne générons plus de bulles. Le principe de cette expérimentation consiste à accroître progressivement le niveau d eau entre les deux capteurs, en partant d un niveau minimum jusqu au total recouvrement des capteurs. Connaissant le diamètre de chacun des capteurs et le niveau d'eau dans le récipient, nous pouvons alors estimer le volume d'eau et donc, le volume d'air présent entre les deux capteurs. Nous avons alors construit une seconde base de données de la manière suivante. Nous avons procédé à l'acquisition de 56 signaux ultrasonores correspondant à des volumes d air compris entre 0 et 14,66cm3. Afin d'effectuer l'étude de faisabilité d'une telle estimation, nous avons construit à partir de cette base de données, plusieurs bases d'apprentissage comportant un nombre variable d'exemples. Cette étude est présentée dans le paragraphe suivant.! " L'objet de cette étude concerne, dans un premier temps, la classification de signaux ultrasonores permettant de déterminer, de façon qualitative, la quantité d'air dans un récipient rempli d'eau. L'objectif de cette étude est de parvenir à un outil permettant l'estimation du taux de vide dans un écoulement dynamique. Nous nous sommes ensuite penchés sur la quantification de ce taux de vide. L'objectif de cette étude est l estimation du volume d air [AMAR 02]. Dans les deux cas, les composantes des vecteurs d'entrées sont les échantillons des signaux ultrasonores. Les signaux ultrasonores n ont ici subit aucun prétraitement avant leur présentation aux différents réseaux neuronaux. 137

#" $ % Concernant le réseau LVQ, le nombre de neurones de la couche d'entrée correspond au nombre de composantes des vecteurs d'entrée, soit 168. Le nombre de sortie correspond quant à lui au nombre de classes que l'on souhaite obtenir. On souhaite classer les vecteurs d'entrée dans 3 catégories, le réseau LVQ comprendra 3 neurones de sortie. Le nombre de neurones dans la couche cachée est un des paramètres à ajuster pour ce modèle. Ce choix est un problème délicat. Nous avons mené une étude en faisant varier le nombre de neurones dans la couche cachée du réseau LVQ de 2 à 100. Les résultats de l'évolution du nombre d'erreurs en phase de généralisation en fonction du nombre de neurones sont représentés par la figure A2.3. Nombre d'erreurs Nombre de neurones dans la couche cachée Figure A2.3 - Evolution du nombre d'erreurs en fonction du nombre de neurones dans la couche cachée du réseau LVQ pour la classification ultrasonores. Nous pouvons remarquer qu'au-delà de six neurones dans la couche cachée, le réseau classe correctement 98 à 100% des signaux de la base de données selon la taille de la couche cachée. Ceci peut s'expliquer par le fait que le nombre de neurones dans la couche cachée d'un réseau LVQ peut être vu comme le nombre de sous-classes dénombré au sein de notre base de données. Six neurones suffisent donc pour obtenir un excellent taux de classification. La croissance du nombre de neurones ne perturbe donc pas le comportement du réseau. De plus, lorsque le réseau se trompe, l'erreur de classification est toujours commise sur le même vecteur de la classe 2 que le réseau reconnaît comme un vecteur de la classe 1. 138

& ' Tout comme le réseau LVQ, les nombres de neurones des couches d'entrée et de sortie sont déterminés par le problème à traiter. Ainsi, le réseau comprendra autant de neurones en entrée que de composantes des vecteurs d'entrée, soit 128. Pour le nombre de neurones de sortie, on peut envisager le problème de deux manières différentes, suivant la manière dont on code les classes (voir II.2.3.2.2.a.). Pour la classification des signaux ultrasonores, la classe sera codée de la seconde manière et le réseau RBF comprend donc 1 seul neurone de sortie. Comme nous l'avons déjà mentionné, contrairement au LVQ, le nombre de neurones de la couche cachée du RBF est déterminé par apprentissage. Les neurones de la couche cachée sont utilisés pour mémoriser un exemple et une fonction d activation. Chacun a une activité locale dans l espace d entrée. Ainsi, les fonctions noyaux ne donnent des réponses utiles que dans le cas d un domaine restreint, leur champ récepteur. Ce champ récepteur, encore appelé zone d'influence, est l'un des paramètres caractéristiques du réseau RBF. Pour le modèle que nous utilisons, le rayon de cette zone est fixe et nous pouvons le faire varier grâce à un paramètre, noté sc. Nous avons étudié, dans chacun des cas, l'impact de la taille de la zone d'influence des neurones. Pour cela, nous avons fait varier le paramètre sc de 0,1 à 10 avec un pas de 0,01.. L'apprentissage s'arrête quand le nombre de neurones cachés atteint le nombre de vecteurs de la base d'apprentissage ou que l'erreur commise atteint un seuil fixé par l'utilisateur. Les résultats obtenus en phase de généralisation sont présentés à la figure A2.4. Pour le problème de classification des signaux ultrasonores; on peut remarquer un taux de classification correct élevé de 98% pour un intervalle précis, à savoir [1,59 ; 1,64]. Cet intervalle, valable pour les vecteurs de cette base d'apprentissage, permet alors d'optimiser dans ces conditions la couverture de l'espace des paramètres. Pour un rayon inférieur, le nombre d'erreurs diminue jusqu'à atteindre le minimum. Puis, au-delà de cet intervalle, le nombre d'erreurs s'accroît à nouveau et finit par rester stable. En effet, la taille de la zone d'influence intervient directement sur la cartographie que réalise le réseau RBF au cours de son apprentissage. Un rayon d'influence trop faible peut alors conduire à une cartographie trop lacunaire, tandis qu'un rayon trop élevé risque de provoquer des recouvrements de zones de classification. Si on analyse les résultats obtenus, on peut remarquer que, pour l'intervalle 139

optimal du rayon, l'erreur commise est toujours la même. Le réseau ne parvient pas à déterminer la classe d'un vecteur de la classe 3. Le résultat fourni alors correspond à une classe non définie. Cependant, cet excellent taux de classification ne doit pas occulter le fait que les résultats obtenus ne concernent qu'une étude assez éloignée de la réalité. Les résultats obtenus ne sont valables que pour les bases d'apprentissage définies. Ils montrent cependant la pertinence de ce paramètre dans la construction d'un réseau adéquat. Il est important de rappeler que les critères d'arrêt d'apprentissage utilisés, mentionnés ci dessus, restent restrictifs du fait que le rayon d'influence a été supposé identique pour tous les neurones de la couche cachée. RBF Nombre d'erreurs 35 30 25 20 15 10 5 0 0 1 2 3 4 5 6 7 8 9 10 Rayon zone d'influence Figure A2.4 - Evolution de l'erreur commise en fonction du paramètre sc pour la classification des signaux ultrasonores $ Nous nous sommes penchés sur la quantification du taux de vide à l'aide d un réseau RBF. L'objectif de cette étude est l estimation du volume d air compris entre les deux capteurs ultrasonores par ce RNA. Dans notre cas, les composantes des vecteurs d'entrées sont les échantillons des signaux ultrasonores. Le réseau fournit dans ce cas une seule information : la valeur estimée du volume d air. Le réseau utilisé comporte 168 neurones dans la couche d'entrée, correspondant aux 168 composantes des vecteurs d'entrée. La couche de sortie contient 1 neurone qui doit prendre la valeur estimée par le RNA du volume d air. 140

La figure A2.5 (a) présente les résultats obtenus en phase de généralisation après apprentissage par le RNA de 28 prototypes de la base de données, soit un vecteur sur deux. Les deux courbes correspondant au volume d air attendu (croix) et au volume d air estimé par le RNA (ligne) sont pratiquement confondues. On obtient donc, avec cette approche, une bonne estimation du volume d air compris entre les deux capteurs même pour des valeurs non apprises par le RNA. Nous avons également procédé à la même expérimentation avec un nombre de prototypes appris par le RNA plus faible, soit 9 vecteurs au lieu de 28. Les résultats obtenus sont présentés figure A2.5 (b). Les valeurs d estimation fournies par le RNA restent satisfaisantes, malgré le peu de prototypes appris. (a) (b) Figure A2.5 - Estimation par le réseau RBF du volume d air en phase de généralisation (a) pour une base d'apprentissage comprenant 28 vecteurs (b) pour une base d'apprentissage comprenant 9 vecteurs 141

Nous avons ensuite fait l'expérimentation suivante : nous avons supprimé les deux extrêmes de la base d'apprentissage et nous avons alors obtenus les résultats présentés Figure A2.6. Les résultats obtenus sont nettement insuffisants. On remarque que les volumes non compris dans l'intervalle appris ne sont pas estimés correctement. Il sera donc nécessaire de connaître l'intervalle dans lequel se situera l'ensemble des volumes à estimer. Figure A2.6 - Estimation par le réseau RBF du volume d air en phase de généralisation (Extrêmes non appris) Puis, nous nous sommes intéressés à l'estimation du volume des bulles d'air de notre première expérimentation. Rappelons toutefois que nous n'avons qu'une connaissance qualitative des "bulles", car il nous est impossible de mesurer avec précision le diamètre, et donc, le volume, des bulles générées par la pompe à air. Cependant, compte tenu du mode opératoire pour l'acquisition des deux bases de données, on peut affirmer que le volume des bulles sera compris entre 0 et 14,66cm 3. Nous avons alors repris le réseau RBF présenté au début de cette partie (réseau RBF comprenant 168 neurones d'entrée et 1 neurone de sortie), entraîné avec 28 prototypes de la seconde base de données. Les résultats alors obtenus sont présentés figure A2.7. On peut remarquer que l'estimation fournie par le réseau RBF est dans l'ensemble correcte, sauf pour certains signaux de la classe 1 (Eau seule). En effet, pour les 142

signaux de cette classe, le volume d'air compris entre les deux capteurs est nul. Or, pour 5 signaux de cette classe, le réseau estime un volume d'air compris entre 4 et 6 cm 3. Cette mauvaise estimation peut venir du fait que l'acquisition des signaux de ces deux bases d'informations n'a pas été faite le même jour et que, par conséquent, les conditions, notamment de température, ne sont pas identiques. Nous avons donc ajouté à la base d'apprentissage précédente un signal de la classe 1, puisque, dans ce cas, nous connaissons le volume d'air correspondant à cette mesure. Les résultats obtenus sont présentés figure A2.8. Figure A2.7 - Estimation du volume d'air pour les signaux de la première base de données L'estimation est alors beaucoup plus satisfaisante. On peut ainsi estimer que : Le volume d'air compris entre les capteurs dans le cas de la classe 3 (fort débit d'air de la pompe) est supérieur à 2 cm 3. Le volume d'air compris entre les capteurs dans le cas de la classe 2 (faible débit d'air de la pompe) est inférieur à 2 cm 3. Même si nous n'avons qu'une connaissance quantitative du volume des bulles, et même si le protocole expérimental d'acquisition de nos bases de données est assez rudimentaire et reste assez éloigné du problème réel, les résultats montrent cependant la faisabilité d'un outil d'estimation du taux de vide à l'aide de réseaux de neurones. 143

Figure A2.8 - Estimation du volume d'air (base d'apprentissage modifiée) Compte tenu de ces résultats, l'utilisation d'autres capteurs pour des mesures en dynamique et la mise en œ uvre de notre structure neuronale hybride dans cette configuration plus complexe sont, à ce jour, à l'étude. 144

On peut décomposer l'appareil auditif en trois parties : l'oreille externe, moyenne et interne. La figure A3.1 est une vue d'ensemble du système auditif à laquelle on pourra se reporter tout au long de cette partie. Figure A3. 1 - Anatomie simplifiée d'une oreille ( Informatique Graphics Corp. 1992) On appelle oreille externe, l'ensemble constitué du pavillon et du conduit auditif externe. Le conduit auditif externe est un conduit musculo-membraneux dans ses deux tiers externe et osseux dans son tiers interne. Son rôle est de protéger le tympan des agressions mécaniques et de modifier le champ sonore en augmentant la directivité des sons, en 146

association avec le rôle diffracteur de la tête. L'oreille externe est responsable d'un gain auditif substantiel sur les hautes fréquences. L'oreille moyenne comprend le tympan et la chaîne ossiculaire ou osselets (marteau, enclume, étrier) logés dans un espace osseux du rocher appelé caisse du tympan. C'est un espace rempli d'air qui communique avec le pharynx par l'intermédiaire de la trompe d'eustache, un conduit musculo-membraneux. Le rôle de ce conduit est de maintenir l'équipression de part et d'autre du tympan grâce à son ouverture régulière au cours des mouvements de bâillement ou de déglutition. Il permet ainsi la vibration optimale de la chaîne tympano-ossiculaire. La membrane tympanique est une structure élastique, fibrillaire dans laquelle est inclus le marteau par sa longue apophyse, encore appelée manche du marteau. La tête du marteau est articulée avec l'enclume. Il est suspendu dans l'oreille moyenne par un puissant ligament qui s'insère sur sa courte apophyse, sa longue apophyse est, elle, en relation avec l'étrier. L'étrier, quant à lui, est constitué de deux branches, et d'une partie plate ou platine qui repose dans la fenêtre ovale, par laquelle il est en contact avec l'oreille interne. Le développement fonctionnel de l'oreille moyenne, qui a commencé chez les amphibiens, a considérablement amélioré la transmission sonore en agissant comme un adaptateur d'impédance. Cet effet est accompli principalement à travers la grande différence de surface entre le tympan (65 mm²) et la platine de l'étrier (3,2 mm²) et, à moindre degré, à travers l'action de levier de la chaîne ossiculaire. Les osselets sont maintenus en place par un système complexe de ligaments et de muscles. Parmi ces derniers, les plus importants sont le muscle du marteau et le muscle de l'étrier ou muscle stapédien dont le rôle est de tendre la chaîne ossiculaire. Il est notamment mis en jeu par voir réflexe, lors de fortes stimulations auditives. C'est un réflexe bilatéral, sous contrôle du nerf facial. Un de ses rôles serait de protéger l'oreille interne des sons de forte intensité en limitant la pénétration de la chaîne des osselets dans l'oreille interne. L'onde sonore atteint le conduit auditif externe et met le tympan en vibration. L'énergie sonore est transférée à la chaîne ossiculaire dont les déplacements sont de l'ordre de quelques angströms, puis au liquide de l'oreille interne par l'intermédiaire de la platine de l'étrier. 147

L'oreille interne est constituée d'une partie responsable de l'audition, la cochlée et d'une partie responsable de l'équilibre, le vestibule. La cochlée, plus familièrement appelée limaçon en raison de sa forme de tube enroulé sur deux trous de demi de spire, est entouré d'une capsule osseuse et remplie de liquide. Ce tube est cloisonné par deux membranes constituant trois rampes, qu'on distingue bien sur une coupe transversale : les rampes vestibulaires, tympaniques et surtout cochléaire qui nous intéresse particulièrement, car c'est là que se situe l'organe sensoriel de l'audition : l'organe de Corti. L'organe de Corti est constitué d'une architecture complexe de cellules sensorielles et de cellules de soutien. On trouve deux types de cellules sensorielles : les cellules ciliées internes (CCI), disposées sur une seule rangée, et les cellules ciliées externes (CCE), disposées, elles, sur trois rangs. Ces cellules ciliées ont la particularité de présenter à leur extrémité apicale des expansions cytoplasmiques en doigts de gants appelées stéréocils. Il existe plusieurs rangées de stéréocils par cellule, les plus courts étant disposés à l'intérieur de la cochlée, les plus longs, à l'extérieur. Ces stéréocils sont rangés en ligne dans les CCI et le long d'un W dans les CCE. Les CCE ont la propriété de se contracter en réponse à une stimulation sonore. Elles ont avant tout une activité musculaire, les CCI étant, quant à elles, les véritables cellules sensorielles qui transmettent l'information sonore au nerf auditif. Lorsque l'onde sonore est transmise à l'oreille interne, elle fait vibrer la membrane basilaire, sur laquelle repose l'organe de Corti. En se contractant, les CCE permettent une amplification très localisée de la vibration de la membrane basilaire, ce qui permet de ne stimuler qu'un nombre limité de CCI, améliorant ainsi la sélection fréquentielle. Quand il y a destruction de CCE, comme dans le cas d'un traumatisme sonore, il faut de fortes intensités sonores pour stimuler directement les CCI. Alors, de nombreuses CCI sont stimulées, entraînant une perte de sélectivité fréquentielle. Les CCI ont un rôle de transduction en transformant la stimulation vibratoire en influx nerveux destiné aux dendrites des axones du nerf auditif qui font synapse au niveau du pôle inférieur de la cellule. Il s'agit d'une innervation afférente. 148

Il existe, au niveau de la cochlée, une répartition fréquentielle tonotopique, les aigus étant codés à la base et les graves à l'apex, qui a fait comparer la cochlée à un clavier de piano. On parle du clavier cochléaire. L'ensemble est 30 000 axones innervant l'organe de Corti constitue le nerf auditif. Il chemine dans le conduit auditif interne et rejoint le tronc cérébral. Il existe, au niveau du nerf auditif, une organisation tonotopique, chaque fibre répondant de manière préférentielle à une fréquence particulière, dite fréquence caractéristique. Au niveau des fibres auditives, on observe une activité spontanée en dehors de toute stimulation auditive. Pour une fibre donnée, le niveau d'activité est assez stable, en revanche, il varie beaucoup d'une fibre à l'autre. Les neurones auditifs primaires répondent tous de manière univoque à la stimulation sonore, en augmentant leur activité. Il existe une brusque augmentation des décharges au début du stimulus, suivie d'une diminution de l'activité qui se stabilise en plateau durant la deuxième partie de la stimulation. Le premier relais des neurones du nerf auditif se situe au niveau des noyaux cochléaires du bulbe qui contiennent les neurones auditifs secondaires. Il existe une grande variété de types cellulaires dans les noyaux cochléaires, corrélée avec une grande variété de types de réponses qui contraste avec l'activité univoque des neurones primaires. Comme au niveau du nerf auditif, on observe une organisation tonotopique au niveau des noyaux cochléaires. Puis, les relais des voies auditives se trouvent au niveau de la protubérance. Il s'agit du complexe olivaire supérieur. Au sein de ces noyaux, les différents neurones n'ont pas tous les mêmes caractéristiques physiologiques. Il s'agit du niveau le plus bas du système auditif. Le relais suivant est le colliculus inférieur. Quand le signal atteint ce relais, il a déjà subi plusieurs modifications, non seulement dues aux transformations synaptiques survenues entre la cochlée et le colliculus inférieur, mais aussi à la convergence des fibres provenant des deux oreilles au niveau d'un même neurone à des niveaux inférieurs. La mise en jeu des excitations et des inhibitions devient de plus en plus complexe. Le corps grenouillé médian est le dernier relais sous cortical. Il est composé de deux parties : une partie principale et un noyau ventral. Les fibres en provenance du colliculus 149

inférieur se terminent essentiellement dans la partie principale. Enfin, les ondes auditives se projettent sur le cortex auditif. 150

[ALPS 94] [ALPS 95] [AMAR 96] [AMAR 02] [ANDE 95] [BARR 03] [BAZO 94] [BENG 97a] [BENG 97b] [BONN 87] [BROO 88] D.Alpsan, Auditory Evoked Potential Classification by Unsupervised Art 2-A and Supervised Fuzzy Artmap Networks, IEEE International Conference on Neural Networks (ICNN), Orlando, July, 1994. Alpsan, D., Towsey, M., Özdamar, Ö., Tsoi, A., Ghista, D.N., "Efficacy of modified back-propagation and optimization methods on a real-world medical problem", Neural Networks, 8:945:962, 1995. V Amarger., A. Bengharbi, K. Madani, "A New Approach to fault diagnosis of Analog Circuit using Neural Networks Based Techniques", IEEE European Test Workshop 96 Montpellier, 12-14 Juin, 1996. V. Amarger, A-S Dujardin, K. Madani, "Vers un Capteur Ultrasonore Intelligent Pour la Surveillance de Processus Industriels", 6 ème Congrès Français d Acoustique, Lille, France, 8-11 avril 2002 J.A. Andersen, "An Introduction to Neural Network", MIT Press, Cambridge, 1995 M. Barret, A-S. Dujardin, V. Amarger, K. Madani, J-F. Durastanti, " "Mechanical faults recognition using wavelet transform and artificial neural network techniques", CISIM'03, 2003. M. A. Bazoon, D.Stacey, C.Cui, A Hierarchical Artificial Neural Network System for the Classification of Cervical Cells, IEEE International Conference on Neural Networks, Orlando, July, 1994. A. Bengharbi, "Contribution au test et diagnostic des circuits analogiques par des approches basées sur des techniques neuronales", PhD thesis report, University of Creteil - Paris XII, 1997. A. Bengharbi, V. Amarger, K. Madani, Multi-Fault Diagnosis of Analog non Linear Circuits by Smart Classification Technique, IEEE European Test Workshop 97, Turin, Mai, 1997. J.C. Bonnet, L.L. Tavlarides, "Ultrasonic technique for dispersed-phase holdup measurements", Ind. Eng. Chem. Res. Vol. 26, N 4,1987, pp 811-815. D.S. Broomhead, D. Lowe, "Multivariable Functionnal Interpolation and Adaptative Networks", Complex Systems, Vol. 2, pp 321-355, 1988. 118

[CAJA 52] [CHAN 02] [CHEB 97] [CHEN 99] [COMB 02] [DON 97] [DUBU 90] [DUJA 99a] [DUJA 99b] [DUJA 99c] R. Cajal, "Histologie du système nerveux de l homme et des vertébrés", Vol. 1 et 2, traduit de l espagnol par L. Azoulay, Madrid 1952 X. Chang, V. Cocquempot, C. Christophe, "Modélisation de la Machine Asynchroneen Présence de Pannes Stator", Conférence Internationale Francophone d'automatique, pp 459-464, Nantes, 8-10 juillet 2002. A. Chebira, K. Madani, G. Mercier, "Multi-Neural Networks Hardware and Software Architecture : Application of Divide to Simplify Paradigm DTS", IWANN'97, Lanzarote, 1997. K. Chen, L. Xu, H. Chi, "Improved Learning Algorithms for mixture of experts in multiclass classification", Neural Networks 12, pp1229-1252, 1999. C. Combastel, S. Gentil, J-P. Rognon, "Génération de Résidus Adaptative pour le Diagnostic de la Machine Asynchrone", Conférence Internationale Francophone d'automatique, pp 453-458, Nantes, 8-10 juillet 2002. M. Don, A. Masuda, R. Nelson, D. Brackmann, "Sucessful detection of small acoustic tunour using the stacked derived-banded auditory brainstem response auditory", The American Journal of Otology, 18:608-621, 1997. Dubuisson, "Diagnostic et Reconnaissance des Formes", Hermès, Traité des Nouvelles Technologies, Série Diagnostic et Maintenance, 1990 A-S Dujardin, V. Amarger, K. Madani, O. Adam, J-F. Motsch. "Multi- Neural Network approach for Classification of Brainstem Evoked Response Auditory". Lecture Notes in Computer Science - Biological and Artificial Computation : From Neuroscience to Technology, Edité par : Jose Mira, Roberto M. Diaz et Joan Cabestany - Springer Verlag Berlin Heidelberg 1999. A-S Dujardin-Bellanger, V. Amarger, K. Madani, O. Adam, J-F. Motsch, "Une approche Multi-Neuronale pour la classification des Potentiels Evoqués Auditifs". CNRIUT'99, Modélisation et Simulation, ouvrage Ed. par L'Harmattan, 1999. A-S Dujardin, V Amarger, K Madani, "A Multi-Neural Networks Approach for Biomedical Applications : Classification of Brainstem Auditory Evoked Potentials", International Joint Conference on Neural networks (IJCNN'99 Proceedings), Washington DC, USA, July 10-16, 1999. 119

[DUJA 01a] [DUJA 01b] [DURS 75] [GROS 92] [HEBB 49] [JODO 94] [JORD 95] [KOHO 88] [KOHO 89] [LEMO 98] [LEUT 98] [MATL] [MOOD 89] A-S Dujardin, V. Amarger, K. Madani, "Approches Neuronales pour Diagnostic Industriel : Application à la Classification de Signaux Ultrasonores", CNRIUT'01, Roanne, ouvrage Ed. par les Publications de l'université de Saint-Étienne, 2001 A-S Dujardin, "Pertinence d'une approche hybride multi-neuronale dans la résolution de problèmes liés au diagnostic industriel ou médical", Valgo n 01-02, octobre 2001, ISSN 1625-9661. (http://www.supelecrennes.fr/acth/valgo/valgo_numero-01-02.html) F. Durst, M. Zare, "Laser Doppler measurements in Two-Phase Flows", Proc LDA Symp., 1975, Copenhagen, pp. 403-429. M. Grossman, "Détection automatique d évolutions vibratoires de machines tournantes", Progrès récents des méthodes de surveillance acoustiques et vibratoires, Senlis, France, Octobre 1992 S. Hebb, "The Organization of Behaviour", Wiley and Sons, New York, USA, 1949 J.F. Jodouin, "Les réseaux neuromimétiques : Modèles et Applications", Editions Hermès, Paris, 1994. M. I. Jordan, L. Xu, "Convergence Result for the EM Approach to Mixtures of Experts Architectures", Neural Networks, Vol.8, n 9, pp.1409-1431, 1995. T. Kohonen, "Learning Vector Quantization", Neural Networks, vol.1, suppl. 1, p. 303, 1988. T. Kohonen, "Self Organising and Associative Memoy", 3 rd ed., Springer- Verlag, Germany, 1989. H. Lemonnier, Ch. Boyer, "Phase fraction determination in three-phase dispersed flows by ultrasonic methods", Third International Conference on Multiphase Flow, ICMF 98, Lyon France, 8-12 Juin, 1998. S. Leuthner, A. H. Manu, H. Auracher, "A high frequency impedance probe for wave structure identification of falling films", Third International Conference on Multiphase Flow, ICMF 98, Lyon France, 8-12 Juin, 1998. Neural Networks ToolBox, http://www.mathworks.com J. Moody, C.J. Darken, "Fast Learning in networks of Locally Tuned Processing Units", Neural Computation, Vol.1, pp. 281-294, 1989. 120

[MOTS 87] [MUST 92] [NIRA 88] [POWE 85] [RUME 86] [SCHW 02] [SHOR 76] [SRID 99] [THOM 99] [VENK 89] [VUCK 02] [YANG 03] J.-F. Motsch, "La dynamique Temporelle du Tronc Cérébral : Recueil, extraction et analyse optimale des Potentiels Evoqués Auditifs du Tronc Cérébral", Thèse d'etat de doctorat, Université de Créteil-Paris XII, 1987. M. T. Mustawi et al., "On the taining of Radial Basis Functions Classifiers", Neural Networks, Vol. 5, pp.595-603, 1992. M. Niranjan, F. Fallside, "Neural Networks and Radial Basis Function in classifying-static speech pattern", Report CUED/FINFENG/TR22, Cambridge University, England, 1988. M. J. D. Powell, "Radial Basis Function for Multi-Variable Interpolation", IMA Conférence, Shrivenham, England, 1985. D.E. Rumelhart, G.E. Hinton, R.J. Williams, "Parallel Distributed Processing", MIT Press, 1986. F.Scwenker, C. Dietrich, H.A. Kestler, K. Riede, G. Palm, "Radial Basis Function Neural Networks and Temporal Fusion for the Classification of Bioacoustic Time Series", Neurocomputing, vol 51, pp 265-275, 2002 E. Shortliffe, "Computer-based medical consulation : MYCIN", Elsevier, New-York, USA, 1976 D.V. Sridhar, E.B. Bartlett, R.C. Seagrave, "An Information Theoretic Approach for Combining Neural Network Process Model", Neural Networks 12, pp 915-926, 1999. W.T. Thomson, "A Review of On-line Condition Monitoring Techniques for Three-Phase squirrel-cage Inductor Motors Past, Present and Future", IEEE SDEMPED'99, Gijon, Spain, pp3-18, 1999. V. Venkatasubramanian, K. Chan, "A neural Network Methodology for Process Fault Diagnosis", American Institute of Chemical Engineers Journal, Vol. 35, n 12, pp1993-2002, 1989. A. Vuckovic, V. Radivojevic, A. C. N. Chen and D. Popovic, "Automatic recognition of alertness and drowsiness from EEG by an artificial neural network", Medical Engineering & Physics, Volume 24, Issue 5, June 2002, Pages 349-360. D.M. Yang, A.F. Stronach, P. MacConnell, "The Application of Advances Signal Processing Techniques to Induction Motor Bearing Condition Diagnosis", Meccanica 38, pp297-308, Kluwer Academic Puvlishers. 121

[ZWIN 91] [ZWIN 92] [ZWIN 95] G. Zwingelstein, M.H. Masson, B. Dubuisson, M. Pavard, J. Mazaleyrat, "The applications of neural netaworks for the predicitve maintenace of nuclear plants", Proceedings of the 3 rd Symposium on Expert System Application te Power Systems, Tokyo, April 1992. G. Zwingelstein, "Quelles perspectives industrielles pour les réseaux de neurones dans les centrales nucléaires", Séminaire Institute for International Research, Paris, 1992 G. Zwingelstein, "Diagnostic des Défaillances", Hermès, Traité des Nouvelles Technologies, Série Diagnostic et Maintenance, 1995. 122

Le problème du diagnostic se rencontre dans de nombreux domaines, notamment médical et industriel, et l homme y joue un rôle indispensable. La difficulté majeure liée à ce problème repose sur la similitude des signatures qui permettent de faire un diagnostic. De plus, on dispose souvent d une connaissance empirique du système, et donc, d un modèle incomplet, nécessitant le recours à un expert. Nos efforts se sont concentrés sur des techniques à base de réseaux de neurones artificiels (RNA) pour l'aide au diagnostic. En effet, en ce qui concerne les tâches de reconnaissance, de classification et de décision, les techniques proposées représentent un certain nombre d'avantages par rapport aux approches conventionnelles grâce à leur capacité d'apprentissage et de généralisation. Constatant de plus que les techniques neuronales simples ne permettent pas d obtenir de bons résultats, nous proposons une structure neuronale hybride. Deux volets ont alors été considérés : l'un lié au domaine biomédical et l'autre, concernant le domaine industriel. : Aide au diagnostic, Réseaux de neurones artificiels, Catégorisation de signatures, Technique neuronale hybride. The problem of diagnosis occurs in many fields, especially medical and industrial, where operator has a key role. The major difficulty bound to this problem lies on the resemblance between the signatures which allow to make a diagnosis. Furthermore, we often have an empirical knowledge of the system, and thus, an incomplete model, requiring the appeal to an expert. Our efforts were focused on techniques based on neural techniques for computer aided diagnosis. For the tasks of pattern recognition, classification and decision, the proposed techniques indeed presents a number of advantages over classical models because of their abilities of learning and generalization. Moreover, noticing that simple neural techniques do not allow obtaining good results, we propose a neural hybrid structure. Two applications have been considered: one linked to the biomedical field and the other concerning the industrial domain. Computer aided diagnosis, Artificial neural networks, Signatures classification, Neural hybrid structure.