RECONNAISSANCE DES FORMES : CLASSIFICATION ET REGROUPEMENT IFT-64321 A S y l l a b u s Jean-Marie Beaulieu Département d'informatique Téléphone: 656-2131 poste 2564 Courriel: jean-marie.beaulieu@ift.ulaval.ca Hiver 2002
Page 2 A. Cours Titre : RECONNAISSANCE DES FORMES: CLASSIFICATION ET REGROUPEMENT Sigle (Université Laval) : IFT-64321 Nombre de crédits : 3 Session : hiver 2002 Salle : 2512 pavillon Adrien-Pouliot Horaire : mercredi de 8h30 à 11h20 B. Professeur Nom et prénom : Bureau : Beaulieu, Jean-Marie 3952 pavillon Adrien-Pouliot Téléphone: 656-2131 poste 2564 Courriel: jean-marie.beaulieu@ift.ulaval.ca Disponibilités : lundi, mardi et jeudi de 14h30 à 16h30. (je suis à mon bureau surtout l'après-midi) Page web: Il y a une page web pour le cours à: http://www.ift.ulaval.ca/~beaulieu/ift64321 Il y aura probablement utilisation de WebCT http://www.webct.ulaval.ca/ C. Description et objectifs du cours Description : Principes théoriques de la reconnaissance des formes. Classification bayésienne. Probabilité conditionnelle. Classes gaussiennes multidimensionnelles. Classification supervisée. Histogramme. Apprentissage de fonction discriminante linéaire: perceptron. Regroupement et classification non supervisée. Algorithme itératif: migration de la moyenne et isodata. Groupement hiérarchique par agglomération ou par division. Sélection des traits caractéristiques. Exemples d'applications. PR : Aucun. Objectifs : Etudier les principes théoriques de la reconnaissance des formes. Comprendre les méthodes et algorithmes utilisés dans la mise en application de ces principes. Comprendre les avantages et les limites de ces techniques. Savoir quand et comment ces principes et techniques peuvent être utilisés dans la pratique.
Page 3 D. Evaluation des apprentissages Évaluation: exercices et travaux 40 % examen partiel 30 % examen final 30 % La note de passage est fixée à 60%. Les dates d'examens seront déterminées en classe. Une seule feuille de notes sera autorisée pour le 1 er examen et à déterminer pour l'examen final. On pourra discuter lors du premier cours d'autres modalités d'évaluation. E. Contenu L'analyse des données a grandement profité de l'arrivée de l'ordinateur. Copiant au besoin l'intelligence humaine, la "reconnaissance des formes" émergea comme une discipline autonome et très prometteuse. Elle vise la reconnaissance, la classification et le regroupement de données expérimentales, d'observations, de formes ou de profils présents dans les données. Les domaines d'application sont nombreux: télédétection, robotique et automatisation, médicale (e.g. rayon X, électrocardiogramme), reconnaissance de la voix et de texte, contrôle de la qualité... La classification est une reconnaissance supervisée, où les caractéristiques de chacune des classes sont connues. Une approche probabiliste sera utilisée pour définir les classes. Un processus de décision statistique est alors utilisé pour choisir à quelle classe une donnée observée doit être assignée. La performance de la classification est définie par son pouvoir de discrimination et sa probabilité d'erreur. La décision peut être basée sur une fonction discriminante. Un processus d'apprentissage permet d'accumuler les expériences passées pour améliorer la décision. Le regroupement est une reconnaissance non-supervisée, où un processus automatique sépare les données observées en groupes distincts (avec aucune connaissance préalable des classes présentes). Chaque groupe doit contenir seulement des éléments similaires. Des mesures, fonctions de la distance entre points (données) ou groupes de points, doivent être définies pour traduire la similarité qui existe entre ces points. Des techniques itératives permettent la modification progressive des groupes vers la solution optimum (ex.: le perceptron, la migration de la moyenne, isodata). Les groupes peuvent également être formés par le chaînage des points (données) similaires. Des mesures de la similarité entre groupes de données permettent la formation de hiérarchies de groupes.
Page 4 INTRODUCTION: perception et classification. CLASSIFICATION: critère de Bayes probabilités conjointes et conditionnelles classes gaussiennes multidimensionnelles CLASSIFICATION SUPERVISEE: estimation des paramètres d'une classe histogramme espace des représentations et fonction discriminante apprentissage: fonction discriminante linéaire algorithme du perceptron REGROUPEMENT ou CLASSIFICATION NON-SUPERVISEE: notion de mesure et de distance entre points ou groupes définition d'un groupe bien formé et d'une bonne partition algorithme itératif: migration de la moyenne isodata groupement hiérarchique par agglomération ou par division mesure de similarité entre groupes regroupement par chaînage: Minimum Spanning Tree. SELECTION DES TRAITS CARACTERISTIQUES: normalisation et réduction de la corrélation transformation linéaire et valeur propre analyse discriminante de Fisher Exemples d'applications: Vision par ordinateur, Télédétection, Médicale, Reconnaissance de la voix, etc...
Page 5 F. Bibliographie Notes de cours obligatoires Des NOTES de cours seront obligatoires et disponibles selon des modalités à discuter en classe. Il n'y a pas de MANUEL de cours obligatoire. RÉFÉRENCES 1) R.O. Duda, P.E.Hart & D.G. Stork, 2001, PATTERN CLASSIFICATION, John Wiley & Sons, Nouvelle edition de Duda & Hart. 2) Sing-Tze Bow, 1984, PATTERN RECOGNITION, Marcel Dekker, Inc, New York. Texte qui couvre tous les aspects de la reconnaissance de formes, bon niveau, un manque au niveau de l'organisation et des explications. 3) Celeux, Diday, Govaert, Lechevallier et Ralambondrainy, 1989, CLASSIFICATION AUTOMATIQUE DES DONNEES, Dunod, Paris, Mathématique, bon manuel, nuées dynamiques, classification optimale, analyse factorielle et discriminante. 4) R.O. Duda & P.E. Hart, 1973, PATTERN CLASSIFICATION AND SCENE ANALYSIS, John Wiley & Sons Très bon manuel, un peu trop mathématique, explique bien la classification bayésienne 5) A. Faure, 1985, PERCEPTION ET RECONNAISSANCE DES FORMES, Editests, Paris. Un peu de confusion dans l'organisation, une partie sur les capteurs. 6) A.D. Gordon, 1981, CLASSIFICATION, Chapman and Hall, Londres, QA 278.65 g662 1981 sciences Bonne couverture du regroupement hiérarchique. 7) M. James, 1985, CLASSIFICATION ALGORITHMS, John Wiley & Sons, New York. QA278.65 j28 1985 Bon texte, contenu simple, de bas niveau, avec exemples de programmes, traite surtout la classification. 8) J.-C. Simon, 1985, LA RECONNAISSANCE DES FORMES PAR ALGORITHMES, Masson, Paris. Présentation formelle, et très mathématique. 9) C.W. Therrien, 1989, DECISION, ESTIMATION AND CLASSIFICATION, John Wiley & Sons, New York. Très bonne présentation de la classification, mathématique. 10) J.T. Tou & R.C. Gonzalez, 1974, PATTERN RECOGNITION PRINCIPLES, Addison-Wesley C. Très bon manuel, bon niveau de présentation (i.e. pas trop mathématique), bon choix de sujets, bon pour le regroupement.
Page 6 11) H.C. Andrews, 1972, INTRODUCTION TO MATHEMATICAL TECHNIQUES IN PATTERN RECOGNITION, John Wiley & Sons, New York. Q327 a566 1972 Bon livre, mathématique, vieux. 12) J.-P. Benzecri, 1980, L'ANALYSE DES DONNEES, tomes 1 & 2, Dunod, Paris. QH83 b479 1980 Une revue de l'analyse des données en taxinomie, et de l'analyse des correspondances. 13) Mike James, 1987, PATTERN RECOGNITION, PSP Professional Books, Oxford. Q327 j28 1987 pour le traitement de l'image, 14) W.S. Meisel, 1972, COMPUTER-ORIENTED APPROACHES TO PATTERN RECOGNITION,Academic Press, New York. Q327 m515 1972 bon livre, mathématique, vieux. 15) Ramakant Nevatia, 1982, MACHINE PERCEPTION, Prentice Hall Inc., Surtout pour l'analyse de l'image. 16) H. Niemann, 1981, PATTERN ANALYSIS, Spring-Verlag, New York. Q327 n671 1981 surtout pour l'analyse de l'image, peu utile pour ce cours. 17) E.A. Patrick, 1972, FUNDAMENTALS OF PATTERN RECOGNITION, Prentice-Hall, Englewood Cliffs, N.J.. Q327 p314 1972 Bon livre, très mathématique, exposé des principaux résultats mathématiques de reconnaissance des formes. 18) J.-G. Postaire, 1987, DE L'IMAGE A LA DECISION, Dunod, Paris. Bas niveau, approche par la courbure de la densité de probabilité, pour l'image, certaines sections utiles. 19) M. Roux, 1985, ALGORITHMES DE CLASSIFICATION, Masson, Paris. QA278.65 r871 1985 Traite surtout le regroupement hiérarchique, limité, avec exemples de programmes. 20) I.L. Thomas, V.M. Benning & N.P. Ching, 1987, CLASSIFICATION OF REMOTELY SENSED IMAGES, Adam Hilger, Bristol. TA1632 t457 1987 classification en télédétection. 21) S. Watanabe, 1985, PATTERN RECOGNITION: HUMAN AND MECHANICAL, John Wiley & Sons, New York. Q327 w314 1985 perception, moins mathématique, beaucoup de chapitres inutiles pour ce cours.