Cartes auto-organisatrices



Documents pareils
Optimisation de la compression fractale D images basée sur les réseaux de neurones

VISUALISATION DES DISTANCES ENTRE LES CLASSES DE LA CARTE DE KOHONEN POUR LE DEVELOPPEMENT D'UN OUTIL D'ANALYSE ET DE REPRESENTATION DES DONNEES

TD : Codage des images

Coup de Projecteur sur les Réseaux de Neurones

Introduction au Data-Mining

Introduction au Data-Mining

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

L utilisation d un réseau de neurones pour optimiser la gestion d un firewall

Chapitre 18 : Transmettre et stocker de l information

Géométrie discrète Chapitre V

Master IMA - UMPC Paris 6 RDMM - Année Fiche de TP

JPEG, PNG, PDF, CMJN, HTML, Préparez-vous à communiquer!

Fonctions de plusieurs variables

Chapitre 13 Numérisation de l information

TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN

Traitement numérique de l'image. Raphaël Isdant

Chapitre 3. Les distributions à deux variables

Comme chaque ligne de cache a 1024 bits. Le nombre de lignes de cache contenu dans chaque ensemble est:

Les algorithmes de fouille de données

TP SIN Traitement d image

L apprentissage automatique

I. Polynômes de Tchebychev

Transmission d informations sur le réseau électrique

Hiver 2013 IMN 259. Introduction à l analyse d images. Par Pierre-Marc Jodoin

LES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES

Structure du format BMP, sa lecture, sa construction et son écriture

Représentation des Nombres

Classification Automatique de messages : une approche hybride

Mesure agnostique de la qualité des images.

Plan d études. Traitement visuel 2D. Techniques d intégration multimédia HU. legault/2d/ 1-2-2

Architecture des ordinateurs

Formats d images. 1 Introduction

Projet Matlab : un logiciel de cryptage

Traitement bas-niveau

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Fête de la science Initiation au traitement des images

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

Algorithme. Table des matières

Première partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015

INFO 2 : Traitement des images

Projet Matlab/Octave : segmentation d'un ballon de couleur dans une image couleur et insertion d'un logo

Chap17 - CORRECTİON DES EXERCİCES

Chapitre 1 Régime transitoire dans les systèmes physiques

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

Baccalauréat ES Amérique du Nord 4 juin 2008

SudoClick Reconnaissance de grilles de sudoku pour téléphones portables

nom : Collège Ste Clotilde

Les algorithmes de base du graphisme

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Les images et les animations sur le web. Guérineau Chloé BTS2 Année 2001/2012

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

Décompresser, créer une archive au format «ZIP»

Quantification Scalaire et Prédictive

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008

Cours de Mécanique du point matériel

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

MAP 553 Apprentissage statistique

LES CARTES À POINTS : POUR UNE MEILLEURE PERCEPTION

Etudier l influence de différents paramètres sur un phénomène physique Communiquer et argumenter en utilisant un vocabulaire scientifique adapté

Laboratoire 4 Développement d un système intelligent

Architectures informatiques dans les nuages

Parallélisme et Répartition

1.Introduction - Modèle en couches - OSI TCP/IP

Cours de numérisation sur Epson Perfection

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Leçon N 4 : Statistiques à deux variables

Ecrire pour le Web: ce que nous apprend la modélisation de la reconnaissance orthographique des mots

LIDAR LAUSANNE Nouvelles données altimétriques sur l agglomération lausannoise par technologie laser aéroporté et ses produits dérivés

Programmation linéaire

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Apprentissage statistique dans les graphes et les réseaux sociaux

La visio-conférence holographique : Pourquoi? Comment?

Exercices Corrigés Premières notions sur les espaces vectoriels

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Une approche de co-classification automatique à base des cartes topologiques

Chapitre 22 Optimisation pour diffusion à l'écran, pour le web

Vers une Optimisation de l Algorithme AntTreeStoch

Sillage Météo. Notion de sillage

Logiciel de Base. I. Représentation des nombres

Le poids et la taille des fichiers

Communications immersives : Enjeux et perspectives

Le génie logiciel. maintenance de logiciels.

Technologies en rafale Un atelier de type GGT à la RN

INF6304 Interfaces Intelligentes

Initiation à linfographie

a et b étant deux nombres relatifs donnés, une fonction affine est une fonction qui a un nombre x associe le nombre ax + b

Correction de l examen de la première session

FORMATS DE FICHIERS. Quels sont les différents types d informations numériques dans un document multimédia?

Pourquoi l apprentissage?

Rencontres Recherche Industrie IRIT - 26 Septembre Michel Kamel

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR

NOTIONS DE RESEAUX INFORMATIQUES

LES NOUVEAUTES DE COST AND PROFITABILITY MANAGEMENT 8.1

intelligence artificielle et cognitique"

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Transcription:

Cartes auto-organisatrices Nicolas P. Rougier Master 2 - Sciences Cognitives Université de Bordeaux

Quantification vectorielle Soit un ensemble de données dans un espace quelconque Comment regrouper les données qui sont similaires? Combien y a t-il de groupes? Quel sont les meilleurs représentants de chaque groupe? Peut-on reconnaître les groupes proches? Exemple Ensemble de points Mauvaise quantification Bonne quantification

Quantification vectorielle Définition Soit un ensemble de données E de taille et de dimension quelconque. Une quantification vectorielle de E se définit par une fonction f et un ensemble Q E telle que x E, f(x) Q. Exemple On considère des données réelles à une seule dimension (E = R) et on veut les quantifier dans un ensemble Q: Q = N f(x) = int(x) 1.2 1, 3.9 3,... Infinité de représentants Q = { 1, +1} f(x) = sign(x) 1.2 +1, 3.9 1,... Deux représentants Problème général Peut on automatiser la procédure pour des données quelconques? (trouver Q et f)

Quantification vectorielle Algorithmes standards Regroupement dynamique (Y. Linde, A. Buzo & R.M. Gray, 1980) Moindres carrés (S.P. Lloyd, 1982) Growing Neural Gas (Fritzke, 1995) Cartes auto-organisatrices (T. Kohonen, 1982) Utilisations standards Compression de données Classifications de données Catégorisation de données

Le cortex visuel Rétinotopie Les aires visuelles sont organisées (via l apprentissage) de telle façon que deux neurones physiquement proches dans le cortex visuel traitent des entrées physiquement proches dans la rétine. On parle d organisatiuon rétinotopique. Suite à ces observations, Teuvo Kohonen a cherché à rendre compte de l organisation spatiale du cortex.

Principe de fonctionnement Soit une carte de n neurones entièrement connectés (chaque neurone est relié à tous les autres) On ajoute une topologie à la carte (il y a une notion de distance entre chaque neurone) Chaque neurone est relié à l ensemble des entrées (le vecteur de poids est le prototype du neurone) A chaque nouvelle entrée, le neurone ayant le prototype le plus proche est déclaré vainqueur. Les prototypes du vainqueur et de ses voisins sont changés afin de se rapprocher de l entrée présenté.

Architecture Soit une carte de n neurones entièrement connectés. chaque neurone est relié à tous les autres.

Topologie On ajoute une topologie à la carte il y a une notion de distance entre chaque neurone Coordonnées relatives au neurone (0,0) Distances relatives au neurone (0,0) -2,2-1,2 0,2 1,2 2,2 8 5 4 5 8-2,1-1,1 0,1 1,1 2,1 5 2 1 2 5-2,0-1,0 0,0. 1,0 2,0 4 1. 0 1 4-2,-1-1,-1 0,-1 1,-1 2,-1 5 2 1 2 5-2,-2-1,-2 0,-2 1,-2 2,-2 8 5 4 5 8

Entrées Chaque neurone est relié à l ensemble des entrées le vecteur de poids correspondant est le prototype du neurone. x 1. x 0

Algorithme Recherche du vainqueur Soit une donnée x = {x 1, x 2,...x n }, on cherche le neurone i vainqueur tel que la distance entre x et w ivainquer soit minimale. C est à dire: i vainqueur = argmin i (d(x, w i )) Apprentissage A chaque exemple présenté, le vainqueur ainsi que ses voisins les plus proches vont modifier leur vecteur de poids selon la formule: w i (t + 1) = w i (t) + µf(w i (t) x) avec f qui est la fonction de voisinage et µ le pas d apprentissage qui décroit au cours du temps.

Fonction de voisinage 1.0 taux d'apprentissage 0.8 0.6 0.4 0.2 0.0 1.0 0.5 0.0 0.5 1.0 distance

Exemples

Exemples

Difficultés La topologie du réseau peut ne pas correspondre à la topologie des données et cela peut poser des problèmes lors de l apprentissage. La carte peut ne pas se déployer correctement en début d apprentissage et on obtient des neouds Le réseau est figé après apprentissage puisque le pas d apprentissage est nul. Il faut connaître par avance le temps d apprentissage, c est à dire le nombre d exaples que l on présente au réseau.

Références Livres et cours Self-Organizing Maps, Third Edition Teuvo Kohonen, 2001. Some Competitive Learning Methods Bernd Fritzke, 1997. Neural Computation and Self-Organizing Maps - An Introduction Helge Ritter, Thomas Martinetz & Klaus Schulten, 1992. Démos et Vidéos DemoGNG at http://sund.de/netze/applets/gng/full/gng-u_0.html Dynamic Self Organization at http://www.loria.fr/~rougier/research/dsom.html

Exercice 1 Compression d'une image On souhaite réduire le nombre de couleurs d une image à l aide d une carte de Kohonen. Soit une image constituée de 600x800 pixels décrits dans le codage RGB. Le codage RGB propose de coder sur un octet (i.e. 8 bits) chaque composante de couleur (rouge, vert, bleu). 1. Quel est le nombre total de couleurs que l on peut virtuellement coder? 2. On souhaite réduire le nombre de couleurs différentes à 256 couleurs pour diminuer la taille de stockage de l image. Quelle sera la taille de l image finale? 3. Quelle architecture proposez-vous pour réduire automatiquement le nombre de couleurs à l aide d une carte auto-organisatrice de Kohonen? 4. Tester votre architecture

Exercice 2 Nuage de points On souhaite regrouper des données similaires à partir d un jeu de données de dimensions 2. 1. Quelle architecture proposez-vous? 2. Après apprentissage, que représente les poids de chaque neurone? 3. Si les données ne sont pas homogènes, quelle influence cela a t-il sur l oargnisation finale? 4. Tester votre architecture