Analyse en Composantes Principales (ACP)



Documents pareils
Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

1 Complément sur la projection du nuage des individus

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Exercices Corrigés Premières notions sur les espaces vectoriels

Formes quadratiques. 1 Formes quadratiques et formes polaires associées. Imen BHOURI. 1.1 Définitions

Extraction d informations stratégiques par Analyse en Composantes Principales

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Transmission d informations sur le réseau électrique

3 Approximation de solutions d équations

de calibration Master 2: Calibration de modèles: présentation et simulation d

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

Cours 02 : Problème général de la programmation linéaire

CHAPITRE V SYSTEMES DIFFERENTIELS LINEAIRES A COEFFICIENTS CONSTANTS DU PREMIER ORDRE. EQUATIONS DIFFERENTIELLES.

Intérêt du découpage en sous-bandes pour l analyse spectrale

Codage hiérarchique et multirésolution (JPEG 2000) Codage Vidéo. Représentation de la couleur. Codage canal et codes correcteurs d erreur

Notes du cours MTH1101 Calcul I Partie II: fonctions de plusieurs variables

Les Angles. I) Angles complémentaires, angles supplémentaires. 1) Angles complémentaires. 2 Angles supplémentaires. a) Définition.

Fonctions de plusieurs variables

Simulation de variables aléatoires

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Introduction à l étude des Corps Finis

Hiver 2013 IMN 259. Introduction à l analyse d images. Par Pierre-Marc Jodoin

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Chapitre 3. Les distributions à deux variables

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

Programmes des classes préparatoires aux Grandes Ecoles

Détection des points d intérêt et Segmentation des images RGB-D. Présentée par : Bilal Tawbe. Semaine de la recherche de l UQO

Programmation Linéaire - Cours 1

TD1 Signaux, énergie et puissance, signaux aléatoires

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48

Fonctions de plusieurs variables

Optimisation, traitement d image et éclipse de Soleil

I. Polynômes de Tchebychev

Première partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015

CAPTEURS - CHAINES DE MESURES

Corrigé du baccalauréat S Pondichéry 12 avril 2007


Fonctions de deux variables. Mai 2011

La structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren)

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Introduction à l approche bootstrap

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Intégration et probabilités TD1 Espaces mesurés

Revue des algorithmes PCA, LDA et EBGM utilisés en reconnaissance 2D du visage pour la biométrie

Mesures gaussiennes et espaces de Fock

Théorie et codage de l information

Correction du Baccalauréat S Amérique du Nord mai 2007

Notes du cours MTH1101N Calcul I Partie II: fonctions de plusieurs variables

Polynômes à plusieurs variables. Résultant

OM 1 Outils mathématiques : fonction de plusieurs variables

Résolution d équations non linéaires

3. Conditionnement P (B)

Géométrie discrète Chapitre V

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Les algorithmes de base du graphisme

PEUT-ON «VOIR» DANS L ESPACE À N DIMENSIONS?

Développement décimal d un réel

1 Définition. 2 Systèmes matériels et solides. 3 Les actions mécaniques. Le système matériel : Il peut être un ensemble.un sous-ensemble..

Programmation linéaire et Optimisation. Didier Smets

La visio-conférence holographique : Pourquoi? Comment?

PROBABILITES ET STATISTIQUE I&II

TP SIN Traitement d image

BACCALAUREAT GENERAL MATHÉMATIQUES

ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection

Chaînes de Markov au lycée

Résolution de systèmes linéaires par des méthodes directes

Data first, ou comment piloter l analyse par les données

Intégration et probabilités TD1 Espaces mesurés Corrigé

ENSAE - DAKAR BROCHURE D'INFORMATION SUR LE CONCOURS DE RECRUTEMENT D ÉLÈVES INGÉNIEURS STATISTICIENS ÉCONOMISTES (I S E) Option Mathématiques CAPESA

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Gestion obligataire passive

Enjeux mathématiques et Statistiques du Big Data

NOTICE DOUBLE DIPLÔME

PHYSIQUE-CHIMIE. Partie I - Spectrophotomètre à réseau

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008

Chapitre I La fonction transmission

ÉdIteur officiel et fournisseur de ServIceS professionnels du LogIcIeL open Source ScILab

Chapitre 22 : (Cours) Numérisation, transmission, et stockage de l information

Traitement numérique de l'image. Raphaël Isdant

INF6304 Interfaces Intelligentes

Régression linéaire. Nicolas Turenne INRA

L'analyse des données à l usage des non mathématiciens

FONCTION DE DEMANDE : REVENU ET PRIX

sentée e et soutenue publiquement pour le Doctorat de l Universitl

PRISE EN MAIN DU SPECTROPHOTOMETRE UV-VISIBLE SHIMADZU U.V. 240

Exercice : la frontière des portefeuilles optimaux sans actif certain

Synthèse d'images I. Venceslas BIRI IGM Université de Marne La

Exemple 4.4. Continuons l exemple précédent. Maintenant on travaille sur les quaternions et on a alors les décompositions

MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .

Aquitaine Thermographie

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Commande Prédictive. J. P. Corriou. LSGC-ENSIC-CNRS, Nancy. corriou@ensic.inpl-nancy.fr

Transcription:

Analyse en Composantes Principales (ACP) Principal Component Analysis (PCA) Nicolas Stoiber Dynamixyz

Contexte : traitement du signal Problématique: comment, dans ce contexte, représenter des entités, des objets. Objectif: réaliser des opérations de haut-niveau, i.e traiter, comparer, retrouver, classifier ces objets Dans le cadre de ce cours: les signaux sont des images. 2

Contexte : traitement d images Quid de la représentation d entités/d objets : «Paramétrisation» du problème Intensité (luminance) des pixels composant l objet Coefficients RGB des pixels composant l objet 3

Formalisation mathématique Paramétrisation canonique : Intensité (luminance) des pixels composant l objet Vecteur dans un espace vectoriel de dimension MxN M v NM N 4

Formalisation mathématique Formalisation mathématique canonique : Trop de dimensions «Fléau de la dimension» (http://en.wikipedia.org/wiki/curse_of_dimensionality) Occupation mémoire, stockage Temps de calcul Redondance des variables Dilution de l information Paramétrisation pas forcément adaptée à la tâche Ne fait pas ressortir d information pertinente, de haut-niveau 5

Formalisation mathématique Solution -> Transformation Changement d espace de représentation d entités image. Exemples Changement de repère y y Transformations linéaires Transformations non-linéaires T (x) Transformations non-analytiques R. x t y L. x y T (x) y... 6

Transformations Exemple : Transformée de Hough : 7

Transformations Exemple : Transformée de Hough : Information de haut-niveau (angle, rayon) Adaptée au problème (détection de lignes dans une image) 8

Transformations Transformations explicites : La transformation est une procédure/formule définie explicitement, indépendamment des données particulières du problème. Exemple: Transformée de Hough 9

Transformations Transformations explicites : Exemple : Transformée de Fourier y 1 y 2 y k x y 10

Transformations Transformations explicites : Exemple : Transformée de Fourier 11

Transformations Transformations explicites : Exemple : Transformée en ondelettes : Gabor 12

Transformations Transformations explicites : Exemple : Transformée en ondelettes : Haar 13

Transformations Transformations explicites : Exemple non analytique: Histogramme 14

Transformations Chaque transformation fait ressortir certaines caractéristiques du signal Fourier fait ressortir des fréquence spatiale Hough fait ressortir la présence de points alignés C est suffisant pour des entités simples (ex: lignes), pour lesquelles on détermine facilement les caractéristiques importantes. 15

Transformations Quid d objets plus complexes? Cas pratiques: on ne sait pas dire trivialement quelles composantes du signal sont pertinentes? 16

Transformations Quid d objets plus complexes? Cas pratiques: on ne sait pas dire trivialement quelles composantes du signal sont pertinentes On peut par contre en fournir des exemples! 17

Transformations Transformations implicites : Objectif : Calculer une transformation de passage dans un espace de représentation pertinent pour le problème Méthode: Déterminer automatiquement cette transformation à partir d exemples du problème (les «données»). 18

Analyse en composantes principales C est une transformation implicite Elle poursuit les objectifs suivants: Transformation linéaire Suppression des corrélations entre variables Concentration de l information sur un nombre réduit de variables. 19

Analyse en composantes principales Exemple : courbe taille/poids 20

Analyse en composantes principales Exemple : courbe taille/poids Chaque point est un exemple Données réelles souvent très corrélées X 2 (poids) X 1 (taille) 21

Analyse en composantes principales Corrélation importante Redondance d information Dynamique importante sur toutes les variables Non optimal X 2 (poids) X 1 (taille) 22

Analyse en composantes principales Peut-on imaginer une meilleure paramétrisation? Y 1 «Corpulence» X 2 (poids) Y 2 X 1 (taille) 23

Analyse en composantes principales Peut-on imaginer une meilleure paramétrisation? A partir d une représentation initiale [X 1,, X N ], trouver une représentation [Y 1,, Y N ] telles que les variables sont décorrélées. 24

Analyse en composantes principales Matrice de covariance sur un jeu de données X : M X C X.X N On cherche les Y tels que : M Y C Y.Y T T 1,1 2,2 0 0,1 1,1 1,2 2,2 0 2,2 0 0 0 1, N N, N 0 0 N, N 25

Analyse en composantes principales C est une diagonalisation de matrice Existe toujours en vertu du théorème spectral (matrice de covariance est symétrique semi-définie positive, réelle). Les valeurs propres sont positives ou nulles, et les vecteurs propres sont orthonormés. M X C P. M Y C. P T Les variables Y = P.X sont décorrélées. 26

Analyse en composantes principales M Y C P T. M X C. P 0 0 1,1 Les vecteurs propres forment la matrice de passage P Les valeurs propres sont les covariance des nouvelles variables Y i. 0 2,2 0 0 0 0 0 N, N 27

Analyse en composantes principales Compression : On peut ordonner les nouvelles variables Y i selon le valeurs propres (indiquent «l importance» de ces variables en terme de variation). Les dernières variables Y i (faible valeur propre), présentent peu de variation -> On peut les supprimer 28

Analyse en composantes principales Compression : Exemple visuel : Y 1 X 2 Y 2 X 1 29

Analyse en composantes principales Compression : Intérêt : transmission/stockage de K images (avec K=beaucoup) de N pixels chacune -> K.N valeurs à transmettre. Si les images présentent de fortes corrélation, il est interessante de faire une PCA pour trouver un meilleur espace de représentation. En conversant P<<N composantes, le nombre de valeurs à transmettre est P.K + P.N 30

Analyse en composantes principales Compression : Valeurs crédibles: P = 10, N=2500, K=200 Stockage naïf : K.N = 500 000 valeurs Stockage PCA : 27 000, soit 5% de K.N -> taux de compression de 95% 31

Analyse en composantes principales Interprétation géométrique d une PCA tronquée : X 2 Y 2 X 1 Une PCA tronquée identifie le sous-espace linéaire qui minimise l erreur de projection (quadratique). «Projection optimale au sens des moindres carrés» 32