Analyse en composantes principales en météorologie & en mécanique des fluides

Documents pareils
Commun à tous les candidats

Extraction d informations stratégiques par Analyse en Composantes Principales

1 Complément sur la projection du nuage des individus

I. Polynômes de Tchebychev

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

Simulation de variables aléatoires

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

3. Conditionnement P (B)

Programmes des classes préparatoires aux Grandes Ecoles

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Projet de Traitement du Signal Segmentation d images SAR

Une premiere approche des elements nis sur un exemple tres simple

3 Approximation de solutions d équations

Analyse des correspondances avec colonne de référence

Analyse en Composantes Principales

Introduction. Préambule. Le contexte

L'analyse de données. Polycopié de cours ENSIETA - Réf. : Arnaud MARTIN

Quantification Scalaire et Prédictive

Intégration et probabilités TD1 Espaces mesurés Corrigé

Amphi 3: Espaces complets - Applications linéaires continues

TSTI 2D CH X : Exemples de lois à densité 1

= 1 si n = m& où n et m sont souvent des indices entiers, par exemple, n, m = 0, 1, 2, 3, 4... En fait,! n m

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

Cours d analyse numérique SMI-S4

Correction du Baccalauréat S Amérique du Nord mai 2007

L'analyse des données à l usage des non mathématiciens

MODELES DE DUREE DE VIE

Oscillations libres des systèmes à deux degrés de liberté

Processus aléatoires avec application en finance

Analyse fonctionnelle Théorie des représentations du groupe quantique compact libre O(n) Teodor Banica Résumé - On trouve, pour chaque n 2, la classe

14. Introduction aux files d attente

Cours d Analyse. Fonctions de plusieurs variables

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

NOTATIONS PRÉLIMINAIRES

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

ETUDE DES PERFORMANCES D UN SYSTEME EOLIEN. APPLICATION POUR DES SITES ALGERIENS

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Correction de l examen de la première session

Formes quadratiques. 1 Formes quadratiques et formes polaires associées. Imen BHOURI. 1.1 Définitions

Erreur statique. Chapitre Définition

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

FIMA, 7 juillet 2005

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

Introduction à l analyse numérique : exemple du cloud computing

Loi binomiale Lois normales

Lagrange, où λ 1 est pour la contrainte sur µ p ).

Variables Aléatoires. Chapitre 2

Une introduction aux codes correcteurs quantiques

Exercice : la frontière des portefeuilles optimaux sans actif certain

possibilités et limites des logiciels existants

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Circuits RL et RC. Chapitre Inductance

CHAPITRE V SYSTEMES DIFFERENTIELS LINEAIRES A COEFFICIENTS CONSTANTS DU PREMIER ORDRE. EQUATIONS DIFFERENTIELLES.

Intérêt du découpage en sous-bandes pour l analyse spectrale

Fonctions de plusieurs variables : dérivés partielles, diérentielle. Fonctions composées. Fonctions de classe C 1. Exemples

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Expérience 3 Formats de signalisation binaire

Renforcement des trois compétences : compréhension orale, expression orale et expression écrite à partir de documents et vidéos.

L exclusion mutuelle distribuée

Suites numériques 4. 1 Autres recettes pour calculer les limites

ALGORITHME GENETIQUE ET MODELE DE SIMULATION POUR L'ORDONNANCEMENT D'UN ATELIER DISCONTINU DE CHIMIE

Soutenance de stage Laboratoire des Signaux et Systèmes

Mesures de Risque Multipériodes Cohérentes Appliquées au Compte à Terme

Processus de comptage, Poisson mélange, fonction de perte exponentielle, système bonus-malus.

Master Modélisation Aléatoire Paris VII, Cours Méthodes de Monte Carlo en nance et C++, TP n 2.

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Examen optimisation Centrale Marseille (2008) et SupGalilee (2008)

3. Caractéristiques et fonctions d une v.a.

Couples de variables aléatoires discrètes

PROBABILITES ET STATISTIQUE I&II

Avant-après, amont-aval : les couples de tableaux totalement appariés

Systèmes Multivariables - Partie II

Corrigé du baccalauréat S Asie 21 juin 2010

Merise. Introduction

Phénomènes dangereux et modélisation des effets

aux différences est appelé équation aux différences d ordre n en forme normale.

Mesures gaussiennes et espaces de Fock

Notes du cours MTH1101 Calcul I Partie II: fonctions de plusieurs variables

Les mesures à l'inclinomètre

Modélisation et simulation

Capes Première épreuve

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Chapitre 1 Régime transitoire dans les systèmes physiques

Journées Télécom-UPS «Le numérique pour tous» David A. Madore. 29 mai 2015

ÉVALUATION FORMATIVE. On considère le circuit électrique RC représenté ci-dessous où R et C sont des constantes strictement positives.

Deux disques dans un carré

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

6. Hachage. Accès aux données d'une table avec un temps constant Utilisation d'une fonction pour le calcul d'adresses

RAPPORT COMPLET D'ETUDE DUALSYS

Introduction à la Statistique Inférentielle

Mathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans

PRÉCIS DE SIMULATION

Le modèle de Black et Scholes

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008

SAS ENTERPRISE MINER POUR L'ACTUAIRE

Introduction à l approche bootstrap

Transcription:

Analyse en composantes principales en météorologie & en mécanique des fluides O.Pannekoucke Météo-France/ CNRS, CNRM/GAME, URA 357 ISAE Séminaire CPGE 9- Mai 0, oulouse

Problématique : pourquoi chercher à réduire l'information? Si un champ complexe se projette sur quelques composantes, alors on peut: - accélérer la prévision numérique en réduisant le coût de calcul == Réduction de modèles compression de l'information application dans le contrôle en temps réel modélisation simplifiée d'un système complexe (urbulence, interaction fluide-structure, coeur humain,...) - mieux comprendre les interactions entre différentes régions du domaine télé-connexion en climat solution récurrente (régime de temps) Problème: - Comment savoir si un champ se prête à une simplification de la dynamique? Il faut que la dynamique soit stationnaire (i.e. qu'on ait toujours le même type de phénomènes) - Comment déterminer ces motifs récurrents dans le phénomène observé? Une approche possible : l'analyse en composante principale (ACP)

Plan de la présentation. Rappel: définition et propriété d'une matrice de covariance Première définition d'une composante principale. Direction (s) principale (s) comme direction(s) de plus forte variance Deuxième définition d'une composante principale 3. Exemple d'une réduction de modèle par ACP (== PCA / EOF / POD) Equation de Burger (EDP) 4. Introduction au P : composantes principales & modèle de Lorenz 963. 3

. Rappel: définition et propriété d'une matrice de covariance 4

. Rappel: définition et propriété d'une matrice de covariance Covariance et distribution Gaussienne Il existe une base orthonormale ei dans laquelle cette métrique C se représente par une matrice diagonale D=diag i C= i i ei ei P i=ei ei représente le projecteur orthogonal suivant la direction e i i 0 est la valeur propre de C suivant e i Ces directions e i sont les composantes principales de C 5

. Rappel: définition et propriété d'une matrice de covariance Densité de probabilité et densité empirique e x k' e xk 6

. Rappel: définition et propriété d'une matrice de covariance Formulation ensembliste des matrices de covariance Soit X =[ x x x N ] la matrice dont les colonnes sont des réalisations de la variable aléatoire x La matrice de covariance empirique est donnée par N CN= x x x x k N k= k N x= k= x k N Dans la suite, on suppose la moyenne empirique comme nulle. La matrice de covariance empirique s'écrit alors CN= XX N (dans la pratique, on utilise souvent des variables centrées) 7

. Rappel: définition et propriété d'une matrice de covariance Utilisation en assimilation de données n 7 8 En assimilation de données, x ℝ,n 0 0 et on rencontre des matrices de très grande dimension C M n ℝ n 4 6 coefficients i.e. O 0 0 Une manière de réduire leur complexité est d'ader une réduction de la matrice aux premières composantes princiaples n C= i= i ei e i m C m = i= i ei ei, où m n Une autre possibilité est de supposer connues les composantes principales ei de la matrice, il ne reste alors qu'à estimer la diagonale ce qui réduit la représentation en machine de la matrice à l'équivalent du stockage mémoire d'un seul vecteur 8

. Direction (s) principale (s) comme direction (s) de plus forte variance 9

. Direction (s) principale (s) comme direction (s) de plus forte variance Direction de plus grande variance : imisation sous contraintes Quelle est la direction suivant laquelle l'information se projette le mieux? On cherche une direction e telle que la variance de la projection des états x i suivant cette direction est maximale. En particulier, e est unitaire, i.e. e = Ces composantes formes un vecteur ligne X e=e X la variance n'est autre que V X e = Xe X e = e X X e=e C N e = J e N N Le problème est donc de maximiser J e sous la contrainte c e =0 avec c e = e 0

. Direction (s) principale (s) comme direction (s) de plus forte variance Résolution de l'imisation sous contrainte & Lagrangien - J e ec = J e J e ec O ec J e =V X e c e =0 Je Je ce ce Je ce J e Ker dc e =Image dc e { w, dc e w = J e } J e c e =0

. Direction (s) principale (s) comme direction (s) de plus forte variance Résolution de l'imisation sous contrainte & Lagrangien - e maximise J e sous la contrainte c e =0 implique: J e c e =0 c e =0 Ce qui se résume à la stationnarité en e, du «Lagrangien» L e, = J e c e est appelé le «multiplicateur de Lagrange» En effet, L= e L e L =0 est équivalent à e L = J e L =c e =0 c e =0

. Direction (s) principale (s) comme direction (s) de plus forte variance Résolution de l'imisation sous contrainte & Lagrangien - Une condition nécessaire et non suffisante : sta il peut y avoir plusieurs points stationnaires ei reste à trouver lequel vérifie l'imalité parmi ces points c e =0 e J e =V X e e sta 3 sta e sta =e 3

. Direction (s) principale (s) comme direction (s) de plus forte variance Résolution du problème avec contrainte pour l'acp L e, =e C N e e C N e= e e est un vecteur propre de C N associé à e =e e= V X e =e C N e= s'interprète comme la variance suivant la direction e e est donc le vecteur propre de C N associé à la plus grande valeur propre 4

. Direction (s) principale (s) comme direction (s) de plus forte variance Résolution du problème avec contrainte pour l'acp Ayant trouvé la première direction principale e, on cherche une deuxième direction e, normalisée, avec comme autre contrainte qu'elle soit orthogonale à la première direction. L e,, =e C N e e e e L'imum est un point vérifiant la stationnarité du Lagrangien: e L =C N e e e=0 L = e =0 3 L =e e=0 e C N e = =0 s'interprète comme la covariance entre e et e e C N e = s'interprète comme la variance suivant la direction e e est donc le vecteur propre de C N associé à la deuxième plus grande valeur propre. L'analyse en composantes principales construit une base orthonormale dans laquelle l'information se projette le mieux. Ces composantes sont les vecteurs propres de la matrice de covariance C N 5

3. Exemple d'une réduction de modèle par ACP aussi appelé: Analyse en Composantes Principales (ACP) Principal Component Analysis (PCA) Empirical Orthogonal Function (EOF) Proper Orthogonal Decomposition (POD) 6

3. Exemple d'une réduction de modèle par ACP Réduction de modèle dans le cas d'une EDP : l'éq. de Burger E t u u x u= x u Sur un domaine circulaire de périmètre L Supposons que les composantes principales soient les exponentielles circulaires en x =e ik n x, k= L La dynamique s'exprime par la description de l'évolution en temps des composantes dans cette base 3 4 5 7 u x, t = n= un t en x L un t = en u = 0 u x, t en x dx L x u x, t = n= un t x en x = n= un t i n k en x u x, t u x,t = n= un t en x

3. Exemple d'une réduction de modèle par ACP Réduction de modèle dans le cas d'une EDP : l'éq. de Burger E t u u x u= x u La projection de Galerkin consiste à ré-écrire la dynamique (E) dans cette représentation: 3 4 8 d un en u x u x u =0, n [, ] dt d un en u x u = n k un, dt d un p q=n up i q k uq = n k un, dt d un = p q=n u p iq kuq n k un. dt

3. Exemple d'une réduction de modèle par ACP Réduction de modèle dans le cas d'une EDP : l'éq. de Burger E t u u x u= x u t=0 t=0.4 t=0 t=0.4 t=0.6 u u =00 9 t=0.6 x =50 x

4. Introduction au P : composantes principales et modèle de Lorenz 963. 0

4. Introduction au P : composantes principales & modèle de Lorenz 963. ACP à partir d'une simulation ou d'observations X =[ x x x3 x4 xn ] N x= k= x k=0 N -- Diagonalisation de C N = X X pour construire les composantes principales N -- Calcul des amplitudes du champ le long des premières composantes principales -3- Représentation de cette dynamique dans l'espace réduit

Conclusion L'analyse en composante principale est un outil d'algèbre linéaire simple à mettre en oeuvre. Le formalisme qui repose sur l'imisation sous contrainte d'égalité (Lagrangien, multiplicateur de Lagrange). Cet outil permet de simplifier la représentation d'un phénomène complexe (champ de la mécanique des fluides, coeur humain,..) On peut en déduire une dynamique réduite qui permet de diminuer le coût d'une prévision et faciliter l'assimilation des données en recherchant la solution dans un petit sous-espace. Quelques questions à traiter : Réduction de modèle pour quelques EDP simples Étude de la convergence vers la solution théorique avec le nombre de composantes sélectionnées Assimilation de données dans le modèle réduit, comparaison avec celle dans le modèle complet Déduction de la dynamique dans l'espace réduit à partir d'une séquence d'observations

Merci