Tableaux multiples Et Données Evolutives 1. Méthode STATIS

Documents pareils
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Analyse en Composantes Principales

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

1 Complément sur la projection du nuage des individus

Chapitre 2 : Caractéristiques du mouvement d un solide

La classification automatique de données quantitatives

Cours d Analyse. Fonctions de plusieurs variables

Circuits RL et RC. Chapitre Inductance

Jean-Philippe Préaux

Calcul intégral élémentaire en plusieurs variables

Analyse des correspondances avec colonne de référence

Introduction. Préambule. Le contexte

ACP Voitures 1- Méthode

N L a R e v u e F r a n c o p h o n e d u M a n a g e m e n t d e P r o j e t 2 è m e t r i m e s t r e

Extraction d informations stratégiques par Analyse en Composantes Principales

Traits biologiques : variables ou K-tableaux?

Michel Henry Nicolas Delorme

Mémo d utilisation de ADE-4

F411 - Courbes Paramétrées, Polaires

Le suivi de la qualité. Méthode MSP : généralités

Individus et informations supplémentaires

Analyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R?

Relation entre deux variables : estimation de la corrélation linéaire

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Document réalisé par :

Statistiques Descriptives à une dimension

COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES

DYNAMIQUE DE FORMATION DES ÉTOILES

MATHS FINANCIERES. Projet OMEGA

Qu est-ce que le ehealthcheck?

ISFA 2 année Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses.

(51) Int Cl.: B23P 19/00 ( ) B23P 19/04 ( ) F01L 1/053 ( )

Listes de fournitures du secondaire pour la rentrée

= constante et cette constante est a.

23. Interprétation clinique des mesures de l effet traitement

VOLT LA NOUVELLE CHEVROLET

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Chafa Azzedine - Faculté de Physique U.S.T.H.B 1

Mathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans

Cours de méthodes de scoring

Le risque Idiosyncrasique

ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection

On ne peut pas entendre la forme d un tambour

Statistique Descriptive Multidimensionnelle. (pour les nuls)

La corrélation entre deux matrices de distances euclidiennes

Chapitre 2/ La fonction de consommation et la fonction d épargne

Repérage d un point - Vitesse et

Plan du cours : électricité 1

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

FORMULAIRE DE STATISTIQUES

IFT3913 Qualité du logiciel et métriques. Chapitre 2 Modèles de processus du développement du logiciel. Plan du cours

8.1 Généralités sur les fonctions de plusieurs variables réelles. f : R 2 R (x, y) 1 x 2 y 2

Agrégation des portefeuilles de contrats d assurance vie

CCP PSI Mathématiques 1 : un corrigé

Modélisation et Simulation

TEPZZ A_T EP A1 (19) (11) EP A1 (12) DEMANDE DE BREVET EUROPEEN. (51) Int Cl.: G07F 7/08 ( ) G06K 19/077 (2006.

Catalogue des connaissances de base en mathématiques dispensées dans les gymnases, lycées et collèges romands.

Conception des systèmes répartis

Comparaison des enjeux énergétiques de la France et de l Allemagne

L OPTIMISATION ÉCONOMIQUE DU VOLUME DU LOT DE FABRICATION DANS LE MANAGEMENT DE LA PRODUCTION EN SÉRIE

SCIENCES INDUSTRIELLES POUR L INGÉNIEUR. Partie I - Analyse système

Plan du cours Cours théoriques. 29 septembre 2014

Collecter des informations statistiques

Catalogue des prestations du distributeur EDF proposées aux clients et fournisseurs d électricité

THEME 2 : LA TRADUCTION COMPTABLE DES FLUX

Introduction à l étude des Corps Finis

Le D.O.N.T. Le DONT. Première partie. Son maître mot est la DISTRIBUTION. Alerte. Principes du DONT

Certificats TURBO. Bénéficiez d un effet de levier en investissant sur l indice CAC 40! Produits non garantis en capital.

: seul le dossier dossier sera cherché, tous les sousdomaines

1S Modèles de rédaction Enoncés

Mesures gaussiennes et espaces de Fock

I. Cas de l équiprobabilité

Chapitre 1 Cinématique du point matériel

L analyseur de combustion industriel

Probabilités conditionnelles Loi binomiale

TRAVAUX PRATIQUES SCIENTIFIQUES SUR SYSTÈME

Christian JUTTEN Théorie du signal

TABLE DES MATIÈRES CHAPITRE I. Les quanta s invitent

Une fréquence peut-elle être instantanée?

EP A1 (19) (11) EP A1 (12) DEMANDE DE BREVET EUROPEEN. (43) Date de publication: Bulletin 2011/26

Allocation Robuste et Restrictions sur les Contributions au Risque

EP A1 (19) (11) EP A1 (12) DEMANDE DE BREVET EUROPEEN. (51) Int Cl.: H04L 12/58 ( )

Préparation des données d entrée pour la définition d un plan de validation

Master IMEA 1 Calcul Stochastique et Finance Feuille de T.D. n o 1

Initiation à l analyse en composantes principales

Propriétés électriques de la matière

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

EBI 25- Système à radiofréquence POUR LA SURVEILLANCE SANS FIL DE LA TEMPÉRATURE, DE L HUMIDITÉ ET D AUTRES GRANDEURS PHYSIQUES

Latitude N Longitude E Altitude 376 m RÉSUMÉ MENSUEL DU TEMPS DE JANVIER 2014

La métrologie au laboratoire. vigitemp 10. centrale de surveillance et de traçabilité vigitemp kit de cartographie vigicart

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

SOMMAIRE. Portraits des intervenants Portraits des animateurs Conférence, Débat et Échanges #$%&'(!)(*+,!-$*./)(*-(!"0!1,2*!34"0!5!!

Cours d algorithmique pour la classe de 2nde

Chapitre 3 : Le budget des ventes. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 3

L exclusion mutuelle distribuée

4. Les structures de données statiques

Oscillations libres des systèmes à deux degrés de liberté

Les étapes de la mise en place d un réseau de chaleur Les réseaux de chaleur Etapes pour la mise en place d un réseau de chaleur Sainte-Ode, le 28

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE

Transcription:

Tableaux multiples Et Données Evolutives 1 Méthode STATIS N. Niang Keita niang@cnam.fr SOMMAIRE Introduction La méthode STATIS Exemple: 1er tour scrutins élections présidentielles La méthode STATIS DUALE Application au contrôle des procédés à temps variable 1

Introduction Cadre général: méthodes d analyse simultanée de plusieurs tableaux de données Diverses situations: pt variables mesurées sur nt individus à différentes dates: données évolutives pt variables mesurées sur nt individus à différentes occasions (non temporel) Plusieurs tableaux de contingence ou de proximités Introduction Plusieurs méthodes: STATIS, STATIS DUALE AFM DACP + AUTRES ANGLO SAXONS 2

Méthodes STATIS Structuration de Tableaux A Trois Indices de la Statistique (Escoufier et L Hermier des plantes (1976) + C.Lavit) permet l exploration simultanée de plusieurs tableaux de données quantitatives: n individus et pt var différentes STATIS Privilégie la position des individus p varet nt individus différents STATIS DUALE Privilégie les relations entre variables L approche de la méthode: Etude classique d un tableau: l analyse factorielle associe au tableau un ensemble de représentation graphiques (cercle de corrélations, plans factoriels) Plusieurs tableaux: études séparées trop de représentations indépendantes, pas pertinent; d où: Recherche d un ensemble unique de représentation, un résumé global, un compromis des tableaux 3

Méthode STATIS Idée essentielle de la méthode: recherche d une réponse à la question: les distances entre individus sont elles stables d un tableaux à un autre? Nécessité de trouver une structure commune aux études appelée intrastructure 4 étapes: Interstructure : étude globale des différences entre tableaux Compromis : résumer les tableaux en un seul représentatif selon certains critères Intrastructure : étude fine des différences entre tableaux Trajectoires : évolution des individus ou variables suivant les tableaux 4

Notations On dispose de N tableaux Xt à pt variables quantitatives décrivant les mêmes n individus X 1 X X X 2 X X X n X X X 11 21 Pt1 12 22 Pt 2 = t 1n 2n Ptn Rappels ACP ACP classique : triplet (X, M, D) facteurs principaux : MVu = λu = (1) composantes principales : c = Xu MX DXu= λu XMX DXu= λxu X* (1) WDc= λc W =matrice des produits scalaires entre individus Composantes principales WDc = λc 5

Etude de l interstructure : analyse globale ACP particulière: 3 phases Définir un objet représentatif Définir une métrique pour distances entre objets Trouver une image des objets représentatifs Interstructure : objet représentatif Wt Individu de l ACP = objet représentatif d un tableau Xt Wt = XtMtX t caractérise (Xt, Mt, D) Wt contient les produits scalaires entre individus = tous les liens inter individus 6

Interstructure objet représentatif Wt On représente chaque étude (X t,, M t, D ) t=1,., N par W t Même nombre d individus D = Matrice de poids des individus X 1 X X X 2 X X X n X X X 11 21 P1 12 22 P 2 = t 1n 2n Pn π t par On associe un poids à chaque W t W t = X tmt X π 0 1 Δ= 0 π N t Interstructure : métrique pour distances entre objets Metrique de l ACP: définir une distance entre objets Produit scalaire de Hilbert Schmidt: ( ) S = W W =Tr DW DW tt' t t' HS t t' Si les objets Wt ont des normes très différentes: ( ) ( ) ( ) 2 2 t t' = Tr t t' Tr HS t Tr t' W W DW DW / [ DW ] [ DW ] 7

Interstructure métrique pour distances entre objets On reconnaît le coefficient RV (cf cours de Gonzalez) : On définit la matrice S qui contient les coefficients RV π 0 1 On associe à chaque tableau un poids: Δ= 0 π N Comme en ACP on peut donc construire une image représentative des objets Rque: S a tous ses termes positifs, on aura un facteur taille Interstructure image représentative des objets Rappel : STATIS = ACP particulière : Individu = W t = objet représentatif d un tableau Tableau de données = S = Matrice des coefficients RV (produits scalaires entre objets W t ) et poids Composante principale = vecteur propre de SΔ 8

Interstructure image représentative des objets ACP de SΔ Les vecteurs propres de SΔ associés aux deux plus grandes valeurs propres permettent la représentation des objets W 1,, W N sur le 1er plan factoriel : Les coordonnées des W t sur l axe i sont contenues dans c t,i : c = λ u ti, i i i ème valeurpropre de SΔ i ème vecteur propre de SΔ STATIS - Résumé Interstructure 9

Exemple 1: 1er tour présidentielle 10

Compromis-Intrastructure Interstructure = analyse globale mise en évidence de ressemblances ou différences globales entre tableaux sans les expliquer. Objectif de la suite = analyse plus fine pour expliquer Deux étapes: * recherche d un point de repère= compromis * étude de l intrastructure 11

Recherche d un compromis Compromis = bon resumé, de même nature que les objets solution: Wco moyenne pondérée desw t Les coefficients étant tels que Wco soit le plus corrélé avec les W t Recherche d un compromis Matrice Compromis W CO α = t 1 π λ 1 ( ) u t t 1 t ième élément du 1 er vecteur propre de SΔ W N = α W CO t t t= 1 1 ère valeur propre de SΔ Matrice de données W = XMX initiales t t t 12

Recherche d un compromis Représentation et Interprétation 4 cas: * Wt ont des normes voisines et des grands RV: existence d une structure commune bien décrite par le compromis * un WtW différent des autres: il intervient peu dans la construction du compromis, robuste * Wt normes trop différentes: il faut normer * Wt très différents,, RV faibles: : pas de structure commune Intrastructure image représentative des points compromis ACP de W CO D Les vecteurs propres de W CO D associés aux deux plus grandes valeurs propres fournissent une image euclidienne des points compromis Les coordonnées compromis sur l axe i sont contenues dans le vecteur c CO,i : 1 c = δ v = W Dv CO, i i i co i δi i ème valeur propre de W CO D i ème vecteur propre de W CO D 13

STATIS - Intrastructure Intrastructure : corrélation variablescompromis Chaque composante principale du compromis est un vecteur à n dimension, n étant le nombre d individus des tableaux initiaux. Calcul de leurs corrélations avec les variables initiales des tableaux Xt Représentation des cercles de corrélation Interprétation des axes pour expliquer les positions compromis des individus 14

15

STATIS - Trajectoires des individus Méthode: technique des points supplémentaires: Représentation sur l image euclidienne compromis des N nuages des individus c = CO t, i t i δ i Remarque : c CO,i est le centre de gravité des points c CO t,i 1 WDv STATIS - Trajectoires des individus Objectif : Mise en évidence des écarts entre les W t et avec le compromis au niveau individuel Détection des individus responsables des écarts entre tableaux Définition : On place les différentes positions d un individu tel qu il est décrit par chaque étude. Ces différentes positions définissent sa trajectoire 16

Interprétation des trajectoires Deux classes de trajectoires des individus : Peu étendue autour de sa position compromis = individus dont l évolution suit l évolution moyenne, écart par rapport à la moyenne régulier d un tableau à l autre Trajectoire de grande amplitude = changement de structure suivant les tableaux, différence avec l évolution moyenne Rque: si les axes du compromis sont bien corrélés avec les variables on pourra expliquer les axes par les variables et on interprètera de façon détaillée les trajectoires des individus 17

STATIS DUALE Même démarche que STATIS en prenant comme matrice représentant un tableau, V t la matrice de covariance des variables à la place des W t. On privilégie les variables au lieu des individus. Interstructure: étude globale des variables Compromis: moyenne pondérée des V t Intrastructure: compromis des variables Trajectoires de variables STATIS DUALE Exemple d application: Contrôle de procédés par lots à temps variable 18