Analyse multidimensionnelle de données longitudinales

Dimension: px
Commencer à balayer dès la page:

Download "Analyse multidimensionnelle de données longitudinales"

Transcription

1 Analyse multidimensionnelle de données longitudinales Ndèye Niang Conservatoire National des Arts et Métiers Plan Introduction Terminologie-Notations Méthodes directes Coefficient d association vectorielle DACP, STATIS, TUCKER, PARAFAC Méthodes secondaires Dual, SCA Typlogies de trajectoires 1

2 Introduction Données longitudinales multidimensionnelles Méthodes exploratoires simples ( cf cours 1) Indispensables mais insuffisantes pour l étude des liaisons entre les variables Besoin de méthodes multidimensionnelles Etude des méthodes descriptives à trois voies utilisant le temps dans l interprétation Introduction Rappel: Données longitudinales: mesures répétées dans le temps, tableau à 3 entrées 2

3 Terminologie - Notations Tableau à trois dimensions X x ijt, i=1,, N; j= 1,, p, t=1,t i pour les individus en lignes j pour les variables en colonnes t pour les instants (temps) de mesure en profondeur Ensemble de matrices : tranches horizontales Xi, tranches latérales Xj, tranches frontales Xt Ensemble de vecteurs: fibres lignes xit, colonnes xjt, tubes xij Méthodes multidimensionnelles 3

4 Introduction Cadre général: méthodes d analyse simultanée de plusieurs tableaux de données Diverses situations: pt variables mesurées sur nt individus à différentes dates: données évolutives pt variables mesurées sur nt individus à différentes occasions (non temporel) Plusieurs tableaux de contingence ou de proximités Ici : données quantitatives individus-variables 4

5 Introduction Plusieurs méthodes: DACP STATIS, STATIS DUALE AFM PARAFAC, TUCKER 2. La double ACP (Bouroche,J.M., 1975) ACP n 1: nuage des centres de gravité g t comme étude de l interstructure Recherche de l intrastructure ACP de chaque tableau: T systèmes d axes Système d axes compromis maximise l inertie de la somme des projections de chaque nuage = somme des inerties après centrage 5

6 double ACP (suite) Axes compromis : vecteurs propres de ACP n 2: ACP de la concaténation verticale (superposition) des X t centrés T Vt t= 1 X 1 X 2 X T double ACP: exemple Crimes et délits en 9 catégories pour l ensemble des départements métropolitains, par année de 1974 à 1993 VO : vols et recels FX :faux et escroqueries DF: délits financiers CH: chèques sans provisions CR: coups, réglements de comptes, traumatismes ST: stupéfiants DD: destructions et dégradations ET : délits à la police des étrangers DV : divers 6

7 7

8 8

9 9

10 10

11 Méthodes STATIS Structuration de Tableaux A Trois Indices de la Statistique (Escoufier et L Hermier des plantes (1976) + C.Lavit) permet l exploration simultanée de plusieurs tableaux de données quantitatives: n individus et pt var différentes STATIS Privilégie la position des individus 11

12 Méthodes STATIS Remarque p var et nt individus différents STATIS DUALE Privilégie les relations entre variables Remarque: données longitudinales : mêmes individus mêmes variables possible application des deux méthodes et DACP L approche de la méthode: Etude classique d un tableau: l analyse factorielle associe au tableau un ensemble de représentation graphiques (cercle de corrélations, plans factoriels) Plusieurs tableaux: études séparées trop de représentations indépendantes, pas pertinent; d où: Recherche d une unique représentation, un résumé global, un compromis des tableaux 12

13 Méthode STATIS Idée essentielle de la méthode: recherche d une réponse à la question: les distances entre individus sont elles stables d un tableaux à un autre? Nécessité de trouver une structure commune aux études appelée intrastructure 4 étapes: Interstructure : étude globale des différences entre tableaux Compromis : résumer les tableaux en un seul représentatif selon certains critères Intrastructure : étude fine des différences entre tableaux Trajectoires : évolution des individus ou variables suivant les tableaux 13

14 Notations On dispose de N tableaux Xt à p variables quantitatives décrivant les mêmes n individus X 1 X X L X 2 X X L X M M M O M n X X K X P P 2 = t 1n 2n Pn Interstructure : analyse globale ACP particulière: 3 phases Définir un objet représentatif Définir une métrique pour distances entre objets Trouver une image des objets représentatifs 14

15 Interstructure objet représentatif Wt W t = X t M t X t caractérise (X t, M t, D) Wt contient les produits scalaires entre individus = tous les liens inter individus Individu de l ACP = objet représentatif d un tableau X t, et on lui associe un poids π t Métrique pour distances entre objets Métrique de l ACP: définir une distance entre objets Produit scalaire de Hilbert Schmidt: ( ) S = W W =Tr DW DW tt ' t t' HS t t' Si les objets Wt ont des normes très différentes: ( ) ( ) ( ) 2 2 W W = Tr DW DW / Tr[ DW ] Tr[ DW ] t t ' HS t t ' t t ' 15

16 Rappels ACP ACP classique : triplet (X, M, D) facteurs principaux : MVu = λu = (1) composantes principales : c = Xu MX DXu= λu XMX DXu= λxu X* (1) WDc= λc W =matrice des produits scalaires entre individus Composantes principales WDc = λc Métrique pour distances entre objets On définit la matrice S qui contient les coefficients RV π 0 1 On associe à chaque tableau un poids: = O 0 π N Comme en ACP on peut construire une image représentative des objets Remarque: S a tous ses termes positifs, on aura un facteur taille 16

17 Image représentative des objets Rappel : STATIS = ACP particulière : Individu = W t = objet représentatif d un tableau Tableau de données = S = Matrice des coefficients RV (produits scalaires entre objets W t ) et poids Composante principale = vecteur propre de S Image représentative des objets ACP de S Les vecteurs propres de S associés aux deux plus grandes valeurs propres permettent la représentation des objets W 1,, W N sur le 1er plan factoriel : Les coordonnées des W t sur l axe i sont contenues dans c t,i : c = λ u t, i i i i ème valeurpropre de S i ème vecteur propre de S 17

18 STATIS - Résumé Interstructure Exemple 1: 1er tour présidentielle 18

19 19

20 Compromis-Intrastructure Interstructure = analyse globale mise en évidence de ressemblances ou différences globales entre tableaux sans les expliquer. Objectif de la suite = analyse plus fine pour expliquer Deux étapes: * recherche d un point de repère= compromis * étude de l intrastructure Recherche d un compromis Compromis = bon resumé, de même nature que les objets solution: Wco moyenne pondérée desw t Les coefficients étant tels que Wco soit le plus corrélé avec les W t 20

21 Recherche d un compromis Matrice Compromis W CO α = t 1 π λ 1 ( ) u t t 1 t ième élément du 1 er vecteur propre de S W N W CO = αt t t= 1 1 ère valeur propre de S Matrice de données W = X MX initiales t t t Recherche d un compromis Représentation et Interprétation tation 4 cas: * Wt ont des normes voisines et des grands RV: existence d une structure commune bien décrite par le compromis * un WtW différent des autres: il intervient peu dans la construction du compromis, robuste * Wt normes trop différentes rentes: il faut normer * Wt très différents rents,, RV faibles: : pas de structure commune 21

22 Intrastructure image représentative des points compromis ACP de W CO D Les vecteurs propres de W CO D associés aux deux plus grandes valeurs propres fournissent une image euclidienne des points compromis Les coordonnées compromis sur l axe i sont contenues dans le vecteur c CO,i : i ème valeur propre de W CO D 1 c = δ v = W Dv δ CO, i i i co i i i ème vecteur propre de W CO D STATIS - Intrastructure 22

23 Intrastructure : corrélation variablescompromis Chaque composante principale du compromis est un vecteur à n dimension, n étant le nombre d individus des tableaux initiaux. Calcul de leurs corrélations avec les variables initiales des tableaux Xt Représentation des cercles de corrélation Interprétation des axes pour expliquer les positions compromis STA112 des mars individus

24 Wco est encore un opérateur d Escoufier car les α j sont non négatifs Wco est donc associé à un tableau de données compromis X tel que Wco=XMX ACP de X = α X α X α X T T Pondération des tableaux 24

25 STATIS - Trajectoires des individus Méthode: technique des points supplémentaires Représentation sur l image euclidienne compromis des N nuages des individus c = 1 W Dv CO t, i t i δ i Remarque : c CO,i est le centre de gravité des points c CO t,i STATIS - Trajectoires des individus Objectif : Mise en évidence des écarts entre les W t et avec le compromis au niveau individuel Détection des individus responsables des écarts entre tableaux Définition : On place les différentes positions d un individu tel qu il est décrit par chaque étude. Ces différentes positions définissent sa trajectoire 25

26 Interprétation des trajectoires Deux classes de trajectoires des individus : Peu étendue autour de sa position compromis = individus dont l évolution suit l évolution moyenne, écart par rapport à la moyenne régulier d un tableau à l autre Trajectoire de grande amplitude = changement de structure suivant les tableaux, différence avec l évolution moyenne Rque: si les axes du compromis sont bien corrélés avec les variables on pourra expliquer les axes par les variables et on interprètera de façon détaillée les trajectoires des individus 26

27 STATIS DUALE Même démarche que STATIS en prenant comme matrice représentant un tableau, V t la matrice de covariance des variables à la place des W t. On privilégie les variables au lieu des individus. Interstructure: étude globale des variables Compromis: moyenne pondérée des V t Intrastructure: compromis des variables Trajectoires de variables 27

Tableaux multiples et données évolutives. N. Niang Keita Gilbert Saporta

Tableaux multiples et données évolutives. N. Niang Keita Gilbert Saporta Tableaux multiples et données évolutives N. Niang Keita niang@cnam.fr Gilbert Saporta gilbert.saporta@cnam.fr 1 2 Plan 1. Généralités 2. Double ACP 3. STATIS 4. AFM 3 1 Généralités Suite de tableaux individusxvariablesxtemps

Plus en détail

Tableaux multiples Et Données Evolutives 1. Méthode STATIS

Tableaux multiples Et Données Evolutives 1. Méthode STATIS Tableaux multiples Et Données Evolutives 1 Méthode STATIS N. Niang Keita niang@cnam.fr SOMMAIRE Introduction La méthode STATIS Exemple: 1er tour scrutins élections présidentielles La méthode STATIS DUALE

Plus en détail

Tableaux multiples et données évolutives

Tableaux multiples et données évolutives Tableaux multiples et données évolutives N. Niang Keita niang@cnam.fr Gilbert Saporta gilbert.saporta@cnam.fr mai 2011 1 Suite de tableaux individusxvariablesxtemps temps discret 1,2,.. t,... T «données

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Analyse simultanée de variables quantitatives et qualitatives. à l aide de l analyse factorielle multiple

Analyse simultanée de variables quantitatives et qualitatives. à l aide de l analyse factorielle multiple Analyse simultanée de variables quantitatives et qualitatives à l aide de l analyse factorielle multiple Jérôme Pagès Laboratoire de mathématiques appliquées Agrocampus France Analyse Factorielle Multiple

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées

Plus en détail

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali LUISS, Libera Università Internazionale degli Studi Sociali Université Paris 13 Laboratoire Analyse, Géométrie et Applications UMR 7539 GOUTTE Analyse Statistique des Données Cours 4 Master 2 EID goutte@math.univ-paris13.fr

Plus en détail

Introduction à l analyse des données. Olivier Godechot

Introduction à l analyse des données. Olivier Godechot Introduction à l analyse des données Olivier Godechot Introduction. Les données statistiques : de très nombreuses variables. Aucune n est parfaite La perception d un phénomène appréhendée comme la combinaison

Plus en détail

Cours 2-3 Analyse des données multivariées

Cours 2-3 Analyse des données multivariées Cours 2-3 des données s Ismaël Castillo École des Ponts, 13 Novembre 2012 Plan 1 2 3 4 1. On s intéresse à un jeu de données multi-dimensionel, avec n individus observés et p variables d intérêt ( variables

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

Introduction à l analyse des données. Analyse des Données (1) Exemple, ville et (in)sécurité. Exemple, ville et (in)sécurité

Introduction à l analyse des données. Analyse des Données (1) Exemple, ville et (in)sécurité. Exemple, ville et (in)sécurité Introduction à l analyse des données Analyse des Données () Le but de l analyse de données est de synthétiser, structurer l information contenue dans des données multidimensionnelles Deux groupes de méthodes

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Plan du cours Analyse en Composantes Principales Introduction Les données Leurs représentations La méthode Modèle Interprétation statistique Espace principal Composantes Principales Représentations Graphiques

Plus en détail

Analyse de données. [Tapez le sous-titre du document] ANALYSE DE DONNEES 2011 2012. ANALYSE DE DONNEES Page 1 LICENCE 3 SCIENCES ECONOMIQUES

Analyse de données. [Tapez le sous-titre du document] ANALYSE DE DONNEES 2011 2012. ANALYSE DE DONNEES Page 1 LICENCE 3 SCIENCES ECONOMIQUES 2011 2012 ANALYSE DE DONNEES 2011 2012 LICENCE 3 SCIENCES ECONOMIQUES COURS DE M. THIERRY BLAYAC Analyse de données [Tapez le sous-titre du document] ANALYSE DE DONNEES Page 1 H34VEN Cours pour Licence

Plus en détail

Analyse de Données. Analyse en Composantes Principales (ACP)

Analyse de Données. Analyse en Composantes Principales (ACP) Analyse de Données Analyse en Composantes Principales (ACP) Analyse en composantes principales (ACP) ** Sur toute la fiche, on notera M' la transposée de M. Cadre de travail : On a des données statistiques

Plus en détail

Analyse en composantes principales

Analyse en composantes principales Université de Rennes 2 Statistiques des données M1-GEO Ouvrages recommandés Analyse en composantes principales Ces livres sont à la BU. Pour les acheter, venir au bureau A-240 ou envoyer un mail : nicolas.jegou@uhb.fr

Plus en détail

Séance 2: Modèle Euclidien

Séance 2: Modèle Euclidien Généralités Métrique sur les INDIVIDUS Métrique sur les VARIABLES Inertie Analyse des individus Laboratoire de Statistique et Probabilités UMR 5583 CNRS-UPS www.lsp.ups-tlse.fr/gadat Généralités Métrique

Plus en détail

L analyse en composantes principales en pratique

L analyse en composantes principales en pratique L analyse en composantes principales en pratique Après avoir vu sa formalisation mathématique dans le module précédent, on s intéresse ici à l utilisation pratique de l ACP. 1 Objectifs L objectif de l

Plus en détail

Analyse des données et Data Mining

Analyse des données et Data Mining Analyse des données et Data Mining Analyse en composantes principales utc sy09 1 Objectif des méthodes factorielles Visualiser, traiter des données multidimensionnelles Problème difficile Information apportée

Plus en détail

Le Multidimensional Scaling et la cartographie des préférences

Le Multidimensional Scaling et la cartographie des préférences Le Multidimensional Scaling et la cartographie des préférences Gilbert Saporta Conservatoire National des Arts et Métiers http://cedric.cnam.fr/~saporta Avril 2014 Multidimensional scaling Egalement appelé

Plus en détail

Analyse multivariée approfondie

Analyse multivariée approfondie Analyse multivariée approfondie Enseignants: NIANG N. et RUSSOLILLIO G. Maître de conférences Statistique Appliquée Laboratoire CEDRIC CNAM http://www.cnam.fr et d autres intervenants extérieurs au Cnam

Plus en détail

CH1 : Introduction à l Analyse Des Données (ADD) B- Les données et leurs caractéristiques C- Grandeurs associées aux données

CH1 : Introduction à l Analyse Des Données (ADD) B- Les données et leurs caractéristiques C- Grandeurs associées aux données CH1 : Introduction à l Analyse Des Données (ADD) A- Introduction A- Introduction B- Les données et leurs caractéristiques C- Grandeurs associées aux données A-1 Les méthodes Lors de toute étude statistique,

Plus en détail

Cours de Statistiques

Cours de Statistiques Cours de Statistiques Romain Raveaux 1 1 Laboratoire L3I Université de La Rochelle romain.raveaux01 at univ-lr.fr Octobre 24-11, 2008 1 / 35 Sommaire 1 Quelques Rappels 2 numériques Relations entre deux

Plus en détail

Analyse discriminante

Analyse discriminante Analyse discriminante Christine Decaestecker & Marco Saerens ULB & UCL LINF2275 1 Analyse Discriminante Particularités: 2 formes/utilisations complémentaires: méthode factorielle: description "géométrique"

Plus en détail

L3 Géographie UE Méthodologie. Statistiques COURS 1. Salle 125. Intervenants : Nadège. UMR Centre de Recherches de Climatologie (CRC)

L3 Géographie UE Méthodologie. Statistiques COURS 1. Salle 125. Intervenants : Nadège. UMR Centre de Recherches de Climatologie (CRC) L3 Géographie UE Méthodologie Statistiques COURS 1 Salle 125 Intervenants : Nadège Martiny & Julien Crétat UFR Sciences Humaines (Département de Géographie) UMR Centre de Recherches de Climatologie (CRC)

Plus en détail

Analyse factorielle des correspondances de Benzécri

Analyse factorielle des correspondances de Benzécri Analyse factorielle des correspondances de Benzécri One Pager Décembre 2013 Vol. 8 Num. 011 Copyright Laréq 2013 http://www.lareq.com Analyse Factorielle des Correspondances de Benzécri Une illustration

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h I.U.T de Caen STID 2ème année Département STID Année Universitaire 2002-2003 Responsable de cours : Alain LUCAS Seule la calculatrice type collège est autorisée. Seul le cours est autorisé. On rappelera

Plus en détail

Analyse en composantes principales

Analyse en composantes principales Analyse en composantes principales Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire LITIS Analyse en composantes principales p. 1/18 Introduction Objectifs Soit {x i } i=1,,l

Plus en détail

Module 2 29 Décembre 2009 Intervenant: Dhuin STATISTIQUES

Module 2 29 Décembre 2009 Intervenant: Dhuin STATISTIQUES STATISTIQUES I. Séries statistiques simples... 1 A. Définitions... 1 1. Population... 1 2. Caractère statistique... 1 B. Séries classées / représentations graphiques.... 2 1. Séries classées... 2 2. Représentations

Plus en détail

Méthodes de placement multidimensionnelles. Fabrice Rossi Télécom ParisTech

Méthodes de placement multidimensionnelles. Fabrice Rossi Télécom ParisTech Méthodes de placement multidimensionnelles Fabrice Rossi Télécom ParisTech Plan Introduction Analyse en composantes principales Modèle Qualité et interprétation Autres méthodes 2 / 27 F. Rossi Plan Introduction

Plus en détail

ANALYSE FACTORIELLE DE DONNÉES MIXTES : PRINCIPE ET

ANALYSE FACTORIELLE DE DONNÉES MIXTES : PRINCIPE ET ANALYSE FACTORIELLE DE DONNÉES MIXTES : PRINCIPE ET EXEMPLE D APPLICATION Jérôme Pagès Laboratoire de mathématiques appliquées Agrocampus, 35042 Rennes cedex email : pages@agrorennes.educagri.fr Résumé

Plus en détail

Chapitre 9 ANALYSE MULTIDIMENSIONNELLE

Chapitre 9 ANALYSE MULTIDIMENSIONNELLE Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 9 ANALYSE MULTIDIMENSIONNELLE L analyse des données multidimensionnelles regroupe un ensemble de méthodes

Plus en détail

Cours 7 ANALYSE EN COMPOSANTES PRINCIPALES (ACP) Master 2 2005/2006

Cours 7 ANALYSE EN COMPOSANTES PRINCIPALES (ACP) Master 2 2005/2006 Cours 7 ANALYSE EN COMPOSANTES PRINCIPALES (ACP) Master 2 2005/2006 . Les données NOMS PUISS CYLI Co uple Ma xi LONG LARG H AUT COFFRE RESE POIDS VITE CONS ALF 47,9 JTD Distinctive 5 90 28 4,7,73,44 280

Plus en détail

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage Classification Exemple : Enquête d opinion sur les OGM Pauline Le Badezet Alexandra Lepage SOMMAIRE Introduction Méthodologie Méthode de partitionnement Classification Ascendante Hiérarchique Interprétation

Plus en détail

L analyse Factorielle des correspondances. 1/ Préambule descriptif de l AFC

L analyse Factorielle des correspondances. 1/ Préambule descriptif de l AFC L analyse Factorielle des correspondances...2 1/ Préambule descriptif de l AFC...2 Exemples de types de données que l AFC peut aborder:...2 Quelques types de tableaux traités par l AFC...3 2/ Exercice

Plus en détail

MÉTHODES DE CLASSIFICATION

MÉTHODES DE CLASSIFICATION MÉTHODES DE CLASSIFICATION Pierre-Louis GONZALEZ MÉTHODES DE CLASSIFICATION Objet Opérer des regroupements en classes homogènes d un ensemble d individus. Données Les données se présentent en général sous

Plus en détail

Outils Statistiques du Data Mining

Outils Statistiques du Data Mining Outils Statistiques du Data Mining Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr

Plus en détail

Analyse en composantes principales Christine Decaestecker & Marco Saerens ULB & UCL

Analyse en composantes principales Christine Decaestecker & Marco Saerens ULB & UCL Analyse en composantes principales Christine Decaestecker & Marco Saerens ULB & UCL LINF 2275 Stat. explor. multidim. 1 A.C.P.: Analyse en Composantes Principales Analyse de la structure de la matrice

Plus en détail

ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection

ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection Nicolas HEULOT (CEA LIST) Michaël AUPETIT (CEA LIST) Jean-Daniel FEKETE (INRIA Saclay) Journées Big Data

Plus en détail

Introduction sur l analyse en composantes principales (ACP)

Introduction sur l analyse en composantes principales (ACP) Introduction sur l analyse en composantes principales (CP) ) Introduction sur un exemple à 2 dimensions On veut représenter graphiquement les profils d élèves qui ont été notés sur 2 matières (Français

Plus en détail

Analyse en composantes principales (ACP)

Analyse en composantes principales (ACP) Analyse en composantes principales (ACP) François Husson Laboratoire de mathématiques appliquées - Agrocampus Rennes husson@agrocampus-ouest.fr 1 / 31 Quel type de données? L ACP s intéresse à des tableaux

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Méthodes de projection

Méthodes de projection Chapitre 11 Méthodes de projection Contenu 11.1 Analyse en composantes principales........ 138 11.1.1 L Analyse en Composantes Principales........ 139 11.1.2 La (grande) famille des ACP............. 151

Plus en détail

Session 1 durée 3 heures

Session 1 durée 3 heures Université de Nantes Mai 27 Master MIM Examen d'analyse de données Session durée 3 heures Les documents sont interdits. Les calculatrices sont autorisées. Exercice : - Etude d un tableau à l aide d une

Plus en détail

ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN

ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN Pôle Informatique de Recherche et d Enseignement en Histoire ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN A. PREMIER PAS 1. INTEGRATION DU TABLEAU

Plus en détail

Ch2 : Analyse en Composantes Principales (ACP)

Ch2 : Analyse en Composantes Principales (ACP) Ch2 : Analyse en Composantes Principales (ACP) A- Objectifs B- construction d un espace factoriel C- Les étapes d une ACP D- Interprétation E- Limites A- Objectifs On dispose d un tableau de données X.

Plus en détail

Partie I. Les données quantitatives

Partie I. Les données quantitatives Variables quantitatives : analyse en composantes principales Jean-Marc Lasgouttes https://whorocqinriafr/jean-marclasgouttes/ana-donnees/ Partie I Les données quantitatives Description de données quantitatives

Plus en détail

Application des méthodes de décomposition en composantes principales à la climatologie

Application des méthodes de décomposition en composantes principales à la climatologie Application des méthodes de décomposition en composantes principales à la climatologie Etude d un exemple: les modes de variabilité de la température de surface de la mer dans l océan Atlantique tropical

Plus en détail

L analyse en composantes principales

L analyse en composantes principales L analyse en composantes principales 1 La méthode 1 Les données, les objectifs de la méthode L Analyse en Composantes Principales (ACP) est la méthode adaptée à l exploration synthétique de l information

Plus en détail

Chapitre 3: Dynamique

Chapitre 3: Dynamique Introduction Le mot dynamique désigne ou qualifie ce qui est relatif au mouvement. Il est l opposé du mot statique. Le mouvement d un point matériel est liée à son interaction avec le monde extérieur ce

Plus en détail

SEMIN. Analyses factorielles avec R. Elisabeth MORAND INED

SEMIN. Analyses factorielles avec R. Elisabeth MORAND INED SEMIN Analyses factorielles avec R Elisabeth MORAND INED SEMIN R du MNHN 10 Décembre 2009 E. Morand 10 Décembre 2009 INED 1 / 42 Part I Analyse en Composantes Principales : ACP 2 / 42 Sommaire 1 Introduction

Plus en détail

Chapitre 3 RÉGRESSION ET CORRÉLATION

Chapitre 3 RÉGRESSION ET CORRÉLATION Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 3 RÉGRESSION ET CORRÉLATION La corrélation est une notion couramment utilisée dans toutes les applications

Plus en détail

Mécanique des solides déformables

Mécanique des solides déformables Mécanique des solides déformables Auteur Michel MAYA 1 Descriptions 2 Représentations graphiques Ce cours est mis à disposition selon les termes de la licence Creative Commons Paternité + Pas d utilisation

Plus en détail

Partie I. Les données quantitatives

Partie I. Les données quantitatives Variables quantitatives : analyse en composantes principales Jean-Marc Lasgouttes https://whorocqinriafr/jean-marclasgouttes/ana-donnees/ Partie I Les données quantitatives Description de données quantitatives

Plus en détail

Analyse de données multidimensionnelles

Analyse de données multidimensionnelles Analyse de données multidimensionnelles M1 Statistique et économétrie, 2014 Projet - V. Monbet Le projet est composé de deux parties indépendantes. Les données sont disponibles sur la page web du cours.

Plus en détail

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 105 HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 1. Introduction En statistiques il arrive fréquemment que les individus soient décrits par un grand nombre de caractères. : voitures décrites par leur

Plus en détail

Marketing Data Set: Follow-Up to Purchases of a Consumer Panel

Marketing Data Set: Follow-Up to Purchases of a Consumer Panel Marketing Data Set: Follow-Up to Purchases of a Consumer Panel Typologie des consommateurs et Mesure de la loyauté/fidélité Stéphanie Ledauphin-Menard, Sébastien Lê Face aux problèmes de pouvoir d achat

Plus en détail

Fonctions de plusieurs variables

Fonctions de plusieurs variables Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme

Plus en détail

CHAPITRE V. de U U dans Hom(F, F ) est de classe C. b dans Hom(F,F ) est de classe C, l application b b. de U U

CHAPITRE V. de U U dans Hom(F, F ) est de classe C. b dans Hom(F,F ) est de classe C, l application b b. de U U CHAPITRE V FIBRÉS VECTORIELS 1. Fibrés vectoriels 1. Cartes et atlas vectoriels Soit B une variété différentielle. Considérons un B -ensemble, c est à-dire un ensemble M muni d une application p : M B.

Plus en détail

Module A ALGEBRE MATRICIELLE. Prçesentation - Plan

Module A ALGEBRE MATRICIELLE. Prçesentation - Plan Module A ALGEBRE MATRICIELLE Prçesentation - Plan Ce module occupe une place particuliçere dans le dispositif de formation ça la statistique mis en place par le service de Formation Permanente et le dçepartement

Plus en détail

ANALYSE FACTORIELLE MULTIPLE PROCRUSTEENNE

ANALYSE FACTORIELLE MULTIPLE PROCRUSTEENNE ANALYSE FACTORIELLE MULTIPLE PROCRUSTEENNE Elisabeth Morand & Jérôme Pagès Agrocampus Rennes Laboratoire de mathématiques appliquées CS 425 3542 Rennes cedex Résumé Pour comparer deux nuages de points

Plus en détail

Analyse Factorielle multiple et intégration de données. Application à la variabilité de la qualité de viande de porc.

Analyse Factorielle multiple et intégration de données. Application à la variabilité de la qualité de viande de porc. [Statomique] 15 mai 2012 Analyse Factorielle multiple et intégration de données. Application à la variabilité de la qualité de viande de porc. D Laloë & B Salmi Analyses multivariées: - Analyse factorielle

Plus en détail

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes STA108 Enquêtes et sondages Sondages àplusieurs degrés et par grappes Philippe Périé, novembre 2011 Sondages àplusieurs degrés et par grappes Introduction Sondages à plusieurs degrés Tirage des unités

Plus en détail

Objectif du groupe GT1.1 Fusion de Données

Objectif du groupe GT1.1 Fusion de Données Objectif du groupe GT1.1 Fusion de Données Le groupe travaille dans trois directions Le vocabulaire (piloté par ADVITAM et l aide de SITE) L état de l art (piloté par SYROKKO) Deux applications illustratives

Plus en détail

Analyse en Composantes. Principales

Analyse en Composantes. Principales AgroParisTech Analyse en Composantes Principales C Duby, S Robin Table des matières Introduction 3 2 Tableau de données 4 3 Choix d une distance 6 4 Choix de l origine 7 5 Moments d inertie 9 5 Inertie

Plus en détail

F411 - Courbes Paramétrées, Polaires

F411 - Courbes Paramétrées, Polaires 1/43 Courbes Paramétrées Courbes polaires Longueur d un arc, Courbure F411 - Courbes Paramétrées, Polaires Michel Fournié michel.fournie@iut-tlse3.fr http://www.math.univ-toulouse.fr/ fournie/ Année 2012/2013

Plus en détail

Cours d Analyse. Fonctions de plusieurs variables

Cours d Analyse. Fonctions de plusieurs variables Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........

Plus en détail

Analyse de données multidimensionnelles Projet : Les habitations en Banlieue de Boston. 2011-2012 LACHAAL Rafik

Analyse de données multidimensionnelles Projet : Les habitations en Banlieue de Boston. 2011-2012 LACHAAL Rafik Analyse de données multidimensionnelles Projet : Les habitations en Banlieue de Boston 2011-2012 LACHAAL Rafik I. Introduction Les données choisis concernent les logements en banlieue de Boston. Celle-ci

Plus en détail

M4 OSCILLATEUR HARMONIQUE

M4 OSCILLATEUR HARMONIQUE M4 OSCILLATEUR HARMONIQUE I Modèle de l oscillateur harmonique (O.H.) I. Exemples Cf Cours I. Définition Définition : Un oscillateur harmonique à un degré de liberté x (X, θ,... ) est un système physique

Plus en détail

Analyse en Composantes Principales (ACP)

Analyse en Composantes Principales (ACP) 1 Analyse en Composantes Principales (ACP) Analyse en Composantes Principales (ACP) Résumé Méthode factorielle de réduction de dimension pour l exploration statistique de données quantitatives complexes

Plus en détail

1 Diagonalisation des endomorphismes auto-adjoints, en dimension finie

1 Diagonalisation des endomorphismes auto-adjoints, en dimension finie Annette Paugam Diagonalisation des auto-adjoints Applications aux formes quadratiques : Directions principales Applications en Géométrie, en Statistique et en Mécanique Les paragraphes, 2, 3 donnent un

Plus en détail

TP R de Statistiques sur l analyse multivariée: AFC, ACP, CAH, k-means et AFCM

TP R de Statistiques sur l analyse multivariée: AFC, ACP, CAH, k-means et AFCM TP R de Statistiques sur l analyse multivariée: AFC, ACP, CAH, k-means et AFCM Emmanuel Rachelson and Matthieu Vignes 9 octobre 2013, SupAero - ISAE 1 Présidentielles 2008 - AFC Récupérer les données,

Plus en détail

Analyse de données fonctionnelles avec le paquet fda

Analyse de données fonctionnelles avec le paquet fda Analyse de données fonctionnelles avec le paquet fda Christophe Pouzat Jeudi 29 mars 2012 Outline Introduction Des données brutes aux fonctions Analyse de l échantillon de fonctions Sommaire Introduction

Plus en détail

Exercices théoriques

Exercices théoriques École normale supérieure 2008-2009 Département d informatique Algorithmique et Programmation TD n 9 : Programmation Linéaire Avec Solutions Exercices théoriques Rappel : Dual d un programme linéaire cf.

Plus en détail

Statistique Descriptive Multidimensionnelle. (pour les nuls)

Statistique Descriptive Multidimensionnelle. (pour les nuls) Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Multidimensionnelle (pour les nuls) (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219

Plus en détail

COURS DE STATISTIQUES (24h)

COURS DE STATISTIQUES (24h) COURS DE STATISTIQUES (24h) Introduction Statistiques descriptives (4 h) Rappels de Probabilités (4 h) Echantillonnage(4 h) Estimation ponctuelle (6 h) Introduction aux tests (6 h) Qu est-ce que la statistique?

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Analyses statistiques multivariées. Béatrice de Tilière

Analyses statistiques multivariées. Béatrice de Tilière Analyses statistiques multivariées Béatrice de Tilière 23 novembre 2009 ii Table des matières 1 La Statistique 1 1.1 Généralités.................................. 1 1.2 Un peu de vocabulaire............................

Plus en détail

Data Mining : la classification non supervisée

Data Mining : la classification non supervisée Data Mining : la classification non supervisée Clustering : une affaire de distance. Etude préliminaire. Valeurs discrètes. Soient les deux individus suivants correspondant à des séquences ADN : X = AGGGTGGC

Plus en détail

L ACP sous SPSS. À Propos de ce document. Introduction

L ACP sous SPSS. À Propos de ce document. Introduction L ACP sous SPSS À Propos de ce document... Introduction... La démarche à suivre sous SPSS.... «Descriptives».... «Extraction».... «Rotation».... «Scores».... «Options»... Analyse des résultats.... Les

Plus en détail

STAGE. «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques»

STAGE. «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques» STAGE «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques» PROGRAMME DETAILLE Intervenant : PARIS nicolas Cabinet : OPTIMA

Plus en détail

Pour un socle de la licence de MATHEMATIQUES

Pour un socle de la licence de MATHEMATIQUES Pour un socle de la licence de MATHEMATIQUES Société Mathématique de France Société de Mathématiques Appliquées et Industrielles Société Française de Statistique Contexte général Afin d éviter de trop

Plus en détail

Reconnaissance des formes

Reconnaissance des formes Reconnaissance des formes - Chapitre 2 - Analyse en composantes principales Objectifs Contexte : Chaque individu x i du tableau X est considéré comme un point d un espace vectoriel E de dimension p. L

Plus en détail

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 29/01/2007 Stéphane Tufféry - Data Mining - http://data.mining.free.fr

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 29/01/2007 Stéphane Tufféry - Data Mining - http://data.mining.free.fr 1 Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE Plan du cours Qu est-ce que le data mining? À quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data

Plus en détail

COURS DE DATA MINING 6 : MODELISATION NON-SUPERVISEE LES ANALYSES FACTORIELLES

COURS DE DATA MINING 6 : MODELISATION NON-SUPERVISEE LES ANALYSES FACTORIELLES COURS DE DATA MINING 6 : MODELISATION NON-SUPERVISEE LES ANALYSES FACTORIELLES EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 6 : Modélisation non-supervisée

Plus en détail

Cours de Mécanique du point matériel

Cours de Mécanique du point matériel Cours de Mécanique du point matériel SMPC1 Module 1 : Mécanique 1 Session : Automne 2014 Prof. M. EL BAZ Cours de Mécanique du Point matériel Chapitre 1 : Complément Mathématique SMPC1 Chapitre 1: Rappels

Plus en détail

Majeurs et mineurs mis en cause par les services de Police en 2013

Majeurs et mineurs mis en cause par les services de Police en 2013 La criminalité en France Rapport annuel 2014 de l ONDRP Premier ministre Majeurs et mineurs par les services de Police en 2013 Antoine le graët, Chargé d études statistiques à l ONDRP 2 Principaux enseignements

Plus en détail

Séance 1: Analyse en composantes principales

Séance 1: Analyse en composantes principales Séance 1: Analyse en composantes principales Révisions Laboratoire de Statistique et Probabilités UMR 5583 CNRS-UPS www.lsp.ups-tlse.fr/gadat Première partie I Analyse en Composantes Principales Motivations

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

SCI03 - Analyse de données expérimentales

SCI03 - Analyse de données expérimentales SCI03 - Analyse de données expérimentales Introduction à la statistique Thierry Denœux 1 1 Université de Technologie de Compiègne tél : 44 96 tdenoeux@hds.utc.fr Automne 2014 Qu est ce que la statistique?

Plus en détail

Les personnes mises en cause pour crimes et délits non routiers en 2012

Les personnes mises en cause pour crimes et délits non routiers en 2012 2 Les personnes mises en cause pour crimes et délits non routiers en 2012 Informations et rappels Lorsqu une personne au moins est mise en cause pour un fait constaté de crime et délit non routier enregistré

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

ISFA 2 année 2002-2003. Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses.

ISFA 2 année 2002-2003. Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses. On considère la matrice de données : ISFA 2 année 22-23 Les questions sont en grande partie indépendantes Merci d utiliser l espace imparti pour vos réponses > ele JCVGE FM1 GM JCRB FM2 JMLP Paris 61 29

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

Espaces vectoriels et applications

Espaces vectoriels et applications Espaces vectoriels et applications linéaires 1 Définitions On parle d espaces vectoriels sur le corps R ou sur le corps C. Les définitions sont les mêmes en substituant R à C ou vice versa. Définition

Plus en détail

Data Mining : la classification non supervisée

Data Mining : la classification non supervisée Data Mining : la classification non supervisée Clustering : une affaire de distance. Etude préliminaire. Valeurs discrètes. Soient les deux individus suivants correspondant à des séquences ADN : X = AGGGTGGC

Plus en détail

Quelques éléments d algèbre pour l analyse de

Quelques éléments d algèbre pour l analyse de Fiche TD avec le logiciel : tdr80 Quelques éléments d algèbre pour l analyse de données A.B. Dufour, D. Chessel et M. Royer L algèbre matricielle est fondamentale dans la compréhension de la théorie liée

Plus en détail