L analyse en composantes principales

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "L analyse en composantes principales"

Transcription

1 L analyse en composantes principales 1

2 La méthode 1 Les données, les objectifs de la méthode L Analyse en Composantes Principales (ACP) est la méthode adaptée à l exploration synthétique de l information contenue dans un tableau de données Individus Variables Quantitatives. Elle ne s applique directement qu aux variables quantitatives dont les valeurs sont prises sur les mêmes individus. Un tableau de données Individus Variables Quantitatives est un tableau rectangulaire pour lequel chaque case correspond àlavaleur prise par une variable j (en colonnes) pour un individu i (en lignes). 2

3 Les valeurs prises par p variables quantitatives sur n individus sont alors rassemblées dans un tableau X à n lignes et p colonnes : X = x 11 x x 1p x 21 x x 2p x n1 x n2... x np. x ij est la valeur prise par l individu i pour la variable j. 3

4 Exemple : tableau donnant les 11 mesures effectuées sur 150 vins jeunes de la région de Gaillac. Les mesures sont : l extrait sec (g/l), acidité totale, acidité volatile, degré alcoolique du vin... Les vins sont les individus en lignes et les mesures les variables en colonnes. 4

5 L ACP consiste à extraire l essentiel de l information d un tableau X en fournissant à l utilisateur des représentations graphiques adaptées à l interprétation. Il s agit d une méthode exploratoire multidimentionnelle. Cette exploration s articule autour de deux aspects principaux : un analyse de ressemblances entre les individus : par exemple peuton mettre en évidence une typologie des individus? une analyse des liaisons entre les variables : par exemple existe-t-il des groupes de variables corrélées entre elles? 5

6 Ces deux voies ne sont pas indépendantes du fait de la dualité inhérente à l étude d un tableau rectangulaire : on caractérise les classes d individus par l intermédiaire des variables ; on caractérise les groupes de variables liées entre elles par l intermédiaire des individus. 6

7 Nous considérons le cas où tous les individus jouent le même rôle dans l analyse. Ils auront le même poids. Il existe cependant des cas où l on peut souhaiter attribuer des poids différents aux individus. Par exemple lorsque les individus représentent chacun une population. 7

8 2 Exploration et transformation des données Avant de mettre en oeuvre la méthode, il est judicieux d opérer quelques vérifications et transformations sur les variables. les variables sont-elles unimodales symétriques? analyse univariée de statistique descriptive ; analyse bivariée visant à étudier s il y a lieu de transformer les variables pour rendre leurs liaisons linéaires. En effet, leurs liaisons seront décrites dans l analyse par des coefficients de corrélation linéaire. 8

9 Une fois ces éventuelles transformations opérées, on doit centrer les variables du tableau X. L influence des variables dans l analyse se mesure par leur variance. Si les données initiales sont réduites et si nous accordonslemêmepoids à toutes les variables dans l analyse, alors elles auront toutes la même influence. On réduit les variables si elles sont de nature différentes ; par exemple : âge, le salaire, le nombre d enfants..., on estime que leurs influences respectives dans l analyse ne doit pas dépendre de leur variabilité ; notes : une matière ayant une forte variance doit-elle avoir uneinfluence plus grande dans l analyse? 9

10 Nous présentons la méthode de l ACP pour des tableaux de données centrés et réduits. Nous considérons alors le tableau de données Y centré et réduit à partir du tableau de données X. Pour tout i {1,...,n} et tout j {1,...,p}, Y apourélément(i, j) : où x.j = 1 n n x ij et s j = i=1 y ij = x ij x.j s j 1 n n (x ij x.j ) 2. i=1 10

11 3 L espace des individus En termes géométriques, les individus du tableau de données Y correspondent à n points de R p. L ensemble de n individus, appelé nuage des individus, est un nuage des points dans R p. A - Distance entre deux individus Comme nous l avons vu, l un des objectifs de l ACP est de décrire les proximités entre les individus. Nous avons alors besoin de mesurer la similarité de deux individus. Comment mesurer la distance entre deux individus? 11

12 Les variables du tableau Y étant réduites, toutes les variables de Y sont exprimées dans le même ordre de grandeur. La distance d 1 entre deux individus i 1 et i 2 du tableau Y est alors définie comme étant : d 1 (i 1,i 2 )= p (y i1 j y i2 j) 2. j=1 Il s agit de la racine carrée de la somme des écarts des coordonnées des deux individus, c est-à-dire la distance euclidienne de leurs vecteurs lignes associés. 12

13 B - Centre de gravité du nuage des individus Le centre de gravité du nuage des individus associé au tableau de données X est défini comme étant le point moyen de coordonnées (x.1,x.2,...,x.p ). Les variables du tableau Y étant centrées, le centre de gravité du nuage des individus associé au tableau Y est le point de coordonnées (0,...,0). Le barycentre du nuage des individus associé au tableau Y est alors l origine du nuage. 13

14 C - L inertie La variance empirique de la j è m e s v a r i a b l e d u t a b l e a u Y, (y 1j,...,y nj ), est donnée par 1 n (y ij y.j ) 2. n i=1 C est une mesure de sa dispersion unidimentionnelle. L inertie est une mesure de la dispersion multidimentionnelle. L inertie d un tableau de données est définie comme étant la moyenne des carrés des distances entre les individus et centre de gravité du nuage. 14

15 Formellement, In e (Y )= 1 n p j=1 n (y ij y.j ) 2. i=1 Le tableau de données Y étant réduit, nous avons et donc In e (Y )=p. n (y ij y.j ) 2 =1 i=1 15

16 4 L espace des variables En terme géométrique, les variables quantitatives du tableau de données Y correspondent à p points de R n. A - Angle entre deux variables L ensemble de p variables, appelé nuage des variables, est un nuage des points dans R n. Comme nous l avons vu, l un des objectifs de l ACP est d étudier les liaisons entre les variables. Pour ce faire, nous allons munir l espace des variables d une métrique. 16

17 Tous les individus ayant les mêmes poids, la produit scalaire naturel entre deux variables j 1 et j 2 du tableau de données Y est : n y ij1 y ij2. i=1 Les variables du tableau de données Y étant centrées réduites n y ij1 y ij2 est le coefficient de corrélation linéaire entre les i=1 variables j 1 et j 2. Ce coefficient de corrélation n est autre que le cosinus de l angle entre les deux variables. Dans l espace des individus, on s intéresse aux distances entre les individus (points), dans l espace des variables on s intéresse aux corrélations entre les variables (vecteurs) et donc aux angles. 17

18 B-Inertie L inertie la même que pour le nuage des individus. Elle est égale à p (nombre de variables) lorsque ces dernières sont réduites 18

19 5 Réduction de dimension dans l espace des individus L un des objectifs de l ACP est de décrire les proximités entre les individus. Le nuage des individus du tableau de données Y est dans un espace de dimension p. Si p =2,pourvisualisercesproximités,onvaanalyserlenuagede points entre les 2 variables. Si p =3,onpeutessayerd analyserlenuagedesindividus,endimension 3, et les nuages de points des variables deux à deux. Si p 4, on ne peut pas visualiser le nuages des individus, c est inaccessible à notre intuition. Aussi, analyser les nuages des variables deux à deux ne permet pas une interprétation claire et une vision synthétique. 19

20 Le principe de l ACP dans l espace des individus est d obtenir une représentation approchée du nuages des individus dans un sous-espace de dimension faible. On obtient de nouvelles dimensions. Ainsi, si l on ne retient parmi ces nouvelles dimensions que les deux ou trois dimensions qui contiennent le plus d information, il est alors éventuellement possible de représenter les données de manières synthétique sans perdre trop d information. 20

21 La réduction du nombre de variables ne se fait pas par une simple sélection de certaines d entre elles. Elle se fait par la construction de nouvelles variables synthétiques, appelées composantes principales, obtenues en combinant linéairement les variables initiales. L analyse en composantes principale dans l espace des individus est une méthode factorielle linéaire. 21

22 A - Recherche des axes factoriels Nous cherchons un sous-espace vectoriel F k de dimension k de R p maximisant l inertie du nuage des individus projeté sur ce sous-espace e t contenant l origine. On cherche à maximiser la moyenne des carrées des distances entreles projections et l origine. Du fait du centrage, les axes factoriels peuvent être interprétés comme des directions d allongement maximum du nuage des individus. On parle aussi de principaux facteurs de variabilité 22

23 La matrice symétrique Y Y est diagonalisable et admet une base orthonormée de vecteurs propres. Solution du problème : Pour tout k {1,...,p},lesous-espaceF k de dimension k est engendré par les k vecteurs propres de la matrice Y Y associés aux k plus grandes valeurs propres. Le premier axe factoriel est le vecteur propre de la matrice Y Y associé à l a p l u s g r a n d e v a l e u r p r o p r e d e Y Y. 23

24 Le deuxième axe factoriel est orthogonal au premier axe factoriel, et il s agit du vecteur propre associé à la deuxième plus grande valeur propre de Y Y... On peut montrer que les axes factoriels rendent minimum l écart entre le nuage des individus est sa projection. Aussi, on peut montrer que la moyenne des carrées des distances entre les projections doit être la plus grande possible. Les distances ne peuvent que diminuer en projection. Les axes factoriels apparaissent alors comme les directions tellesque les distances entre les individus projetés ressemblent le plus possible aux distances entre les individus du nuage. 24

25 6 - Réduction de dimension dans l espace des variables Le deuxième objectif de l analyse en composantes principales consiste à analyser les liaisons entre les variables. A - Recherche des axes factoriels Pour obtenir une suite de variables synthétiques et une représentation approchée des corrélations entre les variables, l ACP applique au nuage des variables la même démarche qu aux nuage des individus. Le critère de l inertie projetée maximum pour choisir les axes est exactement le même. 25

26 le nuage des variables n est pas centré ; tous les vecteurs sont situés sur le sphère unité. ce sont les angles entre les variables qui sont peu déformés parles projections et non pas les distances entre les coordonnées des variables. En outre, les variables étant centrées réduites leur projection sur un axe factoriel est égal à leur coefficient de corrélation avec cette variable. 26

27 On recherche en fait les combinaisons linéaires les plus lié e s à l e n - semble des variables. Les axes factoriels étant orthogonaux deux à deux, on met en évidence une suite de variables synthétiques, appelées composantes principales. Elles sont non corrélées entre elles et résument l ensemble des variables initiales. 27

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali LUISS, Libera Università Internazionale degli Studi Sociali Université Paris 13 Laboratoire Analyse, Géométrie et Applications UMR 7539 GOUTTE Analyse Statistique des Données Cours 4 Master 2 EID goutte@math.univ-paris13.fr

Plus en détail

Introduction à l analyse des données. Analyse des Données (1) Exemple, ville et (in)sécurité. Exemple, ville et (in)sécurité

Introduction à l analyse des données. Analyse des Données (1) Exemple, ville et (in)sécurité. Exemple, ville et (in)sécurité Introduction à l analyse des données Analyse des Données () Le but de l analyse de données est de synthétiser, structurer l information contenue dans des données multidimensionnelles Deux groupes de méthodes

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Analyse de Données. Analyse en Composantes Principales (ACP)

Analyse de Données. Analyse en Composantes Principales (ACP) Analyse de Données Analyse en Composantes Principales (ACP) Analyse en composantes principales (ACP) ** Sur toute la fiche, on notera M' la transposée de M. Cadre de travail : On a des données statistiques

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Plan du cours Analyse en Composantes Principales Introduction Les données Leurs représentations La méthode Modèle Interprétation statistique Espace principal Composantes Principales Représentations Graphiques

Plus en détail

Analyse en composantes principales

Analyse en composantes principales Université de Rennes 2 Statistiques des données M1-GEO Ouvrages recommandés Analyse en composantes principales Ces livres sont à la BU. Pour les acheter, venir au bureau A-240 ou envoyer un mail : nicolas.jegou@uhb.fr

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées

Plus en détail

Analyse de données. [Tapez le sous-titre du document] ANALYSE DE DONNEES 2011 2012. ANALYSE DE DONNEES Page 1 LICENCE 3 SCIENCES ECONOMIQUES

Analyse de données. [Tapez le sous-titre du document] ANALYSE DE DONNEES 2011 2012. ANALYSE DE DONNEES Page 1 LICENCE 3 SCIENCES ECONOMIQUES 2011 2012 ANALYSE DE DONNEES 2011 2012 LICENCE 3 SCIENCES ECONOMIQUES COURS DE M. THIERRY BLAYAC Analyse de données [Tapez le sous-titre du document] ANALYSE DE DONNEES Page 1 H34VEN Cours pour Licence

Plus en détail

Cours 2-3 Analyse des données multivariées

Cours 2-3 Analyse des données multivariées Cours 2-3 des données s Ismaël Castillo École des Ponts, 13 Novembre 2012 Plan 1 2 3 4 1. On s intéresse à un jeu de données multi-dimensionel, avec n individus observés et p variables d intérêt ( variables

Plus en détail

PAD - Notes de cours. S. Rigal, D. Ruiz, et J. C. Satgé

PAD - Notes de cours. S. Rigal, D. Ruiz, et J. C. Satgé ALGÈBRE PAD - Notes de cours S. Rigal, D. Ruiz, et J. C. Satgé November 23, 2006 Table des Matières Espaces vectoriels Applications linéaires - Espaces vectoriels............................... 3 -. Approche

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Statistique Descriptive Multidimensionnelle. (pour les nuls)

Statistique Descriptive Multidimensionnelle. (pour les nuls) Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Multidimensionnelle (pour les nuls) (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219

Plus en détail

Partie I. Les données quantitatives

Partie I. Les données quantitatives Variables quantitatives : analyse en composantes principales Jean-Marc Lasgouttes https://whorocqinriafr/jean-marclasgouttes/ana-donnees/ Partie I Les données quantitatives Description de données quantitatives

Plus en détail

CH1 : Introduction à l Analyse Des Données (ADD) B- Les données et leurs caractéristiques C- Grandeurs associées aux données

CH1 : Introduction à l Analyse Des Données (ADD) B- Les données et leurs caractéristiques C- Grandeurs associées aux données CH1 : Introduction à l Analyse Des Données (ADD) A- Introduction A- Introduction B- Les données et leurs caractéristiques C- Grandeurs associées aux données A-1 Les méthodes Lors de toute étude statistique,

Plus en détail

L3 Géographie UE Méthodologie. Statistiques COURS 1. Salle 125. Intervenants : Nadège. UMR Centre de Recherches de Climatologie (CRC)

L3 Géographie UE Méthodologie. Statistiques COURS 1. Salle 125. Intervenants : Nadège. UMR Centre de Recherches de Climatologie (CRC) L3 Géographie UE Méthodologie Statistiques COURS 1 Salle 125 Intervenants : Nadège Martiny & Julien Crétat UFR Sciences Humaines (Département de Géographie) UMR Centre de Recherches de Climatologie (CRC)

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

Analyse simultanée de variables quantitatives et qualitatives. à l aide de l analyse factorielle multiple

Analyse simultanée de variables quantitatives et qualitatives. à l aide de l analyse factorielle multiple Analyse simultanée de variables quantitatives et qualitatives à l aide de l analyse factorielle multiple Jérôme Pagès Laboratoire de mathématiques appliquées Agrocampus France Analyse Factorielle Multiple

Plus en détail

Chapitre 9 ANALYSE MULTIDIMENSIONNELLE

Chapitre 9 ANALYSE MULTIDIMENSIONNELLE Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 9 ANALYSE MULTIDIMENSIONNELLE L analyse des données multidimensionnelles regroupe un ensemble de méthodes

Plus en détail

Analyse factorielle des correspondances de Benzécri

Analyse factorielle des correspondances de Benzécri Analyse factorielle des correspondances de Benzécri One Pager Décembre 2013 Vol. 8 Num. 011 Copyright Laréq 2013 http://www.lareq.com Analyse Factorielle des Correspondances de Benzécri Une illustration

Plus en détail

3. ACM Analyse des Correspondances Multiples

3. ACM Analyse des Correspondances Multiples 3. ACM Analyse des Correspondances Multiples Analyse des Correspondances Multiples - ACM 1 Plan 1. Exemples, problématique 2. Le tableau de données étudié 3. Principe d une ACM 4. L ajustement des deux

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

Analyse discriminante

Analyse discriminante Analyse discriminante Christine Decaestecker & Marco Saerens ULB & UCL LINF2275 1 Analyse Discriminante Particularités: 2 formes/utilisations complémentaires: méthode factorielle: description "géométrique"

Plus en détail

1 Diagonalisation des endomorphismes auto-adjoints, en dimension finie

1 Diagonalisation des endomorphismes auto-adjoints, en dimension finie Annette Paugam Diagonalisation des auto-adjoints Applications aux formes quadratiques : Directions principales Applications en Géométrie, en Statistique et en Mécanique Les paragraphes, 2, 3 donnent un

Plus en détail

Calcul Matriciel. Chapitre 10. 10.1 Qu est-ce qu une matrice? 10.2 Indexation des coefficients. 10.3 Exemples de matrices carrées.

Calcul Matriciel. Chapitre 10. 10.1 Qu est-ce qu une matrice? 10.2 Indexation des coefficients. 10.3 Exemples de matrices carrées. Chapitre 10 Calcul Matriciel 101 Qu est-ce qu une matrice? Définition : Soit K un ensemble de nombres exemples, K = N, Z, Q, R, C, n, p N On appelle matrice à n lignes et p colonnes la données de np nombres

Plus en détail

Cours de Statistiques

Cours de Statistiques Cours de Statistiques Romain Raveaux 1 1 Laboratoire L3I Université de La Rochelle romain.raveaux01 at univ-lr.fr Octobre 24-11, 2008 1 / 35 Sommaire 1 Quelques Rappels 2 numériques Relations entre deux

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h I.U.T de Caen STID 2ème année Département STID Année Universitaire 2002-2003 Responsable de cours : Alain LUCAS Seule la calculatrice type collège est autorisée. Seul le cours est autorisé. On rappelera

Plus en détail

Master Modélisation Statistique M2 Finance - chapitre 1. Gestion optimale de portefeuille, l approche de Markowitz

Master Modélisation Statistique M2 Finance - chapitre 1. Gestion optimale de portefeuille, l approche de Markowitz Master Modélisation Statistique M2 Finance - chapitre 1 Gestion optimale de portefeuille, l approche de Markowitz Clément Dombry, Laboratoire de Mathématiques de Besançon, Université de Franche-Comté.

Plus en détail

ANALYSE FACTORIELLE MULTIPLE PROCRUSTEENNE

ANALYSE FACTORIELLE MULTIPLE PROCRUSTEENNE ANALYSE FACTORIELLE MULTIPLE PROCRUSTEENNE Elisabeth Morand & Jérôme Pagès Agrocampus Rennes Laboratoire de mathématiques appliquées CS 425 3542 Rennes cedex Résumé Pour comparer deux nuages de points

Plus en détail

Analyses statistiques multivariées. Béatrice de Tilière

Analyses statistiques multivariées. Béatrice de Tilière Analyses statistiques multivariées Béatrice de Tilière 23 novembre 2009 ii Table des matières 1 La Statistique 1 1.1 Généralités.................................. 1 1.2 Un peu de vocabulaire............................

Plus en détail

ANALYSE BIVARIÉE DE VARIABLES QUALITATIVES LE TEST DU Chi2

ANALYSE BIVARIÉE DE VARIABLES QUALITATIVES LE TEST DU Chi2 ANALYSE BIVARIÉE DE VARIABLES QUALITATIVES LE TEST DU Chi2 Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

1 Fiche méthodologique Passage d un mode de représentation d un sev à l autre

1 Fiche méthodologique Passage d un mode de représentation d un sev à l autre 1 Fiche méthodologique Passage d un mode de représentation d un sev à l autre BCPST Lycée Hoche $\ CC BY: Pelletier Sylvain Les deux modes de représentation des sous-espaces vectoriels Il existe deux modes

Plus en détail

Année 2011-2012. Biostatistiques. Rappels de cours et travaux dirigés. Analyse des données M2. jean-marc.labatte@univ-angers.

Année 2011-2012. Biostatistiques. Rappels de cours et travaux dirigés. Analyse des données M2. jean-marc.labatte@univ-angers. Année 2011-2012 Biostatistiques Rappels de cours et travaux dirigés Analyse des données M2 auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr - 1 - Table des matières SOMMAIRE VIII ANALYSE EN

Plus en détail

Partie II. Supplémentaires d un sous-espace donné. Partie I. Partie III. Supplémentaire commun. MPSI B 8 octobre 2015

Partie II. Supplémentaires d un sous-espace donné. Partie I. Partie III. Supplémentaire commun. MPSI B 8 octobre 2015 Énoncé Dans tout le problème, K est un sous-corps de C. On utilisera en particulier que K n est pas un ensemble fini. Tous les espaces vectoriels considérés sont des K espaces vectoriels de dimension finie.

Plus en détail

Recherche opérationnelle. Programmation linéaire et recherche opérationnelle. Programmation linéaire. Des problèmes de RO que vous savez résoudre

Recherche opérationnelle. Programmation linéaire et recherche opérationnelle. Programmation linéaire. Des problèmes de RO que vous savez résoudre Recherche opérationnelle Programmation linéaire et recherche opérationnelle Ioan Todinca Ioan.Todinca@univ-orleans.fr tél. 0 38 41 7 93 bureau : en bas à gauche Tentative de définition Ensemble de méthodes

Plus en détail

Introduction. Préambule. Le contexte

Introduction. Préambule. Le contexte Préambule... INTRODUCTION... BREF HISTORIQUE DE L ACP... 4 DOMAINE D'APPLICATION... 5 INTERPRETATIONS GEOMETRIQUES... 6 a - Pour les n individus... 6 b - Pour les p variables... 7 c - Notion d éléments

Plus en détail

L'analyse des données à l usage des non mathématiciens

L'analyse des données à l usage des non mathématiciens Montpellier L'analyse des données à l usage des non mathématiciens 2 ème Partie: L'analyse en composantes principales AGRO.M - INRA - Formation Permanente Janvier 2006 André Bouchier Analyses multivariés.

Plus en détail

Par contre, lorsque P est finie, l inclusion f(p ) P implique l égalité f(p ) = P car, f

Par contre, lorsque P est finie, l inclusion f(p ) P implique l égalité f(p ) = P car, f Université Lyon 1 Algèbre générale S.P. Groupes III I. Groupe symétrique et géométrie. On se donne un ensemble E (souvent un espace euclidien ou une partie de cet espace) et une bijection f : E E (souvent

Plus en détail

ACP Voitures 1- Méthode

ACP Voitures 1- Méthode acp=princomp(voit,cor=t) ACP Voitures 1- Méthode Call: princomp(x = voit, cor = T) Standard deviations: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 2.1577815 0.9566721 0.4903373 0.3204833 0.2542759 0.1447788

Plus en détail

Programme de mathématiques TSI1

Programme de mathématiques TSI1 Programme de mathématiques TSI1 1. PROGRAMME DE DÉBUT D ANNÉE I. Nombres complexes et géométrie élémentaire 1. Nombres complexes 1 2. Géométrie élémentaire du plan 3 3. Géométrie élémentaire de l espace

Plus en détail

Analyse en Composantes Principales (ACP)

Analyse en Composantes Principales (ACP) 1 Analyse en Composantes Principales (ACP) Analyse en Composantes Principales (ACP) Résumé Méthode factorielle de réduction de dimension pour l exploration statistique de données quantitatives complexes

Plus en détail

6.11 Bases de Lanczos bi-orthogonales pour des matrices non symétriques

6.11 Bases de Lanczos bi-orthogonales pour des matrices non symétriques Chapitre 6 Méthodes de Krylov 611 Bases de Lanczos bi-orthogonales pour des matrices non symétriques Dans le cas où la matrice A n est pas symétrique, comment peut-on retrouver une matrice de corrélation

Plus en détail

Aide mémoire d analyse de données

Aide mémoire d analyse de données Aide mémoire d analyse de données B. Rousselet et J.P. Labrousse 21 novembre 2007 Laboratoire de Mathématiques, Parc Valrose, F 06108 Nice, Cédex 2, email : br@math.unice.fr 1 Table des matières 1 Orientation

Plus en détail

Document créé le 27 novembre 2013 Lien vers la dernière mise à jour de ce document Lien vers les exercices de ce chapitre

Document créé le 27 novembre 2013 Lien vers la dernière mise à jour de ce document Lien vers les exercices de ce chapitre Document créé le 27 novembre 2013 Lien vers la dernière mise à jour de ce document Lien vers les exercices de ce chapitre Chapitre 17 Matrices et applications linéaires Sommaire 171 Matrices et applications

Plus en détail

2. MATRICES ET APPLICATIONS LINÉAIRES

2. MATRICES ET APPLICATIONS LINÉAIRES 2. MATRICES ET APPLICATIONS LINÉAIRES 2.1 Définition Une matrice n m est un tableau rectangulaire de nombres (réels en général) à n lignes et m colonnes ; n et m sont les dimensions de la matrice. Notation.

Plus en détail

1 Notion d espace vectoriel

1 Notion d espace vectoriel Arnaud de Saint Julien - MPSI Lycée La Merci 2014-2015 1 Résumé de cours sur les espaces vectoriels et les applications linéaires Les vecteurs du plan, les nombres réels, et les polynômes à coefficients

Plus en détail

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques.

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques. L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques 1 BUTS DU COURS : se familiariser avec le vocabulaire statistique o variable dépendante, variable indépendante o statistique descriptive,

Plus en détail

Recherche Opérationnelle 1A Programmation Linéaire Résolution d un Programme Linéaire Introduction

Recherche Opérationnelle 1A Programmation Linéaire Résolution d un Programme Linéaire Introduction Recherche Opérationnelle 1A Programmation Linéaire Résolution d un Programme Linéaire Introduction Zoltán Szigeti Ensimag April 4, 2015 Z. Szigeti (Ensimag) RO 1A April 4, 2015 1 / 16 Forme Générale Définition

Plus en détail

Analyse des données Master Statistique et économétrie Notes de cours. V. Monbet

Analyse des données Master Statistique et économétrie Notes de cours. V. Monbet Analyse des données Master Statistique et économétrie Notes de cours V. Monbet Master 1-2013-2014 Table des matières 1 Introduction 5 2 Rappels et compléments d algèbre linéaire Décompositions de matrices

Plus en détail

Exercices Corrigés Premières notions sur les espaces vectoriels

Exercices Corrigés Premières notions sur les espaces vectoriels Exercices Corrigés Premières notions sur les espaces vectoriels Exercice 1 On considére le sous-espace vectoriel F de R formé des solutions du système suivant : x1 x 2 x 3 + 2x = 0 E 1 x 1 + 2x 2 + x 3

Plus en détail

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation

Plus en détail

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 29/01/2007 Stéphane Tufféry - Data Mining - http://data.mining.free.fr

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 29/01/2007 Stéphane Tufféry - Data Mining - http://data.mining.free.fr 1 Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE Plan du cours Qu est-ce que le data mining? À quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data

Plus en détail

Épreuve pratique de mathématiques Printemps 2009. Descriptifs. (Page vide)

Épreuve pratique de mathématiques Printemps 2009. Descriptifs. (Page vide) Épreuve pratique de mathématiques Printemps 2009 Descriptifs (Page vide) Sujet 001 Épreuve pratique de mathématiques Descriptif Étude d une fonction dépendant d un paramètre Étant donné une fonction dépendant

Plus en détail

Formulaire de maths Algèbre linéaire et multilinéaire

Formulaire de maths Algèbre linéaire et multilinéaire Formulaire de maths Algèbre linéaire et multilinéaire Nom Formule Espaces vectoriels Famille libre On dit que la famille est libre si Famille liée On dit que la famille est liée si Théorème de la base

Plus en détail

Cours 7 ANALYSE EN COMPOSANTES PRINCIPALES (ACP) Master 2 2005/2006

Cours 7 ANALYSE EN COMPOSANTES PRINCIPALES (ACP) Master 2 2005/2006 Cours 7 ANALYSE EN COMPOSANTES PRINCIPALES (ACP) Master 2 2005/2006 . Les données NOMS PUISS CYLI Co uple Ma xi LONG LARG H AUT COFFRE RESE POIDS VITE CONS ALF 47,9 JTD Distinctive 5 90 28 4,7,73,44 280

Plus en détail

INTÉGRATION SUR LES SURFACES. Le but de ce texte est d expliquer comment définir et calculer des expressions du type

INTÉGRATION SUR LES SURFACES. Le but de ce texte est d expliquer comment définir et calculer des expressions du type INTÉGRATION SUR LES SURFACES Le but de ce texte est d expliquer comment définir et calculer des expressions du type φ(x)dσ(x) Σ où Σ est une surface de classe C 1 de R 3 ou plus généralement une hypersurface

Plus en détail

Le Sphinx Millenium Modes opératoires d'analyse de données Traitements et analyses avec Le Sphinx Plus²

Le Sphinx Millenium Modes opératoires d'analyse de données Traitements et analyses avec Le Sphinx Plus² Le Sphinx Millenium Modes opératoires d'analyse de données Traitements et analyses avec Le Sphinx Plus² Le Sphinx Développement Parc Altaïs 74650 CHAVANOD Tél : 33 / 4.50.69.82.98. Fax : 33 / 4.50.69.82.78.

Plus en détail

L'analyse de données. Polycopié de cours ENSIETA - Réf. : 1463. Arnaud MARTIN

L'analyse de données. Polycopié de cours ENSIETA - Réf. : 1463. Arnaud MARTIN L'analyse de données Polycopié de cours ENSIETA - Réf : 1463 Arnaud MARTIN Septembre 2004 Table des matières 1 Introduction 1 11 Domaines d'application 2 12 Les données 2 13 Les objectifs 3 14 Les méthodes

Plus en détail

Clustering. Christine Decaestecker, ULB Marco Saerens, UCL. LINF2275 Clustering 1

Clustering. Christine Decaestecker, ULB Marco Saerens, UCL. LINF2275 Clustering 1 Clustering Christine Decaestecker, ULB Marco Saerens, UCL LINF75 Clustering 1 Classification non-supervisée (automatique) Méthodes de regroupement ("Clustering") Objectif : Sur base - soit d'un tableau

Plus en détail

Programmation linéaire

Programmation linéaire 1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit

Plus en détail

PEUT-ON «VOIR» DANS L ESPACE À N DIMENSIONS?

PEUT-ON «VOIR» DANS L ESPACE À N DIMENSIONS? PEUT-ON «VOIR» DANS L ESPACE À N DIMENSIONS? Pierre Baumann, Michel Émery Résumé : Comment une propriété évidente visuellement en dimensions deux et trois s étend-elle aux autres dimensions? Voici une

Plus en détail

C) Fiche : Espaces vectoriels.

C) Fiche : Espaces vectoriels. C) Fiche : Espaces vectoriels. 1) Définition d'un espace vectoriel. K= I ou est le corps des scalaires. E est un K-espace I vectoriel si et seulement si : C'est un ensemble non vide muni de deux opérations,

Plus en détail

1.3 Produit matriciel

1.3 Produit matriciel MATRICES Dans tout ce chapitre, K désigne les corps R ou C, p et n des entiers naturels non nuls 1 Matrices à coefficients dans K 11 Définition Définition 11 Matrice On appelle matrice à coefficients dans

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Initiation à l analyse en composantes principales

Initiation à l analyse en composantes principales Fiche TD avec le logiciel : tdr1103 Initiation à l analyse en composantes principales A.B. Dufour & D. Clot Une première approche très intuitive et interactive de l ACP. Table des matières 1 Introduction

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Cours d Analyse. Fonctions de plusieurs variables

Cours d Analyse. Fonctions de plusieurs variables Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........

Plus en détail

Espaces vectoriels. par Pierre Veuillez

Espaces vectoriels. par Pierre Veuillez Espaces vectoriels par Pierre Veuillez 1 Objectifs : Disposer d un lieu où les opérations + et se comportent bien. Déterminer des bases (utilisation de la dimension) Représenter les vecteurs grace à leurs

Plus en détail

STATISTIQUES ET PROBABILITÉS. Université du Littoral - Côte d Opale Laurent SMOCH. Janvier 2013

STATISTIQUES ET PROBABILITÉS. Université du Littoral - Côte d Opale Laurent SMOCH. Janvier 2013 ISCID-CO - PRÉPA 1ère année STATISTIQUES ET PROBABILITÉS Université du Littoral - Côte d Opale Laurent SMOCH Janvier 2013 Laboratoire de Mathématiques Pures et Appliquées Joseph Liouville Université du

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Applications des nombres complexes à la géométrie

Applications des nombres complexes à la géométrie Chapitre 6 Applications des nombres complexes à la géométrie 6.1 Le plan complexe Le corps C des nombres complexes est un espace vectoriel de dimension 2 sur R. Il est donc muni d une structure naturelle

Plus en détail

Université Joseph Fourier MAT231 2008-2009

Université Joseph Fourier MAT231 2008-2009 Université Joseph Fourier MAT231 2008-2009 mat231-exo-03.tex (29 septembre 2008) Feuille d exercices n o 3 Exercice 3.1 Soit K un corps commutatif et soit {P 0, P 1,... P n } une famille de polynômes de

Plus en détail

Outils d analyse fonctionnelle Cours 5 Théorie spectrale

Outils d analyse fonctionnelle Cours 5 Théorie spectrale Outils d analyse fonctionnelle Cours 5 Théorie spectrale 22 septembre 2015 Généralités Dans tout ce qui suit V désigne un espace de Hilbert réel muni d un produit scalaire x, y. Définition Soit A une application

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Université de Thessalie Département d Aménagement, D Urbanisme et Développement Régional

Université de Thessalie Département d Aménagement, D Urbanisme et Développement Régional Université de Thessalie Département d Aménagement, D Urbanisme et Développement Régional Enseignant : As. Pr. Marie-Noelle Duquenne I. Les Méthodes factorielles La question traitée dans ce document porte

Plus en détail

Marketing Data Set: Follow-Up to Purchases of a Consumer Panel

Marketing Data Set: Follow-Up to Purchases of a Consumer Panel Marketing Data Set: Follow-Up to Purchases of a Consumer Panel Typologie des consommateurs et Mesure de la loyauté/fidélité Stéphanie Ledauphin-Menard, Sébastien Lê Face aux problèmes de pouvoir d achat

Plus en détail

Analyse des correspondances avec colonne de référence

Analyse des correspondances avec colonne de référence ADE-4 Analyse des correspondances avec colonne de référence Résumé Quand une table de contingence contient une colonne de poids très élevé, cette colonne peut servir de point de référence. La distribution

Plus en détail

Introduction à l analyse des correspondances et à la classification

Introduction à l analyse des correspondances et à la classification Introduction à l analyse des correspondances et à la classification Bertrand Iooss Véronique Verrier EDF R&D Département Management des Risques Industriels Cours IUP SID Toulouse - M1-17/10/2011 14/10/2011

Plus en détail

L'analyse des correspondances simples

L'analyse des correspondances simples L'analyse des correspondances simples Julie Josse Cours d'analyse des données multidimensionnelles - AGROCAMPUS OUEST 23 novembre 2010 1 / 38 Cadre général Plusieurs types de tableau : Analyse en Composantes

Plus en détail

Enjeux mathématiques et Statistiques du Big Data

Enjeux mathématiques et Statistiques du Big Data Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris

Plus en détail

Doctorat en économique. Examen de synthèse en Théorie micro-économique 8 août 2011. Durée : 4 heures exactement

Doctorat en économique. Examen de synthèse en Théorie micro-économique 8 août 2011. Durée : 4 heures exactement Département d économie agroalimentaire et des sciences de la consommation Département d économique Université Laval NOM: Doctorat en économique Examen de synthèse en Théorie micro-économique 8 août 211

Plus en détail

La régression logistique PLS

La régression logistique PLS La régression logistique PLS Michel Tenenhaus Groupe HEC, 78351 Jouy-en-Josas 1 Introduction La régression PLS permet de relier une ou plusieurs variables de réponse y àun ensemble de variables prédictives

Plus en détail

HENRI ROUDIER ALGEBRE LINEAIRE COURS & EXERCICES CAPES &AGRÉGATION INTERNES & EXTERNES DEUXIÈME ÉDITION REVUE &.AUGMENTÉE VUIBERT

HENRI ROUDIER ALGEBRE LINEAIRE COURS & EXERCICES CAPES &AGRÉGATION INTERNES & EXTERNES DEUXIÈME ÉDITION REVUE &.AUGMENTÉE VUIBERT HENRI ROUDIER ALGEBRE LINEAIRE COURS & EXERCICES CAPES &AGRÉGATION INTERNES & EXTERNES DEUXIÈME ÉDITION REVUE &.AUGMENTÉE VUIBERT Table analytique des matières 1. La structure d'espace vectoriel 1. Espaces

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. 1 Définitions, notations Calcul matriciel Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. On utilise aussi la notation m n pour le

Plus en détail

Analyse de données et classification bayésienne

Analyse de données et classification bayésienne Parcours OMIS - 3A - École Centrale Marseille Module Informatique Décisionelle Analyse de données et classification bayésienne Stéphane DERRODE stephane.derrode@centrale-marseille.fr Version.1 - Novembre

Plus en détail

Programmation linéaire

Programmation linéaire Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire

Plus en détail

Fiche Méthode 11 : Noyaux et images.

Fiche Méthode 11 : Noyaux et images. Fiche Méthode 11 : Noyaux et images. On se place dans un espace vectoriel E de dimension finie n, muni d une base B = ( e 1,..., e n ). f désignera un endomorphisme de E 1 et A la matrice de f dans la

Plus en détail

Analyse des Données. Travaux Pratiques 3

Analyse des Données. Travaux Pratiques 3 Analyse des Données Travaux Pratiques 3 1 Introduction Ce TP sera consacré aux analyses factorielles. La première partie présentera un exemple réel (et poussé) d une analyse factorielle des correspondances

Plus en détail

Glossaire Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspondances (AFC) Apprentissage supervisé Apprentissage non supervisé

Glossaire Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspondances (AFC) Apprentissage supervisé Apprentissage non supervisé Glossaire Analyse en Composantes Principales (ACP) : *méthode factorielle (Pearson 1901, Hotelling 1933) permettant de fournir un résumé descriptif (sous forme graphique le plus souvent) d une population

Plus en détail

ANALYSE FACTORIELLE DE DONNÉES MIXTES : PRINCIPE ET

ANALYSE FACTORIELLE DE DONNÉES MIXTES : PRINCIPE ET ANALYSE FACTORIELLE DE DONNÉES MIXTES : PRINCIPE ET EXEMPLE D APPLICATION Jérôme Pagès Laboratoire de mathématiques appliquées Agrocampus, 35042 Rennes cedex email : pages@agrorennes.educagri.fr Résumé

Plus en détail

Rappels sur les applications linéaires

Rappels sur les applications linéaires Rappels sur les applications linéaires 1 Définition d une application linéaire Définition 1 Soient E et F deux espaces vectoriels sur un même corps K et f une application de E dans F Dire que f est linéaire

Plus en détail

I. Polynômes de Tchebychev

I. Polynômes de Tchebychev Première épreuve CCP filière MP I. Polynômes de Tchebychev ( ) 1.a) Tout réel θ vérifie cos(nθ) = Re ((cos θ + i sin θ) n ) = Re Cn k (cos θ) n k i k (sin θ) k Or i k est réel quand k est pair et imaginaire

Plus en détail

Bref, c'est difficile, mais tout le monde doit y arriver.

Bref, c'est difficile, mais tout le monde doit y arriver. Bonjour à tous, les colles de mardi m'ont permis de vérifier que les notions de base du chapitre espaces vectoriels sont loin d'être acquises. Comme je vous le disais, il est essentiel d'apprendre régulièrement

Plus en détail

1 Définition. 2 Modélisation des actions mécaniques. On appelle action mécanique toute cause susceptible de : - maintenir un corps au repos

1 Définition. 2 Modélisation des actions mécaniques. On appelle action mécanique toute cause susceptible de : - maintenir un corps au repos 1 Définition On appelle action mécanique toute cause susceptible de : - maintenir un corps au repos - créer ou modifier un mouvement - déformer un corps odélisation des actions mécaniques.1. Notion de

Plus en détail

Cours 5: Exemples d application www.enseeiht.fr/~gergaud/teaching

Cours 5: Exemples d application www.enseeiht.fr/~gergaud/teaching Cours 5: Exemples d application www.enseeiht.fr/~gergaud/teaching Joseph Gergaud 30 novembre 5 Exemples d application 1/ 25 1 Inertie Variables Individus Calculs 2 ACP Variables nominales supplémentaires

Plus en détail

Initiation à l analyse en composantes principales

Initiation à l analyse en composantes principales Fiche TD avec le logiciel : tdr601 Initiation à l analyse en composantes principales A.B. Dufour & J.R. Lobry Une première approche très intuitive et interactive de l ACP. Centrage et réduction des données.

Plus en détail

Analyse en Composantes Principales (avec SPAD) Classification Ascendante Hiérarchique

Analyse en Composantes Principales (avec SPAD) Classification Ascendante Hiérarchique Analyse en Composantes Principales (avec SPAD) et Classification Ascendante Hiérarchique Michel Tenenhaus 1 Peinture représentant un étang (Tombeau de Thèbes, 1400 av. J.-C.) extrait de l Histoire de l

Plus en détail