ANALYSE FACTORIELLE DE DONNÉES MIXTES : PRINCIPE ET

Dimension: px
Commencer à balayer dès la page:

Download "ANALYSE FACTORIELLE DE DONNÉES MIXTES : PRINCIPE ET"

Transcription

1 ANALYSE FACTORIELLE DE DONNÉES MIXTES : PRINCIPE ET EXEMPLE D APPLICATION Jérôme Pagès Laboratoire de mathématiques appliquées Agrocampus, Rennes cedex Résumé Une méthodologie factorielle permettant d inclure à la fois des variables quantitatives et qualitatives en tant qu éléments actifs d une même analyse a été proposée par B. Escofier en 1979 dans le cadre de l analyse des correspondances multiples. De son côté, Saporta a esquissé en 1990 une méthodologie ayant le même objectif mais dans le cadre de l analyse en composantes principales. Enfin, la pratique de l analyse factorielle multiple (AFM) suggère la possibilité de mettre en œuvre une AFM sur des données mixtes en considérant chaque variable, quantitative ou qualitative, comme un groupe d une seule variable. On peut montrer que ces trois approches conduisent aux même résultats. L ensemble de ces trois points de vue confère à la méthode proposée initiallement par B. Escofier le statut d une méthode à part entière : l Analyse Factorielle de Données Mixtes (AFDM). Cette communication présente le principe de l AFDM et une application illustrant la façon dont elle équilibre l influence des différents types de variables. Mots-clés : Analyse ou composantes principales, analyse des correspondances multiples, analyse factorielle multiple, données mixtes. Summary In the framework of multiple correspondences analysis, B. Escofier (1979a) proposed a factor analysis in which both quantitative and qualitative variables can intervene as active ones. This approach is equivalent to the one outlined by Saporta (1990) in the principal components analysis framework and to a multiple factor analysis (MFA ; Escofier & Pagès, 1998) in which each set of variables is composed by only one variable. All these equivalencies lead to a method (Factor analysis for mixed data: FAMD) having several good properties and easy to perform. This paper presents the principle of FAMD and an application showing how it balances the influence of the different kinds of variables. Keywords : Principal components analysis, multiple correspondances analysis, multiple factor analysis, mixed data. 1 Introduction L introduction simultanée de variables quantitatives et qualitatives (données dites mixtes) en tant qu éléments actifs d une même analyse factorielle est une problématique fréquente. L intérêt de conserver telles quelles les variables quantitatives (i.e. sans les coder en qualitatives) vaut essentiellement dans deux cas : lorsque le nombre de variables qualitatives est très petit comparé à celui des variables quantitatives lorsque le nombre d individus est faible. Plusieurs propositions d analyse factorielle de données mixtes ont déjà été faites. On peut citer, sans prétendre à l exhaustivité, les travaux suivants de l Ecole française d Analyse des données : Tenenhaus (1977), Escofier (1979a) et Saporta (1990). Adoptant le point de vue de l ACM, Escofier (1979a) a proposé d introduire des variables

2 quantitatives (moyennant un codage approprié) dans une ACM : elle décrit plusieurs propriétés de cette méthodologie ainsi qu une application. Il est possible, moyennant une métrique judicieusement choisie, de réaliser une ACP sur un tableau juxtaposant des variables quantitatives réduites et des variables qualitatives codées sous forme disjonctive complète. Cette possibilité est esquissée dans Saporta (1990) sous le nom d extension de l ACP et de l ACM. Enfin, lorsque les variables constituent des groupes homogènes (i.e. les variables d un même groupe sont de même type), une analyse factorielle multiple (AFM) peut être réalisée (Escofier & Pagès, 1998 p 173 ; Pagès, 2002). Si l on transpose les idées de B. Escofier (1979a) dans le cadre de l ACP, on retrouve l extension de Saporta (1990). En outre, cette méthode est équivalente à une AFM dans laquelle chaque groupe est réduit à une seule variable, quantitative ou qualitative. La convergence entre ces trois points de vue (ACP, ACM et AFM) apporte une justification solide à cette méthodologie qui du coup mérite une dénomination à part entière soit : Analyse Factorielle de Données Mixtes (AFDM). Les propriétés de l AFDM sont étudiées en détail dans Pagès (2004), présentation qui comporte une application sur des données réelles. Nous nous limitons ici à rappeler le principe de l AFDM et à décrire une application sur des données construites pour illustrer la façon dont l AFDM équilibre l influence des différents types de variables. 2 Données, notations Soient I individus notés i et munis du même poids p i = 1/I i. Ces individus sont décrits par : K 1 variables quantitatives {k = 1, K 1 } ; ces variables seront toujours supposées centrées réduites ; ceci n est pas une commodité mais une nécessité due à la présence des deux types de variables ; Q variables qualitatives {q = 1, Q}; la q ième variable présente K q modalités {k q = 1, K q } ; l ensemble des modalités a pour cardinal Σ q K q = K 2. Soit K = K 1 + K 2 le nombre total de variables quantitatives et de variables indicatrices. Ces notations sont rassemblées dans le tableau de la figure 1 dans lequel les variables qualitatives apparaissent à la fois sous leur forme condensée et sous leur forme disjonctive complète. 1 K 1 variables quantitatives (centrées-réduites) Q variables qualitatives (codage condensé) Q variables qualitatives = K 2 indicatrices (codage disjonctif complet) 1 q Q 1 k q K 2 1 k K 1 1 q Q 1 k q K q i x ik x iq x ik q I Figure 1. Structure des données et principales notations. x ik : valeur de i pour la variable (centrée-réduite) k ; x iq : modalité de i pour la variable q ; x ik q : = 1 si i possède la modalité k de la variable q et 0 sinon 3 Représentation des variables dans R I Soit R I l espace des fonctions sur I. Cet espace est muni de la métrique diagonale des poids des individus notée D : D (i, j) = 0 si j i = p i si j = i Généralement les individus ont le même poids : D = (1/I) I d (en notant I d la matrice identité de

3 dimension I). Comme en ACP normée, les variables quantitatives sont représentées par des vecteurs de longueur 1. Comme en ACM, la variable q est représentée par le nuage N q de ses K q indicatrices centrées. Ce nuage engendre le sous-espace E q de dimension K q 1, ensemble des fonctions sur I centrées et constantes sur les classes de la partition définie par q. Pour que N q ait, dans une ACP non normée, les mêmes propriétés inertielles que dans une ACM, il faut affecter à l indicatrice k q le poids 1/p kq (en notant p kq la proportion des individus possédant la modalité k q ). Comme les programmes d ACP usuels ne permettent pas l introduction directe de poids de colonnes, on préfèrera diviser les valeurs de l indicatrice k q par p kq, ce que nous appelons le codage-acp de la variable qualitative. En procédant ainsi, on obtient en particulier la propriété fondamentale suivante de l ACM : l inertie projetée de N q sur une variable centrée y est égale au rapport de corrélation η²(q, y) entre q et y. 4 Principe de l AFDM En recherchant la direction v de R I qui rend maximum l inertie projetée du nuage N K (comportant à la fois les variables quantitatives et les indicatrices), on rend maximum le critère (en notant r le coefficient de corrélation) : 2 2 r ( k, v) +. η ( q, v) k K1 point de départ de la proposition de Saporta (1990 p66). Géométriquement, les variables k étant réduites, r(k, v) = cosθ kv, en notant θ kv l angle entre les vecteurs k et v. De même, v étant centrée, η²(q, v) = cos²θ qv en notant θ qv l angle entre v et sa projection sur E q. Le critère s écrit alors q Q 2 2 cos θkv + cos θqv k K1 q Q point de départ de la présentation de l AFDM par Escofier (1979a). Dans sa présentation de l AFDM, Escofier (1979a) adopte un point de vue technique symétrique de celui choisi ici : elle se place dans le cadre de l ACM et code la variable quantitative de façon à obtenir un tableau traitable dans ce cadre. Il s agit donc bien de la même méthode, dont les résultats peuvent être obtenus via une ACM ou une ACP. En AFM, les groupes de variables sont pondérés de façon rendre égale à 1 leur inertie axiale maximum. En introduisant un tableau de données mixtes dans lequel chaque variable, quantitative ou qualitative, constitue un groupe, on obtient donc les résultats de l AFDM : - les variables quantitatives sont centrées-réduites ; - les variables qualitatives sont codées comme en ACM. L idée d appliquer l AFM à des groupes constitués chacun d une seule variable quantitative ou qualitative à déjà été proposée (Abascal-Fernandez et al 2003). 5 Graphiques de l AFDM Comme dans toute analyse factorielle on représente : le nuage des individus par sa projection sur ses axes d inertie (on note F s le facteur sur I de rang s) ; les variables quantitatives par leur coefficient de corrélation avec les facteurs F s ; les modalités de variables qualitatives par les centres de gravité des individus correspondant. En outre, s inspirant de la représentation des groupes de variables en AFM, on fait figurer sur un même graphique les deux types de variables dans le droit fil des représentations des variables qualitatives en ACM proposés par Escofier (1979b) ou Cazes (1982). La coordonnée de la variables x le long de l axe s vaut : r²(x, F s ) si x est une variable quantitative ;

4 η²(x, F s ) si x est une variable qualitative. Remarque : cette représentation n annule pas l intérêt du classique cercle des corrélations puisqu elle ne dépend pas du signe de r(x, F s ). 6 Application 6.1 Données, problématique Les données ont été construites de façon à mettre en évidence les propriétés de l AFDM avec un tableau aussi petit que possible : ceci facilite la mise en évidence directe dans les données brutes des résultats montrés par l analyse. Elles se composent de deux variables quantitatives non corrélées (A et B) et d une variable qualitative (C) à trois modalités (C1, C2, C3) liée aux deux précédentes (Tableaux 1 et 2). données brutes données en vue d une ACP A B C Acr Bcr C1 C2 C3 a b A B C c A 1 d B 0 1 e C f Tableau 1. Données : six individus décrits par trois variables A, B : deux variables quantitatives ; C : variables qualitative. Acr, Bcr : variables A et B centrées réduites ; C1, C2, C3 : indicatrices des modalités de C «codées- ACP». Tableau 2. Liaison entres les variables initiales Pour deux variables quantitatives A, B : r²(a, B) ; Pour une variable qualitative C et une variable quantitative A : η²(a, C). 6.2 Pourcentages d inertie Les deux premiers axes expriment, à part à peu près égale, l essentiel de l inertie, résultat attendu compte tenu de la structure des données (Tableau 3). Inertie Totale Axe 1 Axe 2 Ensemble 4 (100%) (48.90%) (46.65%) A B C Tableau 3. Décomposition de l inertie, par variable et par dimension de l AFDM La contribution d une variable à l inertie d un facteur s interprète comme une mesure de la liaison (carré du coefficient de corrélation cas d une variable quantitative ou le rapport de corrélation cas d une variable qualitative) entre le facteur et la variable. Le premier axe exprime la liaison entre A et C et le second la liaison entre B et C, résultat attendu compte tenu de la non corrélation entre A et B et de la liaison plus forte entre A et C qu entre B et C (cf. Tableau 2). L équilibre entre les contributions des deux types de variables apparaît ici de façon parfaite. 6.3 Représentation des individus et des modalités (Figure 2) Du point de vue des individus, l axe 1 place bien les points selon l ordre de la variable A, mais de façon «caricaturée» par la variable C (par rapport à A, rapprochement de a et b, de c et d et de f et

5 e). De façon précise, par exemple, selon la variable quantitative A, b est à mi-chemin entre a et c ; selon la variable qualitative C, b est confondu avec a. Le premier axe, lié de façon identique aux variables A et C, place b dans une position compromis à savoir à mi-chemin entre le milieu de [a, c] et de a. De ce point de vue aussi, le rôle joué par les deux types de variable est parfaitement équilibré. A propos du deuxième axe, on peut faire une remarque analogue : la position des individus correspond globalement à la variable B mais est marquée par la variable qualitative. Facteur % Facteur % f a 1 C3 C1 0.4 e b 0 0 A d C2 c -0.8 B Facteur % Figure 2. Représentation des individus et des modalités (centres de gravité) Facteur % Figure 3. Représentation des variables quantitatives 6.4 Représentation des variables (Figures 3 et 4) La représentation des variables quantitatives est celle, classique, de l ACP (Figure 3). Globalement, l axe 1 correspond à la variable A et l axe 2 à la variable B. La représentation conjointe des deux types de variables (Figure 4) est une illustration du tableau 2. Elle sera donc surtout précieuse dans le cas d un grand nombre de variables. Dans cet exemple, elle montre clairement la liaison de A avec F1, de B avec F2 et de C avec ces deux facteurs Facteur % B C Figure 4. Représentation simultanée des variables quantitatives et qualitatives La coordonnée d une variable le long de l axe s s interprète comme une mesure de la liaison (carré du coefficient de corrélation cas d une variable quantitative ou rapport de corrélation cas d une variable qualitative) entre la variable et le facteur s Facteur % A

6 7 Conclusion La méthodologie proposée initialement par Escofier (1979a), dans le cadre de l ACM, et esquissée par Saporta (1990), dans le cadre de l ACP, prend en compte les variables quantitatives comme une ACP normée et les variables qualitatives comme une ACM. L équilibre entre les deux types de variables est assuré par leurs propriétés inertielles. Les résultats qu elle produit peuvent être interprétés avec les règles usuelles de l ACP et de l ACM. Sa mise en œuvre peut être réalisée très facilement à l aide d un programme d AFM. En combinant l AFDM et l AFM, il est possible d étendre l AFM au cas de groupes de variables pouvant inclure chacun des variables des deux types. Ces groupes sont codées de façon à ce que leur ACP non normée conduise aux résultats de l AFDM ; dans l AFM, ils sont alors déclarés comme quantitatifs. En procédant ainsi, on équilibre à la fois les groupes entre eux et les variables au sein de chaque groupe. On retrouve ici un cas particulier d analyse factorielle multiple hiérarchique (Le Dien et Pagès 2002). Bibliographie [1] Abascal-Fernandez E., Landaluce-Cluo M.I., Garcia-Laube I. (2003). Multiple factor analysis of mixed tables : a proposal for analysing problematic metric variables. Proceeding cf CARME 2003 meeting. Barcelona, June [2] Cazes P. (1980). Note sur les éléments supplémentaires en analyse des correspondances. Les cahiers de l analyse des données, 7 (1) 9-23 et 7 (2) [3] Escofier B.(1979a). Traitement simultané de variables quantitatives et qualitatives en analyse factorielle. Les cahiers de l analyse des données 4 (2) [4] Escofier B.(1979b). Une représentation des variables dans l analyse des correspondances multiples. Revue Statistique Appliquée XXVII (4) [5] Escofier B. et Pagès J. (1998). Analyses factorielles simples et multiples. 3 e ed. Dunod. [6] Le Dien S. et Pagès J. (2002). Analyse factorielle multiple hiérarchique. Revue de statistique appliquée LI (2) [7] Pagès J. (2002). Analyse factorielle multiple appliquée aux variables qualitatives et aux données mixtes. Revue de statistique appliquée L (4) [8] Pagès J. (2004). Analyse factorielle de données mixtes. Revue de statistique appliquée à paraître. [9] Saporta G. (1990). Simultaneous analysis of qualitative and quantitative data. Atti della XXXV riunione scientifica ; società ita liana di statistica, [10] Tenenhaus M. (1977). Analyse en composantes principales d un ensemble de variables nominales ou numériques. Revue de Statistique Appliquée, XXV (2) [11] Spad (2002). Diffusé par CISIA 30 rue Victor Hugo Levallois-Perret cedex

Analyse simultanée de variables quantitatives et qualitatives. à l aide de l analyse factorielle multiple

Analyse simultanée de variables quantitatives et qualitatives. à l aide de l analyse factorielle multiple Analyse simultanée de variables quantitatives et qualitatives à l aide de l analyse factorielle multiple Jérôme Pagès Laboratoire de mathématiques appliquées Agrocampus France Analyse Factorielle Multiple

Plus en détail

ANALYSE FACTORIELLE MULTIPLE PROCRUSTEENNE

ANALYSE FACTORIELLE MULTIPLE PROCRUSTEENNE ANALYSE FACTORIELLE MULTIPLE PROCRUSTEENNE Elisabeth Morand & Jérôme Pagès Agrocampus Rennes Laboratoire de mathématiques appliquées CS 425 3542 Rennes cedex Résumé Pour comparer deux nuages de points

Plus en détail

Introduction à l analyse des données. Analyse des Données (1) Exemple, ville et (in)sécurité. Exemple, ville et (in)sécurité

Introduction à l analyse des données. Analyse des Données (1) Exemple, ville et (in)sécurité. Exemple, ville et (in)sécurité Introduction à l analyse des données Analyse des Données () Le but de l analyse de données est de synthétiser, structurer l information contenue dans des données multidimensionnelles Deux groupes de méthodes

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Introduction à l analyse des données. Olivier Godechot

Introduction à l analyse des données. Olivier Godechot Introduction à l analyse des données Olivier Godechot Introduction. Les données statistiques : de très nombreuses variables. Aucune n est parfaite La perception d un phénomène appréhendée comme la combinaison

Plus en détail

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali LUISS, Libera Università Internazionale degli Studi Sociali Université Paris 13 Laboratoire Analyse, Géométrie et Applications UMR 7539 GOUTTE Analyse Statistique des Données Cours 4 Master 2 EID goutte@math.univ-paris13.fr

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

Analyse factorielle des correspondances de Benzécri

Analyse factorielle des correspondances de Benzécri Analyse factorielle des correspondances de Benzécri One Pager Décembre 2013 Vol. 8 Num. 011 Copyright Laréq 2013 http://www.lareq.com Analyse Factorielle des Correspondances de Benzécri Une illustration

Plus en détail

Analyse multidimensionnelle de données longitudinales

Analyse multidimensionnelle de données longitudinales Analyse multidimensionnelle de données longitudinales Ndèye Niang Conservatoire National des Arts et Métiers Plan Introduction Terminologie-Notations Méthodes directes Coefficient d association vectorielle

Plus en détail

Analyse de données. [Tapez le sous-titre du document] ANALYSE DE DONNEES 2011 2012. ANALYSE DE DONNEES Page 1 LICENCE 3 SCIENCES ECONOMIQUES

Analyse de données. [Tapez le sous-titre du document] ANALYSE DE DONNEES 2011 2012. ANALYSE DE DONNEES Page 1 LICENCE 3 SCIENCES ECONOMIQUES 2011 2012 ANALYSE DE DONNEES 2011 2012 LICENCE 3 SCIENCES ECONOMIQUES COURS DE M. THIERRY BLAYAC Analyse de données [Tapez le sous-titre du document] ANALYSE DE DONNEES Page 1 H34VEN Cours pour Licence

Plus en détail

Chapitre 9 ANALYSE MULTIDIMENSIONNELLE

Chapitre 9 ANALYSE MULTIDIMENSIONNELLE Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 9 ANALYSE MULTIDIMENSIONNELLE L analyse des données multidimensionnelles regroupe un ensemble de méthodes

Plus en détail

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h I.U.T de Caen STID 2ème année Département STID Année Universitaire 2002-2003 Responsable de cours : Alain LUCAS Seule la calculatrice type collège est autorisée. Seul le cours est autorisé. On rappelera

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Plan du cours Analyse en Composantes Principales Introduction Les données Leurs représentations La méthode Modèle Interprétation statistique Espace principal Composantes Principales Représentations Graphiques

Plus en détail

Cours 2-3 Analyse des données multivariées

Cours 2-3 Analyse des données multivariées Cours 2-3 des données s Ismaël Castillo École des Ponts, 13 Novembre 2012 Plan 1 2 3 4 1. On s intéresse à un jeu de données multi-dimensionel, avec n individus observés et p variables d intérêt ( variables

Plus en détail

Illustration sur un exemple de diverses procédures graphiques et quantitatives.

Illustration sur un exemple de diverses procédures graphiques et quantitatives. Au-delà de l'analyse des correspondances multiples : Illustration sur un exemple de diverses procédures graphiques et quantitatives Yannick Savina Jean-Marc Bernard Laboratoire de Psychologie Environnementale

Plus en détail

Analyse factorielle multiple intra-tableaux. Application à l analyse simultanée de plusieurs questions ouvertes.

Analyse factorielle multiple intra-tableaux. Application à l analyse simultanée de plusieurs questions ouvertes. Analyse factorielle multiple intra-tableaux. Application à l analyse simultanée de plusieurs questions ouvertes. Mónica Bécue-Bertaut (1) et Jérôme Pagès (2) (1 ) Universitat Politècnica de Catalunya.

Plus en détail

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage Classification Exemple : Enquête d opinion sur les OGM Pauline Le Badezet Alexandra Lepage SOMMAIRE Introduction Méthodologie Méthode de partitionnement Classification Ascendante Hiérarchique Interprétation

Plus en détail

Cours de Statistiques

Cours de Statistiques Cours de Statistiques Romain Raveaux 1 1 Laboratoire L3I Université de La Rochelle romain.raveaux01 at univ-lr.fr Octobre 24-11, 2008 1 / 35 Sommaire 1 Quelques Rappels 2 numériques Relations entre deux

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées

Plus en détail

IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD

IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD Université de Perpignan - IUT de Carcassonne Vivien ROSSI Année 2006/2007 IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD Ce document est tiré du site : http ://www.stat.ucl.ac.be/ispersonnel/lecoutre/stats/spad/

Plus en détail

L3 Géographie UE Méthodologie. Statistiques COURS 1. Salle 125. Intervenants : Nadège. UMR Centre de Recherches de Climatologie (CRC)

L3 Géographie UE Méthodologie. Statistiques COURS 1. Salle 125. Intervenants : Nadège. UMR Centre de Recherches de Climatologie (CRC) L3 Géographie UE Méthodologie Statistiques COURS 1 Salle 125 Intervenants : Nadège Martiny & Julien Crétat UFR Sciences Humaines (Département de Géographie) UMR Centre de Recherches de Climatologie (CRC)

Plus en détail

Analyse multivariée approfondie

Analyse multivariée approfondie Analyse multivariée approfondie Enseignants: NIANG N. et RUSSOLILLIO G. Maître de conférences Statistique Appliquée Laboratoire CEDRIC CNAM http://www.cnam.fr et d autres intervenants extérieurs au Cnam

Plus en détail

Séance 2: Modèle Euclidien

Séance 2: Modèle Euclidien Généralités Métrique sur les INDIVIDUS Métrique sur les VARIABLES Inertie Analyse des individus Laboratoire de Statistique et Probabilités UMR 5583 CNRS-UPS www.lsp.ups-tlse.fr/gadat Généralités Métrique

Plus en détail

Session 1 durée 3 heures

Session 1 durée 3 heures Université de Nantes Mai 27 Master MIM Examen d'analyse de données Session durée 3 heures Les documents sont interdits. Les calculatrices sont autorisées. Exercice : - Etude d un tableau à l aide d une

Plus en détail

Analyses statistiques multivariées. Béatrice de Tilière

Analyses statistiques multivariées. Béatrice de Tilière Analyses statistiques multivariées Béatrice de Tilière 23 novembre 2009 ii Table des matières 1 La Statistique 1 1.1 Généralités.................................. 1 1.2 Un peu de vocabulaire............................

Plus en détail

Marketing Data Set: Follow-Up to Purchases of a Consumer Panel

Marketing Data Set: Follow-Up to Purchases of a Consumer Panel Marketing Data Set: Follow-Up to Purchases of a Consumer Panel Typologie des consommateurs et Mesure de la loyauté/fidélité Stéphanie Ledauphin-Menard, Sébastien Lê Face aux problèmes de pouvoir d achat

Plus en détail

3. ACM Analyse des Correspondances Multiples

3. ACM Analyse des Correspondances Multiples 3. ACM Analyse des Correspondances Multiples Analyse des Correspondances Multiples - ACM 1 Plan 1. Exemples, problématique 2. Le tableau de données étudié 3. Principe d une ACM 4. L ajustement des deux

Plus en détail

SEMIN. Analyses factorielles avec R. Elisabeth MORAND INED

SEMIN. Analyses factorielles avec R. Elisabeth MORAND INED SEMIN Analyses factorielles avec R Elisabeth MORAND INED SEMIN R du MNHN 10 Décembre 2009 E. Morand 10 Décembre 2009 INED 1 / 42 Part I Analyse en Composantes Principales : ACP 2 / 42 Sommaire 1 Introduction

Plus en détail

Analyse en composantes principales (ACP)

Analyse en composantes principales (ACP) Analyse en composantes principales (ACP) François Husson Laboratoire de mathématiques appliquées - Agrocampus Rennes husson@agrocampus-ouest.fr 1 / 31 Quel type de données? L ACP s intéresse à des tableaux

Plus en détail

Analyse en composantes principales

Analyse en composantes principales Université de Rennes 2 Statistiques des données M1-GEO Ouvrages recommandés Analyse en composantes principales Ces livres sont à la BU. Pour les acheter, venir au bureau A-240 ou envoyer un mail : nicolas.jegou@uhb.fr

Plus en détail

L analyse en composantes principales en pratique

L analyse en composantes principales en pratique L analyse en composantes principales en pratique Après avoir vu sa formalisation mathématique dans le module précédent, on s intéresse ici à l utilisation pratique de l ACP. 1 Objectifs L objectif de l

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

L analyse Factorielle des correspondances. 1/ Préambule descriptif de l AFC

L analyse Factorielle des correspondances. 1/ Préambule descriptif de l AFC L analyse Factorielle des correspondances...2 1/ Préambule descriptif de l AFC...2 Exemples de types de données que l AFC peut aborder:...2 Quelques types de tableaux traités par l AFC...3 2/ Exercice

Plus en détail

MÉTHODES DE CLASSIFICATION

MÉTHODES DE CLASSIFICATION MÉTHODES DE CLASSIFICATION Pierre-Louis GONZALEZ MÉTHODES DE CLASSIFICATION Objet Opérer des regroupements en classes homogènes d un ensemble d individus. Données Les données se présentent en général sous

Plus en détail

Techniques d estimation : Maximum de Vraisemblance et Méthode des Moments Généralisée

Techniques d estimation : Maximum de Vraisemblance et Méthode des Moments Généralisée Techniques d estimation : Maximum de Vraisemblance et Méthode des Moments Généralisée Philippe Gagnepain Université Paris 1 Ecole d Economie de Paris Centre d économie de la Sorbonne-UG 4-Bureau 405 philippe.gagnepain@univ-paris1.fr

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

Préparation à l agrégation 2012/2013. Mots clés : Graphes. Vecteur propre ; matrices stochastiques ; matrices à coefficients positifs.

Préparation à l agrégation 2012/2013. Mots clés : Graphes. Vecteur propre ; matrices stochastiques ; matrices à coefficients positifs. Mots clés : Graphes. Vecteur propre ; matrices stochastiques ; matrices à coefficients positifs. Le jury n exige pas une compréhension exhaustive du texte. Vous êtes laissé(e) libre d organiser votre discussion

Plus en détail

Analyse en Composantes. Principales

Analyse en Composantes. Principales AgroParisTech Analyse en Composantes Principales C Duby, S Robin Table des matières Introduction 3 2 Tableau de données 4 3 Choix d une distance 6 4 Choix de l origine 7 5 Moments d inertie 9 5 Inertie

Plus en détail

COURS DE STATISTIQUES (24h)

COURS DE STATISTIQUES (24h) COURS DE STATISTIQUES (24h) Introduction Statistiques descriptives (4 h) Rappels de Probabilités (4 h) Echantillonnage(4 h) Estimation ponctuelle (6 h) Introduction aux tests (6 h) Qu est-ce que la statistique?

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

LYCEE MICHEL-RODANGE LUXEMBOURG PROGRAMMES DE MATHEMATIQUES POUR LE CYCLE INFERIEUR

LYCEE MICHEL-RODANGE LUXEMBOURG PROGRAMMES DE MATHEMATIQUES POUR LE CYCLE INFERIEUR LYCEE MICHEL-RODANGE LUXEMBOURG PROGRAMMES DE MATHEMATIQUES POUR LE CYCLE INFERIEUR Introduction. page 2 Classe de septième.. page 3 Classe de sixième page 7-1 - INTRODUCTION D une manière générale on

Plus en détail

Objectif du groupe GT1.1 Fusion de Données

Objectif du groupe GT1.1 Fusion de Données Objectif du groupe GT1.1 Fusion de Données Le groupe travaille dans trois directions Le vocabulaire (piloté par ADVITAM et l aide de SITE) L état de l art (piloté par SYROKKO) Deux applications illustratives

Plus en détail

Le Multidimensional Scaling et la cartographie des préférences

Le Multidimensional Scaling et la cartographie des préférences Le Multidimensional Scaling et la cartographie des préférences Gilbert Saporta Conservatoire National des Arts et Métiers http://cedric.cnam.fr/~saporta Avril 2014 Multidimensional scaling Egalement appelé

Plus en détail

Cours de mathématiques - Alternance Gea

Cours de mathématiques - Alternance Gea Cours de mathématiques - Alternance Gea Anne Fredet 11 décembre 005 1 Calcul matriciel Une matrice n m est un tableau de nombres à n lignes( et m colonnes. 1 0 Par exemple, avec n = et m =, on peut considérer

Plus en détail

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème.

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème. Mathématiques - classe de 1ère des séries STI2D et STL. 1. Analyse On dote les élèves d outils mathématiques permettant de traiter des problèmes relevant de la modélisation de phénomènes continus ou discrets.

Plus en détail

Méthodes de projection

Méthodes de projection Chapitre 11 Méthodes de projection Contenu 11.1 Analyse en composantes principales........ 138 11.1.1 L Analyse en Composantes Principales........ 139 11.1.2 La (grande) famille des ACP............. 151

Plus en détail

Polynômes à plusieurs variables. Résultant

Polynômes à plusieurs variables. Résultant Polynômes à plusieurs variables. Résultant Christophe Ritzenthaler 1 Relations coefficients-racines. Polynômes symétriques Issu de [MS] et de [Goz]. Soit A un anneau intègre. Définition 1.1. Soit a A \

Plus en détail

Partie I. Les données quantitatives

Partie I. Les données quantitatives Variables quantitatives : analyse en composantes principales Jean-Marc Lasgouttes https://whorocqinriafr/jean-marclasgouttes/ana-donnees/ Partie I Les données quantitatives Description de données quantitatives

Plus en détail

Use Cases. Introduction

Use Cases. Introduction Use Cases Introduction Avant d aborder la définition et la conception des UC il est bon de positionner le concept du UC au sein du processus de développement. Le Processus de développement utilisé ici

Plus en détail

ANALYSE FACTORIELLE MULTIPLE DE DONNEES MIXTES :

ANALYSE FACTORIELLE MULTIPLE DE DONNEES MIXTES : ANALYSE FACTORIELLE MULTIPLE DE DONNEES MIXTES : APPLICATION A LA COMPARAISON DE DEUX CODAGES Jérôme Pagès & Sergio Camiz Laboratoire de mathématiques appliquées Agrocampus Rennes rue de Saint Brieuc CS

Plus en détail

A. Déterminant d une matrice carrée

A. Déterminant d une matrice carrée IUT ORSAY Mesures Physiques Déterminants Initiation à la diagonalisation de matrice Cours du ème Semestre A Déterminant d une matrice carrée A-I Définitions élémentaires Si A est la matrice ( a ) on appelle

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

GUIDE DU DATA MINER. Classification - Typologies. Data Management, Data Mining, Text Mining

GUIDE DU DATA MINER. Classification - Typologies. Data Management, Data Mining, Text Mining GUIDE DU DATA MINER Classification - Typologies Data Management, Data Mining, Text Mining 1 Guide du Data Miner Classification - Typologies Le logiciel décrit dans le manuel est diffusé dans le cadre d

Plus en détail

Autour du cardinal d un ensemble de matrices binaires

Autour du cardinal d un ensemble de matrices binaires Autour du cardinal d un ensemble de matrices binaires Adrien REISNER 1 Abstract. We here study a couple of algebraic and analytic properties of certain binary matrices in the spaces M n(r). In particular,

Plus en détail

Analyse des données - Logiciel R

Analyse des données - Logiciel R Université de Strasbourg Analyse des données Master de Sciences, Spécialité Statistique 2012/13 Master Actuariat Emmanuel Périnel Analyse des données - Logiciel R TP n 2. L Analyse en Composantes Principales

Plus en détail

Analyse de données avec R Complémentarité des méthodes d'analyse factorielle et de classification. 2 L'analyse de données avec R

Analyse de données avec R Complémentarité des méthodes d'analyse factorielle et de classification. 2 L'analyse de données avec R Analyse de données avec R Complémentarité des méthodes d'analyse factorielle et de classification François Husson, Julie Josse & Jérôme Pagès Laboratoire de mathématiques appliquées - 65 rue de St-Brieuc

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

en utilisant un point-virgule.

en utilisant un point-virgule. 6 Chapitre Chapitre 6. Géométrie analytique Ce chapitre présente les possibilités de votre calculatrice dans le domaine de la géométrie analytique, tout particulièrement pour les problèmes liés aux espaces

Plus en détail

Cours d Analyse. Fonctions de plusieurs variables

Cours d Analyse. Fonctions de plusieurs variables Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........

Plus en détail

Master Modélisation Statistique M2 Finance - chapitre 1. Gestion optimale de portefeuille, l approche de Markowitz

Master Modélisation Statistique M2 Finance - chapitre 1. Gestion optimale de portefeuille, l approche de Markowitz Master Modélisation Statistique M2 Finance - chapitre 1 Gestion optimale de portefeuille, l approche de Markowitz Clément Dombry, Laboratoire de Mathématiques de Besançon, Université de Franche-Comté.

Plus en détail

Par contre, lorsque P est finie, l inclusion f(p ) P implique l égalité f(p ) = P car, f

Par contre, lorsque P est finie, l inclusion f(p ) P implique l égalité f(p ) = P car, f Université Lyon 1 Algèbre générale S.P. Groupes III I. Groupe symétrique et géométrie. On se donne un ensemble E (souvent un espace euclidien ou une partie de cet espace) et une bijection f : E E (souvent

Plus en détail

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 29/01/2007 Stéphane Tufféry - Data Mining - http://data.mining.free.fr

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 29/01/2007 Stéphane Tufféry - Data Mining - http://data.mining.free.fr 1 Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE Plan du cours Qu est-ce que le data mining? À quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data

Plus en détail

Analyse en composantes principales

Analyse en composantes principales Analyse en composantes principales Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire LITIS Analyse en composantes principales p. 1/18 Introduction Objectifs Soit {x i } i=1,,l

Plus en détail

Une étude comparative de logiciels de prévision automatique de séries chronologiques

Une étude comparative de logiciels de prévision automatique de séries chronologiques Une étude comparative de logiciels de prévision automatique de séries chronologiques Valentina STAN Conservatoire National des Arts et Métiers, 292 Rue Saint Martin, F 75141 Paris Cedex 03, France valentina_titu@yahoo.fr

Plus en détail

Les quatre opérations sur les nombres entiers Statistiques et probabilités I. Code Unités Devoirs Code Unités Devoirs

Les quatre opérations sur les nombres entiers Statistiques et probabilités I. Code Unités Devoirs Code Unités Devoirs 1 re secondaire 2 e secondaire Les quatre opérations sur les nombres entiers Statistiques et probabilités I MAT-1005-2 2 3 MAT-2008-2 2 3 (+, -, x, ) dans l ensemble des entiers Z. Ce premier cours portant

Plus en détail

Chapitre 1: Introduction au calcul des probabilités, cas d un univers fini.

Chapitre 1: Introduction au calcul des probabilités, cas d un univers fini. Chapitre 1: Introduction au calcul des probabilités, cas d un univers fini. 1 Introduction Des actions comme lancer un dé, tirer une carte d un jeu, observer la durée de vie d une ampoule électrique, etc...sont

Plus en détail

Didacticiel - Études de cas. Mettre en œuvre l analyse des correspondances multiples (ACM) avec TANAGRA.

Didacticiel - Études de cas. Mettre en œuvre l analyse des correspondances multiples (ACM) avec TANAGRA. Objectif Mettre en œuvre l analyse des correspondances multiples (ACM) avec TANAGRA. L analyse des correspondances multiples (ou analyse factorielle des correspondances multiples AFCM) est une technique

Plus en détail

Analyse de Données. Analyse en Composantes Principales (ACP)

Analyse de Données. Analyse en Composantes Principales (ACP) Analyse de Données Analyse en Composantes Principales (ACP) Analyse en composantes principales (ACP) ** Sur toute la fiche, on notera M' la transposée de M. Cadre de travail : On a des données statistiques

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN

ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN Pôle Informatique de Recherche et d Enseignement en Histoire ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN A. PREMIER PAS 1. INTEGRATION DU TABLEAU

Plus en détail

Représentation des nombres entiers et réels. en binaire en mémoire

Représentation des nombres entiers et réels. en binaire en mémoire L3 Mag1 Phys. fond., cours C 15-16 Rep. des nbs. en binaire 25-09-05 23 :06 :02 page 1 1 Nombres entiers 1.1 Représentation binaire Représentation des nombres entiers et réels Tout entier positif n peut

Plus en détail

À propos des matrices échelonnées

À propos des matrices échelonnées À propos des matrices échelonnées Antoine Ducros appendice au cours de Géométrie affine et euclidienne dispensé à l Université Paris 6 Année universitaire 2011-2012 Introduction Soit k un corps, soit E

Plus en détail

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques.

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques. L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques 1 BUTS DU COURS : se familiariser avec le vocabulaire statistique o variable dépendante, variable indépendante o statistique descriptive,

Plus en détail

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique DOMAINE P3.C3.D1. Pratiquer une démarche scientifique et technologique, résoudre des

Plus en détail

Relations Binaires Relations d équivalence sur un ensemble

Relations Binaires Relations d équivalence sur un ensemble Relations Binaires Relations d équivalence sur un ensemble MPSI 2 1 Généralités Soit E un ensemble non vide. Définition 1..1 On appelle relation binaire sur E le couple (E, G où G est un graphe de E dans

Plus en détail

TITRE, ÉVENTUELLEMENT SUR PLUSIEURS LIGNES EXEMPLE DE MISE EN FORME

TITRE, ÉVENTUELLEMENT SUR PLUSIEURS LIGNES EXEMPLE DE MISE EN FORME TITRE, ÉVENTUELLEMENT SUR PLUSIEURS LIGNES EXEMPLE DE MISE EN FORME Marie MARTIN 1 et John SMITH 2 Traduction en anglais du titre de l article TITLE RÉSUMÉ Ces instructions relatives à la mise en forme

Plus en détail

2.0 Interprétation des cotes d évaluation des risques relatifs aux produits

2.0 Interprétation des cotes d évaluation des risques relatifs aux produits 2.0 Interprétation des cotes d évaluation des risques relatifs aux produits L interprétation des cotes attribuées dans le cadre des évaluations des risques relatifs aux produits décrite plus loin repose

Plus en détail

1 Diagonalisation des endomorphismes auto-adjoints, en dimension finie

1 Diagonalisation des endomorphismes auto-adjoints, en dimension finie Annette Paugam Diagonalisation des auto-adjoints Applications aux formes quadratiques : Directions principales Applications en Géométrie, en Statistique et en Mécanique Les paragraphes, 2, 3 donnent un

Plus en détail

Intérêt et limites des estimations sur petits domaines HID «Petits domaines», une opération inhabituelle :

Intérêt et limites des estimations sur petits domaines HID «Petits domaines», une opération inhabituelle : Intérêt et limites des estimations sur petits domaines HID «Petits domaines», une opération inhabituelle : a. Une opération de «production» b. Visant l ensemble des variables d une enquête c. Recherchant

Plus en détail

SCI03 - Analyse de données expérimentales

SCI03 - Analyse de données expérimentales SCI03 - Analyse de données expérimentales Introduction à la statistique Thierry Denœux 1 1 Université de Technologie de Compiègne tél : 44 96 tdenoeux@hds.utc.fr Automne 2014 Qu est ce que la statistique?

Plus en détail

Cours 3: Inversion des matrices dans la pratique...

Cours 3: Inversion des matrices dans la pratique... Cours 3: Inversion des matrices dans la pratique... Laboratoire de Mathématiques de Toulouse Université Paul Sabatier-IUT GEA Ponsan Module complémentaire de maths, année 2012 1 Rappel de l épisode précédent

Plus en détail

Partie I. Les données quantitatives

Partie I. Les données quantitatives Variables quantitatives : analyse en composantes principales Jean-Marc Lasgouttes https://whorocqinriafr/jean-marclasgouttes/ana-donnees/ Partie I Les données quantitatives Description de données quantitatives

Plus en détail

Correction de l épreuve intermédiaire de mai 2009.

Correction de l épreuve intermédiaire de mai 2009. Licence de Gestion. 3ème Année Année universitaire 8-9 Optimisation Appliquée C. Léonard Correction de l épreuve intermédiaire de mai 9. Exercice 1 Avec les notations du cours démontrer que la solution

Plus en détail

Programmes du collège

Programmes du collège Bulletin officiel spécial n 6 du 28 août 2008 Programmes du collège Programmes de l enseignement de mathématiques Ministère de l Éducation nationale Classe de quatrième Note : les points du programme (connaissances,

Plus en détail

Cours Diagonalisation

Cours Diagonalisation Cours Diagonalisation par Pierre Veuillez 1 Objectif Pour une matrice A donnée, déterminer une matrice D diagonale et une matrice P inversible telle que A = P D P 1. Interprètation : Quelle relation reconnaît-on?

Plus en détail

Optimisation linéaire

Optimisation linéaire Optimisation linéaire Recherche opérationnelle GC-SIE Algorithme du simplexe Phase I 1 Introduction Algorithme du simplexe : Soit x 0 une solution de base admissible Comment déterminer x 0? Comment déterminer

Plus en détail

ATELIER STATISTIQUES - PROBABILITES

ATELIER STATISTIQUES - PROBABILITES ATELIER STATISTIQUES - PROBABILITES I/ INTRODUCTION Extraits du document Ressources pour la classe de seconde Probabilités et Statistiques - : «L enseignement de la statistique et des probabilités constitue

Plus en détail

Théorie et codage de l information

Théorie et codage de l information Théorie et codage de l information Les codes linéaires - Chapitre 6 - Principe Définition d un code linéaire Soient p un nombre premier et s est un entier positif. Il existe un unique corps de taille q

Plus en détail

Simulation Examen de Statistique Approfondie II **Corrigé **

Simulation Examen de Statistique Approfondie II **Corrigé ** Simulation Examen de Statistique Approfondie II **Corrigé ** Ces quatre exercices sont issus du livre d exercices de François Husson et de Jérôme Pagès intitulé Statistiques générales pour utilisateurs,

Plus en détail

Didacticiel - Études de cas

Didacticiel - Études de cas 1 Objectif Analyse factorielle des données mixtes Comparaison des logiciels Tanagra et R. Habituellement, on utilise l analyse en composantes principales (ACP) lorsque toutes les variables actives sont

Plus en détail

Atelier d économétrie

Atelier d économétrie Atelier d économétrie Chapitre 4 : Le problème de la multicolinéarité : application sous SAS Vincent Bouvatier Université de Paris Ouest - Nanterre La Défense Bâtiment G, bureau 308A vbouvatier@u-paris10.fr

Plus en détail

GMEC1311 Dessin d ingénierie. Chapitre 1: Introduction

GMEC1311 Dessin d ingénierie. Chapitre 1: Introduction GMEC1311 Dessin d ingénierie Chapitre 1: Introduction Contenu du chapitre Introduction au dessin technique Normes Vues Traits Échelle Encadrement 2 Introduction Les dessins ou graphiques sont utilisés

Plus en détail

Groupes et Actions de groupes. 1 Groupes, morphismes et actions de groupes.

Groupes et Actions de groupes. 1 Groupes, morphismes et actions de groupes. Groupes et Actions de groupes On présente ici des notions de base de théorie des groupes pour l agrégation interne. 1 Groupes, morphismes et actions de groupes. Un groupe (G, ), ou plus simplement G, est

Plus en détail

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 105 HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 1. Introduction En statistiques il arrive fréquemment que les individus soient décrits par un grand nombre de caractères. : voitures décrites par leur

Plus en détail

Première STMG1 2014-2015 progression. - 1. Séquence : Proportion d une sous population dans une population.

Première STMG1 2014-2015 progression. - 1. Séquence : Proportion d une sous population dans une population. Première STMG1 2014-2015 progression. - 1 Table des matières Fil rouge. 3 Axes du programme. 3 Séquence : Proportion d une sous population dans une population. 3 Information chiffrée : connaître et exploiter

Plus en détail

Théorie et codage de l information

Théorie et codage de l information Théorie et codage de l information Les codes de Hamming et les codes cycliques - Chapitre 6 (suite et fin)- Les codes de Hamming Principe La distance minimale d un code linéaire L est le plus petit nombre

Plus en détail

Systèmes linéaires. 1. Introduction aux systèmes d équations linéaires. Exo7. 1.1. Exemple : deux droites dans le plan

Systèmes linéaires. 1. Introduction aux systèmes d équations linéaires. Exo7. 1.1. Exemple : deux droites dans le plan Exo7 Systèmes linéaires Vidéo partie 1. Introduction aux systèmes d'équations linéaires Vidéo partie 2. Théorie des systèmes linéaires Vidéo partie 3. Résolution par la méthode du pivot de Gauss 1. Introduction

Plus en détail

Analyse des données et Data Mining

Analyse des données et Data Mining Analyse des données et Data Mining Analyse en composantes principales utc sy09 1 Objectif des méthodes factorielles Visualiser, traiter des données multidimensionnelles Problème difficile Information apportée

Plus en détail

SOMMES ET PRODUITS. 1 Techniques de calcul. 1.1 Le symbole. 1.2 Règles de calcul. Laurent Garcin MPSI Lycée Jean-Baptiste Corot

SOMMES ET PRODUITS. 1 Techniques de calcul. 1.1 Le symbole. 1.2 Règles de calcul. Laurent Garcin MPSI Lycée Jean-Baptiste Corot SOMMES ET PRODUITS 1 Techniques de calcul 1.1 Le symbole Notation 1.1 Soient m et n deux entiers naturels. Alors { a m + a m+1 + + a + a n si m n, a = 0 sinon. On peut aussi noter m n =m a ou encore m,n

Plus en détail