TP 2 : Analyse en composantes principales

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "TP 2 : Analyse en composantes principales"

Transcription

1 Université d'angers master MIM TD analyse de données p. I Etude d'un nuage de points TP : Analyse en composantes principales. Construire le nuage centré de 5 individus caractérisés par un couple de variables suivant une loi normale d'espérance (,) et de matrice de covariance Σ =.5 u u : u. Construire une fonction qui pour un vecteur unitaire.5 4 (fonction mvrnorm de MASS). - calcule l'inertie projetée sur l'axe, - calcule l'affixe de la projection de chaque individu sur l'axe, - dans la même fenêtre représente l'histogramme des affixes et l'ajustement d'une loi normale (fonction dnorm) représente le nuage de points et le vecteur 3. Etudier graphiquement (boxplot) la dispersion des projections pour différents vecteurs unitaires. Conclure. 4. Construire l'ellipse de concentration du nuage (fonction ellipse de car) et calculer les axes principaux ainsi que l'inertie suivant chaque axe. mvrnorm(5, mu = c(, ), Sig = matrix(c(,.5,.5, 4), c(, [,] )))[,] mvrnorm(5, mu = c(, ), Sig = matrix(c(,.5,.5, 4), c(, [,] )))[,] II DVS. Soit X un tableau centré et R sa forme réduite. Etudier la DVS de (X,diag( /σ j ), n I n) et (R,I p, n I n).. a. Effectuer la DVS (X,I p,i n ) de A = et b. Determiner l'opérateur de projection sur Im B. B =.

2 Université d'angers master MIM TD analyse de données p. III Etude d un tableau à l aide d une ACP Partie A : calcul à la main Le tableau de données ci-dessous est constitué de trois variables x, y et z, et de quatre individus A à D. On utilisera les valeurs exactes. x y z A B C D EFFECTUER L'ACP NORMEE DU TABLEAU ) Calculer le centre de gravité g I du nuage. ) Calculer le tableau centré réduit. 3) a. Calculer la matrice d'inertie S du nuage N(I). b. Que représente cette matrice? c. Quelle est l'inertie du nuage? 4) Recherche des axes principaux d'inertie : a. Déterminer les valeurs propres de S. b. Vérifier votre résultat à l'aide de la question 3) c. c. Déterminer les deux premiers vecteurs propres. 5) a. Quelle est la contribution absolue de l'axe F à l'inertie du nuage? b. Quel est le taux d'inertie extrait par l'axe F? c. Quelle est la meilleure représentation plane?

3 Université d'angers master MIM TD analyse de données p. 3 REPRESENTATION DES INDIVIDUS ) Compléter dans le tableau ci-dessous les composantes principales (coordonnées des individus). composantes principales qlt = cos² (/) ctr (/) F F F3 F F F F A B C D ) Calculer l'inertie des individus et 4 par rapport à g I. 3) Définir la qualité de représentation de i sur l'axe F et compléter le tableau ci-dessus. 4) Compléter les contributions relatives des individus à l'inertie de l'axe F? 5) Effectuer la représentation graphique du plan ()-().

4 Université d'angers master MIM TD analyse de données p. 4 REPRESENTATION DES VARIABLES ) Calculer les coordonnées des individus sur les différents axes et compléter le tableau. coordonnées ctr (/) F F F F V V V 3 ) Définir la qualité de la représentation de la variable j sur les axes et compléter le tableau. 3) Effectuer la représentation graphique dans les différents plans. INDIVIDUS ET VARIABLES SUPPLEMENTAIRES Construire la représentation graphique de l'individus de coordonnées (,,). Construire la représentation graphique de la variable de coordonnées (,-,,-,). Partie B : Calculs à l'aide du logiciel R. Construire une fonction R permettant de déterminer pour un tableau T les valeurs propres ainsi que les composantes principales et qui représente le plan factoriel FF pour les individus et les variables. Partie C : Un second exemple Reprendre les étapes du I (calcul manuel + vérification sous R) avec le tableau de données : T= ou T= 3 v v v F E D C B A

5 Université d'angers master MIM TD analyse de données p. 5 IV Etude d'exemples Exemple : Etude olfacto-gustative de cidres Plusieurs caractéristiques du cidre ont été mesurées sur cidres différents. Les résultats de l ACP sont présentés page suivante. cidre odeur sucre acide amer astringence suffocante piquante alcool parfum fruitée,4,86 3,9,9,4,9,86,9,9,43,79,7,57,43,57,86,43,4 3,7 3,4,57,57,43,4,4,86,9, ,7,4,7,57,9 3,4 3,4 5 3,43,9,86 3,4,7,86,86,4,9 6 3,4,86,86 3,79,57,4,7 3,9,4 7 3,4,4,86,86,43,7,86,4 8,43 3,7 3,,57,7,57,57,86 9 5,,86,86 3,7,79,7,43,43,57,7 3,7 3,4,57 3,43,9,57 3,7 Partie I : Examen des données Utiliser les résultats ci-dessous pour justifier vos réponses. a. Justifier l'utilisation d'une ACP. b. Expliquer les différences obtenues entre une ACP normée et non normée? c. Déterminer trois groupes de variables qui présentent des corrélations entre elles (r>.5). d. Que représentent les ellipses dans la représentation en 3D. e. Expliquez les différences entre les ellipses obtenues dans les deux nuages. Pour réaliser les différents traitements avec R, il faut charger les packages rgl, ade4 et éventuellement Rcmdr (interface concivial). > cidre <- read.table("../echange/cidre.txt") Paramètres statistiques acid alco amer astr fruit odeu parf piqu sucr suffo > round(cov(cidre),) odeu sucr acid amer astr suffo piqu alco parf fruit odeu sucr acid amer astr suffo piqu alco parf fruit > round(cor(cidre),) odeu sucr acid amer astr suffo piqu alco parf fruit odeu sucr acid amer astr suffo piqu alco parf fruit

6 Université d'angers master MIM TD analyse de données p. 6 Examen graphique : >library("rgl") > cidrer = as.data.frame(scale(cidre)*sqrt(/9)) >attach(cidrer) nuage : >plot3d(acid,alco,suffo,type="s",xlim=c(-3,3),ylim=c(-3,3),zlim=c(-3,3)) >plot3d(ellipse3d(cor(cbind(acid,alco,suffo))),col="grey",alpha=.5,add=true) nuage : >plot3d(parf,alco,sucr,type="s",xlim=c(-3,3),ylim=c(-3,3),zlim=c(-3,3)) >plot3d(ellipse3d(cor(cbind(parf,alco,sucr))),col="grey",alpha=.5,add=true)

7 Université d'angers master MIM TD analyse de données p. 7 Partie II : ACP normée du tableau. Nombre de facteurs retenus > round(acp$eig,) [] > round(cumsum(acp$eig*),) [] a. Les deux premiers facteurs ont été retenus ici. Quel est le pourcentage de variance expliqué par ces deux facteurs? b. Que signifie ce pourcentage? / Analyse des variables >inertie <-inertia.dudi(acp, col.inertia=true) [coordonnées des variables] > round(acp$co,) Comp Comp odeu sucr acid amer astr suffo piqu alco parf.9. fruit [ctr en %] > inertie$col.abs/ Comp Comp odeu sucr acid.7.94 amer astr suffo piqu alco parf fruit [qlt en %] > inertie$col.re/ Comp Comp con.tra odeu sucr acid amer astr suffo piqu alco parf fruit > s.corcircle(acp$co,xax=,yax=) a. Comment reconnaît-on sur la figure des variables qu une variable est bien représentée? h. Donner une signification à cet axe. b. Quelles sont les variables mal représentées dans le plan F-F? Justifier votre réponse. c. A l aide de la figure sur les variables, préciser la variable la plus corrélée positivement à alcool, la plus corrélée négativement à alcool, la moins corrélée à alcool. d. Quelles sont les variables qui ont contribuées à l axe F? Justifier votre réponse. e. f. Donner une signification à cet axe. g. Quelles sont les variables qui ont contribuées à l axe F? Justifier votre réponse.

8 Université d'angers master MIM TD analyse de données p. 8 3/ Analyse des individus >inertie <-inertia.dudi(acp, row.inertia=true) Composantes principales > round(acp$li,) Axis Axis [ctr en %] > inertie$row.abs/ Axis Axis [qlt en %] > inertie$row.re/ Axis Axis con.tra > s.label(acp$li,xax=,yax=) a. Comment évalue-t-on si un individu est bien représenté dans un plan? b. Quel est l individu le mieux représenté dans le plan F-F? Justifier votre réponses. c. Quels sont les 3 individus les moins bien représentés dans le plan F-F? Justifier votre réponse. d. Quels sont les individus qui ont contribuées à l axe F? Justifier votre réponse. e. Quels sont les individus qui ont contribuées à l axe F? Justifier votre réponse. f. Proposer 4 groupes de cidres en précisant clairement les principales caractéristiques de ces groupes. 4. Vers la classification. Les individus semblent se répartir en quatre groupes : groupe : groupe : groupe 3 : 9 groupe 4 : Créons un facteur indiquant le groupe : > fac <- as.factor(c(4,,,,,,,,3,)) > s.class(dfxy=acp$li,fac=fac,xax=,yax=)

9 Université d'angers master MIM TD analyse de données p. 9 Exemple II : Charolais Zebu Nous étudions dans cette partie les masses de différentes parties d'un groupe de 3 bovins constitué de charolais ( à ) et zebus (3 à 3). Les variables représentent: poids vif. poids de la carcasse. poids de la viande de première qualité. poids de la viande totale. poids du gras. poids des os. Analyser les résultats ci-dessous. > zebu<-read.table("zebu.txt",header=t) > zebu vif carc qsup tota gras os race > race <- as.factor(race) > zebu <- zebu[,:6]. Paramètres statistiques: Moyenne et écart-type par race Variable: carc Variable: gras Variable: os Variable: qsup Variable: tota Variable: vif Matrice des corrélations vif carc qsup tota gras os vif carc qsup tota gras os Représentation graphique 6 8 carc gras os qsup tota vif

10 Université d'angers master MIM TD analyse de données p. 3. Valeurs propres > library(ade4) > acp <- dudi.pca(zebu) > round(acp$eig,) [] > round(cumsum(acp$eig*),) [] Analyse des variables inertie <-inertia.dudi(acp, col.inertia=true) Coordonnées >round(acp$co,) Comp Comp Comp3 vif carc qsup tota gras os [CTR en ième ] > inertie$col.abs Comp Comp Comp3 vif carc qsup tota gras os [Qlt en ième ] > inertie$col.re Comp Comp Comp3 con.tra vif carc qsup tota gras os s.corcircle(acp$co,xax=,yax=) axes axes - 3 axes - 3

11 Université d'angers master MIM TD analyse de données p. 4. Analyse des individus inertie <-inertia.dudi(acp, row.inertia=true) Composantes principales > round(acp$li,3) Axis Axis Axis [CTR en ième ] > inertie$row.abs Axis Axis Axis [Qlt en ième ] > inertie$row.re Axis Axis Axis3 con.tra axes axes - 3

12 Université d'angers : master MIM TP analyse des données p. axes Avec les informations sur les races : axes - axes - 3

13 Université d'angers : master MIM TP analyse des données p. 3 Exemple 3 : Etude de l'alimentation des foyers français Soit le tableau suivant décrivant en 97 la consommation annuelle en francs de différentes catégories socio-professionnelles pour différents aliments. pain légumes fruits viandes volailles lait vin MA EM CA MA EM CA MA EM CA MA EM CA CA, MA, EM indiquent la profession: cadre, agent de maintenance et employé. Le chiffre indique le nombre de personnes constituant la famille. Le fichier s'appelle csp.txt. Reprendre l'étude de l'exemple précédent pour étudier ce tableau.

TD ANALYSE DES DONNEES

TD ANALYSE DES DONNEES Master 2 TVPS Angers Analyse des données : ACP AFC CAH 1 TD ANALYSE DES DONNEES Exemple d'acp : Etude olfacto-gustative de cidres Plusieurs caractéristiques du cidre ont été mesurées sur 10 cidres différents.

Plus en détail

2 Première analyse en composantes principales

2 Première analyse en composantes principales UNIVERSITÉ MONTPELLIER 3 Année Universitaire 2011-2012 - Analyse de données - TP 3 corrigé 1 Introduction 1) Calculer la matrice de corrélation des 8 variables : > round(cor(portable2),digits=2) Commodite

Plus en détail

scilab à l École nationale des ponts et chaussées http://cermics.enpc.fr/scilab Analyse en composantes principales et apprentissage 6 juin 2007 (dernière date de mise à jour) Table des matières 1 Rappels

Plus en détail

Reconnaissance des formes

Reconnaissance des formes Reconnaissance des formes - Chapitre 2 - Analyse en composantes principales Objectifs Contexte : Chaque individu x i du tableau X est considéré comme un point d un espace vectoriel E de dimension p. L

Plus en détail

TD 2 : Statistique descriptive

TD 2 : Statistique descriptive Université Montpellier Année - M ICAP TD : Statistique descriptive Exercice. Analyse en composantes principales On dispose des notes sensorielles (rond à astringent) et hédoniques (chaleur et profondeur)

Plus en détail

Chapitre 9 ANALYSE EN COMPOSANTES PRINCIPALES

Chapitre 9 ANALYSE EN COMPOSANTES PRINCIPALES Chapitre 9 ANALYSE EN COMPOSANTES PRINCIPALES On consultera aussi le document «Introduction numérique à l analyse en composantes principales». 1 NATURE DES DONNÉES ET OBJECTIFS. 1.1 Nature des données.

Plus en détail

Notes cours : Analyse de données Statistique descriptive Enseignant : M. KECHICHED Rabah

Notes cours : Analyse de données Statistique descriptive Enseignant : M. KECHICHED Rabah Notes cours : Analyse de données Statistique descriptive Enseignant : M. KECHICHED Rabah Département : Sciences de la Terre et de l Univers Université 1. ANALYSE DE DONNEES STATISTIQUES 1. 1. Analyse monovariée

Plus en détail

Analyse de données. Version de Marc Dinh. Hervé Bertrand

Analyse de données. Version de Marc Dinh. Hervé Bertrand Analyse de données 2012 Version de Marc Dinh 11 février 2012 Hervé Bertrand 1 Sommaire 1 Objectif de l ADD 3 2 Type de données 4 3 Calcul matriciel et ADD 4 4 Approche géométrique : ellipsoïde d inertie

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Master 1 SES C. Hardouin Analyse en Composantes Principales Les données Le tableau des données initiales Définitions X 1 X p x 1,1... x 1,p X =. x i,k. x n,1... x n,p Individu 1 Individu n Tableau des

Plus en détail

Chapitre 2: Analyse en Composante Principale

Chapitre 2: Analyse en Composante Principale Chapitre 2: Analyse en Composante Principale Mohamed Essaied Hamrita ISMAI, Université Kairouan. Tunisie mhamrita@gmail.com http://hamrita.e-monsite.com/ Février 2014 Plan du chapitre Inroduction Motivation

Plus en détail

D- interprétation d une ACP

D- interprétation d une ACP D- interprétation d une ACP 1- choix du nombre d axes 3- interprétation des axes 2- représentation graphique 4- Qualité de représentation 5- Synthèse D-Interprétation d une ACP La décomposition précédente

Plus en détail

L Analyse en Composantes Principales

L Analyse en Composantes Principales L Analyse en Composantes Principales Table des matières 1 Introduction 1 2 Notations 2 3 Définitions 2 4 Projections sur un sous-espace 3 5 Axes principaux 4 6 Facteurs principaux 4 7 Composantes principales

Plus en détail

L analyse en composantes principales

L analyse en composantes principales L analyse en composantes principales 1 La méthode 1 Les données, les objectifs de la méthode L Analyse en Composantes Principales (ACP) est la méthode adaptée à l exploration synthétique de l information

Plus en détail

Introduction. Analyse en composantes la matrice principalesdes. Premiers calculs. Exemple

Introduction. Analyse en composantes la matrice principalesdes. Premiers calculs. Exemple Introduction 19 janvier 2015 Dans la plupart des applications on observe un nombre p très grand de variables; L étude univariée et bivariée est une phase indispensable mais tout à fait insuffisante; Prendre

Plus en détail

Année 2011-2012. Biostatistiques. Rappels de cours et travaux dirigés. Analyse des données M2. jean-marc.labatte@univ-angers.

Année 2011-2012. Biostatistiques. Rappels de cours et travaux dirigés. Analyse des données M2. jean-marc.labatte@univ-angers. Année 2011-2012 Biostatistiques Rappels de cours et travaux dirigés Analyse des données M2 auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr - 1 - Table des matières SOMMAIRE VIII ANALYSE EN

Plus en détail

1 Fréquentation des salles de cinéma en 2003

1 Fréquentation des salles de cinéma en 2003 TD6 : Fréquentation des salles de cinéma en 2003 (correction) 1 Fréquentation des salles de cinéma en 2003 On étudie des données fournies par le Centre National de Cinématographie (CNC) concernant l année

Plus en détail

Analyse en composantes principales

Analyse en composantes principales Analyse en composantes principales Gilles Gasso, Stéphane Canu INSA Rouen - Département ASI Laboratoire LITIS 1 17 septembre 01 1. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles

Plus en détail

CHAPITRE 9 ANALYSE CANONIQUE. Master 2ème Année Page 1

CHAPITRE 9 ANALYSE CANONIQUE. Master 2ème Année Page 1 CHAPITRE 9 ANALYSE CANONIQUE Master 2ème Année Page 1 Plan 1. Les données 2. Le principe de l'analyse canonique 3. Les représentations graphiques 4. Une application de l'ac 5. Les cas particuliers de l'ac

Plus en détail

ANALYSE MULTIDIMENSIONNELLE DES DONNEES Sujet donné en et indications de correction

ANALYSE MULTIDIMENSIONNELLE DES DONNEES Sujet donné en et indications de correction UNIVERSITE DE BRETAGNE OCCIDENTALE Année universitaire 2009-2010 FACULTE DES LETTRES ET SCIENCES HUMAINES CS 93837-29238 BREST CEDEX 3 SECTION: Psychologie - Master 2ème année N.B. Calculatrice et documents

Plus en détail

L analyse multi variée

L analyse multi variée L analyse multi variée Ensemble de méthodes destinées à synthétiser l information - Méthodes descriptives Elles visent à structurer et à simplifier les données issues de plusieurs variables (ACP, AFC)

Plus en détail

Analyse en composantes principales

Analyse en composantes principales Analyse en composantes principales Alain RAKOTOMAMONJY - Gilles GASSO INSA Rouen -Département ASI Laboratoire LITIS 11 Février 2009 A. RAKOTOMAMONJY G. GASSO (INSA ASI) Analyse en composantes principales

Plus en détail

Sommaire. ISBN Presses universitaires de Rennes, 2013,

Sommaire. ISBN Presses universitaires de Rennes, 2013, Sommaire 1 Analyse en Composantes Principales (ACP) 1 1.1 Données - notations - exemples.................... 1 1.2 Objectifs................................. 2 1.2.1 Étude des individus......................

Plus en détail

Chapitre 3 : Analyse en composante principale (ACP) () 1 / 59

Chapitre 3 : Analyse en composante principale (ACP) () 1 / 59 Chapitre 3 : Analyse en composante principale (ACP) () 1 / 59 I. Préambule L ACP propose, à partir d un tableau de données relatives à p variables quantitatives portant sur n unités (individus), des représentations

Plus en détail

L'Analyse en Composantes Principales (ACP)

L'Analyse en Composantes Principales (ACP) L'Analyse en Composantes Principales (ACP) Un exemple élémentaire On considère la population constituée par 17 pays (ou individus) sur lesquels on a relevé les valeurs de deux caractères: l'espérance de

Plus en détail

Transcription de l'audio du cours d'analyse en Composantes Principales

Transcription de l'audio du cours d'analyse en Composantes Principales Transcription de l'audio du cours d'analyse en Composantes Principales Première partie. Deuxième partie. Troisième partie. Données - problématique Diapositives 1 à 9 Pages 2 à 5 Etude des individus et

Plus en détail

PASW/SPSS : Analyse en composantes principales (ACP)

PASW/SPSS : Analyse en composantes principales (ACP) PASW/SPSS : Analyse en composantes principales (ACP) Vincent Jalby 3 octobre 009 Analyse > Réduction des dimensions > Analyse factorielle 1 Mise en œuvre 1.1 Descriptives Statistiques - Caractéristiques

Plus en détail

Introduction aux méthodes statistiques

Introduction aux méthodes statistiques 26 Février 2008 Christian CAPARIN christian.caparin@wanadoo.fr >>Introduction BUT DE LA PREENTATION Faire une présentation non théorique des méthodes statistiques utilisées en pratique Partir des problèmes

Plus en détail

Analyse Factorielle des Correspondances (AFC)

Analyse Factorielle des Correspondances (AFC) Analyse Factorielle des Correspondances (AFC) Jérôme Pagès (& François Husson) Laboratoire de mathématiques appliquées - Agrocampus Rennes husson@agrocampus-ouest.fr / 43 Analyse Factorielle des Correspondances

Plus en détail

Master 1 MMD - Université Paris-Dauphine ANALYSE DES DONNÉES. Travaux Dirigés

Master 1 MMD - Université Paris-Dauphine ANALYSE DES DONNÉES. Travaux Dirigés Master MMD - Université Paris-Dauphine ANALYSE DES DONNÉES Travaux Dirigés 05-06 TD Rappels d algèbre linéaire I. Projecteurs Soit E un espace vectoriel et soient E et E deux sous-espaces vectoriels de

Plus en détail

Statistiques COURS 5. Salle 125. L3 Géographie UE Méthodologie. Intervenants : Année

Statistiques COURS 5. Salle 125. L3 Géographie UE Méthodologie. Intervenants : Année L3 Géographie UE Méthodologie Statistiques COURS 5 Salle 125 Intervenants : Nadège Martiny & Julien Crétat Année 2010-2011 2011 UFR Sciences Humaines (Département de Géographie) UMR Centre de Recherches

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Position du problème : On a observé p variables sur n individus : protocole multivarié. On cherche à remplacer ces p variables par q nouvelles variables résumant au mieux

Plus en détail

Analyse des données 1 / 42

Analyse des données 1 / 42 Analyse des données 1 / 42 2 / 42 Plan 1 Introduction à l analyse des données 2 Analyse bivariée et Ajustement linéaire 3 Analyse en composante principale (ACP) 3 / 42 Chapitre I : I-Introduction à l analyse

Plus en détail

L Analyse en Composantes Principales. A. Morineau

L Analyse en Composantes Principales. A. Morineau L Analyse en Composantes Principales A. Morineau - 2005 1 L ACP, qu est ce? L ACP, qu est ce? Principe géométrique de l ACP X(n,p) tableau de données A. Morineau - 2005 4 Principe géométrique de l ACP

Plus en détail

STATISTIQUES. Valeurs Effectifs Effectifs cumulés croissants

STATISTIQUES. Valeurs Effectifs Effectifs cumulés croissants STATISTIQUES I Rappels : moyenne - médiane - quartiles Exercice 01 Le service de contrôle d'une usine de meubles mesure la longueur en cm d'un élément. On a obtenu les mesures suivantes : 101 99 102 101

Plus en détail

Exemples d analyse en composantes principales

Exemples d analyse en composantes principales Exemples d analyse en composantes principales 1.1.1 Mini-exemple Ci-dessous, un tableau de notes attribuées à 9 sujets dans 5 matières. Sujet Math Sciences Français Latin Musique Jean 6 6 5 5,5 8 Aline

Plus en détail

Exercices de statistique.

Exercices de statistique. Auteurs et sources : E. Leclercq & A. Sébaoun & Oraux de concours & Exercice officiel T E S Exercices de statistique. Séries simples Une série simple X = (x i, n i ) (x i =terme d indice i de la série

Plus en détail

Analyse exploratoire des données

Analyse exploratoire des données Analyse exploratoire des données Christophe Lalanne lalanne@ciep.fr Centre international d études pédagogiques juillet 2007 C. Lalanne (CIEP) Analyse exploratoire des données juillet 2007 1 / 25 Organisation

Plus en détail

Séance 1: Analyse en composantes principales

Séance 1: Analyse en composantes principales Séance 1: Analyse en composantes principales Révisions Laboratoire de Statistique et Probabilités UMR 5583 CNRS-UPS www.lsp.ups-tlse.fr/gadat Première partie I Analyse en Composantes Principales Motivations

Plus en détail

Statistiques COURS 2. Salle 125. L3 Géographie UE Méthodologie. Intervenants :

Statistiques COURS 2. Salle 125. L3 Géographie UE Méthodologie. Intervenants : L3 Géographie UE Méthodologie Statistiques COURS 2 Salle 125 Intervenants : Nadège Martiny & Julien Crétat UFR Sciences Humaines (Département de Géographie) UMR Centre de Recherches de Climatologie (CRC)

Plus en détail

Scatters : Correlation circle

Scatters : Correlation circle ADE-4 Scatters Scatters : Correlation circle...2 Scatters : Convex hulls...3 Scatters : Ellipses...5 Scatters : Labels...7 Scatters : Match two scatters...11 Scatters : Neighbouring relationship...13 Scatters

Plus en détail

La société de restauration rapide «ESCAPADE» réalise une étude statistique de gestion lors du lancement d un nouveau menu.

La société de restauration rapide «ESCAPADE» réalise une étude statistique de gestion lors du lancement d un nouveau menu. EXERCICES SUR LES STATISTIQUES Exercice 1 Le relevé de la masse de 80 barils de lessive de poudre (marqués 1 kg net) remplis par une machine automatique est donné dans le tableau «statistique» suivant

Plus en détail

U.E. ADP4. Analyse en Composantes Principales : Dossier Autoeval. 1) Déterminer combien d axes retenir? Répondre en précisant le critère utilisé.

U.E. ADP4. Analyse en Composantes Principales : Dossier Autoeval. 1) Déterminer combien d axes retenir? Répondre en précisant le critère utilisé. Université René Descartes, Paris 5 Institut de Psychologie Licence, semestre 6 Page 1 U.E. ADP4 Durée de l épreuve : 1h30 Aucun document n est autorisé. La calculatrice est autorisée sans sa documentation.

Plus en détail

CHAPITRE 10 ANALYSE FACTORIELLE DES CORRESPONDANCES. Master 2ème Année Page 1

CHAPITRE 10 ANALYSE FACTORIELLE DES CORRESPONDANCES. Master 2ème Année Page 1 CHAPITRE 10 ANALYSE FACTORIELLE DES CORRESPONDANCES Master 2ème Année Page 1 Plan 1. Les données 2. L'AFC est une AC particulière 3. Les représentations graphiques 4. Les aides à l'interprétation 5. Une

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim.univ-amu.fr/ Introduction (1) Étudier

Plus en détail

Correction Examen Analyse des Données

Correction Examen Analyse des Données I.U.T de Caen STID 2ème année Département STID Année Universitaire 2005-2006 Responsable de cours : Alain LUCAS Correction Examen Analyse des Données Partie A Analyse en Composantes Principales 1. On dénombre

Plus en détail

TD é valué : Analyse en Composante Principale (ACP)

TD é valué : Analyse en Composante Principale (ACP) TD é valué : Analyse en Composante Principale (ACP) Constance Mahlberg & Antoine Mazuyer (23/11/2012) Construction de la matrice des donné es On rentre manuellemment les données. Voici les résultats de

Plus en détail

Les corrigés des examens DPECF - DECF

Les corrigés des examens DPECF - DECF 48h après l examen sur www.comptalia.com 1 ère Ecole en ligne des professions comptables Spécialiste des préparations à l'expertise Comptable et des formations en compta-gestion via Internet Les corrigés

Plus en détail

Session 1 durée 3 heures

Session 1 durée 3 heures Université de Nantes Mai 27 Master MIM Examen d'analyse de données Session durée 3 heures Les documents sont interdits. Les calculatrices sont autorisées. Exercice : - Etude d un tableau à l aide d une

Plus en détail

L Analyse Factorielle des Correspondences (AFC)

L Analyse Factorielle des Correspondences (AFC) Université de Bordeaux - Master MIMSE - 2ème année L Analyse Factorielle des Correspondences (AFC) Marie Chavent http://wwwmathu-bordeauxfr/ machaven/ 204-205 Le but est l analyse des relations entre deux

Plus en détail

Cours 9! Introduction à la Reconnaissance des Formes (RdF)! Analyse de données, classification dʼimages!

Cours 9! Introduction à la Reconnaissance des Formes (RdF)! Analyse de données, classification dʼimages! Bases du traitement des images BIMA Cours 9! Introduction à la Reconnaissance des Formes (RdF)! Analyse de données, classification dʼimages! Prof. Matthieu Cord! 1 Plan 1. Introduction, problématiques

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Maxime CHAMBREUIL maxime.chambreuil@insa-rouen.fr mars Table des matières Explication. Préparation des données.............................. Application de la fonction

Plus en détail

Classification non supervisée

Classification non supervisée Classification non supervisée 13 décembre 2012 Table des matières 1 Présentation du problème 1 2 Visualisation des données 2 3 Algorithme des k-means 3 4 Classification Ascendante Hiérarchique - CAH 4

Plus en détail

Analyse de données M1 Statistique et économétrie V. Monbet Analyse en composantes principales

Analyse de données M1 Statistique et économétrie V. Monbet Analyse en composantes principales Analyse de données M1 Statistique et économétrie - 2013-2014 V. Monbet Analyse en composantes principales Les objectifs de ce TD sont 1. de revoir le cours sur l analyse en composantes principales, 2.

Plus en détail

TP sources électriques

TP sources électriques TP sources électriques Objectif : étudier différents dipôles actifs linéaires ou non linéaires. Les mots générateur et source seront considérés comme des synonymes. 1 Source dipolaire linéaire 1.1 Méthode

Plus en détail

Analyses factorielles multivariées et classification Application sous XlStat - 4 jours (*)

Analyses factorielles multivariées et classification Application sous XlStat - 4 jours (*) Analyses factorielles multivariées et classification - 4 jours (*) Référence : STA-N2-StatAFM Durée : 4 jours soit 28 heures (*) : La durée proposée est une durée standard. Elle peut être adaptée selon

Plus en détail

TP 1 : Initiation à Scilab Théorèmes limites

TP 1 : Initiation à Scilab Théorèmes limites Activité 1 : Initiation à Scilab TP 1 : Initiation à Scilab Théorèmes limites Scilab est un logiciel de calcul scientifique développé par l'inria et appliqué en particulier au calcul numérique matriciel.

Plus en détail

Analyse des données M1 Miage et SCA

Analyse des données M1 Miage et SCA Analyse des données M1 Miage et SCA Matthieu Barrandon, Marco Dozzi Février 2009 Matthieu Barrandon, Marco Dozzi () Février 2009 1 / 26 1. Analyse factorielle des correspondances L analyse factorielle

Plus en détail

Tableaux multiples Et Données Evolutives 1. Méthode STATIS

Tableaux multiples Et Données Evolutives 1. Méthode STATIS Tableaux multiples Et Données Evolutives 1 Méthode STATIS N. Niang Keita niang@cnam.fr SOMMAIRE Introduction La méthode STATIS Exemple: 1er tour scrutins élections présidentielles La méthode STATIS DUALE

Plus en détail

Analyse de données sur le parcours des élèves en Bretagne à partir de données du rectorat

Analyse de données sur le parcours des élèves en Bretagne à partir de données du rectorat Analyse de données sur le parcours des élèves en Bretagne à partir de données du rectorat Stage fait à l ENSAI Du 14 mai au 6 juillet 2007 Les 12 Bassins d Animation de la Politique Educative Auray-Ploërmel-Vannes

Plus en détail

Cours de contrôle de gestion appliqué à l'assurance. Partie 4. Cours complet, exercices d'application et bibliographie sur

Cours de contrôle de gestion appliqué à l'assurance. Partie 4. Cours complet, exercices d'application et bibliographie sur Cours de contrôle de gestion appliqué à l'assurance Partie 4 Cours complet, exercices d'application et bibliographie sur www.cours-assurance.org Partie 4 : Techniques de projection et applications aux

Plus en détail

UE4 Évaluation des méthodes d analyses appliquées aux sciences de la vie et de la santé

UE4 Évaluation des méthodes d analyses appliquées aux sciences de la vie et de la santé 31/10/013 UE4 Évaluation des méthodes d analyses appliquées aux sciences de la vie et de la santé Liaison entre deux variables quantitatives - corrélation linéaire Frédéric Mauny 31 octobre 013 F Mauny

Plus en détail

Analyse de grands jeux de données : classification et analyses multivariées

Analyse de grands jeux de données : classification et analyses multivariées Analyse de grands jeux de données : classification et analyses multivariées M. Bailly-Bechet Université Nice Sophia Antipolis France 1 Introduction On a parfois affaire à de grands jeux de données. Ce

Plus en détail

Source : inspiré d'un exemple de J.-F. Richard, dans Ghiglione, Richard (1994) Cours de Psychologie, Paris : Dunod-CNED, Tome 2,

Source : inspiré d'un exemple de J.-F. Richard, dans Ghiglione, Richard (1994) Cours de Psychologie, Paris : Dunod-CNED, Tome 2, Dossier PSYCHO Source : inspiré d'un exemple de J.-F. Richard, dans Ghiglione, Richard (1994) Cours de Psychologie, Paris : Dunod-CNED, Tome, 465-594. Extrait de l'examen ADP de janvier 005 (Responsable

Plus en détail

Analyse exploratoire. Statistique Exploratoire. Analyse en Composantes Principales. Examen terminal - Durée 2h

Analyse exploratoire. Statistique Exploratoire. Analyse en Composantes Principales. Examen terminal - Durée 2h I.U.T. de Caen LP Biostatistique Département STID Année Universitaire 2008-2009 Responsable de cours : Alain LUCAS Seule la calculatrice type collège est autorisée. Le CM-TD-TP est autorisé. On conservera

Plus en détail

Séries statistiques. Série statistique simple = ensemble de données relatives à une variable mesurée sur un échantillon ou une population d'éléments

Séries statistiques. Série statistique simple = ensemble de données relatives à une variable mesurée sur un échantillon ou une population d'éléments Statistiques IUP 2 Objet du cours Au cours du cours de Statistiques de 1e années, vous avez appris à maîtriser les deux volets du travail interprétatif du statisticien : Statistique descriptive Statistique

Plus en détail

TD 1: Analyse en Composantes Principales

TD 1: Analyse en Composantes Principales TD 1: Analyse en Composantes Principales 1 Questions de cours Soit un tableau de données, X n p contenant les observations de n individus statistiques sur p variables quantitatives continues. L'espace

Plus en détail

Analyse Typologique avec SPSS. On souhaite classifier le comportement de consommateurs en fonction de leurs attitudes vis à vis du shopping.

Analyse Typologique avec SPSS. On souhaite classifier le comportement de consommateurs en fonction de leurs attitudes vis à vis du shopping. Analyse Typologique avec SPSS Cas : On souhaite classifier le comportement de consommateurs en fonction de leurs attitudes vis à vis du shopping. Dans le cadre d un pré-test, une étude quantitative a été

Plus en détail

STATISTIQUES. On considère la série statistique donnée par le tableau : Valeur x 1 x 2 x p Effectif n 1 n 2 n p i = p

STATISTIQUES. On considère la série statistique donnée par le tableau : Valeur x 1 x 2 x p Effectif n 1 n 2 n p i = p STATISTIQUES I Rappels : moyenne - médiane - quartiles Exercice 01 (voir réponses et correction) Le service de contrôle d'une usine de meubles mesure la longueur en cm d'un élément. On a obtenu les mesures

Plus en détail

Université d Orléans Master I ESA Analyse des données qualitatives 1

Université d Orléans Master I ESA Analyse des données qualitatives 1 Université d Orléans Master I ESA Analyse des données qualitatives 1 Analyse de données qualitatives Nils Berglund M1 ESA 2015-2016 2 heures Résumé manuscrit de 4 pages A4 Calculatrice non programmable

Plus en détail

Plan du cours. Séries bivariées

Plan du cours. Séries bivariées Plan du cours 1. Introduction 2. Statistique descriptive séries univariées 3. Calcul des probabilités 4. Variables aléatoires et lois de probabilité 5. Arbres de décision 6. Statistique descriptive séries

Plus en détail

STATISTIQUES I SERIE STATISTIQUE A UNE VARIABLE

STATISTIQUES I SERIE STATISTIQUE A UNE VARIABLE STATISTIQUES I SERIE STATISTIQUE A UNE VARIABLE 1 Définition Les statistiques ont pour but la collecte, l'analyse et l'interprétation des observations relatives à des phénomènes collectifs. 2 Vocabulaire

Plus en détail

Statistique et analyse des données

Statistique et analyse des données Statistique et analyse des données PABLO GONZALEZ VICENTE Recherche de la dimension de l espace latent en ACP Statistique et analyse des données, tome 11, n o 3 (1986), p. 19-29

Plus en détail

Logiciel R ENCADRER PAR: DR.MOHAMED EL MEROUANI P R É S E N T E R P A R :

Logiciel R ENCADRER PAR: DR.MOHAMED EL MEROUANI P R É S E N T E R P A R : Logiciel R P R É S E N T E R P A R : E L A M I N E E L A L A M I N O H A E L H A D R A T I A B I R H A C I N I A L I ENCADRER PAR: DR.MOHAMED EL MEROUANI Plan: Section 1: Introduction Définition Description

Plus en détail

Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui :

Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui : Sommaire SAMEDI 28 JANVIER 2012 Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui : Un rappel de cours sur les séries statistiques à deux variables

Plus en détail

ANALYSES MULTIDIMENSIONNELLES ET APPLICATIONS INFORMATIQUES Enoncé et indications de réponses

ANALYSES MULTIDIMENSIONNELLES ET APPLICATIONS INFORMATIQUES Enoncé et indications de réponses UNIVERSITE DE BRETAGNE OCCIDENTALE Année universitaire 2008-2009 FACULTE DES LETTRES ET SCIENCES HUMAINES CS 93837-29238 BREST CEDEX 3 SECTION: Psychologie - Master 1ère année Durée: 2 heures ANALYSES

Plus en détail

Examen d'analyse des données

Examen d'analyse des données Université d'angers Janvier 2007 Master 1 MIM : Analyse des données Examen d'analyse des données Durée : 3 heures Les documents ne sont pas autorisés. La calculatrice est autorisée. Exercice I (7 points)

Plus en détail

Statistiques descriptives

Statistiques descriptives NOM:... PRENOM:... Date:... Classe:... Section:... Statistiques descriptives Série statistique à une variable (qualitative et quantitative) et à deux variables (nuage de points) EXERCICES Table des matières

Plus en détail

Imagerie couleur Partie 2 : Réduction de l ensemble d attributs pour la classification d images

Imagerie couleur Partie 2 : Réduction de l ensemble d attributs pour la classification d images Imagerie couleur Partie 2 : Réduction de l ensemble d attributs pour la classification d images Alice POREBSKI Introduction 4,5h de cours Intérêt de réduire le nombre d attributs Les méthodes d extraction

Plus en détail

Exercices sur le modèle de régression linéaire simple

Exercices sur le modèle de régression linéaire simple ESSEC de Tunis Exercices sur le modèle de régression linéaire simple Exercice 1 Le tableau ci-dessous représente l évolution du revenu disponible brut et de la consommation des ménages en euros pour un

Plus en détail

TP de Statistiques Descriptives STID Corrigé TP5. Partie 1 Liaison Variable qualitative/quantitative

TP de Statistiques Descriptives STID Corrigé TP5. Partie 1 Liaison Variable qualitative/quantitative TP de Statistiques Descriptives STID Corrigé TP5 Attention! Il n'existe pas une manière unique de construire un compte-rendu. Ce document contient seulement des éléments de correction pour la seconde partie

Plus en détail

Exemple d'ajustement affine par une méthode graphique, par la méthode des moindres carrés et de problème d'optimisation

Exemple d'ajustement affine par une méthode graphique, par la méthode des moindres carrés et de problème d'optimisation Exercice 1 Exemple d'ajustement affine par une méthode graphique, par la méthode des moindres carrés et de problème d'optimisation La société de Werloing a mis au point un nouveau logiciel de gestion destiné

Plus en détail

D. Chessel & A.B. Dufour - Biométrie et Biologie Evolutive - Université Lyon1. Fiche de Biostatistique. Exercices. D. Chessel & A.B. Dufour.

D. Chessel & A.B. Dufour - Biométrie et Biologie Evolutive - Université Lyon1. Fiche de Biostatistique. Exercices. D. Chessel & A.B. Dufour. Fiche de Biostatistique Exercices D. Chessel & A.B. Dufour Résumé La fiche donne des énoncés d'exercices d'algèbre et d'analyse des données. Quand une phrase commence par? décider si elle est vraie ou

Plus en détail

PRÉ-TEST MAT-5102 FORME A. Statistiques III. Seuil de réussite 75% Questionnaire. Produit par Céline Montpetit

PRÉ-TEST MAT-5102 FORME A. Statistiques III. Seuil de réussite 75% Questionnaire. Produit par Céline Montpetit PRÉ-TEST MAT-102 FORME A Statistiques III Seuil de réussite 7% Questionnaire Produit par Céline Montpetit Février 200 NO : 1 a) Tania a été soumise à l examen d admission à un programme d excellence. Sa

Plus en détail

Dossier PSYCHO Analyse

Dossier PSYCHO Analyse Dossier PSYCHO Analyse Type des variables 1/ Indiquer le type de chacune des variables du dossier PSYCHO, (Nominale / Ordinale / Numérique) : - Nombre d'années d'études de psychologie (ANPSY) : Numérique

Plus en détail

ANALYSE DE DONNEES : TP3

ANALYSE DE DONNEES : TP3 Sébastien Arcanger Master2 Statistique -Économétrie, 2008-2009 ANALYSE DE DONNEES : TP3 Nous allons travailler sur des données concernant les départements français divisées en trois grands thèmes : la

Plus en détail

Tableaux multiples et données évolutives. N. Niang Keita Gilbert Saporta

Tableaux multiples et données évolutives. N. Niang Keita Gilbert Saporta Tableaux multiples et données évolutives N. Niang Keita niang@cnam.fr Gilbert Saporta gilbert.saporta@cnam.fr 1 2 Plan 1. Généralités 2. Double ACP 3. STATIS 4. AFM 3 1 Généralités Suite de tableaux individusxvariablesxtemps

Plus en détail

Tableaux multiples et données évolutives

Tableaux multiples et données évolutives Tableaux multiples et données évolutives N. Niang Keita niang@cnam.fr Gilbert Saporta gilbert.saporta@cnam.fr mai 2011 1 Suite de tableaux individusxvariablesxtemps temps discret 1,2,.. t,... T «données

Plus en détail

TP 4 : Statistique descriptive bidimensionnelle

TP 4 : Statistique descriptive bidimensionnelle UFR des SCIENCES -- Département de mathématiques TP 4 : Statistique descriptive bidimensionnelle A. PHILIPPE Exercice 1 Corrélation La corrélation entre deux variables X et Y mesure le lien linéaire entre

Plus en détail

Introduction aux statistiques descriptives

Introduction aux statistiques descriptives Introduction aux statistiques descriptives Illustrée avec XLSTAT Jean Paul Maalouf jpmaalouf@xlstat.com 13 octobre 2016 www.xlstat.com 1 PLAN XLSTAT : qui sommes-nous? Statistiques : définition et catégories

Plus en détail

Fiche TD avec le logiciel. Musique. D. Chessel & A.B. Dufour

Fiche TD avec le logiciel. Musique. D. Chessel & A.B. Dufour Fiche TD avec le logiciel Musique : tdr53 D. Chessel & A.B. Dufour Exercices simples pour repérer que dans une analyse en composantes principales, il est question en même temps de ressemblances (corrélation

Plus en détail

Baccalauréat S Amérique du Sud novembre 2005

Baccalauréat S Amérique du Sud novembre 2005 Durée : 4 heures Baccalauréat S Amérique du Sud novembre 5 EXERCICE 1 Commun à tous les candidats 4 points Les parties A et B sont indépendantes Alain fabrique, en amateur, des appareils électroniques.

Plus en détail

Chapitre 4 Equations différentielles couplées

Chapitre 4 Equations différentielles couplées Université Joseph Fourier UE MAT 127 Mathématiques année 2009-2010 Chapitre 4 Equations différentielles couplées 1 Champs de vecteurs et trajectoires : 1.1 Définitions : Définition 1.1 Un champ de vecteurs

Plus en détail

Mathématiques Statistiques III

Mathématiques Statistiques III Définition du domaine d'examen MAT-5102-1 Mathématiques Statistiques III Corrélation Mise à jour novembre 2004 Définition du domaine d'examen MAT-5102-1 Mathématiques Statistiques III Corrélation Mise

Plus en détail

La corrélation : présentation et test du coefficient de corrélation de Pearson

La corrélation : présentation et test du coefficient de corrélation de Pearson La corrélation : présentation et test du coefficient de corrélation de Pearson C. Bardel Septembre 26 Master 2 Neurosciences / 38 Plan du cours Introduction Mesure de la corrélation : covariance et coefficient

Plus en détail

Parfums & Evocations Profil Pivot

Parfums & Evocations Profil Pivot JOURNÉE EVALUATION SENSORIELLE DE L EBI : MESURE ET SENSORIEL COORDONNÉE PAR A.M. PENSÉ-LHÉRITIER Parfums & Evocations Profil Pivot Projet Etudiant Ingénieur réalisé en 2011 Par Aurélie CALLAC Elodie GUIDAT

Plus en détail

Analyse Factorielle multiple et intégration de données. Application à la variabilité de la qualité de viande de porc.

Analyse Factorielle multiple et intégration de données. Application à la variabilité de la qualité de viande de porc. [Statomique] 15 mai 2012 Analyse Factorielle multiple et intégration de données. Application à la variabilité de la qualité de viande de porc. D Laloë & B Salmi Analyses multivariées: - Analyse factorielle

Plus en détail

Description d une série statistique à deux variables quantitatives Activité 1

Description d une série statistique à deux variables quantitatives Activité 1 Description d une série statistique à deux variables quantitatives Activité 1 On souhaite répondre à la question suivante : «Y a-t-il corrélation entre le revenu mensuel d un ménage et la somme d argent

Plus en détail

Analyse en composantes principales

Analyse en composantes principales 5MS04 - Analyse des données Master 2 spécialité Statistiques Université Pierre et Marie Curie Analyse en composantes principales et une courte introduction à l analyse des correspondances Bertrand MICHEL

Plus en détail

MATHEMATIQUES. Semestre 1. Statistiques descriptives à une variable. TD et exercices

MATHEMATIQUES. Semestre 1. Statistiques descriptives à une variable. TD et exercices Département TECHNIQUES DE COMMERCIALISATION MATHEMATIQUES Semestre 1 Statistiques descriptives à une variable TD et exercices Cours en ligne : sur l ENT, section «outils pédagogiques», plateforme Claroline,

Plus en détail

NOTION DE CORRELATION

NOTION DE CORRELATION Coefficient de de Bravais-Pearson, ou encore linéaire. Le permet de mesurer la liaison ou le lien entre 2 ensembles de données. Par exemple : -Existe-t-il un lien entre le fait que les enfants mangent

Plus en détail