Analyse en Composantes Principales

Dimension: px
Commencer à balayer dès la page:

Download "Analyse en Composantes Principales"

Transcription

1 Plan du cours Analyse en Composantes Principales Introduction Les données Leurs représentations La méthode Modèle Interprétation statistique Espace principal Composantes Principales Représentations Graphiques Individus (qualité globale et individuelle) Variables (qualité de représentation et interprétation) Choix de dimension Part d inertie Eboulis des valeurs propres Pratique de l Préparation des mesures TP N o 2 Scilab Interprétation des résultats TP N o 2 Scilab Bibliographie enib c mp

2 ' $ Introduction 1. Les donne es p variables statistiques Y j, (j = 1 p), n individus affecte s des poids wi, (i = 1 n). n X i = 1 n : wi > 0 et wi = 1 ; yij i = 1 n : y Y = yi yn1... i=1 j = Y (i), mesure de Y j sur le ie me individu. y1j... y1p j yi... yip ynj... ynp 2. Leurs repre sentations espace des individus : E = (IRp, E, M ) espace des variables : F = (IRn, F, D), avec D = diag(w1,, wn ) 3. La me thode repre sentations graphiques optimales de E et F & c mp enib %

3 Modèle 1. Interprétations statistiques variables centrées (vecteurs de F ). longueur d un vecteur écart-type, cosinus d un angle corrélation. 2. Espace principal Observation = Modèle + Bruit. Les u k sont les vecteurs propres D-orthonormés de la matrice XMX D associés aux valeurs propres λ k rangées par ordre décroissant. Les v k, appelés vecteurs principaux, sont les vecteurs propres M-orthonormés de la matrice X DXM = SM associés aux mêmes valeurs propres ; axes principaux = vect{v k }. Espace principal : Êq = vect{v 1 v q }. Projection sur l espace principal : P q est la matrice de projection M-orthogonale sur Êq. 3. Composantes Principales ẑ q i = P q x i + ȳ. Corrélation de Y j et Y k : Moyenne empirique de Y j : y j = y j, 1 n D = D1 yj n. Barycentre des individus : ȳ = Y D1 n. Centrage de Y j : x j = y j y j 1 n. Matrice des données centrées : X = Y 1 n y. Ecart-type de Y j : σ j = (x j Dx j ) 1/2 = x j D. Covariance de Y j et Y k : x j Dx k = x j, x k D. Matrice des covariances : S = n i=1 w ix i x i = X DX. x j,x k D x j D x k D = cos θ D (x j, x k ). {y i ; i = 1,..., n}, n vecteurs aléatoires { indépendants de E, E(εi ) = 0, var(ε y i = z i + ε i, i = 1,..., n avec i ) = σ 2 Γ, σ > 0 inconnu, Γ régulière et connue, A q, sous-espace affine de dimension q de E tel que i, z i A q (q < p). { min X Z M,D Z = Ẑq q k=1 } ; Z M n,p, rang(z) = q. λ 1/2 k u kv k = U q Λ 1/2 V q = X P q, où Pq = V q V q M. enib c mp

4 Représentations Graphiques 1. Individus Projection dans l espace principal : graphiques obtenus représenter au mieux les distances inter-individus mesurées par la métrique M. Chaque individu i représenté par x i est approché par sa projection M-orthogonale ẑ i q sur le sous-espace Êq engendré par les q premiers vecteurs principaux {v 1,..., v q }. En notant e i un vecteur de la base canonique de E, la coordonnée de l individu i sur v k est donnée par x i, v k M = x i Mvk = e i XMvk = c k i. Les coordonnées de la projection M-orthogonale de x i sur Êq sont les q premiers éléments de la ième ligne de la matrice C des composantes principales. Les individus sont étiquetés dans l espace principal, afin de les reconnaître. Qualité globale : part de dispersion expliquée r q = tr(sm P q ) tr(sm) = q k=1 λ k p k=1 λ. k Qualité individuelle : cosinus carré de l angle qu il forme avec sa projection [cos θ(x i, ẑ i q )] 2 = P q x i 2 M x i 2 M = q k=1 (ck i )2 p k=1 (ck i )2 2. Variables Projection dans l espace principal : graphiques obtenus représenter au mieux les corrélations entre les variables (cosinus des angles) et, si celles-ci ne sont pas réduites, leurs variances (longueurs). Une variable X j (ou Y j ) est représentée par la projection D-orthogonale Q q x j sur le sous-espace F q engendré par les q premiers axes factoriels. La coordonnée de x j sur u k est x j, u k D = Du xj k = 1 x j DXMv k = 1 e j X DXMv k = λ k vj k. Les coordonnées de la projection λk λk D-orthogonale de x j sur le sous-espace F q sont les q premiers éléments de la jème ligne de la matrice VΛ 1/2. [ Qualité de représentation : cos θ(x j, Q ] 2 q x j Q q x j 2 q ) = D k=1 x j 2 = λ k(v j k )2 p D k=1 λ k(v j k )2. Interprétation (corrélations principales / initiales) : cor(x j, C k ) = cos θ(x j, c k ) = cos θ(x j, u k ) = xj, u k D x j D = enib c mp λk σ j v k j.

5 Choix de dimension 1. Part d inertie La qualité globale des représentations est mesurée par la part d inertie expliquée r q. La valeur de q est choisie de sorte que cette part d inertie expliquée r q soit supérieure à une valeur seuil fixée a priori par l utilisateur (r q=p = 1). C est souvent le seul critère employé. 2. Eboulis des valeurs propres C est le graphique présentant la décroissance des valeurs propres. Le principe consiste à rechercher, s il existe, un coude (changement de signe dans la suite des différences d ordre 2) dans le graphe et de ne conserver que les valeurs propres jusqu à ce coude. Intuitivement, plus l écart (λ q λ q+1 ) est significativement grand, par exemple supérieur à (λ q 1 λ q ), et plus on peut être assuré de la stabilité de Êq enib c mp

6 Pratique de l 1. Préparation des mesures Traitement préalable à l exécution d un programme d A.C.P. afin de : (a) vérifier la cohérence et l exactitude des données, (b) éliminer certaines variables, (c) procéder à d éventuelles transformations de variables (racine, log...). On obtient alors la matrice Y (n p) qui sera centrée par le programme. Options (a) pondération des individus (par défaut 1 n ) pour regrouper des données identiques, redresser un échantillon... (b) métrique de l espace des individus : par défaut M=Ip ; pour pondérer les variables : M = diag(a 2 1,..., a 2 p). 2. Interprétation des résultats Les contributions permettent d identifier les individus très influents pouvant déterminer à eux seuls l orientation de certains axes ; ces points sont vérifiés, caractérisés, puis éventuellement considérés comme supplémentaires dans une autre analyse. Choisir le nombre de composantes à retenir, c est-à-dire la dimension des espaces de représentation. Axes factoriels interprétés par rapport aux variables initiales. Qualités de représentation des variables initiales. L A.C.P. est une technique linéaire optimisant un critère quadratique ; elle ne tient donc pas compte d éventuelles liaisons non linéaires et présente une forte sensibilité aux valeurs extrêmes. enib c mp

7 Bibliographie 1. Cibois, P. (1983) L Analyse factorielle : analyse en composantes principales et analyse des correspondances. Presses Universitaires de France, ISBN : Philippeau, A. (1986) Comment interpréter les résultats d une analyse en composantes principales? Lavoisier. 3. Salles-Le Gac, D. et Herrera, R.R. (2002) Initiation a l analyse factorielle des données. Fondements mathématiques et interprétations - Cours et Exercices corrigés. Eyrolles, Ellipses, ISBN : Claereboudt, M. et Dufour, P. Analyse des données : Similarité des atolls et relations entre les types d atoll et les caractéristiques de leur colonne d eau en saison sèche. http ://www.com.univ-mrs.fr/ird/atollpol/typatoll/simtypsc.htm enib c mp

Analyse en Composantes Principales (ACP)

Analyse en Composantes Principales (ACP) 1 Analyse en Composantes Principales (ACP) Analyse en Composantes Principales (ACP) Résumé Méthode factorielle de réduction de dimension pour l exploration statistique de données quantitatives complexes

Plus en détail

Introduction à l analyse des données. Analyse des Données (1) Exemple, ville et (in)sécurité. Exemple, ville et (in)sécurité

Introduction à l analyse des données. Analyse des Données (1) Exemple, ville et (in)sécurité. Exemple, ville et (in)sécurité Introduction à l analyse des données Analyse des Données () Le but de l analyse de données est de synthétiser, structurer l information contenue dans des données multidimensionnelles Deux groupes de méthodes

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Introduction à l analyse des données. Olivier Godechot

Introduction à l analyse des données. Olivier Godechot Introduction à l analyse des données Olivier Godechot Introduction. Les données statistiques : de très nombreuses variables. Aucune n est parfaite La perception d un phénomène appréhendée comme la combinaison

Plus en détail

Partie I. Les données quantitatives

Partie I. Les données quantitatives Variables quantitatives : analyse en composantes principales Jean-Marc Lasgouttes https://whorocqinriafr/jean-marclasgouttes/ana-donnees/ Partie I Les données quantitatives Description de données quantitatives

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

Cours de Statistiques

Cours de Statistiques Cours de Statistiques Romain Raveaux 1 1 Laboratoire L3I Université de La Rochelle romain.raveaux01 at univ-lr.fr Octobre 24-11, 2008 1 / 35 Sommaire 1 Quelques Rappels 2 numériques Relations entre deux

Plus en détail

Cours 2-3 Analyse des données multivariées

Cours 2-3 Analyse des données multivariées Cours 2-3 des données s Ismaël Castillo École des Ponts, 13 Novembre 2012 Plan 1 2 3 4 1. On s intéresse à un jeu de données multi-dimensionel, avec n individus observés et p variables d intérêt ( variables

Plus en détail

Partie I. Les données quantitatives

Partie I. Les données quantitatives Variables quantitatives : analyse en composantes principales Jean-Marc Lasgouttes https://whorocqinriafr/jean-marclasgouttes/ana-donnees/ Partie I Les données quantitatives Description de données quantitatives

Plus en détail

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali LUISS, Libera Università Internazionale degli Studi Sociali Université Paris 13 Laboratoire Analyse, Géométrie et Applications UMR 7539 GOUTTE Analyse Statistique des Données Cours 4 Master 2 EID goutte@math.univ-paris13.fr

Plus en détail

Analyse multidimensionnelle de données longitudinales

Analyse multidimensionnelle de données longitudinales Analyse multidimensionnelle de données longitudinales Ndèye Niang Conservatoire National des Arts et Métiers Plan Introduction Terminologie-Notations Méthodes directes Coefficient d association vectorielle

Plus en détail

Analyse en composantes principales

Analyse en composantes principales Université de Rennes 2 Statistiques des données M1-GEO Ouvrages recommandés Analyse en composantes principales Ces livres sont à la BU. Pour les acheter, venir au bureau A-240 ou envoyer un mail : nicolas.jegou@uhb.fr

Plus en détail

Analyse en Composantes. Principales

Analyse en Composantes. Principales AgroParisTech Analyse en Composantes Principales C Duby, S Robin Table des matières Introduction 3 2 Tableau de données 4 3 Choix d une distance 6 4 Choix de l origine 7 5 Moments d inertie 9 5 Inertie

Plus en détail

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 105 HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 1. Introduction En statistiques il arrive fréquemment que les individus soient décrits par un grand nombre de caractères. : voitures décrites par leur

Plus en détail

Analyse simultanée de variables quantitatives et qualitatives. à l aide de l analyse factorielle multiple

Analyse simultanée de variables quantitatives et qualitatives. à l aide de l analyse factorielle multiple Analyse simultanée de variables quantitatives et qualitatives à l aide de l analyse factorielle multiple Jérôme Pagès Laboratoire de mathématiques appliquées Agrocampus France Analyse Factorielle Multiple

Plus en détail

Méthodes de placement multidimensionnelles. Fabrice Rossi Télécom ParisTech

Méthodes de placement multidimensionnelles. Fabrice Rossi Télécom ParisTech Méthodes de placement multidimensionnelles Fabrice Rossi Télécom ParisTech Plan Introduction Analyse en composantes principales Modèle Qualité et interprétation Autres méthodes 2 / 27 F. Rossi Plan Introduction

Plus en détail

Analyse factorielle des correspondances de Benzécri

Analyse factorielle des correspondances de Benzécri Analyse factorielle des correspondances de Benzécri One Pager Décembre 2013 Vol. 8 Num. 011 Copyright Laréq 2013 http://www.lareq.com Analyse Factorielle des Correspondances de Benzécri Une illustration

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées

Plus en détail

Analyse en composantes principales

Analyse en composantes principales Analyse en composantes principales Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire LITIS Analyse en composantes principales p. 1/18 Introduction Objectifs Soit {x i } i=1,,l

Plus en détail

Analyse de données. [Tapez le sous-titre du document] ANALYSE DE DONNEES 2011 2012. ANALYSE DE DONNEES Page 1 LICENCE 3 SCIENCES ECONOMIQUES

Analyse de données. [Tapez le sous-titre du document] ANALYSE DE DONNEES 2011 2012. ANALYSE DE DONNEES Page 1 LICENCE 3 SCIENCES ECONOMIQUES 2011 2012 ANALYSE DE DONNEES 2011 2012 LICENCE 3 SCIENCES ECONOMIQUES COURS DE M. THIERRY BLAYAC Analyse de données [Tapez le sous-titre du document] ANALYSE DE DONNEES Page 1 H34VEN Cours pour Licence

Plus en détail

Analyses statistiques multivariées. Béatrice de Tilière

Analyses statistiques multivariées. Béatrice de Tilière Analyses statistiques multivariées Béatrice de Tilière 23 novembre 2009 ii Table des matières 1 La Statistique 1 1.1 Généralités.................................. 1 1.2 Un peu de vocabulaire............................

Plus en détail

Analyse de spectres d absorbance pour la prédiction des taux de moisissure, de matières grasses et de protéines d échantillons de viande

Analyse de spectres d absorbance pour la prédiction des taux de moisissure, de matières grasses et de protéines d échantillons de viande Université de Nantes M2 Ingénierie Mathématiques Rapport de chimiométrie Analyse de spectres d absorbance pour la prédiction des taux de moisissure, de matières grasses et de protéines d échantillons de

Plus en détail

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h I.U.T de Caen STID 2ème année Département STID Année Universitaire 2002-2003 Responsable de cours : Alain LUCAS Seule la calculatrice type collège est autorisée. Seul le cours est autorisé. On rappelera

Plus en détail

Analyse de Données. Analyse en Composantes Principales (ACP)

Analyse de Données. Analyse en Composantes Principales (ACP) Analyse de Données Analyse en Composantes Principales (ACP) Analyse en composantes principales (ACP) ** Sur toute la fiche, on notera M' la transposée de M. Cadre de travail : On a des données statistiques

Plus en détail

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Ludovic Denoyer 21 septembre 2015 Ludovic Denoyer () FDMS 21 septembre 2015 1 / 1 Contexte Observation La plupart des bonnes

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

Statistique Descriptive Multidimensionnelle. (pour les nuls)

Statistique Descriptive Multidimensionnelle. (pour les nuls) Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Multidimensionnelle (pour les nuls) (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219

Plus en détail

Analyse discriminante

Analyse discriminante Analyse discriminante Christine Decaestecker & Marco Saerens ULB & UCL LINF2275 1 Analyse Discriminante Particularités: 2 formes/utilisations complémentaires: méthode factorielle: description "géométrique"

Plus en détail

Chapitre 9 ANALYSE MULTIDIMENSIONNELLE

Chapitre 9 ANALYSE MULTIDIMENSIONNELLE Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 9 ANALYSE MULTIDIMENSIONNELLE L analyse des données multidimensionnelles regroupe un ensemble de méthodes

Plus en détail

L analyse en composantes principales

L analyse en composantes principales L analyse en composantes principales 1 La méthode 1 Les données, les objectifs de la méthode L Analyse en Composantes Principales (ACP) est la méthode adaptée à l exploration synthétique de l information

Plus en détail

1 Diagonalisation des endomorphismes auto-adjoints, en dimension finie

1 Diagonalisation des endomorphismes auto-adjoints, en dimension finie Annette Paugam Diagonalisation des auto-adjoints Applications aux formes quadratiques : Directions principales Applications en Géométrie, en Statistique et en Mécanique Les paragraphes, 2, 3 donnent un

Plus en détail

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage Classification Exemple : Enquête d opinion sur les OGM Pauline Le Badezet Alexandra Lepage SOMMAIRE Introduction Méthodologie Méthode de partitionnement Classification Ascendante Hiérarchique Interprétation

Plus en détail

Analyse en composantes principales (ACP)

Analyse en composantes principales (ACP) Analyse en composantes principales (ACP) François Husson Laboratoire de mathématiques appliquées - Agrocampus Rennes husson@agrocampus-ouest.fr 1 / 31 Quel type de données? L ACP s intéresse à des tableaux

Plus en détail

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation Programme des épreuves des concours externes de recrutement des personnels E1 RECRUTEMENT DES ASSISTANTS INGENIEURS DE RECHERCHE ET DE FORMATION...2 E1.1 Gestionnaire de base de données...2 E1.2 Développeur

Plus en détail

ANALYSE FACTORIELLE DE DONNÉES MIXTES : PRINCIPE ET

ANALYSE FACTORIELLE DE DONNÉES MIXTES : PRINCIPE ET ANALYSE FACTORIELLE DE DONNÉES MIXTES : PRINCIPE ET EXEMPLE D APPLICATION Jérôme Pagès Laboratoire de mathématiques appliquées Agrocampus, 35042 Rennes cedex email : pages@agrorennes.educagri.fr Résumé

Plus en détail

Partie 1 : Étude des caractéristiques d un ensemble d hôtels

Partie 1 : Étude des caractéristiques d un ensemble d hôtels Analyse de données M1 Statistique et économétrie - 2012 V. Monbet Classification Partie 1 : Étude des caractéristiques d un ensemble d hôtels Le fichier hotels.csv contient des caractéristiques liées au

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

Analyse des données et Data Mining

Analyse des données et Data Mining Analyse des données et Data Mining Analyse en composantes principales utc sy09 1 Objectif des méthodes factorielles Visualiser, traiter des données multidimensionnelles Problème difficile Information apportée

Plus en détail

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème.

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème. Mathématiques - classe de 1ère des séries STI2D et STL. 1. Analyse On dote les élèves d outils mathématiques permettant de traiter des problèmes relevant de la modélisation de phénomènes continus ou discrets.

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Cours IFT6266, Apprentissage Non-Supervisé de Variétés

Cours IFT6266, Apprentissage Non-Supervisé de Variétés Cours IFT6266, Apprentissage Non-Supervisé de Variétés L Apprentissage Non-Supervisé L apprentissage non-supervisé vise à caractériser la distribution des données, et les relations entre les variables,

Plus en détail

Les quatre opérations sur les nombres entiers Statistiques et probabilités I. Code Unités Devoirs Code Unités Devoirs

Les quatre opérations sur les nombres entiers Statistiques et probabilités I. Code Unités Devoirs Code Unités Devoirs 1 re secondaire 2 e secondaire Les quatre opérations sur les nombres entiers Statistiques et probabilités I MAT-1005-2 2 3 MAT-2008-2 2 3 (+, -, x, ) dans l ensemble des entiers Z. Ce premier cours portant

Plus en détail

1 La méthode de l ACP

1 La méthode de l ACP Université de Montpellier 2 M2 MASS TP4 : Introduction au logiciel SAS Procédures statistiques multivariées : Analyse en Composantes Principales 1 La méthode de l ACP D après le cours de P. Besse www.math.univ-toulouse.fr/~besse

Plus en détail

DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES

DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES Université Paris1, Licence 00-003, Mme Pradel : Principales lois de Probabilité 1 DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES Notations Si la variable aléatoire X suit la loi L, onnoterax

Plus en détail

Utiliser les propriétés Savoir réduire un radical savoir +,-,x,: Utiliser les propriétés des puissances Calculer avec des puissances

Utiliser les propriétés Savoir réduire un radical savoir +,-,x,: Utiliser les propriétés des puissances Calculer avec des puissances ARITHMETIQUE 1 C B A Numération Ecrire en lettres et en chiffres Poser des questions fermées autour d un document simple (message, consigne, planning ) Connaître le système décimal Déterminer la position

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Il y a 24 individus en ligne (les modèles de voitures) et 6 variables en colonnes (paramètres mécaniques). Valeurs propres

Il y a 24 individus en ligne (les modèles de voitures) et 6 variables en colonnes (paramètres mécaniques). Valeurs propres VOITURE: On étudie 6 différents paramètres mécaniques (les variables), exprimées dans des unités différentes, de 24 modèles de voitures (les individus). Modèle Cylindre Puissance Vitesse Poids Longueur

Plus en détail

Séance 2: Modèle Euclidien

Séance 2: Modèle Euclidien Généralités Métrique sur les INDIVIDUS Métrique sur les VARIABLES Inertie Analyse des individus Laboratoire de Statistique et Probabilités UMR 5583 CNRS-UPS www.lsp.ups-tlse.fr/gadat Généralités Métrique

Plus en détail

Introduction au modèle linéaire général

Introduction au modèle linéaire général Résumé Introductions au modèle linéaire général Retour au plan du cours Travaux pratiques 1 Introduction L objet de ce chapitre est d introduire le cadre théorique global permettant de regrouper tous les

Plus en détail

Analyse Statistique pour Le Traitement d Enquêtes

Analyse Statistique pour Le Traitement d Enquêtes DAT 104, année 2004-2005 p. 1/90 Analyse Statistique pour Le Traitement d Enquêtes Mastère Développement Agricole Tropical Stéphanie Laffont & Vivien ROSSI UMR ENSAM-INRA Analyse des systèmes et Biométrie

Plus en détail

Cours de spécialité mathématiques en Terminale ES

Cours de spécialité mathématiques en Terminale ES Cours de spécialité mathématiques en Terminale ES O. Lader 2014/2015 Lycée Jean Vilar Spé math terminale ES 2014/2015 1 / 51 Systèmes linéaires Deux exemples de systèmes linéaires à deux équations et deux

Plus en détail

Méthodes de projection

Méthodes de projection Chapitre 11 Méthodes de projection Contenu 11.1 Analyse en composantes principales........ 138 11.1.1 L Analyse en Composantes Principales........ 139 11.1.2 La (grande) famille des ACP............. 151

Plus en détail

Analyse des Données. Travaux Pratiques 3

Analyse des Données. Travaux Pratiques 3 Analyse des Données Travaux Pratiques 3 1 Introduction Ce TP sera consacré aux analyses factorielles. La première partie présentera un exemple réel (et poussé) d une analyse factorielle des correspondances

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

Probabilités et statistiques dans le traitement de données expérimentales

Probabilités et statistiques dans le traitement de données expérimentales Probabilités et statistiques dans le traitement de données expérimentales S. LESECQ, B. RAISON IUT1, GEII 1 Module MC-M1 2009-2010 1 V Estimation de paramètres, tests d hypothèse, statistiques Module MC-M1

Plus en détail

Correction de l épreuve intermédiaire de mai 2009.

Correction de l épreuve intermédiaire de mai 2009. Licence de Gestion. 3ème Année Année universitaire 8-9 Optimisation Appliquée C. Léonard Correction de l épreuve intermédiaire de mai 9. Exercice 1 Avec les notations du cours démontrer que la solution

Plus en détail

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 29/01/2007 Stéphane Tufféry - Data Mining - http://data.mining.free.fr

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 29/01/2007 Stéphane Tufféry - Data Mining - http://data.mining.free.fr 1 Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE Plan du cours Qu est-ce que le data mining? À quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Outils Statistiques du Data Mining

Outils Statistiques du Data Mining Outils Statistiques du Data Mining Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

I. LA VARIABILITE AU SEIN DES POPULATIONS

I. LA VARIABILITE AU SEIN DES POPULATIONS I. LA VARIABILITE AU SEIN DES POPULATIONS La notion de population recouvre un concept difficilement réductible à une définition unique. Au sens de la génétique, une population représente une entité de

Plus en détail

Analyse des données et algèbre linéaire

Analyse des données et algèbre linéaire Analyse des données et algèbre linéaire Fondamentaux pour le Big Data c Télécom ParisTech 1/15 Machine-Learning : Une donnée x i = un ensemble de features (caractères) d un individu i x i = (x i,1,...,

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Ministère de la Jeunesse et des Sports Institut Royal de Formation des Cadres Département des Sciences de la Vie. A. Arfaoui

Ministère de la Jeunesse et des Sports Institut Royal de Formation des Cadres Département des Sciences de la Vie. A. Arfaoui Ministère de la Jeunesse et des Sports Institut Royal de Formation des Cadres Département des Sciences de la Vie A. Arfaoui PLA Définitions Paramètres marginaux Covariance Coefficient de Corrélation Coefficient

Plus en détail

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive U.P.S. I.U.T. A, Département d Informatique Année 2008-2009 Probabilités et Statistiques Emmanuel PAUL Chapitre 1 : Statistique descriptive 1 Objectifs des statistiques. Il s agit d étudier un ou plusieurs

Plus en détail

Filtre de Wiener. Analyse en Composantes Principales

Filtre de Wiener. Analyse en Composantes Principales Filtre de Wiener Analyse en Composantes Principales Guillaume Obozinski LIGM/Ecole des Ponts - ParisTech Traitement de l information et vision artificielle Ecole des Ponts Filtre de Wiener Norbert Wiener

Plus en détail

TP d entraãőnement : reconnaissance de caractères

TP d entraãőnement : reconnaissance de caractères TP d entraãőnement : reconnaissance de caractères O. Wilk avril 2010 1 Introduction Dans ce TP, nous allons développer une méthode permettant la reconnaissance de caractères. Nous nous limiterons à reconnaitre

Plus en détail

Introduction à la programmation sous Scilab : TP auto-correctifs II

Introduction à la programmation sous Scilab : TP auto-correctifs II Introduction à la programmation sous Scilab : TP auto-correctifs II Licence de Physique à distance Table des matières I Vecteurs et matrices (II) 1 a) Vecteurs........................................ 1

Plus en détail

IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD

IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD Université de Perpignan - IUT de Carcassonne Vivien ROSSI Année 2006/2007 IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD Ce document est tiré du site : http ://www.stat.ucl.ac.be/ispersonnel/lecoutre/stats/spad/

Plus en détail

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques.

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques. L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques 1 BUTS DU COURS : se familiariser avec le vocabulaire statistique o variable dépendante, variable indépendante o statistique descriptive,

Plus en détail

Résumé du cours d algèbre de Maths Spé MP

Résumé du cours d algèbre de Maths Spé MP 1 POLYNÔMES Résumé du cours d algèbre de Maths Spé MP 1 Polynômes 1) Formule de Taylor pour les polynômes. Soit P un polynôme non nul de degré n N. a K, P(X) = k=0 P (k) (a) (X a) k et en particulier P(X)

Plus en détail

L3 Géographie UE Méthodologie. Statistiques COURS 1. Salle 125. Intervenants : Nadège. UMR Centre de Recherches de Climatologie (CRC)

L3 Géographie UE Méthodologie. Statistiques COURS 1. Salle 125. Intervenants : Nadège. UMR Centre de Recherches de Climatologie (CRC) L3 Géographie UE Méthodologie Statistiques COURS 1 Salle 125 Intervenants : Nadège Martiny & Julien Crétat UFR Sciences Humaines (Département de Géographie) UMR Centre de Recherches de Climatologie (CRC)

Plus en détail

Traitement des données influentes dans le cas d un sondage à deux phases avec une application au traitement de la non-réponse

Traitement des données influentes dans le cas d un sondage à deux phases avec une application au traitement de la non-réponse Traitement des données influentes dans le cas d un sondage à deux phases avec une application au traitement de la non-réponse Jean-François Beaumont, Statistics Canada Cyril Favre Martinoz, Crest-Ensai

Plus en détail

Module A ALGEBRE MATRICIELLE. Prçesentation - Plan

Module A ALGEBRE MATRICIELLE. Prçesentation - Plan Module A ALGEBRE MATRICIELLE Prçesentation - Plan Ce module occupe une place particuliçere dans le dispositif de formation ça la statistique mis en place par le service de Formation Permanente et le dçepartement

Plus en détail

SEMIN. Analyses factorielles avec R. Elisabeth MORAND INED

SEMIN. Analyses factorielles avec R. Elisabeth MORAND INED SEMIN Analyses factorielles avec R Elisabeth MORAND INED SEMIN R du MNHN 10 Décembre 2009 E. Morand 10 Décembre 2009 INED 1 / 42 Part I Analyse en Composantes Principales : ACP 2 / 42 Sommaire 1 Introduction

Plus en détail

GUIDE DU DATA MINER. Scoring - Modélisation. Data Management, Data Mining, Text Mining

GUIDE DU DATA MINER. Scoring - Modélisation. Data Management, Data Mining, Text Mining GUIDE DU DATA MINER Scoring - Modélisation Data Management, Data Mining, Text Mining 1 Guide du Data Miner Scoring - Modélisation Le logiciel décrit dans le manuel est diffusé dans le cadre d un accord

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Analyse de données et méthodes numériques

Analyse de données et méthodes numériques Analyse de données et méthodes numériques Analyse de données: Que faire avec un résultat? Comment le décrire? Comment l analyser? Quels sont les «modèles» mathématiques associés? Analyse de données et

Plus en détail

Résumé du Cours de Modèles de Régression. Yves Tillé

Résumé du Cours de Modèles de Régression. Yves Tillé Résumé du Cours de Modèles de Régression Yves Tillé 0 janvier 20 Chapitre Régression bivariée Série statistique bivariée On s intéresse à deux variables x et y Ces deux variables sont mesurées sur les

Plus en détail

Atelier d économétrie

Atelier d économétrie Atelier d économétrie Chapitre 4 : Le problème de la multicolinéarité : application sous SAS Vincent Bouvatier Université de Paris Ouest - Nanterre La Défense Bâtiment G, bureau 308A vbouvatier@u-paris10.fr

Plus en détail

MÉTHODES DE CLASSIFICATION

MÉTHODES DE CLASSIFICATION MÉTHODES DE CLASSIFICATION Pierre-Louis GONZALEZ MÉTHODES DE CLASSIFICATION Objet Opérer des regroupements en classes homogènes d un ensemble d individus. Données Les données se présentent en général sous

Plus en détail

Ch2 : Analyse en Composantes Principales (ACP)

Ch2 : Analyse en Composantes Principales (ACP) Ch2 : Analyse en Composantes Principales (ACP) A- Objectifs B- construction d un espace factoriel C- Les étapes d une ACP D- Interprétation E- Limites A- Objectifs On dispose d un tableau de données X.

Plus en détail

Chapitre 3 : Analyse en composante principale (ACP) () 1 / 59

Chapitre 3 : Analyse en composante principale (ACP) () 1 / 59 Chapitre 3 : Analyse en composante principale (ACP) () 1 / 59 I. Préambule L ACP propose, à partir d un tableau de données relatives à p variables quantitatives portant sur n unités (individus), des représentations

Plus en détail

ACP Voitures 1- Méthode

ACP Voitures 1- Méthode acp=princomp(voit,cor=t) ACP Voitures 1- Méthode Call: princomp(x = voit, cor = T) Standard deviations: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 2.1577815 0.9566721 0.4903373 0.3204833 0.2542759 0.1447788

Plus en détail

Université René Descartes Faculté de Pharmacie - Master Professionnel Dimension Économique des Produits de Santé 14 décembre 2005

Université René Descartes Faculté de Pharmacie - Master Professionnel Dimension Économique des Produits de Santé 14 décembre 2005 Université René Descartes Faculté de Pharmacie - Master Professionnel Dimension Économique des Produits de Santé 14 décembre 2005 Prise en Compte de l Incertitude dans l Évaluation des Technologies de

Plus en détail

Recherche Opérationnelle 1A Programmation Linéaire Résolution d un Programme Linéaire Introduction

Recherche Opérationnelle 1A Programmation Linéaire Résolution d un Programme Linéaire Introduction Recherche Opérationnelle 1A Programmation Linéaire Résolution d un Programme Linéaire Introduction Zoltán Szigeti Ensimag April 4, 2015 Z. Szigeti (Ensimag) RO 1A April 4, 2015 1 / 16 Forme Générale Définition

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Application des méthodes de décomposition en composantes principales à la climatologie

Application des méthodes de décomposition en composantes principales à la climatologie Application des méthodes de décomposition en composantes principales à la climatologie Etude d un exemple: les modes de variabilité de la température de surface de la mer dans l océan Atlantique tropical

Plus en détail

UNIVERSITE PARIS 1 PANTHEON SORBONNE LICENCE DE SCIENCES ECONOMIQUES. STATISTIQUE APPLIQUEE F. Gardes / P. Sevestre. Fiche N 7.

UNIVERSITE PARIS 1 PANTHEON SORBONNE LICENCE DE SCIENCES ECONOMIQUES. STATISTIQUE APPLIQUEE F. Gardes / P. Sevestre. Fiche N 7. UNIVERSITE PARIS 1 PANTHEON SORBONNE LICENCE DE SCIENCES ECONOMIQUES STATISTIQUE APPLIQUEE F. Gardes / P. Sevestre Fiche N 7 (avec corrigé) L objet de ce TD est de vous initier à la démarche et à quelques

Plus en détail

Optimisation linéaire

Optimisation linéaire Optimisation linéaire Recherche opérationnelle GC-SIE Algorithme du simplexe Phase I 1 Introduction Algorithme du simplexe : Soit x 0 une solution de base admissible Comment déterminer x 0? Comment déterminer

Plus en détail

Les macros SAS. d'analyse des données

Les macros SAS. d'analyse des données INSTITUT NATIONAL DE LA STATISTIQUE ET DES ÉTUDES ÉCONOMIQUES DIRECTION GÉNÉRALE 18, boulevard Adolphe Pinard - 75675 PARIS CEDEX 14 Les macros SAS d'analyse des données Document n F 9405 15 mars 1994

Plus en détail

UNIVERSITÉ DE POITIERS

UNIVERSITÉ DE POITIERS UNIVERSITÉ DE POITIERS Faculté des Sciences Fondamentales et Appliquées Mathématiques PREMIÈRE ANNEE DE LA LICENCE DE SCIENCES ET TECHNOLOGIES UE L «algèbre linéaire» Plan du cours Exercices Enoncés des

Plus en détail

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes STA108 Enquêtes et sondages Sondages àplusieurs degrés et par grappes Philippe Périé, novembre 2011 Sondages àplusieurs degrés et par grappes Introduction Sondages à plusieurs degrés Tirage des unités

Plus en détail

Projets scilab. L3 Maths Appliquées lagache@biologie.ens.fr 02 Avril 2009

Projets scilab. L3 Maths Appliquées lagache@biologie.ens.fr 02 Avril 2009 Projets scilab L3 Maths Appliquées lagache@biologie.ens.fr 2 Avril 29 REMARQUE: quelques résultats importants concernant le théorème central limite et les intervalles de confiance sont rappelés dans la

Plus en détail

La méthode des quotas

La méthode des quotas La méthode des quotas Oliviero Marchese, décembre 2006 1 La méthode des quotas Principe de la méthode Point de départ et but recherché Caractère «intuitif» de la méthode A quoi ressemble une feuille de

Plus en détail

Liste complète des sujets d oral (SESSION 2004) servant pour 2004-2005. Leçons d Algèbre et de Géométrie

Liste complète des sujets d oral (SESSION 2004) servant pour 2004-2005. Leçons d Algèbre et de Géométrie http://perso.wanadoo.fr/gilles.costantini/agreg.htm Liste complète des sujets d oral (SESSION 2004) servant pour 2004-2005 Légende : En italique : leçons dont le libellé a changé ou évolué par rapport

Plus en détail

Espaces vectoriels. par Pierre Veuillez

Espaces vectoriels. par Pierre Veuillez Espaces vectoriels par Pierre Veuillez 1 Objectifs : Disposer d un lieu où les opérations + et se comportent bien. Déterminer des bases (utilisation de la dimension) Représenter les vecteurs grace à leurs

Plus en détail

RAPPORT SUR L ETUDE DES DONNEES FINANCIERES ET STATISTIQUES A L AIDE DU LOGICIEL SCILAB

RAPPORT SUR L ETUDE DES DONNEES FINANCIERES ET STATISTIQUES A L AIDE DU LOGICIEL SCILAB RAPPORT SUR L ETUDE DES DONNEES FINANCIERES ET STATISTIQUES A L AIDE DU LOGICIEL SCILAB PAR : MAROOF ASIM DAN BENTOLILA WISSAM ESSID GROUPE 1 LM206 Lundi 10H45 INTRODUCTION : ( Ce rapport est un compte

Plus en détail