Analyse multivariée approfondie

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "Analyse multivariée approfondie"

Transcription

1 Analyse multivariée approfondie Enseignants: NIANG N. et RUSSOLILLIO G. Maître de conférences Statistique Appliquée Laboratoire CEDRIC CNAM et d autres intervenants extérieurs au Cnam 1 STA 201 Analyse Multivariée Approfondie Inscriptions et agréments (master actuariat, MR085) prérequis STA101 STA102 Programme Modalités de contrôle SAS Informations: 2 1

2 Bibliographie M.BARDOS : Analyse discriminante (Dunod, 2001) T.HASTIE, J.FRIEDMAN, R.TIBSHIRANI : The Elements of Statistical Learning, 2 ème édition (Springer, 2009) L.LEBART, M.PIRON, A.MORINEAU : Statistique exploratoire multidimensionnelle, 4 ème édition (Dunod, 2006) J.P.NAKACHE, J.CONFAIS : Statistique explicative appliquée (Technip, 2003) G.SAPORTA : Probabilités, analyse des données, statistique, 3 ème édition (Technip, 2011) S.TUFFÉRY : Data mining et statistique décisionnelle, 3 ème édition (Technip, 2010) Le Livre de James, Witten, Hastie, & Tibshirani (2013). An Introduction to Statistical Learning with Applications in R. (Téléchargeable à partir de la page des auteurs). 3 STA 201 Analyse Multivariée Approfondie Objectifs pédagogiques Approfondir les méthodes statistiques à plusieurs variables, qu'elles soient descriptives ou décisionnelles Compétences visées Maitriser les principales méthodes récentes d'analyse multivariée 4 2

3 STA 201 Analyse Multivariée Approfondie PARTIE 1 Rappels de base Rappels sur les méthodes d analyse multivariée Eléments de statistique multivariée (lois, tests ) Echantillonnage, simulation, bootstrap PARTIE 2 Approfondissement des méthodes exploratoires ACP non linéaire, de données mixtes, multiblocs, distances-mds modèles de mélanges en classification, classification de variables PARTIE 3 Approfondissement des méthodes explicatives Régression Ridge, PLS, logistique, robuste, non paramétrique Equations structurelles PARTIE 4 Méthodes récentes 5 théorie de l apprentissage, SVM, méthodes sparse, méta modèles Introduction Rappels d analyse des données multivariée L analyse multivariée désigne un ensemble de méthodes et de techniques pour l étude de tableaux de plusieurs variables décrivant plusieurs individus. Plusieurs de ces techniques sont récentes leur développement étant lié en partie à l augmentation de performances des ordinateurs. Le but de ce cours est de donner un panorama des méthodes pour aider au choix de méthodes adéquates en fonction du type de données ou de la problématique à étudier. 6 3

4 I. Généralités Statistique ensemble de données recueil, traitement, interprétation des données Aspect descriptif, exploratoire : tableaux, graphiques, résumés numériques Aspect explicatif, inférentiel, décisionnel : échantillon issu d une population, estimations, tests hypothèses probabilistes. Statistique classique étude d un nombre restreint de variables sur un petit ensemble d individus 7 Analyse des données * traitement de données en masse : grand nombre de variables et d individus * vision globale multidimensionnelle des individus et des variables * représentations géométriques, création de nouvelles variables *Outils informatiques indispensables mais pas que! 8 4

5 Data mining Big data * Explosion du volume des données : très grand nombre de variables et d individus, multiples sources, natures, vitesse (flux, temps réel ) Données opérationnelles, analyse secondaire Possibilités de valorisation (valeur), succès, effet de mode? * Besoins de méthodes et d outils informatiques spécifiques: renouveau de l analyse des données 9 Deux points de vue : Individus : - ressemblances ou différences - recherche de groupes homogènes Variables : - liaisons entre variables - recherche d une explication d une variable par les autres importance de la prise en compte des liaisons entre variables Plusieurs méthodes 10 5

6 Quelques définitions Population : ensemble d objets Individus, unités statistiques : objets de base Échantillon : partie observée Variables : grandeurs mesurées sur les individus numériques discrètes ou continues qualitatives nominales ou ordinales 11 Un exemple Individus = voitures, variables : grandeurs mesurées sur les individus numériques discrètes ou continues qualitatives nominales ou ordinales 12 6

7 II- Les différents types de tableaux de données Tableaux individus variables n lignes : les individus et p colonnes : les variables - numériques : matrice X nxp - qualitatives : modalités codées (arbitraires) ou tableau disjonctif (indicatrices) Tableau de contingence croisement de 2 variables qualitatives 13 Exemple: n= 4 individus, p=3 variables qualitatives à 3, 3 et 2 modalités Tableau brut de données codées arbitraires Transformation tableau disjonctif p p X = p p np X = (X 1 X 2 X p ) indicatrices des modalités X 1 X 2 X Tableau de contingence X 1 *X

8 Les différents types de tableaux de données (suite) Tableaux de préférence (ou de rangs) entre objets : les variables sont les objets et chaque individu range ces objets par ordre de préférence décroissante. Tableaux de distances: tableaux des nxn distances entre individus Tableaux de présence absence Autres types de tableaux: tableaux de notes, de pourcentage 15 III- Les différentes méthodes Classement selon l objectif poursuivi: * description : but est de comprendre au mieux les données grâce à une description simplifiée aussi proche que possible de la réalité. (On étudie le tableau entier) * explication et prévision : but est d expliquer et de prévoir une ou plusieurs variables du tableau en fonction d autres variables. (tableau partitionné en 2) Remarque: Il existe aussi les cas de plusieurs tableaux a décrire ou à expliquer Deux familles de méthodes. 16 8

9 Les différentes méthodes exploratoires (1) Méthodes factorielles ( faire la différence entre réduction et sélection) réduction du nombre de variables en les résumant par un petit nombre de composantes synthétiques appelés facteurs : ACP pour les variables quantitatives (analyse en composantes principales) AFC pour 2 variables qualitatives (analyse factorielle des correspondances simples) ACM pour plusieurs variables qualitatives (analyse des correspondances multiples) Extension: non linéaire, MDS, données mixtes, évolutives, tableaux Les différentes méthodes exploratoires (2) Méthodes de classification réduction du nombre d individus par la formation de groupes homogènes : méthodes de partitionnement en un nombre fixé de classes a priori: méthode des centres mobiles, nuées dynamiques méthodes hiérarchiques: suite de partitions emboîtées: méthodes de classification ascendante hiérarchique (CAH) Extension: classification de variables (méthodes divisives), méthodes probabilistes modèles de mélanges (non géométriques) 18 9

10 Méthodes explicatives, décisionnelles ou inférentielles Modèle linéaire général : recherche d une relation entre une variable numérique et plusieurs autres : Numériques : régression Qualitatives : analyse de la variance Mixtes : analyse de la covariance Analyse discriminante: prédiction d une variable qualitative à l aide de plusieurs prédicteurs en général numériques Extension : Disqual, PLS, ridge, régression logistique, arbre de décision, non linéaire, réseaux de neurones 19 Le but de l analyse multidimensionnelle exploratoire est de décrire ce tableau de données. Pas d hypothèses probabilistes ou de modèle. La démarche classique en deux étapes: 1) analyses préalables unidimensionnelle et bidimensionnelle 2) Réaliser une étude multidimensionnelle 20 10

11 ANALYSE EN COMPOSANTES PRINCIPALES 21 EXEMPLE: LES DONNEES Feuille de calcul Microsoft Excel 22 11

12 EXEMPLE 23 EXEMPLE 24 12

13 EXEMPLE 25 EXEMPLE 26 13

14 EXEMPLE 27 EXEMPLE 28 14

15 EXEMPLE 29 EXEMPLE 30 15

de la classification Approche pragmatique t Editions TECHNIP 27 rue Cinoux, 75737 PARIS Cedex 15, FRANCE Arbres hiérarchiques Partitionnements

de la classification Approche pragmatique t Editions TECHNIP 27 rue Cinoux, 75737 PARIS Cedex 15, FRANCE Arbres hiérarchiques Partitionnements Jean-Pierre NAKACHE Ingénieur de recherche CNRS détaché à l'inserm Chargé de cours à l'isup Josiane CONFAIS Ingénieur d'études chargée des enseignements pratiques à l'isup Approche pragmatique de la classification

Plus en détail

L analyse des données statistiques

L analyse des données statistiques L analyse des données statistiques Public : Les cadres devant analyser des données quantitatives et qualitatives Objectif : Apprendre, en utilisant principalement Excel : - à traiter des données provenant

Plus en détail

COURS DE STATISTIQUES (24h)

COURS DE STATISTIQUES (24h) COURS DE STATISTIQUES (24h) Introduction Statistiques descriptives (4 h) Rappels de Probabilités (4 h) Echantillonnage(4 h) Estimation ponctuelle (6 h) Introduction aux tests (6 h) Qu est-ce que la statistique?

Plus en détail

Outils Statistiques du Data Mining

Outils Statistiques du Data Mining Outils Statistiques du Data Mining Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr

Plus en détail

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali LUISS, Libera Università Internazionale degli Studi Sociali Université Paris 13 Laboratoire Analyse, Géométrie et Applications UMR 7539 GOUTTE Analyse Statistique des Données Cours 4 Master 2 EID goutte@math.univ-paris13.fr

Plus en détail

L analyse en composantes principales en pratique

L analyse en composantes principales en pratique L analyse en composantes principales en pratique Après avoir vu sa formalisation mathématique dans le module précédent, on s intéresse ici à l utilisation pratique de l ACP. 1 Objectifs L objectif de l

Plus en détail

STAGE. «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques»

STAGE. «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques» STAGE «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques» PROGRAMME DETAILLE Intervenant : PARIS nicolas Cabinet : OPTIMA

Plus en détail

M2, spécialité Ingénierie Mathématique Laboratoire de Mathématiques Jean Leray Département de Mathématiques Université de Nantes. Programme 2013-2014

M2, spécialité Ingénierie Mathématique Laboratoire de Mathématiques Jean Leray Département de Mathématiques Université de Nantes. Programme 2013-2014 M2, spécialité Ingénierie Mathématique Laboratoire de Mathématiques Jean Leray Département de Mathématiques Université de Nantes Programme 2013-2014 Contact : master-pro@math.univ-nantes.fr Option : CS

Plus en détail

COURS DE DATA MINING 6 : MODELISATION NON-SUPERVISEE LES ANALYSES FACTORIELLES

COURS DE DATA MINING 6 : MODELISATION NON-SUPERVISEE LES ANALYSES FACTORIELLES COURS DE DATA MINING 6 : MODELISATION NON-SUPERVISEE LES ANALYSES FACTORIELLES EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 6 : Modélisation non-supervisée

Plus en détail

Introduction à l analyse des données. Olivier Godechot

Introduction à l analyse des données. Olivier Godechot Introduction à l analyse des données Olivier Godechot Introduction. Les données statistiques : de très nombreuses variables. Aucune n est parfaite La perception d un phénomène appréhendée comme la combinaison

Plus en détail

TABLE DES MATIÈRES CHAPITRE 1 LA CONSTRUCTION D UN INSTRUMENT DE MESURE... 9. Avant-propos... 5 Sommaire... 7

TABLE DES MATIÈRES CHAPITRE 1 LA CONSTRUCTION D UN INSTRUMENT DE MESURE... 9. Avant-propos... 5 Sommaire... 7 TABLE DES MATIÈRES Avant-propos... 5 Sommaire... 7 CHAPITRE 1 LA CONSTRUCTION D UN INSTRUMENT DE MESURE... 9 1. Le processus de construction d un test... 9 2. La construction d un test d acquis scolaires...

Plus en détail

Analyse de spectres d absorbance pour la prédiction des taux de moisissure, de matières grasses et de protéines d échantillons de viande

Analyse de spectres d absorbance pour la prédiction des taux de moisissure, de matières grasses et de protéines d échantillons de viande Université de Nantes M2 Ingénierie Mathématiques Rapport de chimiométrie Analyse de spectres d absorbance pour la prédiction des taux de moisissure, de matières grasses et de protéines d échantillons de

Plus en détail

Semestre 1. Volume horaire hebdomadaire. Cours TD TP T.Perso. Total. Calcul de Probabilité 3 1,5 1,5 6 84 2. Introduction à l Economie 1,5 1,5 3 42 2

Semestre 1. Volume horaire hebdomadaire. Cours TD TP T.Perso. Total. Calcul de Probabilité 3 1,5 1,5 6 84 2. Introduction à l Economie 1,5 1,5 3 42 2 3ème Année Semestre 1 N MODULES MATIERES Volume horaire hebdomadaire Cours TD TP T.Perso. Total Volume horaire semestriel (14 semaines) Coefficients Régime d'examen 1 Modèle Probabiliste 1,5 1,5 1,5 4,5

Plus en détail

Module 3 : Introduction à la Modélisation SOUS MODELER

Module 3 : Introduction à la Modélisation SOUS MODELER Module 3 : Introduction à la Modélisation SOUS MODELER 1 Techniques prédictives Passé pour prédire l avenir 2 Concepts de la modélisation Données test / apprentissage Généralement créées par l utilisateur

Plus en détail

GUIDE DU DATA MINER. Classification - Typologies. Data Management, Data Mining, Text Mining

GUIDE DU DATA MINER. Classification - Typologies. Data Management, Data Mining, Text Mining GUIDE DU DATA MINER Classification - Typologies Data Management, Data Mining, Text Mining 1 Guide du Data Miner Classification - Typologies Le logiciel décrit dans le manuel est diffusé dans le cadre d

Plus en détail

Apprentissage statistique Stratégie du Data-Mining

Apprentissage statistique Stratégie du Data-Mining Apprentissage statistique Stratégie du Data-Mining Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 H. Milhem (IMT, INSA Toulouse) Apprentissage statistique

Plus en détail

Annexe : Programme du master de mathématiques : Spécialité Ingénierie Mathématique Première Année. Tronc commun

Annexe : Programme du master de mathématiques : Spécialité Ingénierie Mathématique Première Année. Tronc commun Annexe : Programme du master de mathématiques : Spécialité Ingénierie Mathématique Première Année Tronc commun MI1 Analyse fonctionnelle pour l'ingénieur: (64 H ; C : 32 H, TD : 32 H) (ECTS : 8) - Eléments

Plus en détail

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage Classification Exemple : Enquête d opinion sur les OGM Pauline Le Badezet Alexandra Lepage SOMMAIRE Introduction Méthodologie Méthode de partitionnement Classification Ascendante Hiérarchique Interprétation

Plus en détail

ECOLE SUPERIEURE DE COMMERCE D ALGER

ECOLE SUPERIEURE DE COMMERCE D ALGER MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE ECOLE SUPERIEURE DE COMMERCE D ALGER PROGRAMME DE LICENCE EN SCIENCES COMMERCIALES ET FINANCIERES OPTION : GESTION ( applicable à partir

Plus en détail

Formation Actuaire Data-Scientist PROGRAMME

Formation Actuaire Data-Scientist PROGRAMME Formation Actuaire Data-Scientist PROGRAMME 15 Septembre 2014 Arthur Charpentier, Romuald Élie & Jérémie Jakubowicz 15914 Programme Séance inaugurale : révolu-on numérique besoins des entreprises cadre

Plus en détail

1.1 Exemple introductif d un cube de données... 2

1.1 Exemple introductif d un cube de données... 2 1.1 Exemple introductif d un cube de données............... 2 2.1 Pré-traitement des données avec les outils OLAP [MHW00]...... 14 2.2 Architecture d un système intégrant SGBD, OLAP et MOLAP [Fu05] 16

Plus en détail

Anne-lise HUYET- Jean-Luc PARIS LIMOS équipe Recherche en Systèmes de Production IFMA Mail: huyet@ifma.fr, paris@ifma.fr

Anne-lise HUYET- Jean-Luc PARIS LIMOS équipe Recherche en Systèmes de Production IFMA Mail: huyet@ifma.fr, paris@ifma.fr Extraction de Connaissances pertinentes sur le comportement des systèmes de production: une approche conjointe par Optimisation Évolutionniste via Simulation et Apprentissage Anne-lise HUYET- Jean-Luc

Plus en détail

SEMIN. Analyses factorielles avec R. Elisabeth MORAND INED

SEMIN. Analyses factorielles avec R. Elisabeth MORAND INED SEMIN Analyses factorielles avec R Elisabeth MORAND INED SEMIN R du MNHN 10 Décembre 2009 E. Morand 10 Décembre 2009 INED 1 / 42 Part I Analyse en Composantes Principales : ACP 2 / 42 Sommaire 1 Introduction

Plus en détail

PLACE DES STATISTIQUES DANS LA RECHERCHE MEDICALE

PLACE DES STATISTIQUES DANS LA RECHERCHE MEDICALE PLACE DES STATISTIQUES DANS LA RECHERCHE MEDICALE PLAN Définition des statistiques Échantillonnage Mise en place d une étude Interprétation des résultats Petits échantillons Analyse des bases de données

Plus en détail

L3 Géographie UE Méthodologie. Statistiques COURS 1. Salle 125. Intervenants : Nadège. UMR Centre de Recherches de Climatologie (CRC)

L3 Géographie UE Méthodologie. Statistiques COURS 1. Salle 125. Intervenants : Nadège. UMR Centre de Recherches de Climatologie (CRC) L3 Géographie UE Méthodologie Statistiques COURS 1 Salle 125 Intervenants : Nadège Martiny & Julien Crétat UFR Sciences Humaines (Département de Géographie) UMR Centre de Recherches de Climatologie (CRC)

Plus en détail

Classification simultanée des lignes et des colonnes de plusieurs tableaux de contingence

Classification simultanée des lignes et des colonnes de plusieurs tableaux de contingence Classification simultanée des lignes et des colonnes de plusieurs tableaux de contingence Vincent Loonis Ensae Timbre J120-3 avenue Pierre Larousse FR-92245 Malakoff Cedex France RÉSUMÉ Le présent article

Plus en détail

Analyse multidimensionnelle de données longitudinales

Analyse multidimensionnelle de données longitudinales Analyse multidimensionnelle de données longitudinales Ndèye Niang Conservatoire National des Arts et Métiers Plan Introduction Terminologie-Notations Méthodes directes Coefficient d association vectorielle

Plus en détail

Scénario: Exploration, classification des encours boursiers parisiens

Scénario: Exploration, classification des encours boursiers parisiens Scénario: Exploration, classification des encours boursiers parisiens Résumé Scénario d analyse d un jeu de données : l ensemble des séries des encours boursier à Paris. Description, lissage et classification

Plus en détail

Méthodes de projection

Méthodes de projection Chapitre 11 Méthodes de projection Contenu 11.1 Analyse en composantes principales........ 138 11.1.1 L Analyse en Composantes Principales........ 139 11.1.2 La (grande) famille des ACP............. 151

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

Pierre-Louis GONZALEZ

Pierre-Louis GONZALEZ SEGMENTATION Pierre-Louis GONZALEZ 1 I. Les méthodes de segmentation. Introduction Les méthodes de segmentation cherchent à résoudre les problèmes de discrimination et de régression en divisant de façon

Plus en détail

MODELISATION DE DONNÉES QUALITATIVES PREMIÈRE PARTIE

MODELISATION DE DONNÉES QUALITATIVES PREMIÈRE PARTIE MODELISATION DE DONNÉES QUALITATIVES PREMIÈRE PARTIE Pierre-Louis Gonzalez 1 I INTRODUCTION 1 variable qualitative. Tri à plat. Représentations graphiques. Modélisation : loi binomiale loi multinomiale

Plus en détail

DOSSIER PEDAGOGIQUE LABORATOIRE D ETUDES DE MARCHES ET STATISTIQUE APPLIQUEE

DOSSIER PEDAGOGIQUE LABORATOIRE D ETUDES DE MARCHES ET STATISTIQUE APPLIQUEE MINISTERE DE LA COMMUNAUTE FRANCAISE ADMINISTRATION GENERALE DE L ENSEIGNEMENT ENSEIGNEMENT DE PROMOTION SOCIALE DE REGIME 1 DOSSIER PEDAGOGIQUE UNITE D ENSEIGNEMENT LABORATOIRE D ETUDES DE MARCHES ET

Plus en détail

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation Programme des épreuves des concours externes de recrutement des personnels D1 RECRUTEMENT DES ASSISTANTS INGÉNIEURS...2 D1.1 Assistant cartographe (nouveau programme)...2 D1.2 Assistant en production et

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Classification. Pr Roch Giorgi. roch.giorgi@univ-amu.fr

Classification. Pr Roch Giorgi. roch.giorgi@univ-amu.fr Classification Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr Objectif Rechercher

Plus en détail

LES TYPOLOGIES DE PARCOURS METHODES ET USAGES. Yvette Grelet, Patrick Rousset CEREQ grelet@mrsh.unicaen.fr rousset@cereq.fr

LES TYPOLOGIES DE PARCOURS METHODES ET USAGES. Yvette Grelet, Patrick Rousset CEREQ grelet@mrsh.unicaen.fr rousset@cereq.fr LES TYPOLOGIES DE PARCOURS METHODES ET USAGES Yvette Grelet, Patrick Rousset CEREQ grelet@mrsh.unicaen.fr rousset@cereq.fr 1 PLAN Première partie : un exemple traité «en vraie grandeur» : les 26500 jeunes

Plus en détail

IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD

IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD Université de Perpignan - IUT de Carcassonne Vivien ROSSI Année 2006/2007 IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD Ce document est tiré du site : http ://www.stat.ucl.ac.be/ispersonnel/lecoutre/stats/spad/

Plus en détail

Analyse des données et Data Mining

Analyse des données et Data Mining Analyse des données et Data Mining Analyse en composantes principales utc sy09 1 Objectif des méthodes factorielles Visualiser, traiter des données multidimensionnelles Problème difficile Information apportée

Plus en détail

Analyse simultanée de variables quantitatives et qualitatives. à l aide de l analyse factorielle multiple

Analyse simultanée de variables quantitatives et qualitatives. à l aide de l analyse factorielle multiple Analyse simultanée de variables quantitatives et qualitatives à l aide de l analyse factorielle multiple Jérôme Pagès Laboratoire de mathématiques appliquées Agrocampus France Analyse Factorielle Multiple

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Analyse de données avec Complémentarité des méthodes d analyse factorielle et de classification

Analyse de données avec Complémentarité des méthodes d analyse factorielle et de classification Analyse de données avec Complémentarité des méthodes d analyse factorielle et de classification François Husson & Julie Josse Laboratoire de mathématiques appliquées Agrocampus Rennes husson@agrocampus-ouest.fr

Plus en détail

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques.

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques. L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques 1 BUTS DU COURS : se familiariser avec le vocabulaire statistique o variable dépendante, variable indépendante o statistique descriptive,

Plus en détail

Séminaire de Statistique

Séminaire de Statistique Master 1 - Economie & Management Séminaire de Statistique Support (1) Statistique descriptive «Uni & Bi-variée» R. Abdesselam - 2013/2014 Faculté de Sciences Economiques et de Gestion Université Lumière

Plus en détail

Glossaire Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspondances (AFC) Apprentissage supervisé Apprentissage non supervisé

Glossaire Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspondances (AFC) Apprentissage supervisé Apprentissage non supervisé Glossaire Analyse en Composantes Principales (ACP) : *méthode factorielle (Pearson 1901, Hotelling 1933) permettant de fournir un résumé descriptif (sous forme graphique le plus souvent) d une population

Plus en détail

Cycles de formation certifiante du CIEMS

Cycles de formation certifiante du CIEMS Cycles de formation certifiante du CIEMS Casablanca, Agadir, Tanger Calendrier 2016 Cycle de formation certifiante Etudes Quantitatives & Qualitatives En partenariat avec Le Sphinx Initiation, Approfondissement

Plus en détail

Analyses de données avec FactoMineR Statistiques Multidimensionnelles Oct.-Nov. 2013

Analyses de données avec FactoMineR Statistiques Multidimensionnelles Oct.-Nov. 2013 Analyses de données avec FactoMineR Statistiques Multidimensionnelles Oct.-Nov. 2013 FactoMineR est un paquet R qui implémente les principales méthodes d analyse de données. Si le paquet n est pas déjà

Plus en détail

La classification 2012-2013. Fabien Chevalier Jérôme Le Bellac

La classification 2012-2013. Fabien Chevalier Jérôme Le Bellac La classification 2012-2013 Fabien Chevalier Jérôme Le Bellac Introduction : Classification : méthode d analyse de données Objectif : Obtenir une représentation schématique simple d'un tableau de données

Plus en détail

GOUTTE. Analyse Statistique des Données Cours 6. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali

GOUTTE. Analyse Statistique des Données Cours 6. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali LUISS, Libera Università Internazionale degli Studi Sociali Université Paris 13 Laboratoire Analyse, Géométrie et Applications UMR 7539 GOUTTE Analyse Statistique des Données Cours 6 Master 2 EID goutte@math.univ-paris13.fr

Plus en détail

UNIVERSITÉ LUMIÈRE LYON 2 FACULTÉ DE SCIENCES ÉCONOMIQUES ET DE GESTION

UNIVERSITÉ LUMIÈRE LYON 2 FACULTÉ DE SCIENCES ÉCONOMIQUES ET DE GESTION UNIVERSITÉ LUMIÈRE LYON 2 FACULTÉ DE SCIENCES ÉCONOMIQUES ET DE GESTION Economie quantitative Master 2-ECOSMA Etudes et COnseil en Stratégie et MArketing Analyse des données Polycopié 1 : Méthodes factorielles

Plus en détail

Session 1 durée 3 heures

Session 1 durée 3 heures Université de Nantes Mai 27 Master MIM Examen d'analyse de données Session durée 3 heures Les documents sont interdits. Les calculatrices sont autorisées. Exercice : - Etude d un tableau à l aide d une

Plus en détail

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 105 HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 1. Introduction En statistiques il arrive fréquemment que les individus soient décrits par un grand nombre de caractères. : voitures décrites par leur

Plus en détail

Analyse en composantes principales (ACP)

Analyse en composantes principales (ACP) Analyse en composantes principales (ACP) François Husson Laboratoire de mathématiques appliquées - Agrocampus Rennes husson@agrocampus-ouest.fr 1 / 31 Quel type de données? L ACP s intéresse à des tableaux

Plus en détail

Séance 2: Modèle Euclidien

Séance 2: Modèle Euclidien Généralités Métrique sur les INDIVIDUS Métrique sur les VARIABLES Inertie Analyse des individus Laboratoire de Statistique et Probabilités UMR 5583 CNRS-UPS www.lsp.ups-tlse.fr/gadat Généralités Métrique

Plus en détail

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques

Plus en détail

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h I.U.T de Caen STID 2ème année Département STID Année Universitaire 2002-2003 Responsable de cours : Alain LUCAS Seule la calculatrice type collège est autorisée. Seul le cours est autorisé. On rappelera

Plus en détail

Pour un socle de la licence de MATHEMATIQUES

Pour un socle de la licence de MATHEMATIQUES Pour un socle de la licence de MATHEMATIQUES Société Mathématique de France Société de Mathématiques Appliquées et Industrielles Société Française de Statistique Contexte général Afin d éviter de trop

Plus en détail

Atelier N 6 : Analyse en composantes principales (ACP) Présentation des méthodes d analyses multivariées

Atelier N 6 : Analyse en composantes principales (ACP) Présentation des méthodes d analyses multivariées Atelier N 6 : Analyse en composantes principales (ACP) Contenu : Présentation des méthodes d analyses multivariées Présentation des méthodes d analyses multivariées Classification des méthodes : Les méthodes

Plus en détail

LEHALLIER Benoît YGUEL Benjamin. Tutorial : Utilisation de R pour une modélisation optimale de phénomènes expérimentaux.

LEHALLIER Benoît YGUEL Benjamin. Tutorial : Utilisation de R pour une modélisation optimale de phénomènes expérimentaux. LEHALLIER Benoît YGUEL Benjamin Tutorial : Utilisation de R pour une modélisation optimale de phénomènes expérimentaux. ECIM Comportement et socialisation Mars 2006 La modélisation est utilisée pour comprendre

Plus en détail

Guide de démarrage avec SAS Enterprise Miner 6.1

Guide de démarrage avec SAS Enterprise Miner 6.1 Guide de démarrage avec SAS Enterprise Miner 6.1 Guide de démarrage avec SAS Enterprise Miner 6.1... 1 Introduction au Data Mining... 1 Cas HMEQ :... 2 1. Démarrer SAS Enterprise Miner... 2 2. Définition

Plus en détail

Module A ALGEBRE MATRICIELLE. Prçesentation - Plan

Module A ALGEBRE MATRICIELLE. Prçesentation - Plan Module A ALGEBRE MATRICIELLE Prçesentation - Plan Ce module occupe une place particuliçere dans le dispositif de formation ça la statistique mis en place par le service de Formation Permanente et le dçepartement

Plus en détail

TP R de Statistiques sur l analyse multivariée: AFC, ACP, CAH, k-means et AFCM

TP R de Statistiques sur l analyse multivariée: AFC, ACP, CAH, k-means et AFCM TP R de Statistiques sur l analyse multivariée: AFC, ACP, CAH, k-means et AFCM Emmanuel Rachelson and Matthieu Vignes 9 octobre 2013, SupAero - ISAE 1 Présidentielles 2008 - AFC Récupérer les données,

Plus en détail

PSY C3 Eléments de statistique

PSY C3 Eléments de statistique PSY C3 Eléments de statistique Responsables : Amandine Penel & Fabrice Guillaume Maîtres de conférence en Psychologie Cognitive penel@up.univ-mrs.fr guillaume@isc.cnrs.fr semaine du 4 Sept semaine du oct

Plus en détail

Rapport du stage effectué au laboratoire HEUDIASYC UMR CNRS 6599. Moustapha DOUMIATI. pour obtenir le diplôme Master de recherche en informatique

Rapport du stage effectué au laboratoire HEUDIASYC UMR CNRS 6599. Moustapha DOUMIATI. pour obtenir le diplôme Master de recherche en informatique Rapport du stage effectué au laboratoire HEUDIASYC UMR CNRS 6599 présenté par Moustapha DOUMIATI pour obtenir le diplôme Master de recherche en informatique Fouille de données pour l analyse des performances

Plus en détail

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation Programme des épreuves des concours externes de recrutement des personnels E1 RECRUTEMENT DES ASSISTANTS INGENIEURS DE RECHERCHE ET DE FORMATION...2 E1.1 Gestionnaire de base de données...2 E1.2 Développeur

Plus en détail

Prof.É.D.Taillard. Classification automatique @Prof. E. Taillard 1 EIVD, Informatique logiciel, 4 e semestre

Prof.É.D.Taillard. Classification automatique @Prof. E. Taillard 1 EIVD, Informatique logiciel, 4 e semestre INFORMATIQUE ORIENTATION LOGICIELS CLASSIFICATION AUTOMATIQUE Prof.É.D.Taillard Classification automatique @Prof. E. Taillard EIVD, Informatique logiciel, 4 e semestre CLASSIFICATION AUTOMATIQUE But :

Plus en détail

...fin du cours précédent

...fin du cours précédent ...fin du cours précédent num voiture moto cheval camion bus âne mulet 1 1 1 0 1 0 0 0 2 1 1 0 1 0 0 0 3 1 1 0 1 0 0 0 4 0 1 1 1 0 1 1 5 1 0 0 1 1 0 0 6 1 0 0 1 1 0 0 7 1 0 0 1 1 0 0 8 1 0 0 1 1 0 0 9

Plus en détail

Cours Fouille de données avancée

Cours Fouille de données avancée Ministère de l Enseignement Supérieur et de la Recherche Scientifique Université Mohamed Khider - Biskra Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie Département d Informatique

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

EFFICACITE PROFESSIONNELLE. Itinéraires : Ecoute et analyse prospective de son terrioire Ecoute citoyenne et démocratie participative

EFFICACITE PROFESSIONNELLE. Itinéraires : Ecoute et analyse prospective de son terrioire Ecoute citoyenne et démocratie participative EFFICACITE PROFESSIONNELLE Itinéraires : Ecoute et analyse prospective de son terrioire Ecoute citoyenne et démocratie participative DOMAINE : REPÈRES ET OUTILS FONDAMENTAUX / Sous-domaine : Connaissance

Plus en détail

Statistical Software. Nouveautés

Statistical Software. Nouveautés Statistical Software Mettez votre version à jour dès à présent pour obtenir plus de soixante-dix améliorations : une plus grande puissance statistique avec, entre autres nouveautés, un menu Assistant pour

Plus en détail

Cours de Statistiques

Cours de Statistiques Cours de Statistiques Romain Raveaux 1 1 Laboratoire L3I Université de La Rochelle romain.raveaux01 at univ-lr.fr Octobre 24-11, 2008 1 / 35 Sommaire 1 Quelques Rappels 2 numériques Relations entre deux

Plus en détail

MÉTHODES DE CLASSIFICATION

MÉTHODES DE CLASSIFICATION MÉTHODES DE CLASSIFICATION Pierre-Louis GONZALEZ MÉTHODES DE CLASSIFICATION Objet Opérer des regroupements en classes homogènes d un ensemble d individus. Données Les données se présentent en général sous

Plus en détail

Statistiques descriptives (1/2)

Statistiques descriptives (1/2) Statistiques descriptives (1/2) Anita Burgun 2011-2012 http://www.med.univ-rennes1.fr Introduction! Statistique: méthode scientifique qui consiste à réunir des données chiffrées sur des ensembles d individus

Plus en détail

L analyse Factorielle des correspondances. 1/ Préambule descriptif de l AFC

L analyse Factorielle des correspondances. 1/ Préambule descriptif de l AFC L analyse Factorielle des correspondances...2 1/ Préambule descriptif de l AFC...2 Exemples de types de données que l AFC peut aborder:...2 Quelques types de tableaux traités par l AFC...3 2/ Exercice

Plus en détail

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives *************

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives ************* ************* Cours de niveau gradué en méthodes quantitatives ************* SOL 6210 - Analyse quantitative avancée Le séminaire d analyse quantitative avancée se donne en classe une fois par année. Chaque

Plus en détail

Rapport d'activités / Curriculum Vitae

Rapport d'activités / Curriculum Vitae Rapport d'activités / Curriculum Vitae Dominique Mahut Né le 01 Juillet 1964 à Paris 14ème Marié, deux enfants (18 et 20 ans) Ingénieur d étude statistique IE2 BAP E titulaire CNRS UMR 7088 (DMR) et UMR

Plus en détail

La régression. Quantifier en sociologie. Séance 10 Joanie Cayouette

La régression. Quantifier en sociologie. Séance 10 Joanie Cayouette La régression Quantifier en sociologie. Séance 10 Joanie Cayouette Principe général L effet d une variable x sur une seconde variable y toutes choses égales par ailleurs Deux types de régression : 1)La

Plus en détail

Ingénierie d aide à la décision

Ingénierie d aide à la décision Ingénierie d aide à la décision Maria Malek 1 er septembre 2009 1 Objectifs et débouchés Nous proposons dans cette option deux grands axes pour l aide à la décision : 1. La recherche opérationnelle ; 2.

Plus en détail

STATGRAPHICS CENTURION 17.1.12 (fr) UNIWIN PLUS 8.1.0 (fr) et VMAIL 2.4.0 (fr)

STATGRAPHICS CENTURION 17.1.12 (fr) UNIWIN PLUS 8.1.0 (fr) et VMAIL 2.4.0 (fr) STATGRAPHICS CENTURION 17.1.12 (fr) UNIWIN PLUS 8.1.0 (fr) et VMAIL 2.4.0 (fr) STATGRAPHICS Centurion 17.1.12 vous fait découvrir une nouvelle conception des analyses statistiques sur micro-ordinateur.

Plus en détail

STATGRAPHICS CENTURION 17.1.12 (32 et 64 bits, fr) UNIWIN PLUS 8.1.0 (fr) et VMAIL 2.4.0 (fr)

STATGRAPHICS CENTURION 17.1.12 (32 et 64 bits, fr) UNIWIN PLUS 8.1.0 (fr) et VMAIL 2.4.0 (fr) STATGRAPHICS CENTURION 17.1.12 (32 et 64 bits, fr) UNIWIN PLUS 8.1.0 (fr) et VMAIL 2.4.0 (fr) STATGRAPHICS Centurion 17.1.12 vous fait découvrir une nouvelle conception des analyses statistiques sur micro-ordinateur.

Plus en détail

Caractérisation de l entreprise

Caractérisation de l entreprise Caractérisation de la décision scientifique dans l entreprise d un point de vue statistique Abderahmane Yousfate Universté Djillali Lyabes Sidi Bel Abbes Caractérisation de l entreprise 'entreprise peut

Plus en détail

Partie I : Séries statistiques descriptives univariées (SSDU)... 1

Partie I : Séries statistiques descriptives univariées (SSDU)... 1 Table des matières Préface Avant-propos Pourquoi un tel ouvrage?... À propos de l ouvrage... À propos de la statistique................................................................ Remerciements....

Plus en détail

Analyse des données - Logiciel R

Analyse des données - Logiciel R Université de Strasbourg Analyse des données Master de Sciences, Spécialité Statistique 2012/13 Master Actuariat Emmanuel Périnel Analyse des données - Logiciel R TP n 2. L Analyse en Composantes Principales

Plus en détail

Catalogue des formations statistiques 2014

Catalogue des formations statistiques 2014 Catalogue des formations statistiques 2014 Améliorez vos connaissances statistiques pour une meilleure exploitation de vos données Toutes les solutions formation INTER Entreprises (catalogue) ou INTRA

Plus en détail

WEKA : c est quoi? Brigitte Bigi. 15 février 2011. LPL - Équipe C3I. Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32

WEKA : c est quoi? Brigitte Bigi. 15 février 2011. LPL - Équipe C3I. Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32 WEKA : c est quoi? Brigitte Bigi LPL - Équipe C3I 15 février 2011 Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32 Introduction 1 Introduction 2 Classification supervisée 3 WEKA

Plus en détail

Rapport sur la formation «Méthodes d analyses quantitatives pour la psychologie» (du 24/10 au 27/10/2011, Oran, Algérie)

Rapport sur la formation «Méthodes d analyses quantitatives pour la psychologie» (du 24/10 au 27/10/2011, Oran, Algérie) Rapport sur la formation «Méthodes d analyses quantitatives pour la psychologie» (du 24/10 au 27/10/2011, Oran, Algérie) Introduction Dans le cadre du projet Européen Tempus 159287-2009 «Développement

Plus en détail

Méthodes de placement multidimensionnelles. Fabrice Rossi Télécom ParisTech

Méthodes de placement multidimensionnelles. Fabrice Rossi Télécom ParisTech Méthodes de placement multidimensionnelles Fabrice Rossi Télécom ParisTech Plan Introduction Analyse en composantes principales Modèle Qualité et interprétation Autres méthodes 2 / 27 F. Rossi Plan Introduction

Plus en détail

LA PROFESSIONNALISATION DES CURSUS

LA PROFESSIONNALISATION DES CURSUS LA PROFESSIONNALISATION DES CURSUS EN MASTER 1 Les étudiants de M1 devront faire au plus tard pour le 15 novembre le choix d une inscription en alternance ou en formation initiale. L alternance est une

Plus en détail

TD ANALYSE DES DONNEES

TD ANALYSE DES DONNEES Master 2 TVPS Angers Analyse des données : ACP AFC CAH 1 TD ANALYSE DES DONNEES Exemple d'acp : Etude olfacto-gustative de cidres Plusieurs caractéristiques du cidre ont été mesurées sur 10 cidres différents.

Plus en détail

Statistique descriptive unidimensionnelle

Statistique descriptive unidimensionnelle 1 Statistique descriptive unidimensionnelle Statistique descriptive unidimensionnelle Résumé Les objectifs et la démarche d un première exploration d un jeu de données, les outils de la description statistique

Plus en détail

STATISTICA. Transformez vos Données en Actions. Les Graphiques : Un outil de Requêtage :

STATISTICA. Transformez vos Données en Actions. Les Graphiques : Un outil de Requêtage : Transformez vos Données en Actions S P É C I F I C I T É S C O M M U N E S D E L A G A M M E est une suite de plateforme logicielle pour l analyse statistique et graphique des données. Les solutions sont

Plus en détail

philippe.longchamp@hesav.ch

philippe.longchamp@hesav.ch La notion de champ et l analyse des correspondances multiples (ACM) Programme Doctoral Romand en Sociologie Séminaire résidentiel méthodologique, 22-23 septembre 2011, Montreux Organisé par Félix Bühlmann

Plus en détail

PROGRAMME DE MATHÉMATIQUES BTS Comptabilité et gestion des organisations

PROGRAMME DE MATHÉMATIQUES BTS Comptabilité et gestion des organisations 1 PROGRAMME DE MATHÉMATIQUES BTS Comptabilité et gestion des organisations I. Lignes directrices 1. Objectifs généraux L enseignement des mathématiques doit fournir les outils nécessaires pour permettre

Plus en détail

Laboratoire 2 Extraction des caractéristiques

Laboratoire 2 Extraction des caractéristiques Laboratoire 2 Extraction des caractéristiques L objectif de l extraction et de la sélection de caractéristiques est d identifier les caractéristiques importantes pour la discrimination entre classes. Après

Plus en détail

Analyse de données multidimensionnelles

Analyse de données multidimensionnelles Analyse de données multidimensionnelles M1 Statistique et économétrie, 2014 Projet - V. Monbet Le projet est composé de deux parties indépendantes. Les données sont disponibles sur la page web du cours.

Plus en détail

Microcrédit, cause de la défaillance dans le prêt collectif (Une analyse empirique)

Microcrédit, cause de la défaillance dans le prêt collectif (Une analyse empirique) Microcrédit, cause de la défaillance dans le prêt collectif (Une analyse empirique) Mohammed Kaicer* & Rajae Aboulaich* *Laboratoire d étude et de recherche en mathématiques appliquées, Université Mohammed

Plus en détail

Solutions Décisionnelles SPAD. La maîtrise des données, l'art de la décision

Solutions Décisionnelles SPAD. La maîtrise des données, l'art de la décision Solutions Décisionnelles SPAD La maîtrise des données, l'art de la décision SPAD, la référence en Analyse de Données et Data Mining La solution logicielle SPAD permet de tirer le meilleur parti de tous

Plus en détail

LICENCE D' INGENIERIE MATHEMATIQUES - 1LINM

LICENCE D' INGENIERIE MATHEMATIQUES - 1LINM UNIVERSITE PAUL SABATIER SCIENCES TOULOUSE III U.F.R. MATHEMATIQUE INFORMATIQUE GESTION LICENCE D' INGENIERIE MATHEMATIQUES - 1LINM PRESENTATION DES ENSEIGNEMENTS Année Universitaire 2003/2004 La licence

Plus en détail