COMBIEN D AXES DANS VOS ANALYSES FACTORIELLES? LA PETITE HISTOIRE MÉCONNUE DÉCEMBRE
|
|
- Lucile Pageau
- il y a 8 ans
- Total affichages :
Transcription
1 COMBIEN D AXES DANS VOS ANALYSES FACTORIELLES? LA PETITE HISTOIRE MÉCONNUE DÉCEMBRE de la vie aux idées
2 Combien d axes dans vos analyses factorielles? La petite histoire méconnue. Réflexions sur le nombre d Axes à conserver lors d une Analyse Factorielle (AF), où comment des considérations économiques désuètes influencent encore aujourd hui la pratique de l AF. Résumé La recherche marketing fait une grande utilisation de l analyse factorielle, en particulier pour réduire le nombre de dimensions de l espace d analyse, éliminer le bruit résiduel, et préparer le terrain pour une segmentation ou une régression. Un critère fréquemment utilisé pour décider du nombre d axes à conserver est celui d un seuil minimum (souvent 1 ou légèrement plus) pour les valeurspropres associées - règle de Kaiser-Guttman (KG). Ce critère semble raisonnable, puisqu on demande aux axes retenus de résumer au moins autant d information qu une variable simple. Ce qui nous a toujours paru moins logique, est d appliquer ce critère avant d effectuer une rotation des axes, sur des axes dépourvus de sens, puisque toute l analyse subséquente se fera sur les axes signifiants, après rotation. Nous illustrerons par des exemples simples pourquoi il nous semble souvent préférable d appliquer ce critère après rotation (il ne s agira alors plus à strictement parler de valeurs-propres, mais de leur équivalent variance de l axe) et proposerons des tentatives d explication dont une inattendue à l origine de cette pratique peu logique dans les logiciels statistiques courants, ainsi que quelques recettes pratiques pour contourner cette lacune. Introduction L analyse factorielle (AF) est une méthode largement répandue en recherche marketing. Pour la distinguer de l analyse factorielle originelle des psychologues, qui vise à découvrir des facteurs cachés par les variables mesurées, on utilise souvent le terme d analyse factorielle exploratoire pour décrire la méthode qui vise à résumer une information multi-dimensionnelle (batterie de questions d attitude, scores de satisfaction etc) en un nombre restreint de facteurs non ambigus et aussi distincts que possible. L objectif en est à la fois un de synthèse (extraire le sens), de simplification pour rendre les données plus facilement manipulables (prélude à une régression ou une segmentation), et de réduction du bruit, en ignorant les dimensions résiduelles.
3 Dans ce qui suit, nous ferons référence à l AF exploratoire appliquée à la recherche marketing. Nous supposons que le lecteur a une pratique de base de l AF, et en comprend les termes principaux. Selon la pratique la plus répandue, nous supposerons une analyse en composantes principales (ACP), suivie d une rotation de type Varimax, qui tend à enligner les facteurs au mieux possible sur les variables de départ. Un des premiers problèmes auxquels se heurte le praticien de l AF est celui de la dimensionnalité de l espace factoriel. On entend par cela le nombre d axes factoriels que l on doit retenir. Ce nombre est inférieur ou égal au nombre de variables de départ, et on le souhaite strictement inférieur pour qu il y ait effectivement réduction des données. Bien qu il n existe pas de solution optimale théorique, la littérature propose plusieurs règles dont nous ne citerons que les 3 plus simples : 1. La règle dite de Kaiser-Guttman (KG) datant des années , propose de se limiter aux axes dont les valeurs-propres (eigenvalues) sont supérieures ou égales à 1 (ou un seuil arbitraire légèrement supérieur comme 1,25). 2. L observation du diagramme d éboulis (scree plot) qui projette les valeurspropres sur le nombre d axes. On cherche alors un coude, ou une forte augmentation de la courbure de la ligne du graphe. 3. Un seuil a priori de variance expliquée à conserver. On pourrait par exemple décider de conserver les n premiers axes résumant cumulativement au moins 75% de la variance totale. Le premier critère semble logique : tout axe qui représente moins d information qu une simple variable de départ est considéré résiduel et donc à écarter. Le deuxième critère suppose que si le graphe devient presque plat, c est que chaque nouvel axe n apporte pas beaucoup d information supplémentaire, relativement aux précédents. Ce qui cependant ne nous a jamais semblé logique, c est que les critères 1 et 2 ne tiennent pas compte de l espace d analyse final, car on les applique avant d effectuer la rotation des axes. Pourtant, tout le reste de l analyse s effectuera sur des axes ayant subi une rotation. L ACP sert à déterminer le sous-espace dans lequel sera effectuée la rotation. Ce qui n est pas logique, c est d appliquer aux axes issus de l ACP, axes mathématiques dépourvus de sens un critère relevant du sens de l axe.
4 Tout se passe comme si on s était arrêté à répondre à la question du nombre d axes de l analyse en composantes principales (axes mathématiques), en oubliant qu on effectue en fait une analyse factorielle (axes signifiants). Ce problème ne concerne pas le critère 3, car la variance expliquée sera la même, dans l espace avant et après rotation. Dans ce qui suit, nous tenterons d illustrer par des exemples ce qu il y a d illogique à procéder de la sorte, et fournirons une tentative d explication historique inattendue à cette manière de faire. Quelques exemples L exemple 1 provient d une véritable AF sur 20 variables d attitude à l égard d un produit de consommation. Le critère KG nous indique que 6 axes sont à retenir. Cependant, si nous retenons 7, 8 et même 9 axes, nous constatons après rotation que la variance associée (l équivalent de la valeur-propre : la somme des contributions au carré sum of squared loadings) est encore supérieure à 1 pour ces 3 axes additionnels. Leur interprétation (que nous omettons de détailler ici) est aussi cohérente et non ambiguë. Pourquoi faudrait-il les rejeter? Nous avons tracé le diagramme d éboulis (Scree plot), ainsi que son équivalent pour les variances associées (figure 1). On constate d abord que la courbure des graphes après rotation est moins prononcée et que les graphes après rotation rejoignent la cote 1 plus loin que le graphe avant rotation. Cela semble normal, car la variance du premier axe est redistribuée sur les axes suivants. D autre part, les graphes sont moins réguliers (en zigzag). Ceci est normal aussi, car la sémantique impose un sens à des objets purement mathématiques, à travers la rotation. Cette sémantique est ce qui distingue l AF d une simple ACP. Pourquoi l ignorer? Le deuxième exemple (figure 2) illustre bien l aspect irrégulier des variances associées aux axes après rotation, comparativement à celles des axes principaux (avant rotation). On y chercherait cependant en vain un coude, selon la règle 2. On y constate simplement aussi le fait que plus le nombre de variables augmente, moins le problème est pertinent, car le graphe des valeurpropres avant rotation tend alors à rejoindre la cote 1 au même point que celui des variances des axes après rotation. En effet, la variance des premiers axes est redistribuée sur un grand nombre de facteurs et la contribution aux derniers axes devient négligeable. Notre dernier exemple (figure 3) est un exemple extrême fictif mais éloquent qui facilite la réflexion sur le problème et sa compréhension. Le lecteur peut facilement reproduire l expérience avec le logiciel statistique de son choix. Dans
5 une base de données d enquête, créons 2 variables aléatoires indépendantes, par exemple selon une loi uniforme, X et Y. Leur coefficient de corrélation R est donc voisin de 0. Créons une troisième variable Z = X + Y. Clairement, Z est corrélé avec X (R.7). Si nous effectuons une AF sur les variables X et Z, avec le critère KG habituel (valeurs-propres >= 1), alors nous n obtenons qu un seul axe. Par contre, si nous retenons 2 axes et leur imposons une rotation, nous obtenons 2 axes de variance 1 (équivalent des valeurspropres = somme des contributions au carré). La dimensionnalité de notre espace factoriel est bien 2. La même expérience effectuée directement avec X et Y donne des résultats similaires, pour peu qu il existe la moindre corrélation entre X et Y (aussi petite soit-elle en valeur absolue, mais 0). Dans ce cas, on pourra toujours objecter qu on ne respecte pas toutes les prémisses de l AF (présence de corrélation au départ). L exemple est extrême, et on touche ici à la philosophie. Du point de vue de l AF originelle, en psychologie, par exemple, on pourrait considérer que l espace factoriel est de dimension 1 car on cherche le sous-espace dont l information est commune aux 2 variables. Du point de vue de l AF exploratoire, et du point de vue géométrique, clairement cet espace est de dimension 2.
6 Total Variance Explained Extraction Sums of Squared Loadings Component Initial Eigenvalues Unrotated Rotation Total % of Variance Cumulative % Total 10 axes 9 axes 8 axes 7 axes 6 axes Extraction Method: Principal Component Analysis Répartition de la variance expliquée, selon le nombre d'axes retenus Avant rotation Rotation 9 axes Rotation 8 axes Rotation 7 axes Rotation 6 axes Figure 1
7 Total Variance Explained Component Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings Total % of VarianceCumulative %Total % of Variance Cumulative Total % % of Variance Cumulative % Avant rotation Après rotation Extraction Method: Principal Component Analysis. Figure 2
8 Total Variance Explained Component Initial Eigenvalues Unrotated Rotation Sums of Squared Loadings Total % of Variance Cumulative % Total 2 axes Extraction Method: Principal Component Analysis Avant rotation Après rotation Figure 3 Recul historique En écrivant cet article, nous avons trouvé des douzaines de papiers sur le sujet, offrant les méthodes les plus sophistiquées et créatives pour déterminer la dimensionnalité de l espace factoriel, mais nous n en avons trouvé aucun qui remette en question ce dogme qu on détermine d abord la dimensionnalité de l espace, et qu on effectue la rotation après. Pour conclure, nous proposons 2 explications à cet état de fait. D abord, la recherche récente en ce domaine provient surtout de l intelligence artificielle, du data mining et autres disciplines plus préoccupées de performance et d automatisation que de sens. Par exemple un article intéressant de Mu Zhu et Ali Ghodsi (Automatic dimensionality selection from the scree plot via the use of profile likelihood, Waterloo 2005) propose un algorithme efficace pour l ACP. Il s agit ici d application en reconnaissance automatique d image, et si on cherche des algorithmes puissants, pour de grands espaces factoriels, on se soucie peu d interpréter les axes résultants. L objectif ultime est ici la réduction du bruit.
9 Une explication possible Mais la raison principale nous semble historique : les pionniers en la matière furent Kaiser et Guttman, dans les années 1950 à A cette époque, le temps de calcul sur ordinateur coûtait très cher quand on ne calculait pas à la main! La rotation des axes requiert un calcul intensif où le nombre d opérations est d ordre n! si n est le nombre de variables de départ. Une simple rotation pouvait donc coûter des dizaines, voire des centaines de dollars. La solution d appliquer un seuil aux valeurs-propres avant rotation était donc avant tout une astuce économique. En effet, pour appliquer l équivalent du critère KG après rotation, il faut effectuer une rotation des axes pour tous les entiers supérieurs au nombre d axes déterminé par KG jusqu à ce que la variance du dernier axe résultant soit inférieure à 1 (dans l exemple 1, il faut donc effectuer une rotation sur 7, 8, 9 et 10 axes afin de déterminer qu on arrête à 9). Ce qui se fait en quelques secondes aujourd hui pouvait représenter un travail colossal il y a 50 ans. Nous vivons donc avec l héritage d une époque révolue. On comprend mal cependant pourquoi l industrie ne s est pas mise à jour dans ce cas. Inertie, manque de perspective historique? Pour nous c est un exemple parfait du syndrôme : «Mon logiciel fait ainsi, ça doit être bon». Une petite question pour les sceptiques : pourquoi en 2010 le nombre d itérations maximal par défaut pour accomplir une rotation Varimax dans le logiciel le plus utilisé et enseigné est toujours de 25, comme en 1970, ce qui, dans la pratique, est souvent insuffisant? La technologie actuelle permettrait de porter cette valeur par défaut à 1000, voire 10000, sans pénaliser le chercheur. Une nouvelle règle : KG + Notre usage en AF est proche de KG (le seuil dépend du contexte plus il y a de variables, plus nous avons tendance a prendre un seuil élevé, car la contribution relative de chaque axe diminue). Si KG détermine n axes, nous avons pris l habitude cependant de toujours regarder aussi les solutions à n+1, n+2, n+3 etc axes, en comparant la variance des axes additionnels après rotation avec le seuil. Dans la majorité des cas, ces axes sont interprétables et sont porteurs de sens. De notre point de vue, KG permet donc de déterminer un nombre minimum d axes. KG appliqué aux axes après rotation, que nous appellerons KG+ nous permet d identifier le nombre d axes signifiants, qui est généralement égal ou légèrement supérieur au nombre obtenu par KG. Le critère ultime demeure cependant l interprétabilité des axes. De notre point de vue, la question est loin d être vidée, et nous croyons que la technologie actuelle devrait permettre à de nouveaux critères basés sur les axes signifiants d émerger.
10 À venir En fouillant l Internet pour écrire cet article, nous sommes tombés sur un livre de recette à l usager des étudiants de premier cycle qui nous a étonnés. On y recommande de ne pas regarder la solution avant la rotation des axes. Au contraire, nous y portons toujours une attention particulière. Un prochain article expliquera pourquoi. Références Les deux articles suivants comportent une bibliographie abondante et pertinente sur le sujet de la détermination du nombre d axes en AF : Automatic dimensionality selection from the scree plot via the use of profile likelihood (Waterloo 2005) de Mu Zhu et Ali Ghodsi cité plus haut et Finding the Magic Number (The Psychologist, Octobre 2008) de Paul Wilson et Colin Cooper. Remerciements Nous tenons à remercier Michel Saulnier de l ARIM pour ses corrections et commentaires pertinents sur une première version de cet article.
11 de la vie aux idées 550, RUE SHERBROOKE OUEST MONTRÉAL (QUÉBEC) H3A 1B9 BUREAU 900 TOUR EST T , POSTE 3064
L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :
La vision nous permet de percevoir et d interpreter le monde qui nous entoure. La vision artificielle a pour but de reproduire certaines fonctionnalités de la vision humaine au travers de l analyse d images.
Plus en détailIntelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com
Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailPrincipe et règles d audit
CHAPITRE 2 Principe et règles d audit 2.1. Principe d audit Le principe et les règles d audit suivent logiquement l exposé précédent. D abord, comme dans toute branche de l activité d une entreprise, l
Plus en détailFrancis BISSON (06 794 819) Kenny CÔTÉ (06 836 427) Pierre-Luc ROGER (06 801 883) IFT702 Planification en intelligence artificielle
Francis BISSON (06 794 819) Kenny CÔTÉ (06 836 427) Pierre-Luc ROGER (06 801 883) PLANIFICATION DE TÂCHES DANS MS PROJECT IFT702 Planification en intelligence artificielle Présenté à M. Froduald KABANZA
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailACP Voitures 1- Méthode
acp=princomp(voit,cor=t) ACP Voitures 1- Méthode Call: princomp(x = voit, cor = T) Standard deviations: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 2.1577815 0.9566721 0.4903373 0.3204833 0.2542759 0.1447788
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailExtraction d informations stratégiques par Analyse en Composantes Principales
Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction
Plus en détailDes données à la connaissance client. A la découverte de la plateforme de connaissance client knowlbox
Des données à la connaissance client A la découverte de la plateforme de connaissance client knowlbox Livre blanc mai 2013 A l heure du Big Data, les entreprises s interrogent davantage sur leurs données.
Plus en détailLe rôle d un CRM dans la gestion intégrée des services à la clientèle
LIVRE BLANC Le rôle d un CRM dans la gestion intégrée des services à la clientèle Quels sont les avantages d adopter uneapproche intégrée à la gestion de service. INTRODUCTION Lorsque vous pensez CRM,
Plus en détailQU EST-CE QUE LE DECISIONNEL?
La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce
Plus en détailL ATTRIBUTION EN MARKETING DIGITAL
Online Intelligence Solutions L ATTRIBUTION EN MARKETING DIGITAL Par Jacques Warren WHITE PAPER WHITE PAPER A Propos de Jacques Warren Jacques Warren évolue en marketing digital depuis 1996, se concentrant
Plus en détailQUESTIONNAIRE DE DIAGNOSTIC RAPIDE DES NIVEAUX DE CPO ET TMS EN ETABLISSEMENTS DE SOIN
NOTE EXPLICATIVE ORSOSA QUESTIONNAIRE DE DIAGNOSTIC RAPIDE DES NIVEAUX DE CPO ET TMS EN ETABLISSEMENTS DE SOIN Ce document détaille le contenu des questionnaires établis lors de la cohorte ORSOSA 1 et
Plus en détailStatistique Descriptive Multidimensionnelle. (pour les nuls)
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Multidimensionnelle (pour les nuls) (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219
Plus en détailAdWords Guide de survie
AdWords Guide de survie Avril 2011 Guide de survie AdWords. Ce guide liste dix des astuces les plus utiles pour gérer une campagne AdWords efficacement, et sans gaspiller d argent. Plan de référencement
Plus en détailSylvie Guessab Professeur à Supélec et responsable pédagogique du Mastère Spécialisé en Soutien Logistique Intégré des Systèmes Complexes
Préface Toute personne est un jour confrontée à devoir prendre une décision, qu il s agisse de l étudiant qui réfléchit à son orientation académique, du chercheur qui doit privilégier une option scientifique
Plus en détailDidacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).
1 Objectif Description succincte de Pentaho Data Integration Community Edition (Kettle). L informatique décisionnelle («Business Intelligence BI» en anglais, ça fait tout de suite plus glamour) fait référence
Plus en détailPREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE
PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE Jean-Paul Valois, Claude Mouret & Nicolas Pariset Total, 64018 Pau Cédex MOTS CLEFS : Analyse spatiale, ACP, Lissage, Loess PROBLEMATIQUE En analyse multivariée,
Plus en détailUn accueil de qualité :
Un accueil de qualité : Mercredi 08 Juin 2011, dans l après-midi, notre classe de 3 ème de Découverte Professionnelle s est rendue sur le site de THALES ALENIA SPACE à CANNES LA BOCCA. Nous étions accompagnés
Plus en détailMises en relief. Information supplémentaire relative au sujet traité. Souligne un point important à ne pas négliger.
Cet ouvrage est fondé sur les notes d un cours dispensé pendant quelques années à l Institut universitaire de technologie de Grenoble 2, au sein du Département statistique et informatique décisionnelle
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailIl y a trois types principaux d analyse des résultats : l analyse descriptive, l analyse explicative et l analyse compréhensive.
L ANALYSE ET L INTERPRÉTATION DES RÉSULTATS Une fois les résultats d une investigation recueillis, on doit les mettre en perspective en les reliant au problème étudié et à l hypothèse formulée au départ:
Plus en détailBREVET DE TECHNICIEN SUPÉRIEUR ÉPREUVE DE MANAGEMENT DES ENTREPRISES BOITIER PHARMA
BREVET DE TECHNICIEN SUPÉRIEUR ÉPREUVE DE MANAGEMENT DES ENTREPRISES BOITIER PHARMA La commission de choix de sujets a rédigé cette proposition de corrigé, à partir des enrichissements successifs apportés
Plus en détailPartie I Stratégies relationnelles et principes d organisation... 23
Introduction......................................................................... 1 1. Définition........................................................................ 2 1.1 Le CRM comme processus
Plus en détailLe montant des garanties constituées aux fins du STPGV est-il excessif?
Le montant des garanties constituées aux fins du STPGV est-il excessif? Kim McPhail et Anastasia Vakos* L e système canadien de transfert des paiements de grande valeur (STPGV) sert à effectuer les paiements
Plus en détailIntroduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
Plus en détailPROGRAMME (Susceptible de modifications)
Page 1 sur 8 PROGRAMME (Susceptible de modifications) Partie 1 : Méthodes des revues systématiques Mercredi 29 mai 2013 Introduction, présentation du cours et des participants Rappel des principes et des
Plus en détailLe Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Plus en détailMASTER 2 SCIENCES HUMAINES ET SOCIALES Mention Psychologie. Spécialité : Recherches en psychologie
S3 Spécialité : Recherches en psychologie UE OBLIGATOIRES UE 1 : Epistémologie et méthodes de recherche en psychologie Ce séminaire aborde plusieurs aspects de la recherche en psychologie. Il présente
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailLe Futur de la Visualisation d Information. Jean-Daniel Fekete Projet in situ INRIA Futurs
Le Futur de la Visualisation d Information Jean-Daniel Fekete Projet in situ INRIA Futurs La visualisation d information 1.Présentation 2.Bilan 3.Perspectives Visualisation : 3 domaines Visualisation scientifique
Plus en détailLean management et conditions de travail!
Lean management et conditions de travail! Conférence APIRAF! IUT Lumière 18 février 2014! www.aravis.aract.fr! 18/02/14! N 1! Au delà du seul lean " Quels liens entre «#évolution des organisations#» et
Plus en détailSharePoint (Toute la Gamme)... 1 Office 2010 (Toute la Gamme)... 2 OLAP (Toute la Gamme)... 2 STATISTICA Connecteur PI (Produit Complémentaire)...
SharePoint (Toute la Gamme)... 1 Office 2010 (Toute la Gamme)... 2 OLAP (Toute la Gamme)... 2 STATISTICA Connecteur PI (Produit Complémentaire)... 3 Introduction... 3 Échelle Interactive... 4 Navigation
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détailComment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie
Partie I : Séries statistiques descriptives univariées (SSDU) A Introduction Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie et tous sont organisés selon le même
Plus en détailQ&A 1. Qu est ce que AdKash? 2. Pourquoi AdKash est innovative par rapport aux autres systèmes de publicité Mobile?
1. Qu est ce que AdKash? AdKash est une plateforme innovante de publicité mobile crée par WOR(l)D. L innovation de AdKash se situe dans la technologie de consigne de la publicité sur Mobile comme dans
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailTABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie
PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be
Plus en détailAnalyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57
Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation
Plus en détailReconstruction de bâtiments en 3D à partir de nuages de points LIDAR
Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR Mickaël Bergem 25 juin 2014 Maillages et applications 1 Table des matières Introduction 3 1 La modélisation numérique de milieux urbains
Plus en détailBientôt plus d'1 Français sur 10 client d'une banque en ligne.
www.audirep.fr Bientôt plus d'1 Français sur 10 client d'une banque en ligne. Restitution des résultats d une étude menée par internet sur un échantillon de 1 001 personnes représentatives de la population
Plus en détailMéthode universitaire du commentaire de texte
Méthode universitaire du commentaire de texte Baptiste Mélès Novembre 2014 L objectif du commentaire de texte est de décrire la structure argumentative et de mettre au jour les concepts qui permettent
Plus en détail23. Interprétation clinique des mesures de l effet traitement
23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d
Plus en détailDATA MINING - Analyses de données symboliques sur les restaurants
Master 2 Professionnel - Informatique Décisionnelle DATA MINING - Analyses de données symboliques sur les restaurants Etudiants : Enseignant : Vincent RICHARD Edwin DIDAY Seghir SADAOUI SOMMAIRE I Introduction...
Plus en détailNotes de lecture : Dan SPERBER & Deirdre WILSON, La pertinence
Notes de lecture : Dan SPERBER & Deirdre WILSON, La pertinence Gwenole Fortin To cite this version: Gwenole Fortin. Notes de lecture : Dan SPERBER & Deirdre WILSON, La pertinence. 2006.
Plus en détailCONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS
CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS Nazih Selmoune (*), Zaia Alimazighi (*) Selmoune@lsi-usthb.dz, Alimazighi@wissal.dz (*) Laboratoire des systèmes
Plus en détailAnalyse en Composantes Principales
Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées
Plus en détailLa structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren)
La structure de la base de données et l utilisation de PAST La structure de la base de données données originales SPÉCIMENS Code des spécimens: Identification des spécimens individuels. Dépend du but de
Plus en détailUniversité de Montréal. département de sociologie. L'analyse factorielle et l'analyse de fidélité. notes de cours et exemples
Université de Montréal département de sociologie L'analyse factorielle et l'analyse de fidélité notes de cours et exemples Claire Durand, 2003 Notes aux lecteurs... Ce texte a d'abord été préparé pour
Plus en détailUNITED NATIONS NATIONS UNIES
Programme : 16 Duration : 7 42 Producer : Lisa Andracke UNITED NATIONS NATIONS UNIES 21 st Century GHANA: L EDUCATION EN PLEINE REVOLUTION Partout dans le monde, le nombre d enfants inscrits à l école
Plus en détailLes 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie
Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie Découvrir les stratégies ayant fait leurs preuves et les meilleures pratiques Points clés : Planifier
Plus en détailCoheris est agréé organisme de formation, n d agrément 11 92 19507 92.
Formations 2015 Coheris est agréé organisme de formation, n d agrément 11 92 19507 92. Introduction La formation est une préoccupation constante de Coheris vis-à-vis de ses clients et de ses partenaires,
Plus en détailStructure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données
Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques
Plus en détailLa planification de l offre médicale en Belgique: les kinésithérapeutes
La planification de l offre médicale en Belgique: les kinésithérapeutes ETAT DE LA SITUATION 2007 V1.1 Direction générale Soins de Santé primaires et Gestion de Crise Bruxelles, octobre 2008 1. Les Kinésithérapeutes
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Plus en détailTRAVAUX DE RECHERCHE DANS LE
TRAVAUX DE RECHERCHE DANS LE DOMAINE DE L'EXPLOITATION DES DONNÉES ET DES DOCUMENTS 1 Journée technologique " Solutions de maintenance prévisionnelle adaptées à la production Josiane Mothe, FREMIT, IRIT
Plus en détailSSQ Gestion privée Martin Bédard, MBA Directeur institutionnel et gestion privée
SSQ Gestion privée SSQ Groupe financier est une entreprise qui a «Les valeurs à la bonne place» puisqu elle est constituée de gens de valeur, passionnés par leur métier et dont l ambition première est
Plus en détailExploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.
Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Etudes et traitements statistiques des données : le cas illustratif de la démarche par sondage INTRODUCTION
Plus en détailDOCUMENT DE TRAVAIL DES SERVICES DE LA COMMISSION RÉSUMÉ DE L'ANALYSE D'IMPACT. accompagnant le document:
COMMISSION EUROPÉENNE Bruxelles, le 22.4.2015 SWD(2015) 88 final DOCUMENT DE TRAVAIL DES SERVICES DE LA COMMISSION RÉSUMÉ DE L'ANALYSE D'IMPACT accompagnant le document: Rapport de la Commission au Parlement
Plus en détailRECHERCHE EXPLORATOIRE (2) SUR LES CRITÈRES DE SUCCÈS DES PROJETS DES PETITES ET MOYENNES ENTREPRISES
RECHERCHE EXPLORATOIRE (2) SUR LES CRITÈRES DE SUCCÈS DES PROJETS DES PETITES ET MOYENNES ENTREPRISES Julie Bérubé (berj23@uqo.ca) Programme de maîtrise en gestion de projet, UQO RÉSUMÉ Les critères de
Plus en détailwww.cas-marketing.fr Retrouvez des études de cas marketing pratiques! iphone : Succès commercial ou Manipulation médiatique?
Retrouvez des études de cas marketing pratiques! iphone : Succès commercial ou Manipulation médiatique? L histoire d un mobile C'est en 2002 qu'apple a pensé à créer ce qui est aujourd'hui l'iphone L histoire
Plus en détailLa carte, le territoire et l'explorateur où est la visualisation? Jean-Daniel Fekete Equipe-projet AVIZ INRIA Jean-Daniel.Fekete@inria.fr www.aviz.
La carte, le territoire et l'explorateur où est la visualisation? Jean-Daniel Fekete Equipe-projet AVIZ INRIA Jean-Daniel.Fekete@inria.fr www.aviz.fr Quelques exemples 1 La campagne de Russie de Napoléon
Plus en détailLE TABLEAU DE BORD DE SUIVI DE L ACTIVITE
TABLEAU DE BORD LE TABLEAU DE BORD DE SUIVI DE L ACTIVITE DEFINITION Le tableau de bord est un support (papier ou informatique) qui sert à collecter de manière régulière des informations permettant de
Plus en détailPRÉSENTATION PRODUIT. Plus qu un logiciel, la méthode plus efficace de réconcilier.
PRÉSENTATION PRODUIT Plus qu un logiciel, la méthode plus efficace de réconcilier. Automatiser les réconciliations permet d optimiser l utilisation des ressources et de générer plus de rentabilité dans
Plus en détailTexte Agrégation limitée par diffusion interne
Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse
Plus en détailMAÎTRISE DES ACHATS D INVESTISSEMENTS
MAÎTRISE DES ACHATS D INVESTISSEMENTS Une enquête auprès des DAF et dirigeants de l industrie en France Paris, le 20 octobre 2010 Olaf de Hemmer International Business Manager Purchasing Department 16,
Plus en détailSoutenance de stage Laboratoire des Signaux et Systèmes
Soutenance de stage Laboratoire des Signaux et Systèmes Bornes inférieures bayésiennes de l'erreur quadratique moyenne. Application à la localisation de points de rupture. M2R ATSI Université Paris-Sud
Plus en détailPi, poker et informatique ; une «épuisante» alliance pour des projets en mathématiques
Pi, poker et informatique ; une «épuisante» alliance pour des projets en mathématiques Jean Fradette et Anik Trahan, Cégep de Sherbrooke Résumé Dans un cours intégrateur en mathématiques, des étudiants
Plus en détailESIEA PARIS 2011-2012
ESIEA PARIS 2011-2012 Examen MAT 5201 DATA MINING Mardi 08 Novembre 2011 Première Partie : 15 minutes (7 points) Enseignant responsable : Frédéric Bertrand Remarque importante : les questions de ce questionnaire
Plus en détailDéclin des groupes visés par l équité en matière d emploi lors du recrutement. Étude de la Commission de la fonction publique du Canada
Déclin des groupes visés par l équité en matière d emploi lors du recrutement Étude de la Commission de la fonction publique du Canada Octobre 2009 Commission de la fonction publique du Canada 300, avenue
Plus en détailLecture critique et pratique de la médecine
1-00.qxp 24/04/2006 11:23 Page 13 Lecture critique appliquée à la médecine vasculaireecture critique et pratique de la médecine Lecture critique et pratique de la médecine Introduction Si la médecine ne
Plus en détailLa nouvelle dimension de l analyse acoustique et vibratoire
La nouvelle dimension de l analyse acoustique et vibratoire HEAD Gallery Des fonctions innovantes intégrées dans une technologie de pointe ArtemiS suite est la solution logicielle intégrée de HEAD acoustics
Plus en détailNe laissez pas le stockage cloud pénaliser votre retour sur investissement
Ne laissez pas le stockage cloud pénaliser votre retour sur investissement Préparé par : George Crump, analyste senior Préparé le : 03/10/2012 L investissement qu une entreprise fait dans le domaine de
Plus en détailLa persistance des nombres
regards logique & calcul La persistance des nombres Quand on multiplie les chiffres d un nombre entier, on trouve un autre nombre entier, et l on peut recommencer. Combien de fois? Onze fois au plus...
Plus en détailChristophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Plus en détailBusiness & High Technology
UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...
Plus en détailIODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21
IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances
Plus en détailSillage Météo. Notion de sillage
Sillage Météo Les représentations météorologiques sous forme d animation satellites image par image sont intéressantes. Il est dommage que les données ainsi visualisées ne soient pas utilisées pour une
Plus en détailDÉVERSEMENT ÉLASTIQUE D UNE POUTRE À SECTION BI-SYMÉTRIQUE SOUMISE À DES MOMENTS D EXTRÉMITÉ ET UNE CHARGE RÉPARTIE OU CONCENTRÉE
Revue Construction étallique Référence DÉVERSEENT ÉLASTIQUE D UNE POUTRE À SECTION BI-SYÉTRIQUE SOUISE À DES OENTS D EXTRÉITÉ ET UNE CHARGE RÉPARTIE OU CONCENTRÉE par Y. GALÉA 1 1. INTRODUCTION Que ce
Plus en détailComment optimiser l utilisation des ressources Cloud et de virtualisation, aujourd hui et demain?
DOSSIER SOLUTION Solution CA Virtual Placement and Balancing Comment optimiser l utilisation des ressources Cloud et de virtualisation, aujourd hui et demain? agility made possible La solution automatisée
Plus en détailSéries Statistiques Simples
1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &
Plus en détailMarketing. en 12 étapes clés. Une introduction au Marketing Automation Comment délivrer le bon contenu au bon moment à son interlocuteur
Marketing Automation en 12 étapes clés Une introduction au Marketing Automation Comment délivrer le bon contenu au bon moment à son interlocuteur Marketing Automation : pourquoi cela fonctionne mieux qu
Plus en détailplate-forme PaaS (Audit)
Contrôle d accès dans une plate-forme PaaS (Audit) Ahmed BOUCHAMI, Olivier PERRIN, LORIA Introduction La sécurité d une plate-forme collaborative nécessite un module d authentification et un module de
Plus en détailCalcul des pertes de pression et dimensionnement des conduits de ventilation
Calcul des pertes de pression et dimensionnement des conduits de ventilation Applications résidentielles Christophe Delmotte, ir Laboratoire Qualité de l Air et Ventilation CSTC - Centre Scientifique et
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailDegré de confiance pour les indicateurs de performance : degré de fiabilité du processus de production et écart significatif 1
Degré de confiance pour les indicateurs de performance : degré de fiabilité du processus de production et écart significatif 1 L utilisation des indicateurs de performance ne peut se faire de manière pertinente
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailEVALUATION DE LA SANTÉ FINANCIÈRE D UNE MUNICIPALITÉ VIA UNE APPROCHE STATISTIQUE MULTIVARIÉE.
EVALUATION DE LA SANTÉ FINANCIÈRE D UNE MUNICIPALITÉ VIA UNE APPROCHE STATISTIQUE MULTIVARIÉE. MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE DE LA MAÎTRISE EN ADMINISTRATION PUBLIQUE - «OPTION POUR ANALYSTES»
Plus en détailBusinessHIGHLIGHT L EXPÉRIENCE CLIENT : Inspirer. n 1022011 .../... UN LEVIER SIMPLE POUR SE DIFFÉRENCIER SOMMAIRE L APPARITION DE L EXPÉRIENCE CLIENT
BusinessHIGHLIGHT Inspirer L EXPÉRIENCE CLIENT : UN LEVIER SIMPLE POUR SE DIFFÉRENCIER L APPARITION DE L EXPÉRIENCE CLIENT SOMMAIRE L apparition de l expérience client Notre définition de l expérience
Plus en détailLes dessous des moteurs de recommandation
Les dessous des moteurs de recommandation La personnalisation est un enjeu majeur du e-commerce aujourd hui. Elle réveille l esprit commerçant dans les boutiques en ligne en remettant le visiteur au cœur
Plus en détailMODÈLE CROP DE CALIBRATION DES PANELS WEB
MODÈLE CROP DE CALIBRATION DES PANELS WEB 550, RUE SHERBROOKE OUEST MONTRÉAL (QUÉBEC) H3A 1B9 BUREAU 900 TOUR EST T 514 849-8086, POSTE 3064 WWW.CROP.CA Le Protocole CROP de calibration des panels en ligne
Plus en détail" # $ % % & ' ( ) * +,! '()*+ *, + ' +' + ' ' -+ - +.+. /0 / 1 0 12 1 1 2 34+ 4 1 +. 50 5 * 0 4 * 0 6! "##$ % &!
"# $ %%& ' ( )*+, '()*+,'+''-++.+/0112134+1.50*406 "##$ %& 8CC "#$%& ' ( )* +,-./ 0 123 456+7 3 7-55-89.*/ 0 +3 *+:3 ;< =3 3-3 8 0 23 >-8-3 >5? //*/*0;* @A: *53,,3 / * $/ >B+? - 5, 2 34*56 7 /+#** //8
Plus en détailAnalyse de grandes bases de données en santé
.. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.
Plus en détailGRP et Internet : une transposition sans risque? The use of GRP for the media Internet calls certain reserves.
GRP et Internet : une transposition sans risque? The use of GRP for the media Internet calls certain reserves. Philippe JOURDAN Maître de Conférences Université de Paris XI IUT d'evry Val Essonne Directeur
Plus en détailAvis n 94-02 sur la méthodologie relative aux comptes combinés METHODOLOGIE RELATIVE AUX COMPTES COMBINES
CONSEIL NATIONAL DE LA COMPTABILITÉ Avis n 94-02 sur la méthodologie relative aux comptes combinés Le Conseil national de la comptabilité réuni en formation de Section des entreprises le 28 octobre 1994,
Plus en détailData Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.
des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le
Plus en détail1 Définition de la non stationnarité
Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles
Plus en détailL utilisation d un réseau de neurones pour optimiser la gestion d un firewall
L utilisation d un réseau de neurones pour optimiser la gestion d un firewall Réza Assadi et Karim Khattar École Polytechnique de Montréal Le 1 mai 2002 Résumé Les réseaux de neurones sont utilisés dans
Plus en détailGestion de la Relation Client (GRC)
Techniques de DM pour la GRC dans les banques Page 2 I.1 Introduction La gestion de la relation client est devenue un processus essentiel dans les institutions bancaires. Ils essaient toujours d améliorer
Plus en détail